توضیحات
حذف نویز فایل صوتی به روش تفریق طیفی با متلب
در بیشتر محیط های زندگی نویز های مختلفی حضور دارد که داده های صوتی را تخریب میکند. یکی از مباحث مهم در پردازش سیگنال، حذف سیگنال های ناخواسته و یا نویز از سیگنال اصلی است. روش های بسیاری برای حذف نویز از سیگنال گفتار پیشنهاد شده است. حذف نویز از سیگنال گفتار از اهمیت بالایی برخوردار است زیرا اولا قابلیت فهم سیگنال گفتار را بالا می برد و ثانیا باعث افزایش راندمان سیستم های شناسایی گفتار و گوینده خواهد شد. در این پروژه از روش تفاضل طیفی یا تفریق طیفی استفاده می کنیم و با استفاده از این روش نویز را کاهش می دهیم تا سیگنال شنیداری گفتار بازسازی شده بهبود یابد. در واقع الگوریتم تفاضل طیف یکی از قدیمی ترین و مشهورترین روش های بهسازی سیگنال گفتار است که برای بازیابی طیف توان سیگنال آلوده به نویز استفاده می شود. این روش طیف توان نویز تخمین زده شده را از طیف توان سیگنال نویزی کم کرده و سیگنال بهسازی شده را تولید می کند. در روش تفاضل طیفی ، تخمین اندازه طیف توان نویز با استفاده از نواحی سکوت و از طریق میانگین گیری اندازه طیف توان نویز در پنجره های مختلف این نواحی انجام می شود. اساسی ترین مشکل این روش وجود نویزی آزار دهنده بنام نویز موزیکال در سیگنال بهسازی شده است که دلیل اصلی آن عدم دقت در تخمین طیف نویز است.
میدانیم که عواملی مانند طول فریم و… روی دقت تخمین طیف نویز موثر هستند و به طور خاص اثر آن بر روی نویز موزیکال ایجاد شده مورد مطالعه قرار می گیرد. بررسی ازمایشات انجام شده در مقالات که در مراجع نیز آورده شده اند نشان می دهند که هر چقدر طول فریم کمتر باشد و به عبارتی پنجره کوتاهتر باشد به علت کانوالو شدن طیف گفتار و طیف پنجره، طیف سیگنال گفتار نیز به این طریق خراب خواهد شد. همه عوامل فوق ما را به این سمت سوق می دهند که طول فریم را بزرگ انتخاب کنیم. بزرگتر گرفتن طول فریم دقت تخمین طیف نویز را افزایش داده و بنابراین موجب کاهش نویز موزیکال و افزایش کیفیت سیگنال شنیداری بهسازی شده می گردد و ثانیأ اگر دقت تخمین طیف بیشتر باشد می توان در روش تفریق طیفی،ضریب تفریق را بزرگتر انتخاب کرده و مقدار بهبود SNR را افزایش داد.
در الگوریتم تفریق طیفی اگر تخمین ما از طیف نویز درست نباشد، با افزایش ضریب تفریق مقدار نویز موزیکال به شدت افزایش می یابد. در این پروژه برای سادگی کار و عدم نیاز به VAD از فایل های گفتاری استفاده می کنیم که حدودا یک ثانیه سکوت در ابتدای خود داشته باشند و از این یک ثانیه سکوت همان طور که در بالا توضیح داده شد برای تخمین طیف نویز استفاده می کنیم.
نتایج پیاده سازی این پروژه بر روی سیگنال های مختلف با نسبت سیگنال به نویز های (SNR) متفاوت بیان خواهد شد و در ادامه کارایی ضعیف روش تفاصل طیفی در حضور سیگنال های نویزی با نویز غیر ایستان(همهمه) نیز بیان می شود.
در طول دو -سه دهه اخير و با پيشرفت جنبه هاي مختلف پردازش سيگنال گفتار، طيف وسيعي از رويكردها وروش ها براي بهسازي گفتار ارائه گرديده است . در اين بخش، به معرفي اجمالي الگوريتم ها و تكنيك هاي عمده بهسازي گفتار مي پردازيم. راه هاي متفاوتي براي طبقه بندي سيستم هاي بهسازي گفتار وجود دارد . يكي از طرق، تفكيك روش ها بر اساس پارامتري يا غيرپارامتري بودن مي باشد؛ در حالي كه تكنيك هايي نظير تفريق طيفي و زيرفضاي سيگنال به دليل كار بر روي خود سيگنال، الگوريتم هايي غيرپارامتري محسوب مي گردد، روش هايي نظير HMM به دليل استفاده از مدل هاي آماري و تصادفي براي سيگنال گفتار و نويز، در خانواده روش هاي پارامتري قرار مي گيرد.
روش هاي بهسازي گفتار بر پايه تعداد کانال (میکروفون) ورودي نيز قابل تقسيم بندي مي باشد؛ بر اين اساس، دو خا نواده تك كاناله و چندكاناله براي گروه بندي روش هاي مختلف متصور مي باشد . در روش هاي يك كاناله، تنها يك ميكروفون ورودي در دسترس بوده و اندازه گيري مشخصات نويز مي بايد در بخش هاي غير گفتار (سکوت) همان كانال صورت بگيرد . اساس كار اين خانواده از روش ها، مبتني بر فرض ايستان بودن موضعي نويز مي باشد. در روش هاي چندكاناله، دو يا چند گيرنده در ورودي سيستم بهسازي گفتار مورد استفاده واقع مي شود. افزايش تعداد ميكروفون ها و يا كانال هاي ورودي , قدرت روش را در پاكسازي سيگنال نويزي بالا مي برد، ولي در مقابل بر هزينه و پيچيدگی پياده سازی سيستم نيز افزوده می گردد. روش دوکاناله فيلتر وفقی به عنوان متداول ترين عضو از اين خانواده روش ها مطرح می باشد. در اين روش، يكي از دو ورودي, نويز مرجع و ديگري سيگنال نويزي است.
در اين فصل، بر اساس يک يا چندکاناله بودن به طبقه بندی و معرفی روش های بهسازی گفتار می پردازيم. از خانواده روش های تک کاناله، پنج مورد زير را مورد مطالعه اجمالي قرار مي دهيم:
- روش تفریق طیفی
- روش فیلتر وینر
- بهسازی با استفاده ار مدل های آماری
- روش زیر فضای سیگنال
- بهسازی گفتار با استفاده از تبدیل موجک
از دسته روش های چند کاناله نیز روش فیلتر وفقی را به عنوان عضو اساسی و پر کاربرد این خانواده معرفی خواهیم کرد.
در این پروژه پس از معرفی مختصر روش ها به بیان کامل روش تفریق طیفی پرداخته و بهسازی گفتار و پیاده سازی های خود را بر مبنای این روش انجام می دهیم.
حذف نویز فایل صوتی به روش تفریق طیفی با متلب توسط کارشناسان گروه ۱.۲.۳ پروژه پیاده سازی گردیده و به تعداد محدودی قابل فروش می باشد.فایلهای پروژه به صورت کامل پس از خرید فایل بلافاصله در اختیار شما قرار خواهد گرفت.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.