پیادهسازی سیستمهای ترکیبی حذف انعکاس از گفتار و ارائه دادگان دوکاناله گفتار فارسی برای سنجش کارآیی آنها
محورهای موضوعی : سیستمهای ترکیبیفرهاد فغانی 1 , حمید رضا ابوطالبی 2
1 - استادیار/دانشگاه آزاد اسلامی واحد نجف آباد
2 - دانشیار/دانشگاه یزد
کلید واژه: بهبود قابلیت فهم, حذف انعکاس, بهسازی سیگنال آغشته به انعکاس, دادگان گفتارفارسی, آزمون DRT,
چکیده مقاله :
در این مقاله جوانب مختلف مسأله حذف انعکاس از سیگنال گفتارفارسی بررسی میشود. به عنوان مصالحهای بین میزان بهسازی گفتار از یکسو و پیچیدگی و بار محاسباتی روش از سوی دیگر، تعداد دو میکروفون در سیستم در نظر گرفته شده است. به منظور امکان سنجش و مقایسه کارآیی سیستمهای مورد نظر، ابتدا مجموعه لغات فارسی برای آزمون قابلیت فهم گفتار تهیه و سپس با استفاده از آن، دادگان دو کاناله گفتار فارسیِ دارای انعکاس طراحی و ضبط گردید. در این تحقیق، روشهای پایه (تککاناله و دوکاناله) حذف انعکاس از گفتار مطالعه و پیاده سازی و با استفاده از دادگان تهیه شده مقایسه گردیدهاند. بر پایه این مطالعه، یک سری از روشهای ترکیبی که قابلیت فهم و کیفیت سیگنال گفتار آغشته به انعکاس را به نحو مطلوبی افزایش میدهد، ارائه شدهاست و نشان داده شده است که ترکیب سه روش delay-and-sum beamforing، فیلتر معکوس، و روش مبتنی بر خطای فاز نسبت به سایر سیستمهای ترکیبی از لحاظ میزان کیفیت و قابلیت فهم گفتار خروجی منجر به نتایج بهتری میشود.
In various applications, such as speech recognition and automatic teleconferencing, the recorded speech signals may be corrupted by both noise and reverberation. Reverberation causes a noticeable change in speech intelligibility and quality. In this research, firstly reverberation is described. There are some de-reverberation enhancement algorithms that use only one microphone. They mostly use inverse filtering and spectral subtraction as their sub-systems. On the other hand, there are many multi-microphone speech enhancement systems; Delay-and-sum beam former is the most famous amongst them. Moreover, several efficient approaches have been also reported that use linear prediction (LP) residual signal, inverse filtering, and phase error.Despite the improvements and benefits gained by the use of several input microphones, considering the tradeoff between these gains and the complexity and computational cost forced by the use of more microphones, many researchers have focused on dual-microphones systems. So, a review on Microphone array signal processing is explained and then an arrangement for two microphones systems is proposed.As we want to evaluate these algorithms for Farsi speech signals, the problem of speech intelligibility assessment has been explained and a Farsi word list for Diagnostic Rhyme Test (DRT) is presented.The structure of presented word list is similar to that of English DRT words. In this research, after a brief study of above-mentioned methods, we propose and implement some hybrid techniques to benefit from the advantages of several methods and achieve significant improvement in output signals. It will be shown that the proposed method performs superior to the state-of-the-art dereverberation algorithms.
_||_