جداسازی کور سیگنالهای گفتار فارسی در محیط کانولوتیو با استفاده از زاویه هرمیشن
محورهای موضوعی : پردازش سیگنال و سیستمعاطفه سلطانی 1 , سید حمید محمودیان 2 , علی هاشمی 3
1 - کارشناس ارشد/دانشگاه آزاد اسلامی واحد نجف آباد
2 - استادیار/دانشگاه آزاد اسلامی واحد نجف آباد
3 - استادیار/گروه مهندسی برق و کامپیوتر، دانشکده شهید مهاجر- دانشگاه فنی و حرفهای استان اصفهان- ایران
کلید واژه: جداسازی کور منابع, تنک بودن, تعامد نامتصل پنجره بندی شده, زاویه هرمیشن, ماسک زمان-فرکانس,
چکیده مقاله :
در این مقاله برای جداسازی کور منابع گفتار کانولوتیو، یک روش ماسک زمان- فرکانس بر اساس مفهوم زاویه هرمیشن ارائه شده است. زاویه هرمیشن بین بردار ترکیب (خروجی میکروفونها) و بردار مرجع محاسبه میشود. در این مقاله ابتدا دو بردار مرجع مختلف برای محاسبه دو زاویه هرمیشن متفاوت فرض شده، سپس این زوایا با استفاده از روشهای k-means و fuzzy-cmeans خوشهبندی میشود. مسئله جایگشت منابع، بر اساس خوشهبندیk-means ماسکهای تخمینی که به گروههای کوچک دسته بندی شدهاند حل میشود. نتایج شبیهسازی نشان میدهد عملکرد الگوریتم جداسازی با استفاده از دو بردار مرجع در مقایسه با یک بردار مرجع بهبود مییابد.
This paper presents a T-F masking method for convolutive blind source separation based on hermitian angle concept. The hermitian angle is calculated between T-F domain mixture vector and reference vector. Two different reference vectors are assumed for calculating two different hermitian angles, and then these angles are clustered with k-means or FCM method to estimate unmixing masks. The well-known permutation problem is solved based on k-means clustering of estimated masks which are partitioned to small groups. The experimental results show an improvement in performance when using two different reference vectors compared to only one.
_||_