کدگذاری سیگنال صحبت تحت محیط‌های نویزی مبتنی بر مدل سیستم شنوایی انسان

ابطحی, سید ایمان; عشوری, محمد رضا; امیرفتاحی, رسول

کد مقاله : 550700 بازدید : 347 صفحه: 3 - 10

20.1001.1.23223871.1391.3.9.1.0

نوع مقاله: پژوهشی

کدگذاری سیگنال صحبت تحت محیط‌های نویزی مبتنی بر مدل سیستم شنوایی انسان

محورهای موضوعی : انرژی های تجدیدپذیر

سید ایمان ابطحی ^{1
*} , محمد رضا عشوری ² , رسول امیرفتاحی ³

1 - مربی/دانشگاه آزاد اسلامی واحد میمه
2 - استادیار/دانشگاه صنعتی اصفهان
3 - دانشیار/دانشگاه صنعتی اصفهان

تاریخ دریافت : 1390/02/25 تاریخ پذیرش : 1391/01/23 تاریخ انتشار : 1391/03/12

کلید واژه: آزمون‌های استاندارد کمی و کیفی, بانک فیلتر گاماتن مختلط, کدینگ بدون تلفات, مدل طبیعی حلزونی گوش, ویژگی‌های درک شنوایی,

چکیده مقاله :

در این مقاله یک سیستم آنالیز/ سنتز، بر اساس مدل طبیعی حلزونی گوش و ویژگی‌های درک شنوایی انسان ارائه شده که قادر به کد کردن سیگنال گفتار در شرایط دشوار آکوستیکی است. بدین منظور، سیگنال نویزی توسط یک بانک فیلترگاماتن مختلط به تعدادی زیرباند شنوایی تجزیه شده و سیگنالِ هر زیرباند به طور مستقل و وفقی، از جهت حذف نویز پردازش می‌شود. استخراج پارامترها و فشرده‌سازی نیز از طریق ماسک گذاری کوتاه مدت، یک روش کوانتیزاسیون غیریکنواخت جدید و الگوریتم‌های کدینگ بدون تلفات صورت می‌گیرد. ارزیابی کیفیت از طریق آزمون‌های استاندارد کمی و کیفی، نشان می‌دهد که علیرغم کاهش قابل توجه نرخ بیت تا حدودKbps 14.6، کیفیت سیگنال‌های سنتزشده بهبود معناداری یافته، و عملکرد سیستم در برابر انواع نویزهای سفید، رنگی و پریودیک، باثبات و مؤثر است. همچنین کیفیت سیگنال‌های خروجی در مقایسه با نتایج چند نمونه کدینگ استاندارد، قابل رقابت ارزیابی شده است.

چکیده انگلیسی:

In this paper, an analysis/synthesis system based on the natural Cochlear model and the human auditory perception properties is presented that is capable of coding the speech signal under harsh acoustic conditions. For this purpose, the corrupted signal is decomposed into a number of sub-bands using complex Gammatone filter bank, and the sub-band signals are individually and adaptively denoised. Temporal masking, a combination of a novel non-uniform quantization method and lossless coding algorithms are then applied to reduce the number of coefficients and compression. The proposed system is very robust and effective in dealing with different kinds of noises such as white, colored and periodic noises. Objective and Subjective quality measurements demonstrate significant improvement in the perceptual quality of synthesized speech while considerable reduction in bit-rate to approximately 14.6 Kbps is achieved.

منابع و مأخذ:
_||_

مقالات مرتبط

طبقه بندی ضایعه های پوستی از روی تصاویر درموسکپی با استفاده از ویژگی های رنگ و شکل
تاریخ چاپ : 1396/02/01
طراحی همزمان پارامترهای PSS و SVC با استفاده از روش کوانتوم بهبود یافته جهت ارتقای پایداری سیستم قدرت چند ماشینه
تاریخ چاپ : 1396/08/15
کاربرد مبدل ماتریسی منبع امپدانسی سه فاز به تک فاز در توربین‌های بادی
تاریخ چاپ : 1395/11/01
مروری بر روش‌های کاهش توان در تقویت‌کننده‌های عصبی
تاریخ چاپ : 1395/07/10
ارائه یک مبدل dc-dc جدید بدون ترانسفورماتور با ضریب بهره بهبود یافته و تنش ولتاژ کم در دو سر کلید
تاریخ چاپ : 1395/07/10
صرفه‌جویی در مصرف انرژی با جایگزینی به‌موقع موتور القایی سه فاز به کمک تخمین دقیق بازده آن توسط الگوریتم‌ زنبورعسل اصلاح‌شده
تاریخ چاپ : 1396/05/15

اشتراک گذاری

آدرس مقاله

کدگذاری سیگنال صحبت تحت محیط‌های نویزی مبتنی بر مدل سیستم شنوایی انسان