تشخیص حالت احساسی از سیگنال گفتار در حالت مستقل از گوینده با استفاده از آنتروپی بسته موجک
الموضوعات : Signal and systems processing
مینا کدخدایی الیادرانی
1
,
حمید محمودیان
2
,
غزال شیخی
3
1 - گروه برق، موسسه آموزش عالی بنیان، شاهین شهر، اصفهان، ایران
2 - دانشکده برق، واحد نجف آباد، دانشگاه آزاد اسلامی
3 - دانشجوی دکتری- دانشکده مهندسی کامپیوتر، دانشگاه مدیترانه شرقی، ترکیه
الکلمات المفتاحية: ماشین بردار پشتیبان, تشخیص احساسات از گفتار, بسته موجک, ضرایب آنتروپی شانون,
ملخص المقالة :
در این مقاله آنتروپی بسته موجک برای بازشناسی احساسات از گفتار در حالت مستقل از گوینده پیشنهاد شده است. پس از پیشپردازش، بسته موجکِ db3 سطح 4 در هر فریم محاسبه شده است و آنتروپی شانون در گرههای آن به عنوان ویژگی در نظر گرفته شده است. ضمناً ویژگیهای نواییِ گفتار شامل فرکانس چهار فرمنت اول، جیتر یا دامنه تغییرات فرکانس گام و شیمر یا دامنه تغییرات انرژی به عنوان ویژگیهای پرکاربرد در حوزه تشخیص احساسات در کنار ضرایب فرکانسی کپسترال مل (MFCC) برای تکمیل بردار ویژگی مورد استفاده قرار گرفتهاند. طبقهبندی با استفاده از ماشین بردار پشتیبان (SVM) انجام شده است و ترکیبهای مختلفی از بردار ویژگی در حالت چند دستهای برای همه احساسات و دودستهای نسبت به حالت طبیعی مورد بررسی قرار گرفتهاند. 46 بیانِ مختلف از جمله واحد در دادگان احساسی دانشگاه برلین به زبان آلمانی انتخاب شده که توسط 10 گوینده مختلف با حالتهای احساسی ناراحتی، خوشحالی، ترس، ملالت، خشم و حالت طبیعی بیان شدهاند. نتایج نشان میدهند استفاده از ضرایب آنتروپی به عنوان بردار ویژگی نرخ بازشناسی را در حالت چند دستهای بهبود میبخشد. علاوه بر آن ویژگیهای پیشنهادی در ترکیب با سایر ویژگیها باعث بهبود نرخ تشخیص احساس خشم، ترس و خوشحالی نسبت به حالت طبیعی میشوند.
