بازشناسی حالات ایستای دست با مدل مارکف مخفی بر اساس ویژگی شیب انحنای کانتور پیرامونی
محورهای موضوعی : انرژی های تجدیدپذیرنسیبه علیجانپورشلمانی 1 , حسین ابراهیم نژاد 2 , افشین ابراهیمی 3
1 - کارشناس ارشد/دانشگاه صنعتی سهند
2 - استادیار/دانشگاه صنعتی سهند تبریز
3 - استادیار/دانشگاه صنعتی سهند تبریز
کلید واژه: استخراج ویژگی, منحنی Bspline, مدل مخفی مارکف, بازشناسی دست,
چکیده مقاله :
امروزه ارتباط انسان با رایانه از طریق صفحه کلید، ماوس و ... امکانپذیر میباشد. این گونه وسایل با محدودیتهایی از جمله سرعت عملکرد مواجه هستند. هدف نهایی دنیای فنآوری این است که تعامل بین انسان با کامپیوتر مانند تعامل بین انسانها با هم، طبیعی و آسان باشد. در این مقاله روشی برای بازشناسی حالات دست مبتنی بر ویژگی شیب انحنای منحنی Bspline دست ارائه میگردد. بدین ترتیب که ابتدا تصویر دست در فریمهای مختلف استخراج شده و تعدادی نقطه روی کانتور پیرامونی دست به صورت متساوی الفاصله انتخاب میشود. سپس، منحنی Bspline مرتبه 3 برای دستههای 4 تایی از این نقاط محاسبه میگردد. در ادامه شیب انحنا برای منحنیهای Bspline محاسبه و به عنوان بردار ویژگی برای طبقه بندی به مدل مخفی مارکف داده میشود. روش پیشنهادی با توجه به استفاده از ویژگی شیب انحنا، نسبت به چرخش، انتقال و تغییر اندازه حساس نمیباشد. نتایج آزمایش روی 15 مجموعه از دنبالههای ویدیویی با تعداد فریمهای متوسط 150 فریم، نرخ بازشناسی %92/21 را به دست میدهد.
Today, the connection between human and computer is possible using mouse, keyboard and etc. These devices have some limitations like application speed. Making easy the interaction between human and computer is final objective of technology. In this paper, we propose one method for gesture recognition using curvature of B-Spline curves. First, the image of hand is extracted from different frames and some numbers of points are selected on the contour of hand in equal distances. Then, B-spline curves for groups of 4 points are calculated. Next, the slope of curvature for B-spline curves is calculated and used as feature vector of HMM classifier. The proposed method is inariant to rotation, movement and size of image because of using the slope of curvature. The results on 15 video sequences (with 150 frames in average) give recognition rate of 92.21%.
_||_