طبقه بندی داده های نامتعادل با ترکیب منحنی اصلی و smote بهبود یافته درجه پشتیبان

کمال پور, ریحانه; قاضی خانی, عادل

رقم المقالة : 543380 زيارة : 277 الصفحة: 42 - 54

نوع المخطوط: ابحاث

طبقه بندی داده های نامتعادل با ترکیب منحنی اصلی و smote بهبود یافته درجه پشتیبان

الموضوعات : مجله فناوری اطلاعات در طراحی مهندسی

1 - گروه مهندسی کامپیوتر، دانشگاه بین المللی امام رضا (ع)، مشهد، ایران
2 - گروه مهندسی کامپیوتر، دانشگاه بین المللی امام رضا (ع)، مشهد، ایران

تاريخ الإرسال : 21 الإثنين , محرم, 1440 تاريخ التأكيد : 21 الإثنين , محرم, 1440 تاريخ الإصدار : 04 الثلاثاء , جمادى الثانية, 1439

الکلمات المفتاحية: طبقه بندی, داده های نامتعادل, نمونه افزایی, منحنی اصلی, حد آستانه عضویت,

ملخص المقالة :

مسئله طبقهبندی دادههای نامتعادل بهعنوان یکی از چالشهای اصلی در حوزه دادهکاوی است. در مجموعه دادههای نامتعادل، تعدادنمونهها در کلاسهای گوناگون اختلاف بسیاری دارند. در دادههای نامتعادل هدف اصلی شناسایی صحیح نمونههای کلاس اقلیت است.بهعنوان مثال در حوزهیپزشکی، تعداد نمونههای مثبت از یک بیماری در مقابل تعداد نمونههای منفی بسیار کمتر است. در حالیکهبرای این مسئله ارائه ،SdCurveSmote اهمیت شناسایی نمونههای مربوط به دسته مثبت، بسیار زیاد است. در این مقاله الگوریتمی بانامشده است. این الگوریتم شامل سه بخش کلی است بخش اول محاسبه پارامتری بنام درجه پشتیبانی برای انتخاب نمونههای مناسببر روی این نمونههای مناسب با درجه پشتیبان بالا و تولید نمونه جدید است Smote و بخش دوم انجام عمل Smote مرزی برای عملو در بخش آخر محاسبات منحنی اصلی وحدآستانه و بررسی نمونههای تولید شده میباشد. در این مقاله از 5 مجموعه داده نامتعادل،استفاده شده است که میزان عدم تعادل متفاوت دارند. الگوریتم پیشنهادی نسبت به الگوریتمهای مشابه، KEEL و UCI برگرفته از سایتنشان میدهد که در آن تفاوت معنادار بسیار مطلوبی بین Adaboost با آزمون فریدمن نتایج بهتری داشت در این آزمون برای طبقه بندوجود دارد. SdSmote و Smote روش پیشنهادی و روشهای

المصادر:

شارک

عنوان URL للمقالة

طبقه بندی داده های نامتعادل با ترکیب منحنی اصلی و smote بهبود یافته درجه پشتیبان

سند

الروابط

المراكز ذات الصلة

دعامة

الصفحات الرسمية