یک الگوریتم انتخاب ویژگی در دادههای برخط چند برچسبی با استفاده از اطلاعات متقابل چندگانه
محورهای موضوعی : مجله فناوری اطلاعات در طراحی مهندسیمریم رحمانی نیا 1 * , سندس بهادری 2
1 - گروه مهندسی کامپیوتر، مرکز قصرشیرین، دانشگاه آزاد اسلامی، قصرشیرین، کرمانشاه، ایران
2 - گروه مهندسی کامپیوتر، واحد ایلام، دانشگاه آزاد اسلامی، ایلام، ایران
کلید واژه: انتخاب ویژگی, داده های چند برجسب, دادههای با جریان ویژگی, اطلاعات متقابل چند گانه,
چکیده مقاله :
در حال حاضر، با حجم بزرگی از دادههای آموزشی چندبرچسبی که در آن هر نمونه آموزشی دارای بیش از یک برچسب است، روبرو هستیم. یکی از مشکلات اصلی این نوع دادههای آموزشی، افزایش ناگهانی اندازه آنها است که به کارآیی الگوریتمهای دادهکاوی ضربه میزند. روشهای انتخاب ویژگی چندبرچسبی با انتخاب یک زیرمجموعه مهم از ویژگیهای اولیه ابعاد این دادهها را کاهش میدهند. از سوی دیگر، در دنیای امروز، دادهها به تدریج با گذر زمان به مجموعه اضافه میشوند. بنابراین، الگوریتمهای انتخاب ویژگی چندبرچسبی باید بتوانند به صورت آنلاین استفاده شوند. اگرچه اخیرا الگوریتمهای انتخاب ویژگی چندبرچسبی آنلاین متعددی ارائه شده است، اما هیچکدام به وابستگی بین برچسبها جهت تعیین ارتباط ویژگیها و برچسبها توجه نکردهاند. به همین منظور، در این مقاله، یک روش انتخاب ویژگی چندبرچسبی آنلاین ارائه شده است که با استفاده از اطلاعات متقابل چندگانه به فرآیند انتخاب ویژگیها میپردازد. همچنین، برای نمایش کارایی روش پیشنهادی، چند آزمایش بر روی چندین الگوریتم انتخاب ویژگی چندبرچسبی و چند داده آموزشی انجام شده است. نتایج به دست آمده نشان میدهد که روش پیشنهادی از نظر معیارهای مختلف به خوبی عمل میکند.
Currently, we are facing a large volume of multi-label training data, where each training instance has more than one label. One of the main challenges with this type of training data is the sudden increase in its size, which impacts the efficiency of data mining algorithms. Multi-label feature selection methods reduce the dimensions of this data by selecting a subset of important initial features. On the other hand, in today's world, data is gradually being added over time. Therefore, multi-label feature selection algorithms need to be used in an online fashion. Although several online multi-label feature selection algorithms have been proposed recently, none of them have considered the dependency between labels to determine the relationship between features and labels.To address this issue, this paper presents an online multi-label feature selection method that incorporates multiple mutual information measures into the feature selection process. Additionally, several experiments have been conducted on multiple multi-label feature selection algorithms and datasets to demonstrate the effectiveness of the proposed method. The results obtained indicate that the proposed method performs well in terms of various evaluation metrics.