یک رویکرد جدید مبتنی بر تحلیل پوششی دادهها با مرز دوگانه برای رتبهبندی قواعد کشف شده از دادهکاوی
محورهای موضوعی : آمار
1 - استادیار، گروه ریاضی، واحد پارسآباد مغان، دانشگاه آزاد اسلامی، پارسآباد مغان، ایران.
کلید واژه: data mining, overall performance, Data Envelopment Analysis, optimistic and pessimistic efficiencies,
چکیده مقاله :
تحلیل پوششی دادهها (DEA) یک رویکرد نسبتاً جدید با ماهیت دادهای برای ارزیابی عملکرد مجموعهای از موجودیتهای همتا به نام واحدهای تصمیمگیری (DMUها) است که چندین ورودی را به چندین خروجی تبدیل میکنند. DEA در دورهی زمانی نسبتاً محدودی تبدیل به ابزار کمّی و تحلیلی قدرتمندی برای اندازهگیری و ارزیابی عملکرد شده است. در مقالهای به قلم طلوع و همکاران [5]، آنها یک مدل DEAی جدید برای پیدا کردن کارآترین قاعدهی ارتباطی در دادهکاوی پیشنهاد کردند. آنگاه، با استفاده از این مدل، آلگوریتمی برای رتبهبندی قواعد ارتباطی با در نظر گرفتن معیارهای متعدد ایجاد کردند. در این مقاله، ما نشان میدهیم که مدل آنها تنها یک قاعدهی ارتباطی کارآی خوشبینانه را به طور شانسی انتخاب میکند و کاملاً وابسته به روش حل یا برنامهی نرمافزاری است که برای حل مسئله استفاده میشود. به علاوه، نشان داده میشود که آلگوریتم پیشنهادی آنها تنها میتواند قواعد کارآی خوشبینانه را به طور تصادفی رتبهبندی کند، و قادر به رتبهبندی DMUهای غیرکارآی خوشبینانه نیست. همچنین، به معایب دیگری در این مقاله، اشاره میکنیم و رویکرد جدید «DEA با مرز دوگانه» را برای ایجاد یک رتبهبندی کامل قواعد ارتباطی پیشنهاد میکنیم. یک مثال عددی برخی از محتویات مقاله را توضیح خواهد داد.
Data envelopment analysis (DEA) is a relatively new data oriented approach to evaluate performance of a set of peer entities called decision-making units (DMUs) that convert multiple inputs into multiple outputs. Within a relative limited period, DEA has been converted into a strong quantitative and analytical tool to measure and evaluate performance. In an article written by Toloo et al. (2009), they proposed a new DEA model to find the most efficient association rule in data mining. Considering several criteria, they created an algorithm for ranking association rules using this model. In the present article, we show that their model only selects an optimistic efficient association rule randomly and it is completely dependent on solution or software, which is used for solving problems. In addition, it shows that their proposed algorithm can only rank optimistic efficient rules randomly and it is not able to rank optimistic non-efficient DMUs. We mention other disadvantages and propose a new approach “DEA with double frontiers” to create a complete ranking of association rules. A numerical example will explain some contents of the paper.