خوشهبندی با الگوریتم k- میانگین لاینکس هوشمند
محورهای موضوعی : آمارنرگس احمدزادهگلی 1 , محمدحسن بهزادی 2 , عادل محمدپور 3
1 - گروه آمار، دانشگاه آزاد اسلامی واحد علوم و تحقیقات، تهران، ایران
2 - گروه آمار، دانشگاه آزاد اسلامی واحد علوم و تحقیقات، تهران، ایران (نویسنده مسئول).
3 - گروه آمار، دانشکده ریاضی و علوم کامپیوتر، دانشگاه صنعتی امیرکبیر، تهران، ایران
کلید واژه: intelligent K-means, Clustering, dissimilarity measure, LINEX loss function,
چکیده مقاله :
خوشهبندی k- میانگین لاینکس هوشمند یک تعمیم از خوشهبندی k- میانگین است که در آن تعداد خوشهها و مراکز مربوطه را میتوان مشخص کرد در حالی که تابع زیان لاینکس بهعنوان معیار عدمتشابه در نظر گرفته میشود. بنابراین انتخاب مراکز در هر خوشه تصادفی نیست. انتخاب معیار عدمتشابه لاینکس به پژوهشگر کمک میکند تا مراکز را در صورت نیاز بیش برآورد یا کم برآورد نماید که سبب میشود برخی مشاهدات به خوشهای خاص هدایت شوند. در این پژوهش، کارکرد الگوریتم یاد شده بر برخی پایگاه دادههای واقعی و شبیهسازی شده بررسی میشود و نتایج با توجه به برخی معیارهای درونی و بیرونی ارزیابی میشود.
The intelligent LINEX k-means clustering is a generalization of the k-means clustering so that the number of clusters and their related centroid can be determined while the LINEX loss function is considered as the dissimilarity measure. Therefore, the selection of the centers in each cluster is not randomly. Choosing the LINEX dissimilarity measure helps the researcher to overestimate or underestimate the centers which helps to assign some entities into a special cluster. We check the performance of the algorithm on some real and artificial datasets and evaluate the results according to some internal and external indexes.