کاهش بعد داده ها ضمن حفظ خوشه های داده
الموضوعات : مجله فناوری اطلاعات در طراحی مهندسیمحبوبه حقایقی پور 1 , یحیی فرقانی 2 , محمدحسین معطر 3
1 - گروه مهندسی کامپیوتر، واحد مشهد، دانشگاه آزاد اسلامی، مشهد، ایران
2 - گروه مهندسی کامپیوتر، واحد مشهد، دانشگاه آزاد اسلامی، مشهد، ایران
3 - گروه مهندسی کامپیوتر، واحد مشهد، دانشگاه آزاد اسلامی، مشهد، ایران
الکلمات المفتاحية: خوشه بندی, کاهش ویژگی, K-means وزن دار,
ملخص المقالة :
در این مقاله، با توجه به موفقیت روش های خوشه بندی مبتنی بر k-means، یک روش کاهش ویژگی بر پایه k-means وزن دار ارائه می شود. در روش پیشنهادی، نخست با استفاده از روش k-means وزن دار، به ویژگی های داده ها وزن داده می شود. ویژگی های وزین تر ضرورتا ویژگی های مهمتر نیستند و وزن هر ویژگی، تنها بازه هر ویژگی را به نحوی تغییر می دهد که خوشه بندی بهتری صورت بگیرد. لذا، سپس با استفاده از یک مدل ریاضی جدید، کسری از ویژگی های وزندار شده داده های هر خوشه انتخاب می شود به نحوی که کمترین تغییر در خوشه ها حاصل شود. تعداد ویژگی های منتخب هر خوشه در روش پیشنهادی، برخلاف روش های مشابهی چون k-means تنک و fuzzy c-means تنک بصورت صریح تعیین می شود. درضمن، آزمایش های تجربی روی چهار مجموعه داده واقعی نشان می دهد که روش پیشنهادی، از دقت بیشتری نسبت به روش های L1PCA, LLE و روش K-means تُنُک برخوردار است.