پارتیشن بندی زمانی گراف برای خوشه بندی در سیستم های برچسب دار
محورهای موضوعی : مجله فناوری اطلاعات در طراحی مهندسیعلی اکبر اله داغی 1 , مهرداد جلالی 2 , سید جواد سید مهدوی چابک 3
1 - دانشگاه آزاد اسلامی، واحد مشهد، گروه کامپیوتر، مشهد، ایران
2 - دانشگاه آزاد اسلامی، مشهد
3 - گروه کامپیوتر
کلید واژه: Clustering, خوشه بندی, Folksonomy, برچسب, Temporal, Graph Partitioning, Temporal, Graph Partitioning, Folksonomy, Tags,
چکیده مقاله :
در عصر حاضر رشد اطلاعات در دنیای وب 2.0 به حدی بوده است که به علت حجم وسیع داده ها و اطلاعات و همچنین تغییر برخی مفاهیم در طی گذر زمان، اطلاعات غیرضروری و غیر مرتبط بسیاری با آنچه کاربران به دنبال آن هستند، به وجود آمده است.در این مقاله ما برای حل این مشکل، خوشه بندی زمانی برچسب ها در سیستمهایی که از برچسب بهعنوان یک متاداده استفاده کردهو در طی زمان در حال تغییر می باشند را پیشنهاد می دهیم. این عمل از طریقپارتیشنبندی زمانی گراف برچسب هاست، بهطوریکه با تغییر دادن وزن های مشابهت برچسب ها در طی زمان، خوشه بندی ما هم دچار تغییر شده و خودش را با تغییرات وفق می دهد. برای نشان دادن کارایی این روش، ما آن را بر روی مجموعه داده سایت متافیلتر اجرا کرده و با روش های مشابه مقایسه کردیم. نتایج نشاندهنده این مطلب است که روش پیشنهادی ما،F-Measureمیانگین خوشه ها را 24% نسبت به بهترین روش مشابه در طول زمان، بهبود بخشیده است و ازنظر مفهومی، هم با مفاهیم گذشته وهم با مطالب روز در ارتباط است.
Today, information growth in the world of Web 2.0, due to the vast amount of data and change of some concepts over time, there is a lot of unnecessary and irrelevant information to what users are looking for. In this paper, we for solve this problem, propose temporal clustering of tags for systems that use tags as a metadata and are changing over time. The way we use for clustering, is temporal graph partitioning tags by changing the tag similarity weights during the time, then clustering will change and adapt itself with the changes. To demonstrate the effectiveness of this approach, we implemented it on a data set of MetaFilter site and compared it with similar methods. The results show that our proposed methods improved F-Measure out 24% compared to best clusters in the same way, over time, has improved and its concept is associated both with the past concepts and the newsletter.
_||_