بهبود عملکرد دستهبند k نزدیکترین همسایه با الگوریتم بهینهسازی ازدحام گربهها برای تشخیص ایمیلهای هرزنامه
محورهای موضوعی : مجله فناوری اطلاعات در طراحی مهندسیمهدی درستی 1 , فرهاد سلیمانیان قره چپق 2
1 -
2 -
کلید واژه: طبقهبندی, شخیص ایمیل هرزنامه, k نزدیکترین همسایه, الگوریتم بهینهسازی اجتماع گربه,
چکیده مقاله :
با گسترش اینترنت و شبکههای آنلاین و پیوستن کاربران به این شبکهها باعث شده است که هر تبلیغی بر روی آنها انجام شود و نظر کاربران را با روشهای گوناگون جلب کنند. مهمترین روشی که از آن بهعنوان روشی برای تبلیغ استفاده میشود، ایمیل است. کاربران از طریق هرز نامهنویسها با انبوهی از ایمیل هرزنامهها مواجه هستند و زمان و حافظه آنها با این ایمیلها مختل میشود. یک مشکل دیگر در ایمیل هرزنامه این است که برخی از هرز نامهنویسها از ایمیل هرزنامه بهمنظور اهداف امنیتی و دزدی هویتی استفاده میکنند و با این روش وارد کامپیوتر کاربر و حسابهای شخصی کاربر میشوند. لذا چالش اصلی در تشخیص ایمیل هرزنامه، تفکیک ایمیلهای هرزنامه از غیر هرزنامه است. برای حل این مشکل باید ویژگیهای ایمیل مانند عنوان، متن و کاراکترها تشخیص داده شود. در این مقاله مدل ترکیبی برمبنای k نزدیکترین همسایه و الگوریتم بهینهسازی اجتماع گربه برای تشخیص ایمیل هرزنامه استفادهشده است. از الگوریتم بهینهسازی اجتماع گربه برای انتخاب ویژگی و جستجو در فضای بردارهای ویژگی و از k نزدیکترین همسایه برای طبقهبندی دادهها استفادهشده است. نتایج ارزیابی بر روی مجموعه داده Spambase نشان داده که دقت تشخیص مدل پیشنهادی برمبنای 20 بار تکرار برابر با 97.61 درصد میباشد.