• فهرست مقالات K-Nearest Neighbors

      • دسترسی آزاد مقاله

        1 - A Novel Hybrid Approach for Email Spam Detection based on Scatter Search Algorithm and K-Nearest Neighbors
        Samira Amjad Farhad Soleimanian Gharehchopogh
        Because cyberspace and Internet predominate in the life of users, in addition to business opportunities and time reductions, threats like information theft, penetration into systems, etc. are included in the field of hardware and software. Security is the top priority t چکیده کامل
        Because cyberspace and Internet predominate in the life of users, in addition to business opportunities and time reductions, threats like information theft, penetration into systems, etc. are included in the field of hardware and software. Security is the top priority to prevent a cyber-attack that users should initially be detecting the type of attacks because virtual environments are not monitored. Today, email is the foundation of many internet attacks that have happened. The Hackers and penetrators are using email spam as a way to penetrate into computer systems junk. Email can contain viruses, malware, and malicious code. Therefore, the type of email should be detected by security tools and avoid opening suspicious emails. In this paper, a new model has been proposed based on the hybrid of Scatter Searching Algorithm (SSA) and K-Nearest Neighbors (KNN) to email spam detection. The Results of proposed model on Spambase dataset shows which our model has more accuracy with Feature Selection (FS) and in the best case, its percentage of accuracy is equal to 94.54% with 500 iterations and 57 features. Also, the comparison shows that the proposed model has better accuracy compared to the evolutionary algorithm (data mining and decision detection such as C4.5). پرونده مقاله
      • دسترسی آزاد مقاله

        2 - مقایسه عملکرد مدل‌های داده‌کاوی در پیش‌بینی بارش باران با استفاده از رویکرد دسته‌بندی (مطالعه موردی: ایستگاه هواشناسی سینوپتیک فرودگاه همدان)
        مرتضی صالحی سربیژن حمید رضا دزفولیان
        زمینه و هدف: بارندگی یکی از پدیده‌های پیچیده طبیعی و از مهم‌ترین اجزای چرخه آب بوده و در سنجش خصوصیات اقلیمی هر منطقه نقش بسیار مهمی ایفا می‌کند. شناخت میزان و روند تغییرات بارش به‌عنوان یکی از عناصر مهم هواشناسی، از یک‌سو جهت داشتن مدیریت اثربخش و برنامه‌ریزی دقیق‌تر ب چکیده کامل
        زمینه و هدف: بارندگی یکی از پدیده‌های پیچیده طبیعی و از مهم‌ترین اجزای چرخه آب بوده و در سنجش خصوصیات اقلیمی هر منطقه نقش بسیار مهمی ایفا می‌کند. شناخت میزان و روند تغییرات بارش به‌عنوان یکی از عناصر مهم هواشناسی، از یک‌سو جهت داشتن مدیریت اثربخش و برنامه‌ریزی دقیق‌تر برای بخش‌های کشاورزی، اقتصادی و اجتماعی و از سوی دیگر برای مطالعاتی مانند رواناب‌ها، خشک‌سالی‌ها، وضعیت آب‌های زیرزمینی و سیلاب‌ها ضروری است. همچنین پیش‌بینی بارش در مناطق شهری تأثیر بسیار زیادی بر کنترل ترافیک، جریان فاضلاب‌ها و فعالیت‌های ساخت‌وساز دارد. روش پژوهش: هدف این مطالعه مقایسه دقت مدل‌های کلاس‌بندی درخت تصمیم (چاید (CHAID)، درخت تصمیم C5، نیو بیزین (NB)، کوئست (Quest) و جنگل تصادفی)، k نزدیک‌ترین همسایگی (KNN)، ماشین بردار پشتیبان (SVM) و شبکه عصبی مصنوعی (ANN) جهت پیش‌بینی وقوع بارش باران با استفاده از داده‌های یک دوره 50 ساله در ایستگاه سینوپتیک فرودگاه همدان است. در این مطالعه از 80 درصد داده‌ها جهت آموزش و از 20 درصد داده‌ها جهت صحت سنجی مدل‌ها استفاده‌شده و نتایج حاصل از اجرای مدل‌ها با استفاده از معیارهای ماتریس درهم‌ریختگی (اغتشاش)، منحنی ROC و شاخص AUC مقایسه شدند. برای ساخت متغیر کلاس‌بندی داده‌های بارش و عدم بارش، با توجه به داده‌های بارش، روزهای سال در دو کلاس روزهای وقوع بارش (y) و روزهای عدم وقوع بارش (n) دسته‌بندی شدند. در این تحقیق پیش‌پردازش داده‌ها با استفاده از پیش‌پردازش خودکار داده‌ها (ADP) انجام شده و آنگاه کاهش ابعاد متغیرها از روش PCA استفاده شد. یافته‌ها: در این مطالعه با توجه به روش PCA ابعاد متغیرها به 5 بعد کاهش یافت. همچنین از داده‌های موجود تقریباً 80 درصد، روزها بدون بارش و 20 درصد روزها با بارش هستند. نتایج تحقیق نشان داد که مدل KNN با معیار صحت 9/91 برای داده‌های آموزشی و مدل SVM، 13/89 درصد برای داده‌های آزمون بهترین عملکرد را بین مدل‌های داده‌کاوی داشتند. شاخص AUC مدل KNN برابر 97/0 در داده‌های آموزشی و در داده‌های آزمون مقدار 94/0 برای الگوریتم SVM به دست آمد. همچنین با توجه به منحنی عملکرد سیستم (ROC) برای داده‌های بارش همدان مدل KNN نسبت به سایر مدل‌ها عملکرد بهتری را دارا می‌باشد. توجه به شاخص حساسیت در ماتریس اغتشاش، مدل‌های KNN و SVM در پیش‌بینی عدم وقوع بارش برای داده‌های آموزش بهتر عمل کردند. با توجه به شاخص خاصیت در پیش‌بینی وقوع بارش مدل‌های RT و KNN نتایج بهتری داشتند. نتایج: نتایج تحقیق نشان داد که در داده‌های آموزش مقدار معیار صحت برای مدل‌های RT، C5، ANN، SVM، BN،KNN ، CHAID و QUEST به ترتیب 82/86، 78/89، 55/89، 96/89، 06/88، 9/91، 29/88 و 46/87 بدست آمده اند. همچنین این معیار در داده‌های آزمون برای این مدل‌ها به ترتیب 2/83، 9/87، 12/88، 13/89، 12/87، 19/88، 93/86 و 76/86 به دست آمد. مقدار شاخص AUC در داده‌های آموزش برای مدل‌های RT، C5، ANN، SVM، BN،KNN ، CHAID و QUEST به ترتیب 94/0، 92/0، 94/0، 94/0، 93/0، 97/0، 93/0 و 89/0 به دست آمد. همچنین این معیار در داده‌های آزمون برای این مدل‌ها به ترتیب 89/0، 89/0، 93/0، 94/0، 92/0، 90/0، 92/0 و 88/0 برآورد شد. همان‌طور که مشاهده شد، با توجه به معیارهای صحت و شاخص AUC در داده‌های آموزش مدل KNN و با توجه به داده‌های آزمون مدل SVM کارا تر در پیش‌بینی بارش باران بودند. پرونده مقاله
      • دسترسی آزاد مقاله

        3 - پیش بینی کمیت پسماند شهری با استفاده از مدل‌های هوشمند و آنالیز عدم قطعیت آن ها
        مریم عباسی ملیحه فلاح نژاد روح الله نوری مریم میرابی
        زمینه و هدف: اولین قدم برای طراحی سیستم‌های مدیریت پسماند شهری، آگاهی کامل از کمیت پسماند تولیدی می باشد. پیش‌بینی کمیت تولید پسماند به دلیل تاثیر عوامل متنوع و خارج از کنترل، یکی از پیچیده‌ترین مسایل مهندسی می‌باشد. به همین خاطر، لزوم استفاده از مدل‌هایی که قابلیت مدل‌ چکیده کامل
        زمینه و هدف: اولین قدم برای طراحی سیستم‌های مدیریت پسماند شهری، آگاهی کامل از کمیت پسماند تولیدی می باشد. پیش‌بینی کمیت تولید پسماند به دلیل تاثیر عوامل متنوع و خارج از کنترل، یکی از پیچیده‌ترین مسایل مهندسی می‌باشد. به همین خاطر، لزوم استفاده از مدل‌هایی که قابلیت مدل‌سازی پدیده‌های پیچیده را دارند، به خوبی روشن می‌باشد. هدف از این مطالعه، پیش بینی کمیت پسماند با استفاده از مدل های هوشمند، مقایسه عملکرد و آنالیز عدم قطعیت آن ها می باشدروش بررسی: در این مطالعه، شهر مشهد به عنوان مطالعه موردی انتخاب شد و از سری زمانی تولید پسماند در فاصله زمانی سال‌های 1380 تا 1390 برای پیش‌بینی هفتگی استفاده گردید. جهت مدل سازی از مدل های هوشمند شبکه عصبی، ماشین بردار پشتیبان، سیستم استنتاجی تطبیقی نروفازی و کا نزدیک ترین همسایه استفاده گردید. پس از بهینه سازی پارامترهای هر مدل، با استفاده از از شاخص های آماری، عملکرد مدل ها مورد مقایسه قرار گرفت. در نهایت، آنالیز عدم قطعیت نتایج مدل سازی با کمک روش مونت کارلو انجام گرفت.یافته ها: نتایج نشان داد که ضریب اطمینان (2R) مدل‌های شبکه عصبی، سیستم استنتاجی تطبیقی نروفازی، ماشین بردار پشتیبان و کا نزدیک‍ترین همسایه به ترتیب 67/0، 69/0، 72/0 و 64/0 می باشد. آنالیز عدم قطعیت نیز نتایج این مقایسه را تایید نمود و نشان داد مدل ماشین بردار پشتیبان در بین سایر مدل‌ها، عدم قطعیت کم‍تری داشته و نسبت به داده‌های ورودی کم‍ترین حساسیت را دارد.بحث و نتیجه گیری: مدل‌های هوشمند از توانایی رضایت‌بخشی برای پیش بینی کمی پسماند برخوردارند و در بین مدل‌های هوشمند مورد  مطالعه، مدل ماشین بردار پشتیبان بهترین نتایج را از خود نشان داد. همچنین، عدم قطعیت نتایج مدل ماشین بردار پشتیبان در بین سایر مدل‌ها، عدم قطعیت کم تری برخوردار بود. پرونده مقاله