-
دسترسی آزاد مقاله
1 - A Novel Hybrid Approach for Email Spam Detection based on Scatter Search Algorithm and K-Nearest Neighbors
Samira Amjad Farhad Soleimanian GharehchopoghBecause cyberspace and Internet predominate in the life of users, in addition to business opportunities and time reductions, threats like information theft, penetration into systems, etc. are included in the field of hardware and software. Security is the top priority t چکیده کاملBecause cyberspace and Internet predominate in the life of users, in addition to business opportunities and time reductions, threats like information theft, penetration into systems, etc. are included in the field of hardware and software. Security is the top priority to prevent a cyber-attack that users should initially be detecting the type of attacks because virtual environments are not monitored. Today, email is the foundation of many internet attacks that have happened. The Hackers and penetrators are using email spam as a way to penetrate into computer systems junk. Email can contain viruses, malware, and malicious code. Therefore, the type of email should be detected by security tools and avoid opening suspicious emails. In this paper, a new model has been proposed based on the hybrid of Scatter Searching Algorithm (SSA) and K-Nearest Neighbors (KNN) to email spam detection. The Results of proposed model on Spambase dataset shows which our model has more accuracy with Feature Selection (FS) and in the best case, its percentage of accuracy is equal to 94.54% with 500 iterations and 57 features. Also, the comparison shows that the proposed model has better accuracy compared to the evolutionary algorithm (data mining and decision detection such as C4.5). پرونده مقاله -
دسترسی آزاد مقاله
2 - مقایسه عملکرد مدلهای دادهکاوی در پیشبینی بارش باران با استفاده از رویکرد دستهبندی (مطالعه موردی: ایستگاه هواشناسی سینوپتیک فرودگاه همدان)
مرتضی صالحی سربیژن حمید رضا دزفولیانزمینه و هدف: بارندگی یکی از پدیدههای پیچیده طبیعی و از مهمترین اجزای چرخه آب بوده و در سنجش خصوصیات اقلیمی هر منطقه نقش بسیار مهمی ایفا میکند. شناخت میزان و روند تغییرات بارش بهعنوان یکی از عناصر مهم هواشناسی، از یکسو جهت داشتن مدیریت اثربخش و برنامهریزی دقیقتر ب چکیده کاملزمینه و هدف: بارندگی یکی از پدیدههای پیچیده طبیعی و از مهمترین اجزای چرخه آب بوده و در سنجش خصوصیات اقلیمی هر منطقه نقش بسیار مهمی ایفا میکند. شناخت میزان و روند تغییرات بارش بهعنوان یکی از عناصر مهم هواشناسی، از یکسو جهت داشتن مدیریت اثربخش و برنامهریزی دقیقتر برای بخشهای کشاورزی، اقتصادی و اجتماعی و از سوی دیگر برای مطالعاتی مانند روانابها، خشکسالیها، وضعیت آبهای زیرزمینی و سیلابها ضروری است. همچنین پیشبینی بارش در مناطق شهری تأثیر بسیار زیادی بر کنترل ترافیک، جریان فاضلابها و فعالیتهای ساختوساز دارد. روش پژوهش: هدف این مطالعه مقایسه دقت مدلهای کلاسبندی درخت تصمیم (چاید (CHAID)، درخت تصمیم C5، نیو بیزین (NB)، کوئست (Quest) و جنگل تصادفی)، k نزدیکترین همسایگی (KNN)، ماشین بردار پشتیبان (SVM) و شبکه عصبی مصنوعی (ANN) جهت پیشبینی وقوع بارش باران با استفاده از دادههای یک دوره 50 ساله در ایستگاه سینوپتیک فرودگاه همدان است. در این مطالعه از 80 درصد دادهها جهت آموزش و از 20 درصد دادهها جهت صحت سنجی مدلها استفادهشده و نتایج حاصل از اجرای مدلها با استفاده از معیارهای ماتریس درهمریختگی (اغتشاش)، منحنی ROC و شاخص AUC مقایسه شدند. برای ساخت متغیر کلاسبندی دادههای بارش و عدم بارش، با توجه به دادههای بارش، روزهای سال در دو کلاس روزهای وقوع بارش (y) و روزهای عدم وقوع بارش (n) دستهبندی شدند. در این تحقیق پیشپردازش دادهها با استفاده از پیشپردازش خودکار دادهها (ADP) انجام شده و آنگاه کاهش ابعاد متغیرها از روش PCA استفاده شد. یافتهها: در این مطالعه با توجه به روش PCA ابعاد متغیرها به 5 بعد کاهش یافت. همچنین از دادههای موجود تقریباً 80 درصد، روزها بدون بارش و 20 درصد روزها با بارش هستند. نتایج تحقیق نشان داد که مدل KNN با معیار صحت 9/91 برای دادههای آموزشی و مدل SVM، 13/89 درصد برای دادههای آزمون بهترین عملکرد را بین مدلهای دادهکاوی داشتند. شاخص AUC مدل KNN برابر 97/0 در دادههای آموزشی و در دادههای آزمون مقدار 94/0 برای الگوریتم SVM به دست آمد. همچنین با توجه به منحنی عملکرد سیستم (ROC) برای دادههای بارش همدان مدل KNN نسبت به سایر مدلها عملکرد بهتری را دارا میباشد. توجه به شاخص حساسیت در ماتریس اغتشاش، مدلهای KNN و SVM در پیشبینی عدم وقوع بارش برای دادههای آموزش بهتر عمل کردند. با توجه به شاخص خاصیت در پیشبینی وقوع بارش مدلهای RT و KNN نتایج بهتری داشتند. نتایج: نتایج تحقیق نشان داد که در دادههای آموزش مقدار معیار صحت برای مدلهای RT، C5، ANN، SVM، BN،KNN ، CHAID و QUEST به ترتیب 82/86، 78/89، 55/89، 96/89، 06/88، 9/91، 29/88 و 46/87 بدست آمده اند. همچنین این معیار در دادههای آزمون برای این مدلها به ترتیب 2/83، 9/87، 12/88، 13/89، 12/87، 19/88، 93/86 و 76/86 به دست آمد. مقدار شاخص AUC در دادههای آموزش برای مدلهای RT، C5، ANN، SVM، BN،KNN ، CHAID و QUEST به ترتیب 94/0، 92/0، 94/0، 94/0، 93/0، 97/0، 93/0 و 89/0 به دست آمد. همچنین این معیار در دادههای آزمون برای این مدلها به ترتیب 89/0، 89/0، 93/0، 94/0، 92/0، 90/0، 92/0 و 88/0 برآورد شد. همانطور که مشاهده شد، با توجه به معیارهای صحت و شاخص AUC در دادههای آموزش مدل KNN و با توجه به دادههای آزمون مدل SVM کارا تر در پیشبینی بارش باران بودند. پرونده مقاله -
دسترسی آزاد مقاله
3 - پیش بینی کمیت پسماند شهری با استفاده از مدلهای هوشمند و آنالیز عدم قطعیت آن ها
مریم عباسی ملیحه فلاح نژاد روح الله نوری مریم میرابیزمینه و هدف: اولین قدم برای طراحی سیستمهای مدیریت پسماند شهری، آگاهی کامل از کمیت پسماند تولیدی می باشد. پیشبینی کمیت تولید پسماند به دلیل تاثیر عوامل متنوع و خارج از کنترل، یکی از پیچیدهترین مسایل مهندسی میباشد. به همین خاطر، لزوم استفاده از مدلهایی که قابلیت مدل چکیده کاملزمینه و هدف: اولین قدم برای طراحی سیستمهای مدیریت پسماند شهری، آگاهی کامل از کمیت پسماند تولیدی می باشد. پیشبینی کمیت تولید پسماند به دلیل تاثیر عوامل متنوع و خارج از کنترل، یکی از پیچیدهترین مسایل مهندسی میباشد. به همین خاطر، لزوم استفاده از مدلهایی که قابلیت مدلسازی پدیدههای پیچیده را دارند، به خوبی روشن میباشد. هدف از این مطالعه، پیش بینی کمیت پسماند با استفاده از مدل های هوشمند، مقایسه عملکرد و آنالیز عدم قطعیت آن ها می باشدروش بررسی: در این مطالعه، شهر مشهد به عنوان مطالعه موردی انتخاب شد و از سری زمانی تولید پسماند در فاصله زمانی سالهای 1380 تا 1390 برای پیشبینی هفتگی استفاده گردید. جهت مدل سازی از مدل های هوشمند شبکه عصبی، ماشین بردار پشتیبان، سیستم استنتاجی تطبیقی نروفازی و کا نزدیک ترین همسایه استفاده گردید. پس از بهینه سازی پارامترهای هر مدل، با استفاده از از شاخص های آماری، عملکرد مدل ها مورد مقایسه قرار گرفت. در نهایت، آنالیز عدم قطعیت نتایج مدل سازی با کمک روش مونت کارلو انجام گرفت.یافته ها: نتایج نشان داد که ضریب اطمینان (2R) مدلهای شبکه عصبی، سیستم استنتاجی تطبیقی نروفازی، ماشین بردار پشتیبان و کا نزدیک‍ترین همسایه به ترتیب 67/0، 69/0، 72/0 و 64/0 می باشد. آنالیز عدم قطعیت نیز نتایج این مقایسه را تایید نمود و نشان داد مدل ماشین بردار پشتیبان در بین سایر مدلها، عدم قطعیت کم‍تری داشته و نسبت به دادههای ورودی کم‍ترین حساسیت را دارد.بحث و نتیجه گیری: مدلهای هوشمند از توانایی رضایتبخشی برای پیش بینی کمی پسماند برخوردارند و در بین مدلهای هوشمند مورد مطالعه، مدل ماشین بردار پشتیبان بهترین نتایج را از خود نشان داد. همچنین، عدم قطعیت نتایج مدل ماشین بردار پشتیبان در بین سایر مدلها، عدم قطعیت کم تری برخوردار بود. پرونده مقاله