-
حرية الوصول المقاله
1 - پیش بینی قیمت سهام با استفاده از روش داده کاوی
مجتبی حاجی غلامیاین مقاله به بررسی روشهای داده کاوی برای پیشبینی بازار های مالی و تحلیل توسعه پایدار موضوعات مالی و پیشبینی روند با استفاده از داده کاوی میپردازد. این مقاله همچنین به بررسی تأثیر استفاده از روشهای داده کاوی در بازار سهام و کارایی آن در این زمینه میپردازد. در این ت أکثراین مقاله به بررسی روشهای داده کاوی برای پیشبینی بازار های مالی و تحلیل توسعه پایدار موضوعات مالی و پیشبینی روند با استفاده از داده کاوی میپردازد. این مقاله همچنین به بررسی تأثیر استفاده از روشهای داده کاوی در بازار سهام و کارایی آن در این زمینه میپردازد. در این تحقیق یک رویکرد یادگیری ماشینی معرفی میشود که اطلاعات را با استفاده از داده های موجودی عمومی میسازد و از آن اطلاعات برای پیشبینی دقیق استفاده میکند. همچنین به بررسی گونههای متنوعی از روشهای داده کاوی میپردازد که در حوزه تجزیه و تحلیل بازارهای مالی کاربرد دارند و به طور ویژه تمرکز خود را بر پیشبینی روندهای بازار سهام معطوف میدارد. مطالعه ما نشان میدهد که از آنجایی که بازارهای مالی پویا و متغیر هستند و همواره تحت تأثیر عوامل اقتصادی، سیاسی و اجتماعی قرار دارند، استفاده از روشهای یادگیری ماشینی و داده کاوی میتواند در پیشبینی دقیقتر حرکات قیمتی سهام مؤثر واقع شود. با توجه به دادههای گسترده و پیچیده موجود در بازارهای مالی، روشهای داده کاوی میتوانند پتانسیل فراوانی در کشف الگوهای پنهان و تعیین ارتباط میان متغیرهای مختلف داشته باشند. در این راستا، الگوریتمهای مختلف یادگیری ماشینی مانند شبکههای عصبی مصنوعی، ماشینهای بردار پشتیبان و جنگلهای تصادفی به عنوان مثال مورد استفاده قرار گرفته و در کنار آنالیزهای آماری، به بهبود قابلیتهای تحلیلگران و سرمایهگذاران در تصمیمگیریهای اقتصادی کمک میکنند. استفاده از دادههای بزرگ و تحلیلهای پیچیده همچنین به توسعه استراتژیهای معاملاتی هوشمندانه که میتوانند به بهینهسازی بازگشت سرمایه کمک کنند، کمک نموده است. برای نمونه، تحلیلگران میتوانند با ادغام دادههای احساسی حاصل از شبکههای اجتماعی در مدلهای پیشبینی خود، دقت تخمینهای خود را ارتقا بدهند. این مطالعه تأکید دارد که توسعه پایدار در بازارهای مالی نیازمند تحلیلی دقیقتری از دادهها است که در نهایت منجر به تصمیمگیریهای مبتنی بر داده و فرآیندهای معاملاتی قوی تر میشود. تفاصيل المقالة -
حرية الوصول المقاله
2 - ارائه یک مدل جدید برای سناریو سازی تقاضای دستگاههای خودپرداز (مورد مطالعه : دستگاههای خودپرداز شهر تهران)
علیرضا آقا قلیزاده سیار محمد رضا معتدل علیرضا پور ابراهیمیدر دنیای رقابتی امروز توانایی شناخت و پیش بینی تقاضای مشتریان یک مقوله مهم جهت موفقیت سازمانها به شمار میرود.و از انجا که دستگاههای خود پرداز یکی از مهم ترین کانالهای توزیع وجه نقد و یکی از اساسی ترین معیارهای ارزیابی سطح خدمات برای بانکها بشمار میروند در این مقاله ویژ أکثردر دنیای رقابتی امروز توانایی شناخت و پیش بینی تقاضای مشتریان یک مقوله مهم جهت موفقیت سازمانها به شمار میرود.و از انجا که دستگاههای خود پرداز یکی از مهم ترین کانالهای توزیع وجه نقد و یکی از اساسی ترین معیارهای ارزیابی سطح خدمات برای بانکها بشمار میروند در این مقاله ویژگیهای مربوط به دستگاه های خودپرداز با توجه به زمان های مراجعه و مکان قرار گیری دستگاهها بررسی می گردد . این مقاله به دنبال یافتن مدلی پویا و کاربردی جهت سناریو سازی تقاضای دستگاههای خود پرداز می باشد . از این رو مورد کاوی بر روی ۳۷۸ دستگاه خودپرداز در سراسر شهر تهران در بازه زمانی یک ماه که شامل ۶۹۴۱۸ رکورد می باشد انجام گرفت . این مدل در نهایت با خوشه بندی داده های آماری در بعد زمانی و مکانی موفق به یادگیری الگوی موجود در داده های کلان شده و بر همین مبنای درخت تصمیم ارائه شده قادر به پیش بینی تعداد مراجعه کننده به هر دستگاه می باشد که پس از ارایه سناریو های ایجاد شده در جهت ارتقای کیفیت خدمات دهی بانکی و ارتقای عملکرد شبکه خودپردازها ترکیب بهینه مکانی دستگاههای خودپرداز در بعد مکانی و زمانی ارایه میگردد. تفاصيل المقالة -
حرية الوصول المقاله
3 - تجارب داخلی و بین المللی در زمینه سامانه های آینده پژوهی ـ پویش محیطی وب محور
مرتضی تیزچنگ هرزندی مینا ابراهیمیپویش محیطی، در سالهای اخیر بهصورت چشمگیری مورد استفاده در سراسر جهان قرار گرفته است. اگرچه تعریف دقیق و شفافی برای این مفهوم وجود ندارد، ولی در کل میتوان اینگونه بیان کرد که این فرآیند، استفاده سیستماتیک از بهترین اطلاعات موجود برای انتخاب بهترین تصمیم ممکن را فراه أکثرپویش محیطی، در سالهای اخیر بهصورت چشمگیری مورد استفاده در سراسر جهان قرار گرفته است. اگرچه تعریف دقیق و شفافی برای این مفهوم وجود ندارد، ولی در کل میتوان اینگونه بیان کرد که این فرآیند، استفاده سیستماتیک از بهترین اطلاعات موجود برای انتخاب بهترین تصمیم ممکن را فراهم می کند. جستجویی سیستماتیک برای گرایشهای نوین، فرصتها و محدودیتهایی که در مسیر رسیدن به اهداف تعیین شده مدیریتی اثرگذار هستند. اهداف صریح پویش محیطی برای مسائل نوین و تکوینی، دانش و دادههای ذخیره شده درباره آنها و در نهایت آگاهی از تصمیمات حیاتی است. در این راستا می توان به راهکارهای کلیدی فنی بهکار گرفته شده در فرآیندهای پویش محیطی نظیر وبگردی، شاخص گذاری، نگاشت دانش، هم استنادی، هم واژگانی، هم رخدادی، الگوریتم رتبه صفحه، الگوریتم اچ.آی.تی.اس، داده کاوی، دسته بندی و خوشه بندی اشاره کرد. در مدت زمان نگارش این پژوهش تلاش شده است تا موسسات و کمپانی های در حال بهره بردن و یا خدمت رساندن در زمینه پویش محیطی وب محور شناسایی و اهداف و راهکارهای آنها مورد بررسی قرار بگیرد و همچنین تکنیک ها و ابزارهایی که استفاده می کنند شناسایی و مطالعه شوند. تفاصيل المقالة -
حرية الوصول المقاله
4 - مدلی برای پیش بینی نیاز به جراحی ارتوپدی با استفاده از تکنیک های داده کاوی
سید سینا فاطمی رضوی سید عبداله امین موسویبا گسترش استفاده از رایانه در جنبه های مختلف زندگی افراد، حجم بسیار زیادی از داده ها تولید می شود که در بسیاری از اوقات این داده ها شامل اطلاعات ارزشمندی هستند. برای استخراج این اطلاعات و بهره بردن از آنها می توان از علم داده کاوی1 بهره برد. با استفاده از داده کاوی می ت أکثربا گسترش استفاده از رایانه در جنبه های مختلف زندگی افراد، حجم بسیار زیادی از داده ها تولید می شود که در بسیاری از اوقات این داده ها شامل اطلاعات ارزشمندی هستند. برای استخراج این اطلاعات و بهره بردن از آنها می توان از علم داده کاوی1 بهره برد. با استفاده از داده کاوی می توان، الگوهای پنهان موجود در داده ها را کشف نمود و برای پیش بینی موارد جدید مورد استفاده قرار داد. از جمله حوزه هایی که با تولید حجم انبوه داده ها روبرو می باشد، حوزه ی درمان است. در این پژوهش به طور خاص در زمینه ی ارتوپدی تمرکز خواهد شد. این تحقیق به دنبال این است که با استفاده از تکنولوژی و تکنیک های داده کاوی بتواند از داده موجود در دیتابیس بیمارستان به اطلاعات ارزشمندی دست یابد و از طریق آن اطلاعات بتواند احتمال شکستگی و همچنین نیازمند بودن بیمار به جراحی را پیش بینی کند و تصمیم گیری را برای پزشکان ساده تر و سریع تر کند. بدین صورت می توان با سرعت و دقت بالاتری نسبت به روش های موجود به تفکیک بیماران و ارائه ی خدمات به آن ها پرداخت. این پژوهش بر مبنای متدولوژی CRISP بنا نهاده شده است و نتایج حاصل از تحقیق بیانگر این امر است که استفاده ی تلفیقی از الگوریتم های CHAID و شبکه ی عصبی2 تقویت شده با روش تجمعی3 Boosting، می تواند دقت مطلوبی در پیش بینی نیاز به جراحی در بیماران ارتوپدی را ارائه دهد. تفاصيل المقالة -
حرية الوصول المقاله
5 - ارائه مدلی جهت پیش بینی و بهبود کیفیت تولید با استفاده از الگوریتم های درخت تصمیم و برنامه ریزی خطی ( مورد مطالعه: شرکتهای تولید کننده موج گیرتیبا در ایران)
نادره سادات راست قلم رویا محمدعلی پور اهری احمد رضا شکرچی زاده عاطفه امین دوستامروز در اکثر صنایع کشور از ابزار کنترل کیفیت آماری جهت بهبود کیفیت محصولات استفاده مینمایند ولی با توجه به حجم بالای دادهها در حال حاضر نیاز به ابزاری قویتر میباشد که بتواند فرایندهای کنترل کیفیت آماری را تحت کنترل قرار دهد با توجه به گستردگی الگوریتمهای دادهکاوی أکثرامروز در اکثر صنایع کشور از ابزار کنترل کیفیت آماری جهت بهبود کیفیت محصولات استفاده مینمایند ولی با توجه به حجم بالای دادهها در حال حاضر نیاز به ابزاری قویتر میباشد که بتواند فرایندهای کنترل کیفیت آماری را تحت کنترل قرار دهد با توجه به گستردگی الگوریتمهای دادهکاوی در این تحقیق از ابزار دادهکاوی جهت بهبود فرایند استفاده شده است و همچنین هدف اصلی تحقیق ارائه روشی جهت کشف اقلام معیوب قبل از تولید کامل آنها و جلوگیری از تولید اقلام معیوب میباشد. روش کار بدین گونه است که در ابتدا پایگاه داده خرابی تشکیل میگردد و پس از جمع آوری داده های کنترل کیفیت، با استفاده از الگوریتمهای مختلف درخت تصمیم دقت پیش بینی کیفیت قطعات تعیین میگردد و در مرحله بعد با استفاده از مدل-تحلیلپوششیدادهها هر یک از قوانین ارزیابی می گردد و در نهایت با استفاده از قوانینی که در هر ایستگاه کاری صدق میکنند ارزیابی ایستگاه های کاری انجام می گیرد. بر این اساس در این پژوهش جامعه آماری تمامی قطعات تولیدی موجگیر تیبا در سال 1398 میباشد. خصیصه ها شامل 9 ایستگاه کاری هستند، بر اساس نتایج بدست آمده بهترین الگوریتم در پیشبینی خرابی C5 میباشد و مهمترین خصیصههای انتخابی توسط آن تعیین میگردند عبارتاند از: کیفیت خنک کاری، کیفیت سوراخ کاری و کیفیت برش. همچنین ارزیابی قوانین نیز با استفاده از مدلتحلیلپوششیدادهها انجام شده و مهمترین قوانین استخراج شدهاند و در نهایت بر اساس حل مدل دستگاههایی که در اولویت اصلاحی برای سال جاری قرار گیرند عبارتند از: رولینگ، لحیم کاری و برش تفاصيل المقالة -
حرية الوصول المقاله
6 - طبقه بندی متقاضیان تسهیلات اعتباری بانکها با استفاده از تکنیک ماشین بردار پشتیبان
دکتر عباس طلوعی اشلقی دکتر هاشم نیکومرام فرناز مقدوری شربیانیدر صنعت بانکداری یکی از موضوعاتی که همواره بایستی مدنظر سیاستگذاران اعتباری قرار دا شته باشد، مبحث مدیریتریسک است. در بین ریسک های مختلفی که بان کها با آن مواجهند, ریسک اعتباری از با اهمیت ترین آن ها است که اززیان های ناشی از ناتوانی یا عدم تمایل مشتری به ایفای تعهدات خ أکثردر صنعت بانکداری یکی از موضوعاتی که همواره بایستی مدنظر سیاستگذاران اعتباری قرار دا شته باشد، مبحث مدیریتریسک است. در بین ریسک های مختلفی که بان کها با آن مواجهند, ریسک اعتباری از با اهمیت ترین آن ها است که اززیان های ناشی از ناتوانی یا عدم تمایل مشتری به ایفای تعهدات خویش در برابر بانک حاصل م یگردد.جهت مدیریت و کنترل ریسک مذکور , سیستم های طبقه بندی اعتباری مشتریان ضرورتی انکار ناپذیر است . چنین سیستمی،براساس سوابق و اطلاعات موجود، طبقه مشتریان را تعیین می کند. بدیهی است بهره گیری از چنین سیستمی بانک را درگزینش مطلوب مشتریان خود یاری نموده و ضمن کنترل و کاهش ریسک اعتباری، سطح بهره وری فرایند اعطای تسهیلاتبانکی را ارتقا میدهد.در مقاله حاضر مدل طبقه بندی مبتنی بر ماشین بردار پشتیبان با رویکرد هوش مصنوعی، به منظور پیش بینی عملکرد مالیمشتریان حقوقی بانک ها ارائه گردیده است . در واقع، در این نوشتار ماشین بردار پشتیبان به همراه دیگر مک انیزمها از جملهتکنیکهایF-score وGrid searchجهت طبقهبندی متقاضیان تسهیلات اعتباری بانکی وافزایش کارایی مدل استفاده شده است . نتایج، حاکی از افزایش صحت طبقه بندی است و نشان می دهد که ماشین بردار پشتیبان در مقایسه با دیگرمدلهای طبقه بندی دارای صحت بیشتری است. تفاصيل المقالة -
حرية الوصول المقاله
7 - Diagnosis of hyperlipidemia in patients based on an artificial neural network with pso algorithm
asma naeimi minoo soltanshahi amir rajabiOne of the most common and most dangerous diseases of blood fats are such as heart disease, diabetes and stroke, heart and brain. It can control the timely diagnosis, treatment and then prevention of complications is become very effective even without using medicine. He أکثرOne of the most common and most dangerous diseases of blood fats are such as heart disease, diabetes and stroke, heart and brain. It can control the timely diagnosis, treatment and then prevention of complications is become very effective even without using medicine. Heart disease and diabetes file if patients has useful information that can be used to estimate blood fat timely diagnosis. In this paper we introduce a method based on data mining according to the information of patients' medical records to predict and detect blood lipid cardiovascular. And to identify patients with high blood lipids,we use a category based on neural network without feedback and pso algorithm to train the neural network to determine the appropriate value to reduce error the weights of the neural network . Simulation is done in MATLAB environment by using Body Fat data set, it shows the accuracy of 93.22 percent compared to the same methods, which means high accurate, higher detection sensitivity and Democrats. تفاصيل المقالة -
حرية الوصول المقاله
8 - Developing A Fault Diagnosis Approach Based On Artificial Neural Network And Self Organization Map For Occurred ADSL Faults
Vahid Golmah Mina TashakoriTelecommunication companies have received a great deal of research attention, which have many advantages such as low cost, higher qualification, simple installation and maintenance, and high reliability. However, the using of technical maintenance approaches in Telecomm أکثرTelecommunication companies have received a great deal of research attention, which have many advantages such as low cost, higher qualification, simple installation and maintenance, and high reliability. However, the using of technical maintenance approaches in Telecommunication companies could improve system reliability and users' satisfaction from Asymmetric digital subscriber line (ADSL) services. In ADSL systems, there are many variables giving some noise for classification and there are many fault patterns with overlapping data. Therefore, this paper proposes a multilayer perceptron (MLP) classifier integrated with Self Organization Map (SOM) models for fault detection and diagnosis (FDD) of occurred ADSL systems. The interest of this paper is to improve the performance of single MLP by dividing the fault pattern space into a few smaller sub-spaces using SOM clustering technique and triggering the right local classifier by designing a supervisor agent. The performances of this method are evaluated on the fault data of Iranian Telecommunication Company which develop ADSL services and then the proposed algorithm is also compared against single MLP. Finally, the results obtained by this algorithm are analyzed to increase user's satisfaction with reducing occurred faults for them with predicting before they face it. تفاصيل المقالة -
حرية الوصول المقاله
9 - Document Analysis And Classification Based On Passing Window
ZAHER BAMASOODIn this paper we present Document analysis and classification system to segment and classify contents of Arabic document images. This system includes preprocessing, document segmentation, feature extraction and document classification. A document image is enhanced in th أکثرIn this paper we present Document analysis and classification system to segment and classify contents of Arabic document images. This system includes preprocessing, document segmentation, feature extraction and document classification. A document image is enhanced in the preprocessing by removing noise, binarization, and detecting and correcting image skew. In document segmentation, an algorithm is proposed to segment a document image into homogenous regions. In document classification, Neural Network (Multilayer Perceptron- Back propagation) classifier is applied to classify each region to text or non text based on a number of features extracted in feature extraction. These features are collected from different other researchers’ works. Experiments were conducted on 398 document images selected randomly from printed Arabic text database (PATDB) which was selected from various printing forms which are advertisements, book chapters, magazines, newspapers, letters and reports documents. As results, the proposed segmentation algorithm achieved only 0.814% as ratio of the overlapping areas of the merged zones to the total size of zones and 1.938% as the ratio of missed areas to total size of zones. The features, that show the best accuracy individually, are Background Vertical Run Length (RL) Mean, and Standard Deviation of foreground. تفاصيل المقالة -
حرية الوصول المقاله
10 - Prediction of Student Learning Styles using Data Mining Techniques
Esther Khakata Vincent Omwenga Simon MsanjilaThis paper focuses on the prediction of student learning styles using data mining techniques within their institutions. This prediction was aimed at finding out how different learning styles are achieved within learning environments which are specifically influenced by أکثرThis paper focuses on the prediction of student learning styles using data mining techniques within their institutions. This prediction was aimed at finding out how different learning styles are achieved within learning environments which are specifically influenced by already existing factors. These learning styles, have been affected by different factors that are mainly engraved and found within the students learning environment. To obtain the learning styles, a data mining technique was used and this explicitly involved the use of pattern analysis in order to identify the underlying learning styles in the data collected from the learners. This paper highlights the five major learning styles that describe the patterns extracted from the collected data. Therefore, considering the changed learning ecosystem, it is clear that prediction of student learning styles can be done when the various factor inputs within the student environment are brought together and analyzed to focus on learning within internet-mediated environments. تفاصيل المقالة -
حرية الوصول المقاله
11 - Optimization of weighting-based approach to predict and deal with cold start of web recommender systems using cuckoo algorithm
reza molaee fardRecommending systems are systems that, by taking limited information from the user and features such as what the user has searched for in the past and what product they have rated, can correctly identify the user and the desired items Offer the user. The user's desired أکثرRecommending systems are systems that, by taking limited information from the user and features such as what the user has searched for in the past and what product they have rated, can correctly identify the user and the desired items Offer the user. The user's desired items are suggested to him through the user profile. In this research, a new method is presented to recommend the user's interests in the form of the user's personalized profile. The way to do this is to use other users' searched information in the form of a database to recommend to new users. The procedure is that we first collect a log file from the items searched by users, then we pre-process this log file to remove the data from the raw state and clean it. Then, using data weighting and using the score function, we extract the most searched items of users in the past and provide them to the user in the form of a recommendation system based on participatory filtering. Finally, we use our data using an algorithm. We optimize the cuckoo that this information can be of interest to the user. The results of this study showed 99% accuracy and 97% frequency, which can to a large extent correctly predict the user's favorite items and pages and start with the problem that is the problem of most recommender systems To confront. تفاصيل المقالة -
حرية الوصول المقاله
12 - بررسی امکان مدل سازی میزان تغییرات کالبدی بافت های شهر با استفاده از داده کاوی
ناجی پژمان ضیایی محمد نقی زاده سید مصطفی مختابادپیشبینی آهنگ تغییرات کالبدی بافتهای شهری یکی از عوامل تاثیرگذار بر کیفیت طراحی و برنامهریزی شهری بهشمار میرود. هدف از انجام این پژوهش تدوین شیوهای برای مدلسازی آهنگ تغییرات کالبدی بافتهای شهری است بهگونهای که علاوه بر سهولت استفاده، امکان پیشبینی تغییرات را از أکثرپیشبینی آهنگ تغییرات کالبدی بافتهای شهری یکی از عوامل تاثیرگذار بر کیفیت طراحی و برنامهریزی شهری بهشمار میرود. هدف از انجام این پژوهش تدوین شیوهای برای مدلسازی آهنگ تغییرات کالبدی بافتهای شهری است بهگونهای که علاوه بر سهولت استفاده، امکان پیشبینی تغییرات را از طریق پایش دورههای پیشین فراهم سازد. از این رو با استفاده از تحلیل رگراسیونی خطی، آهنگ تغییرات فرم بافت برای یک دوره زمانی خاص مدل شده و میزان تغییرات آن مشخص گردید. در راستای آزمودن این شیوه، قسمتی از بافت محله فیض آباد شهر کرمانشاه مورد مطالعه قرار گرفته و بواسطه استخراج اطلاعات مربوط به چهار دوره از روی تصاویر هوایی، وضعیت بافت برای سال هدف مدل گردید. مقایسه اطلاعات مدل شده با وضعیت واقعی بافت نشان داد که مدل ایجاد شده کاربرد پذیر بوده و در مناطق مصون از تغییرات مبتنی بر طرحهای شهری منطقه مورد مطالعه از دقت بیش از 70 درصد برخوردار میباشد. تفاصيل المقالة -
حرية الوصول المقاله
13 - یک رویکرد جدید مبتنی بر تحلیل پوششی دادهها با مرز دوگانه برای رتبهبندی قواعد کشف شده از دادهکاوی
حسین عزیزیتحلیل پوششی دادهها (DEA) یک رویکرد نسبتاً جدید با ماهیت دادهای برای ارزیابی عملکرد مجموعهای از موجودیتهای همتا به نام واحدهای تصمیمگیری (DMUها) است که چندین ورودی را به چندین خروجی تبدیل میکنند. DEA در دورهی زمانی نسبتاً محدودی تبدیل به ابزار کمّی و تحلیلی قدرتمن أکثرتحلیل پوششی دادهها (DEA) یک رویکرد نسبتاً جدید با ماهیت دادهای برای ارزیابی عملکرد مجموعهای از موجودیتهای همتا به نام واحدهای تصمیمگیری (DMUها) است که چندین ورودی را به چندین خروجی تبدیل میکنند. DEA در دورهی زمانی نسبتاً محدودی تبدیل به ابزار کمّی و تحلیلی قدرتمندی برای اندازهگیری و ارزیابی عملکرد شده است. در مقالهای به قلم طلوع و همکاران [5]، آنها یک مدل DEAی جدید برای پیدا کردن کارآترین قاعدهی ارتباطی در دادهکاوی پیشنهاد کردند. آنگاه، با استفاده از این مدل، آلگوریتمی برای رتبهبندی قواعد ارتباطی با در نظر گرفتن معیارهای متعدد ایجاد کردند. در این مقاله، ما نشان میدهیم که مدل آنها تنها یک قاعدهی ارتباطی کارآی خوشبینانه را به طور شانسی انتخاب میکند و کاملاً وابسته به روش حل یا برنامهی نرمافزاری است که برای حل مسئله استفاده میشود. به علاوه، نشان داده میشود که آلگوریتم پیشنهادی آنها تنها میتواند قواعد کارآی خوشبینانه را به طور تصادفی رتبهبندی کند، و قادر به رتبهبندی DMUهای غیرکارآی خوشبینانه نیست. همچنین، به معایب دیگری در این مقاله، اشاره میکنیم و رویکرد جدید «DEA با مرز دوگانه» را برای ایجاد یک رتبهبندی کامل قواعد ارتباطی پیشنهاد میکنیم. یک مثال عددی برخی از محتویات مقاله را توضیح خواهد داد. تفاصيل المقالة -
حرية الوصول المقاله
14 - طراحی یک مدل هوشمند جهت تعیین سیگنال های معاملات سهام با رویکرد داده کاوی
پانته آ ملکی مقدم اکبر عالم تبریز اسماعیل نجفییکی از مهمترین مسائل در بازارهای مالی مدرن یافتن راههای کارآمد برای تلخیص و تجسم کردن اطلاعات بازار بورس میباشد. با حجم انبوه از دادههایی که در بازار بورس تهران در هر لحظه ایجاد میگردد برای بررسی روابط میان دادهها و دست یافتن به اطلاعات نهفته آنها که تاثیر قابل ملاح أکثریکی از مهمترین مسائل در بازارهای مالی مدرن یافتن راههای کارآمد برای تلخیص و تجسم کردن اطلاعات بازار بورس میباشد. با حجم انبوه از دادههایی که در بازار بورس تهران در هر لحظه ایجاد میگردد برای بررسی روابط میان دادهها و دست یافتن به اطلاعات نهفته آنها که تاثیر قابل ملاحظهای در تصمیمات سرمایه-گذاران دارد به مدلهایی دست یافتیم. با استفاده از کلان دادههای ارزشمند تولید شده توسط بازار سهام با استفاده از روش خوشه بندی افرازی و به کمک الگوریتم k-means به تعیین نقاط سیگنال معاملات سهام پرداخته شده است. در این پژوهش از داده های صنایع خودرو و فرآورده های نفتی طی سال 1387 تا 1396 که با کمک بیست شاخص تکنیکی مدل سازی انجام پذیرفت. نتایج این پژوهش نشان داد که مدل مورد استفاده در شناسایی و پیش بینی سیگنالهای فروش صادره در نقاط حداکثری دارای عملکرد قابل توجهی بوده و با دقت قابل قبولی قابل پیش بینی میباشند. در واقع این سیگنالها دارای خطای کمتری بوده و بهتر پیشبینی گردیده است. تفاصيل المقالة -
حرية الوصول المقاله
15 - استفاده از داده کاوی و سه الگوریتم درخت تصمیمگیری جهت بهینهسازی فرآیند تعمیرات و نگهداری
محمد ایزدی خواه دنیا گرشاسبیهدف از این تحقیق پیش­بینی خرابی دستگاه­ها با استفاده از ابزار داده کاوی می­باشد که بدین منظور در ابتدا پایگاه داده مناسب متشکل از 392 رکورد از خرابی­های به وقوع پیوسته در یک شرکت داروسازی در سال 1394 تشکیل شده است، در مرحله بعد با تعیین 9 خصیصه و نوع خرا أکثرهدف از این تحقیق پیش­بینی خرابی دستگاه­ها با استفاده از ابزار داده کاوی می­باشد که بدین منظور در ابتدا پایگاه داده مناسب متشکل از 392 رکورد از خرابی­های به وقوع پیوسته در یک شرکت داروسازی در سال 1394 تشکیل شده است، در مرحله بعد با تعیین 9 خصیصه و نوع خرابی بعنوان کلاس پایگاه داده، تحلیل­ها صورت پذیرفته است که در این راستا از 3 الگوریتم درخت تصمیم برای تعیین مهمترین خصیصه­ها و تعیین قوانین موثر بر خرابی استفاده شده است. بر اساس نتایج بدست آمده از انتخاب خصیصه هر سه الگوریتم مورد استفاده خصیصه­های عمر دستگاه، نام ماشین و مدت زمان تا آخرین خرابی بعنوان مهمترین خصیصه­ها در نظر گرفته شده­اند. بر این اساس عمر دستگاه از اهمیت ویژه­ای برخوردار است. از آنجائی که استهلاک در صنعت داروسازی در حد بالائی می­باشد لذا عمر دستگاه­های مورد استفاده در تعمیرات و نگهداری اثرات ویژه­ای دارد. در این راستا دستگاه­های که دارای عمر بیش از 20 سال می­باشند استهلاک و خرابی آنها بسیار بالا می­باشد و نیاز است تا علاوه بر تعمیرات معمول بازبینی­ها و تعمیرات ویژه­ای در مورد آنها اعمال گردد. تفاصيل المقالة -
حرية الوصول المقاله
16 - ارائهی یک مدل دو مرحلهی مبتنی بر داده کاوی جهت ارزیابی عملکرد مشتریان مشترک بانک و بیمه
حمیدرضا امیر حسنخانی عباس طلوعی اشلقی علیرضا پورابراهیمی رضا رادفراکتشاف دانش از پایگاه داده و داده کاوی یکی از مهم ترین ابزار های مدیریت ارتباط با مشتری است که می تواند به سازمان با تاکید بر یافتن اطلاعات مفید یا دانش مورد علاقه آن کمک کند. امروزه بانک ها و بیمه ها از پایگاه های اطلاعاتی متعدد و گسترده ای برخوردار هستند که حاوی اطلاع أکثراکتشاف دانش از پایگاه داده و داده کاوی یکی از مهم ترین ابزار های مدیریت ارتباط با مشتری است که می تواند به سازمان با تاکید بر یافتن اطلاعات مفید یا دانش مورد علاقه آن کمک کند. امروزه بانک ها و بیمه ها از پایگاه های اطلاعاتی متعدد و گسترده ای برخوردار هستند که حاوی اطلاعات مربوط به مبادلات و جزئیات دیگر مربوط به مشتریانشان هستند. اطلاعات ارزشمند تجاری از درون همین ذخایر داده ای قابل بازیابی است. اما پشتیبانی از این دست تحلیل ها و تصمیم گیری با استفاده از زبان های گزارش گیری سنتی امکان پذیر نخواهد بود. بنابراینبا توجه به اهمیت اطلاعات مشتریان مشترک بانک و بیمه باید آنها را هرچه دقیق تر تحلیل نمود. در این تحقیق با گردآوری و تجزیه و تحلیل اطلاعات مشتریان مشترک بانک و بیمه یک متدولوژی مبتنی بر داده کاوی جهت ارزیابی مشتریان بر اساس شاخص های عملکردی آنها در حوزه بانکی و بیمه ای ارائه می شود. همچنین با تحلیل رفتار مشتریان با استفاده از یه رویکرد دو مرحله ای مبتنی بر یادگیری بدون نظارت و یادگیری با نظارت اقدام به پیش بینی رفتار مشتریان جدیدالورود خواهیم نمود. تفاصيل المقالة -
حرية الوصول المقاله
17 - A hybrid Model on the Basis of Data Envelopment Analysis and Data Mining Techniques to Analyze the Investment Behavior in Stock Exchange: A Real Case Study in Tehran Stock Exchange
Saiedeh Molla Hosseinagha Kaveh Khalili-DamghaniStock exchange, which is the core of investment market, transfers scattered resources to the productive sector of the service and industry. The analysis of stock exchange has attracted lots of researches in recent decades. The issue concern both of securities and invest أکثرStock exchange, which is the core of investment market, transfers scattered resources to the productive sector of the service and industry. The analysis of stock exchange has attracted lots of researches in recent decades. The issue concern both of securities and investors. More formally both sides of investment (i.e., behavior of investors and fluctuations of returns on securities) form the markets. In this paper, a hybrid model on the basis of data envelopment analysis and data mining techniques is proposed to analyze the investment behavior in stock exchange. The proposed approach is applied in Tehran stock exchange. First, the financial data of investments on selective companies during 2013-2014 are analyzed using data mining approaches to recognize the behavioral patterns of investors and securities.Second, customers are clustered in 3 selling and 4 buying groups using data mining techniques. Then, the efficiency of active companies in stock exchange is evaluated using and input-oriented Data Envelopment Analysis model considering variable returns-to-scale assumption. Data mining techniques and DEA model are codified using MATLAB and LINGO software, respectively. The obtained results indicate that in 2013 and 2014,nine and six companies are efficient, respectively.Among these companies, six companies are efficient in both years. The most visited companies in reference sets are determined during periods of this study. The reference set of inefficient companies are determined in order to project them toward efficient frontier. The results of this study can provide insightful vision to investors in order to illustrate the behavior of previous investors and securities. تفاصيل المقالة -
حرية الوصول المقاله
18 - داده کاوی الگوی نامشهود تراکنشهای رفتارهای اطلاعیابی و اطلاع درمانی متخصصان بیماریهای نقص ایمنی
صدیقه محمداسماعیل شیبا کیانمهرمقدمه: پژوهش حاضر با هدف تحلیل رفتار اطلاع درمانی ایمونولوژیستهای کشور، بر مبنای مدل شبکه عصبی خودسازمانده کوهونن انجام شده است. روش پژوهش: پژوهش کاربردی، به روش پیمایشی توصیفی و با استفاده از تکنیک شبکه عصبی انجام شده است. ابزار پرسشنامهای است محققساخته که بین ۱۴۹ أکثرمقدمه: پژوهش حاضر با هدف تحلیل رفتار اطلاع درمانی ایمونولوژیستهای کشور، بر مبنای مدل شبکه عصبی خودسازمانده کوهونن انجام شده است. روش پژوهش: پژوهش کاربردی، به روش پیمایشی توصیفی و با استفاده از تکنیک شبکه عصبی انجام شده است. ابزار پرسشنامهای است محققساخته که بین ۱۴۹ نفر توزیع شد. به منظور خوشهبندی با استفاده از نرمافزارMATLAB متخصصان بر اساس مؤلفههای اصلی پژوهش خوشهبندی و سپس با حذف هر یک از زیرمؤلفههای اصلی، مؤثرترین و کماثرترین گزینه تعیین گردید. یافتهها: تحلیل ها نشان داد در مهارتهای اطلاعیابی؛ 63/75 درصد از افراد جامعه در خوشه اول با میانگین 29/88 و در خوشه دوم 36/24 درصد با میانگین نمرات 30/22، قرار دارند و مهم ترین مولفه استفاده از کلیدواژهها و اصطلاحات مرتبط با اطلاعات مورد نیاز است. در مورد راههای اطلاعیابی؛ 22/14 درصد جامعه با میانگین نمرات 54/36 در خوشه اول، 18/12 درصد افراد با میانگین 48/11 در خوشه دوم، 14/09 درصد با میانگین 43/28 در خوشه سوم، 16/1 درصد با میانگین 49/04 در خوشه چهارم و 29/53 درصد افراد با میانگین نمرات 53/72 در خوشه پنجم قرار داشته، و مهمترین راههای اطلاع یابی، استفاده از منابع اطلاعات الکترونیک بوده است. بر مبنای میزان استفاده از انواع خدمات اطلاعاتی؛46 درصد افراد با میانگین نمرات 54/85 در خوشه اول، 20/66 درصد با میانگین 49/38 در خوشه دوم و 32/66 درصد با میانگین 43/08 در خوشه سوم قرار داشته و مهم ترین مولفه خدمات اطلاع درمانی، آشنایی با انواع منابع و خدمات اطلاعاتی رشته تخصصی بوده است نتیجهگیری: خوشهبندی عصبی رفتارهای اطلاع درمانی جامعه مورد مطالعه و تراکنش های اطلاعاتی حاصل از آن، علاوه بر منتج شدن به آگاهی از نیازها و منابع اطلاعاتی مورد نیاز کاربران، به عنوان روشی در دسترس و کم هزینه که ارتقای سطح کیفیت اطلاعات متخصصین سیستم نقص ایمنی را در پی دارد و به ارایه خدمات درمانی موثرتر به بیماران منتهی میگردد، زمینه لازم جهت پیش بینی تمهیدات و تصمیمگیریهای اطلاعاتگرا را جهت تامین نیازها و محمل های اطلاعاتی مورد درخواست کاربران پایگاه های دادههای پزشکی فراهم و در اختیار مدیران و دستاندرکاران این حوزه قرار می دهد، و به عنوان راهبردی موثر با حداکثر سطح استانداردهای ممکن، به کشف الگوی نامشهود رفتار های اطلاعیابی کاربران حوزه سلامت منتهی، و به فرد مخاطب میآموزد تا هوشمندانه از محملهای اطلاعاتی بهره گیرد. تفاصيل المقالة -
حرية الوصول المقاله
19 - Customer Retention Based on the Number of Purchase: A Data Mining Approach
Sahar Mehregan Reza SamizadehPurpose: this study wants to find any relationship between the numbers of purchase and the income the customer brings to the company. The attempt is to find those customers who buy more than one life insurance policy and represent the signs of good payments at the same أکثرPurpose: this study wants to find any relationship between the numbers of purchase and the income the customer brings to the company. The attempt is to find those customers who buy more than one life insurance policy and represent the signs of good payments at the same time by the help of data mining tools. Design/ methodology/ approach: the approach of this research is to use data mining tools based on CRISP-DM methodology. The classification is based on the K-means algorithm and prediction is applied by a proposed formula by the researcher in Excel worksheet. Findings: By selecting the customers who bought more than one policy, and filtering the Income bringer customers, the researcher could extract some simple rules to predict which customer belongs to which cluster. Based on the prediction, the company can change its strategies in relation to different customers. Originality/value: Utilizing data mining approach to classify different customers in life insurance and prediction based on the classification is a new approach amongIran insurance companies. There is not enough research and implementation in relation to the CRM and data mining in the insurance industry. Especially CRISP-DM methodology was used very hardly before in a life insurance investigation. تفاصيل المقالة -
حرية الوصول المقاله
20 - Retaining Customers Using Clustering and Association Rules in Insurance Industry: A Case Study
R. Samizadeh S. MehreganThis study clusters customers and finds the characteristics of different groups in a life insurance company in order to find a way for prediction of customer behavior based on payment. The approach is to use clustering and association rules based on CRISP-DM methodology أکثرThis study clusters customers and finds the characteristics of different groups in a life insurance company in order to find a way for prediction of customer behavior based on payment. The approach is to use clustering and association rules based on CRISP-DM methodology in data mining. The researcher could classify customers of each policy in three different clusters, using association rules. At the end of study the characteristics are defined and given to the company, so they could implement CRM strategies based on the newly found differences. Attention to the income and cash earning comes before paying attention to other problems. In most of the companies in developing countries, infrastructural problems of the company like earning enough income prevent the company from effective research implementation on advanced strategies. So this study focuses on basic problems. Utilizing data mining approach to classify customers in life insurance is a new approach among insurance companies in Iran. There are some research in relation to the CRM and data mining, but the contribution of this study is to investigate two new attributes plus those common attributes used before in studying customer behavior; the two attributes are "payment type" and the "purchaser". In order to have a framework, all the process is embedded in CRISP-DM methodology. تفاصيل المقالة -
حرية الوصول المقاله
21 - A Study to Improve the Response in Email Campaigning by Comparing Data Mining Segmentation Approaches in Aditi Technologies
P. Theerthaana S. SharadEmail marketing is increasingly recognized as an effective Internet marketing tool. In this study, a questionnaire is constructed and distributed to a sample of 146 prospects of Aditi Technologies to find the factors associated with higher response rates. The collected أکثرEmail marketing is increasingly recognized as an effective Internet marketing tool. In this study, a questionnaire is constructed and distributed to a sample of 146 prospects of Aditi Technologies to find the factors associated with higher response rates. The collected data is analyzed using Factor Analysis and the 11 factors, From Line, Subject Line, Personalization of the subject line, Timings for sending mails, Frequency of mailing, Length of the Emails, Incentives to respond, Pre-existing Business Relationship, Permission based emails, Links and Image are extracted and it explains 78.363% of variance. These 11 factors is analyzed using Multiple Linear Regression and the .922 R square value indicates that 9 independent variables, Permission based emails, Length of Email, Timings, From Line, Frequency of mailing, Preexisting Business, Personalization, Incentives to respond, Subject Line contributes to higher response rate. This study also investigates marketing campaigns of Aditi Technologies using RFM, CHAID, and logistic regression segmentation methods. One-way ANOVA is used to analyze the data and it is found that there exists no difference between the three approaches. The study concludes that RFM is the most commonly used segmentation approach, however RFM may focus too much attention on transaction information (recency, frequency, and monetary value) and ignore individual difference information (e.g., values, motivations, lifestyles) that may help a firm to better market to their customers. This consideration would favor analytical techniques such as CHAID and logistic regression that can accommodate a variety of personality and individual difference information. تفاصيل المقالة -
حرية الوصول المقاله
22 - شناسایی عوامل مؤثر بر موفقیت بازاریابی در یکی از شعب بانک تجارت با استفاده از تکنیکهای دادهکاوی
مهدی غضنفری اقدس بدیعی فاطمه مصلحیبا توجه به بازار رقابتی موجود در صنعت بانکداری، اهمیت مدیریت ارتباط با مشتری روزبهروز افزایش مییابد که یکی از مهمترین ارکان آن، بازاریابی فعال و مؤثر است. از این رو، در این پژوهش تلاش شده است با توجه به کاربرد ابزارهای دادهکاوی، عوامل مؤثر بر موفقیت فعالیت بازاریابی أکثربا توجه به بازار رقابتی موجود در صنعت بانکداری، اهمیت مدیریت ارتباط با مشتری روزبهروز افزایش مییابد که یکی از مهمترین ارکان آن، بازاریابی فعال و مؤثر است. از این رو، در این پژوهش تلاش شده است با توجه به کاربرد ابزارهای دادهکاوی، عوامل مؤثر بر موفقیت فعالیت بازاریابی در یکی از شعب بانک تجارت، شناسایی و بررسی شود. عواملی که باعث می شوند مشتریان بانک، تمایل بیشتری به بهره مندی از سپردههای بلند مدت در بانک از خود نشان دهند. در حقیقت، نتایج این پژوهش به افزایش نرخ بازگشت در بازاریابی مستقیم در صنعت بانکداری کمک خواهد کرد که در مطالعات پیشین کمتر مورد توجه قرار گرفته بود. به این منظور، مجموعه دادهای مربوط به کمپین بازاریابی تلفنی صورت گرفته در یکی از شعب بانک تجارت در بازه زمانی اردیبهشت 1395 الی شهریور 1397 دریافت شده است. تحقیق حاضر از حیث طبقه بندی تحقیقات بر مبنای هدف از نوع کاربردی است و از دیدگاه روش شناسی تحقیق، از نوع آمیخته می باشد. متغیر هدف این مسئله، نتیجه موفقیت یا شکست فعالیت بازاریابی تلفنی صورت گرفته است. ابتدا به جهت شناسایی مشتریان با استفاده از الگوریتم خوشهبندی K-Means داده ها به شش خوشه تقسیم شده اند. در مرحله بعد، به منظور شناسایی عوامل مؤثر بر موفقیت کمپین بازاریابی، از الگوریتمهای درخت تصمیم C5 و CART استفاده شده است. بهعنوان نتیجهگیری کلی از اجرای سه الگوریتم ذکرشده میتوان عنوان کرد که در مقایسه با سایر متغیرها، متغیر مدتزمان مکالمه با مشتری، بیشترین تأثیر را در تصمیمگیری شخص در مورد افتتاح سپرده داشته است. لازم به ذکر است از آن جا که دوره زمانی و مکان جمع آوری داده در این پژوهش محدود بوده است، احتمالاً نتایج این پژوهش قابل تعمیم به سایر بانک ها نیست. تفاصيل المقالة -
حرية الوصول المقاله
23 - ارائه مدل بهینه ساز هزینه های کنترل موجودی دستگاه های خودپرداز شهر تهران
علیرضا آقا قلیزاده سیار حسین شیرازی مهدی ایزدیار محمدمهدی فتاح دماوندیازآنجا که مدیریت هزینه ها یکی از مهمترین وظایف سازمان ها هستند ، مدیریت هزینه های سیستم کنترل موجودی دستگاههای خود پرداز نیز یکی از اساسی ترین وظایف بانکها بشمار میروند. این مقاله به دنبال ارائه مدلی پویا و بهینه برای کنترل هزینه های موجودی دستگاههای خودپرداز، با توجه ب أکثرازآنجا که مدیریت هزینه ها یکی از مهمترین وظایف سازمان ها هستند ، مدیریت هزینه های سیستم کنترل موجودی دستگاههای خود پرداز نیز یکی از اساسی ترین وظایف بانکها بشمار میروند. این مقاله به دنبال ارائه مدلی پویا و بهینه برای کنترل هزینه های موجودی دستگاههای خودپرداز، با توجه به شرایط زمانی و مکانی هر دستگاه میباشد .بنابر این از داده های کل جامعه آماری، مربوط به بانک متبوع در شهر تهران که شامل 368 دستگاه خودپرداز می گردد استفاده شد . بررسی رفتار دستگاه ها در بازه زمانی سه ماهه در سال 1396 انجام شده است. این مدل با خوشه بندی داده های آماری در ابعاد زمانی و مکانی موفق به یادگیری الگوی موجود در کلان داده ها شده و بر همین مبنا درخت تصمیم ارائه شده قادر به پیش بینی تعداد مراجعه کننده به هر دستگاه می باشد . سپس با استفاده از تابع هزینه ها برای سناریوهای بدست آمده هزینه های سیستم مشخص میگردند.هزینه ی کل سیستم شامل مجموع هزینه های نگهداری پول ، کمبود پول و سفارش دهی پول برای هر دستگاه میباشد . در نهایت با ارائه الگوی بهینه سازی شده کنترل موجودی برای هر سناریو، هزینه های کل سیستم به طور میانگین 5/16 درصد ، یعنی به مقدار 38 میلیون تومان در ماه کاهش پیدا میکند. تفاصيل المقالة -
حرية الوصول المقاله
24 - بررسی تاثیر روش های مختلف خوشه بندی داده ها بر روی دقت مدل های مربوط به برآوردی های حسابداری از طریق مقایسه روش های خوشه بندی سنتی و کلاسیک
سید محسن صالحی وزیری جمال برزگری خانقاهامروزه استفاده از برآورد اطلاعات حسابداری همانند سایر رشته ها بدلیل عدم دسترسی به تمام اطلاعات، لازم و ضروری می باشد. به همین دلیل در این پژوهش سعی شده با استفاده از روش های مختلف خوشه بندی دقت مدل های مربوط به برآورد های حسابداری مورد بررسی قرار گیرد تا مشخص گردد روش ه أکثرامروزه استفاده از برآورد اطلاعات حسابداری همانند سایر رشته ها بدلیل عدم دسترسی به تمام اطلاعات، لازم و ضروری می باشد. به همین دلیل در این پژوهش سعی شده با استفاده از روش های مختلف خوشه بندی دقت مدل های مربوط به برآورد های حسابداری مورد بررسی قرار گیرد تا مشخص گردد روش های مختلف خوشه بندی به چه میزان دقت مدل های مدنظر را افزایش میدهند و روش ارجح تر در میان روش های مختلف خوشه بندی در افزایش دقت مدل ها کدام روش می تواند باشد. نمونه آماری پژوهش بدین منظور شامل 99 شرکت پذیرفته شده در بورس اوراق بهادار تهران بوده و به منظور جمع آوری داده های مورد نیاز، از اطلاعات صورت های مالی و یادداشت های دوره 9 ساله (1387-1395) شرکت های مورد نظر استفاده شده است. نتایج حاصل از تحقیق نشان داد که استفاده از روش های مختلف خوشه بندی دقت مدل های مربوط به برآوردهای حسابداری را در اکثر موارد افزایش می دهد ولی از میان روش های خوشه بندی مورد استفاده در تحقیق، روش خوشه بندی کلاسیک روش مناسب تری نسبت به روش سنتی در افزایش دقت مدل های مربوط به برآورد های حسابداری می باشد. تفاصيل المقالة -
حرية الوصول المقاله
25 - Machine learning clustering algorithms based on Data Envelopment Analysis in the presence of uncertainty
Reza Ghasempour Feremi Mohsen Rostamy-MalkhalifehThis study combines Data Envelopment Analysis (DEA) with machine learning clustering method in datamining for finding the most efficient Decision Making Unit (DMU) and the best clustering algorithm, respectively. The problem of assessment of units by using DEA may not b أکثرThis study combines Data Envelopment Analysis (DEA) with machine learning clustering method in datamining for finding the most efficient Decision Making Unit (DMU) and the best clustering algorithm, respectively. The problem of assessment of units by using DEA may not be straightforward due to the data uncertainty. Several scholars have been attracted to develop methods which incorporate uncertainty into input/output values in the DEA literature. On the other hand, in many real world applications, the data is reported in the form of intervals. This means that each input/output value is selected from a symmetric box. In the DEA literature, this type of uncertainty has been addressed as Interval DEA approaches. The main goal of this study is to evaluate the efficiency of banks in the case of data uncertainty with cross-efficiency method in the DEA literature. For this purpose, we consider the BCC-CCR and CCR-BCC models in the presence of uncertain data to find the superior model. After applying the optimization models, in machine learning step, clustering method is applied. Clustering is a procedure for grouping similar items together which this group is called the cluster. Also, the different clustering algorithms can be used according to the behavior of data. In this study, we apply the farthest first and expectation maximization algorithms and show that, in the case of data uncertainty, the BCC-CCR and farthest first algorithms are as a superior optimization model and machine learning algorithm, respectively. تفاصيل المقالة -
حرية الوصول المقاله
26 - ارزیابی عملکرد روشهای مدل درختی M5 و رگرسیون بردار پشتیبان در مدلسازی رسوب معلق رودخانه
محمدتقی ستاری علی رضازاده جودی فروغ صفدری فراز قهرمانیانهمواره پدیده انتقال رسوب، بسیاری از سازههای رودخانهای و سازههای عمرانی را تحت تاثیر قرار داده و عدم اطلاع از میزان دقیق آن خسارات بسیاری را موجب میشود. از این جهت برآورد صحیح بار رسوبی در رودخانهها از نقطه نظر رسوب، فرسایش و کنترل سیلاب بسیار حایز اهمیت است. در ا أکثرهمواره پدیده انتقال رسوب، بسیاری از سازههای رودخانهای و سازههای عمرانی را تحت تاثیر قرار داده و عدم اطلاع از میزان دقیق آن خسارات بسیاری را موجب میشود. از این جهت برآورد صحیح بار رسوبی در رودخانهها از نقطه نظر رسوب، فرسایش و کنترل سیلاب بسیار حایز اهمیت است. در این تحقیق، از دو روش نوین دادهکاوی شامل مدل درختی M5 و رگرسیون بردار پشتیبان برای برآورد بار رسوبی معلق رودخانه اهرچای در مقایسه با روش کلاسیک منحنی سنجه رسوب استفاده گردید. جهت ارزیابی عملکرد روشهای استفاده شده از سه آماره شامل ضریب همبستگی، جذر میانگین مربعات خطا و میانگین خطای مطلق استفاده گردید. با انجام تحلیل حساسیت مدلها به متغیر ورودی مشخص گردید، متغیر دبی جریان در ماه جاری دارای بیشترین تاثیر بر روی میزان بار رسوبی معلق میباشد. در حالت کلی نتایج بدست آمده بیانگر دقت بسیار بالای روشهای دادهکاوی نسبت به منحنی سنجه رسوب میباشد. اگرچه هر دو روش دادهکاوی بررسی شده دقت بیشتر و خطای کمتری نسبت به روش متداول منحنی سنجه رسوب داشتهاند، اما با توجه به روابط خطی ساده و قابل فهم ارائه شده توسط مدل درختی M5، کاربرد این روش کارآمد در موارد مشابه توصیه میگردد. تفاصيل المقالة -
حرية الوصول المقاله
27 - مدلسازی رواناب ماهانه با استفاده از روشهای داده کاوی براساس الگوریتم های انتخاب ویژگی
محمدتقی ستاری علی رضازاده جودیباتوجه به اهمیت مقدار جریان خروجی از حوضه آبریز جهت مدیریت آب های سطحی، فهم دقیق ارتباط بین مقدار رواناب با پارامترهای اقلیمی همچون بارش و دما و شناسائی موثرترین پارامتر در فرآیند مدل سازی بسیار مهم میباشد. در این تحقیق پس از آزمون همگنی دادههای بارش، دما و رواناب ماه أکثرباتوجه به اهمیت مقدار جریان خروجی از حوضه آبریز جهت مدیریت آب های سطحی، فهم دقیق ارتباط بین مقدار رواناب با پارامترهای اقلیمی همچون بارش و دما و شناسائی موثرترین پارامتر در فرآیند مدل سازی بسیار مهم میباشد. در این تحقیق پس از آزمون همگنی دادههای بارش، دما و رواناب ماهانه حوضه آبریز ناورود، ابتدا براساس دو الگوریتم رلیف و همبستگی دو ترکیب مختلف از پارامترهای موثر در رواناب مورد توجه قرار گرفت. الگوریتم جدید رلیف با استفاده از میانگین بردار وزنی مرتبط بین دادهها و یک مقدار آستانه، ویژگیهای موثر در بین یک مجموعه از دادهها را به ویژه در شرایطی که تعداد دادهها کم باشد، به ترتیب اهمیت شناسایی میکند. سپس با استفاده از دو روش رگرسیون بردار پشتیبان و نزدیکترین همسایگی رواناب ماهانه مبتنی بر دو ترکیب ورودی پیشنهادی مدل سازی گردید. نتایج بهدست آمده نشان داد، روش رگرسیون بردار پشتیبان با بهره گیری از تابع کرنل شعاع محور نسبت به روش نزدیکترین همسایگی از دقت بالا و خطای کمتری در برآورد رواناب به خصوص در مقادیر جریانهای سیلابی برخوردار است. تفاصيل المقالة -
حرية الوصول المقاله
28 - طراحی مدل هوشمند پیش بینی توانگری مالی در شرکتهای بیمه (رویکرد داده کاوی)
فاطمه شاه بازاده ابراهیم عباسی حسین دیده خانی علی خوزینهدف از این پژوهش ارائه یک مدل هوشمند جهت پیشبینی توانگری مالی در شرکتهای بیمه،به عنوان یک سیستم پشتیبان تصمیم میباشد.بدین منظور با بررسی پیشینه تعداد 17متغیر به عنوان متغیر پیش بین جهت پیش بینی طبقه توانگری مالی از منابع معتبر سایت بیمه مرکزی ج.ا.ا ، طی سال 1390 تا 13 أکثرهدف از این پژوهش ارائه یک مدل هوشمند جهت پیشبینی توانگری مالی در شرکتهای بیمه،به عنوان یک سیستم پشتیبان تصمیم میباشد.بدین منظور با بررسی پیشینه تعداد 17متغیر به عنوان متغیر پیش بین جهت پیش بینی طبقه توانگری مالی از منابع معتبر سایت بیمه مرکزی ج.ا.ا ، طی سال 1390 تا 1395 استخراج شده است. در این پژوهش ابتدا نتایج حاصل از بهکارگیری مدل های مختلف پیشبینی مبتنی بر دادهکاوی مورد مقایسه قرار گرفته و در مرحله بعد رتبهبندی الگوریتمهای پیشبینی شونده مورد بررسی قرار گرفت. نتایج حاصل از این پژوهش نشان داد که توانگری مالی با دقت قابل قبول پیشبینی پذیرند و مدل استخراج شده بااستفاده از درخت تصمیم دقت و قابلیت بسیار بالایی در تخمین را داراست. تفاصيل المقالة -
حرية الوصول المقاله
29 - تبیین نقش ویژگیهای شخصیتی و ساختاری مدیریت بر توان رقابتپذیری در بازار محصولات شرکتهای پذیرفته شده در بورس اوراق بهادار تهران: تاکیدی بر مدلهای داده کاوی و تحلیل پوششی دادهها
امیر فریدنیا محسن لطفی بهروز اسکندرپوراین پژوهش به بررسی تاثیر مجموعهای از ویژگیهای شخصیتی و ساختاری مدیریت (شامل کوتهبینی، خوشبینی، محافظهکاری، استقلال، تنوع جنسیت هیئت مدیره، ثبات و توانایی مدیریت) بر توان رقابتپذیری در بازار محصولات شرکتهای پذیرفته شده در بورس اوراق بهادار تهران پرداخته است. این پ أکثراین پژوهش به بررسی تاثیر مجموعهای از ویژگیهای شخصیتی و ساختاری مدیریت (شامل کوتهبینی، خوشبینی، محافظهکاری، استقلال، تنوع جنسیت هیئت مدیره، ثبات و توانایی مدیریت) بر توان رقابتپذیری در بازار محصولات شرکتهای پذیرفته شده در بورس اوراق بهادار تهران پرداخته است. این پژوهش با استفاده از نمونهای شامل 144 شرکت پذیرفته شده در بورس اوراق بهادار تهران در دوره زمانی سالهای 1386 تا 1397 و بکارگیری روشهای آماری همچون تحلیل پوششی دادهها، مدل رگرسیونی مبتنی بر دادههای پانلی و روشهای دادهکاوی(مدل شبکههای عصبی و درخت تصمیم) انجام گرفته است. یافتههای روشهای رگرسیونی نشان داد که از بین متغیرهای مورد بررسی متغیرهای کوتهبینی، استقلال هیئت مدیره، ثبات و توانایی مدیریت تاثیری معنادار بر توان رقابتپذیری در بازار محصولات را داشته است. مقایسه نتایج روشهای رگرسیونی و مدلهای دادهکاوی نشان داد که از میان ویژگیهای مدیریت، تنها متغیرهای کوتهبینی، توانایی و استحکام مدیریت تاثیری معنادار بر رقابتپذیری در بازار محصولات شرکتها داشته است. تفاصيل المقالة -
حرية الوصول المقاله
30 - طراحی مدل هوشمند ترکیبی جهت پیشبینی نقاط طلایی قیمت سهام
محمد مشاری حسین دیده خانی کاوه خلیلی دامغانی ابراهیم عباسیهدف از این پژوهش ارائه یک مدل هوشمند جهت پیشبینی نقاط طلایی در نمودار قیمت سهام ،به عنوان یک سیستم پشتیبان تصمیم میباشد.جهت انجام این پژوهش از دادههای صنعت خودرو، و ساخت قطعات طی سال 1380 تا 1395 استفادهشده است.در این پژوهش ابتدا نتایج حاصل از بهکارگیری مدل های مخت أکثرهدف از این پژوهش ارائه یک مدل هوشمند جهت پیشبینی نقاط طلایی در نمودار قیمت سهام ،به عنوان یک سیستم پشتیبان تصمیم میباشد.جهت انجام این پژوهش از دادههای صنعت خودرو، و ساخت قطعات طی سال 1380 تا 1395 استفادهشده است.در این پژوهش ابتدا نتایج حاصل از بهکارگیری مدل های مختلف پیشبینی مبتنی بر دادهکاوی مقایسه قرار گرفت،در مرحله بعد متغیرهای پژوهش به وسیله الگوریتم ژنتیک بهینهسازی شد و مجددا مدلسازی انجام پذیرفت.نتایج حاصل از این پژوهش نشان داد که نقاط طلایی با دقت قابل قبول پیشبینی پذیرند و بهینهسازی در همه مدل ها باعث افزایش دقت پیشبینینمیگردد اما خطای فاحش را به میزان قابل توجهی کاهش میدهد. تفاصيل المقالة -
حرية الوصول المقاله
31 - استفاده از تکنیکهای دادهکاوی برای سنجش ریسک مالیاتی مؤدیان مالیات بر ارزش افزوده
محمد مسیحی احمد یعقوب نژاد امیررضا کیقبادی تقی ترابیدر این مقاله با استفاده از تکنیکهای دادهکاوی ریسک مالیاتی مؤدیان در نظام مالیات بر ارزش افزوده مورد مطالعه قرار میگیرد. اهمیت ارزیابی ریسک مالیاتی مؤدیان مالیات بر ارزش افزوده به منظور تدوین طرح مؤثر انتخاب مؤدیان برای حسابرسی مالیاتی با هدف افزایش کارایی و اثر بخشی أکثردر این مقاله با استفاده از تکنیکهای دادهکاوی ریسک مالیاتی مؤدیان در نظام مالیات بر ارزش افزوده مورد مطالعه قرار میگیرد. اهمیت ارزیابی ریسک مالیاتی مؤدیان مالیات بر ارزش افزوده به منظور تدوین طرح مؤثر انتخاب مؤدیان برای حسابرسی مالیاتی با هدف افزایش کارایی و اثر بخشی در نظام مالیات بر ارزش افزوده کشور میباشد. مؤدیان مالیاتی در این تحقیق به سه گروه مؤدیان فاقد ریسک، با ریسک پایین و پر ریسک طبقه بندی شدهاند به منظور ارزیابی ریسک مالیاتی از دو تکنیک دادهکاوی ماشین بردار پشتیبان و رگرسیون لجستیک استفاده شده است. جامعه آماری پژوهش شامل اشخاص حقوقی بزرگ در شهر تهران میباشد که در سال های 1390 تا 1393 مورد حسابرسی مالیاتی در نظام مالیات بر ارزش افزوده قرار گرفتهاند در این تحقیق متغیرها شامل ساز و کارهای حاکمیت شرکتی، ویژگیهای خاص شرکتی، ماهیت فعالیت مؤدیان سیستم کنترلی مؤدیان و نسبتهای مالی میباشد که به منظور آموزش و آزمون مدل استفاده شدهاند نتایج تحقیق نشان میدهد دو تکنیک LSVM و Logistic از توان صحت ارزیابی70% برخوردار هستند و نوعی ادغام در نتایج این دو تکنیک توانسته است با کسب نزدیک به 83% صحت ارزیابی از توان بالاتری برخوردار باشد. تفاصيل المقالة -
حرية الوصول المقاله
32 - A Hybrid DEA Based CHAID and Imperialist Competitive Algorithm for Stock Selection
F. Faezy RaziIn this paper, the investment portfolio is formed based on the data mining algorithm of CHAID on the basis of the risk status criteria. In the next step, the second investment portfolio is created based on the decision rules extracted by the DEA-BCC model. The final por أکثرIn this paper, the investment portfolio is formed based on the data mining algorithm of CHAID on the basis of the risk status criteria. In the next step, the second investment portfolio is created based on the decision rules extracted by the DEA-BCC model. The final portfolio is created through a two-objective mathematical programming model based on the Imperialist Competitive algorithm. تفاصيل المقالة -
حرية الوصول المقاله
33 - بررسی عوامل مدیریتی تأثیرگذار بر شاخصهای تنوع زیستی علفهرز و عملکرد مزارع گندم با استفاده از درخت تصمیمگیری CART در شهرستان چناران
ستایش خردمند بهنام کامکار جاوید قرخلو محمد حسن هادی زاده قربانعلی رسامبه منظور بررسی عواملمدیریتی و محیطی مؤثر برتراکم و غالبیت علفهای هرز مزارع گندم آبی(Triticum aestivum L) مطالعههای در دو سال متوالی در سالهای 1393-1394 در 200 مزرعه از بیست روستا واقع در چهار جهت شهرستان چناران صورت گرفت. برای این منظور نمونهبرداری به روش (w) و با پ أکثربه منظور بررسی عواملمدیریتی و محیطی مؤثر برتراکم و غالبیت علفهای هرز مزارع گندم آبی(Triticum aestivum L) مطالعههای در دو سال متوالی در سالهای 1393-1394 در 200 مزرعه از بیست روستا واقع در چهار جهت شهرستان چناران صورت گرفت. برای این منظور نمونهبرداری به روش (w) و با پرتاب کوآدرات 25/0 مترمربعی انجام و گونههای علفهای هرز هرکادر به تفکیک جنس و گونه شناسایی و تعداد آنها تعیین گردید. سپس شاخصهای تنوع شانن واینر و شاخص یکنواختی سیمپسون برای اندازهگیری تنوع زیستی مورد محاسبه قرار گرفت. عوامل کمی و کیفی مدیریتی در قالب پرسشنامه از کشاورزان تهیه شد. بدین منظور تمام اطلاعات مربوط به مدیریت زراعی شامل مساحت اراضی، سابقه کشاورزان، عملیات تهیه بستر بـذر ، روش مبارزه با علف هرز و ... در قالب پرسشنامه و در طول فصل رشد از طریق پرسش از کشاورزان جمعآوری و تکمیل شد، در پایان فصل رشـد نیـز میـزان عملکـرد واقعـی برداشت شده توسط کشاورزان، ثبت گردید. تجزیه و تحلیل دادهها با روش درخت تصمیمگیری CART (Classification and Regression Trees) نشان داد که از میان پارامترهای مختلف مورد بررسی تجربه کشاورزی، تعداد استفاده از علفکش دو منظوره، نیتروژن، پتاسیم، کشت تابستان دو سال قبل و استفاده از بذرپاش سانتریفوژ، سن کشاورز، بر تغییرات شاخص شانون –وینر و سیمپسون اثرگذار بوده است. عوامل مدیریتی مهم اثر گذار بر روی عملکرد گندم شامل سه عامل مدیریتی تقسیط بندی کودپاشی، تعداد استفاده از علفکش دو منظوره و کودپتاسیم و همچنین تناوب و سطح تحصیلات بوداست.نتایج این تحقیق نشان داد که مقدار مناسب کود پتاسیم و نیتروژن و انتخاب تناوب مناسب راهکارهای مدیریتی موثر در بهبود عملکرد گندم و افزایش تنوع آن در شهرستان چناران هستند. تفاصيل المقالة -
حرية الوصول المقاله
34 - بهبود سیستم های تشخیص نفوذ باکاهش ویژگی مبتنی بر الگوریتم ژنتیک و تکنیکهای دادهکاوی
مهدی کشاورزی حسین مومن زاده حقیقیامروزه سیستم های کامپیوتری مبتنی بر شبکه، نقش حیاتی در جامعه مدرن امروزی دارند و به همین علت ممکن است هدف دشمنی و یا نفوذ قرار گیرند. به منظور ایجاد امنیت کامل در یک سیستم کامپیوتری متصل به شبکه، استفاده از دیوار آتش و سایر مکانیزم های جلوگیری از نفوذ همیشه کافی نیست و أکثرامروزه سیستم های کامپیوتری مبتنی بر شبکه، نقش حیاتی در جامعه مدرن امروزی دارند و به همین علت ممکن است هدف دشمنی و یا نفوذ قرار گیرند. به منظور ایجاد امنیت کامل در یک سیستم کامپیوتری متصل به شبکه، استفاده از دیوار آتش و سایر مکانیزم های جلوگیری از نفوذ همیشه کافی نیست و این نیاز احساس می شود تا از سیستم های دیگری به نام سیستم های تشخیص نفوذ استفاده شود. سیستم تشخیص نفوذرا می توان مجموعه ای از ابزارها، روش ها و مدارکی در نظر گرفت که به شناسایی، تعیین و گزارش فعالیت های غیرمجاز یا تائید نشده تحت شبکه، کمک میکند. سیستم های تشخیص نفوذ به صورت سیستم های نرم افزاری و سخت افزاری ایجاد شده و هر کدام مزایا و معایب خاص خود را دارند. به دلیل وجود مشخصه های زیاد در داده های مربوط به سیستم های تشخیص نفوذ در این تحقیق ما مشخصه های مطلوب و موثر را با استفاده از الگوریتم ژنتیک بهبود یافته انتخاب می کنیم. سپس با استفاده از تکنیک های داده کاوی استاندارد، مدلی برای طبقه بندی داده ها ارائه می دهیم. برای ارزیابی عملکرد روش پیشنهادی از پایگاه داده NSL-KDD که نسبتبه سایر داده های تشخیص نفوذ از رکوردهای واقعی تری برخورد دار است، استفاده خواهیم کرد. تفاصيل المقالة -
حرية الوصول المقاله
35 - Improving of Diabetes Diagnosis using Ensembles and Machine Learning Methods
Razieh Asgarnezhad Karrar Ali Mohsin AlhameedawiDiabetes is one of the most common metabolic diseases, and diagnosis of it is a classification problem. The most challenge is this area is missing value problem. Artificial Intelligence techniques have been successfully implemented over medical disease diagnoses. Classi أکثرDiabetes is one of the most common metabolic diseases, and diagnosis of it is a classification problem. The most challenge is this area is missing value problem. Artificial Intelligence techniques have been successfully implemented over medical disease diagnoses. Classification systems aim clinicians to predict the risk factors that cause diabetes. To address this challenge, we introduce a novel model to investigate the role of pre-processing and data reduction for classification problems in the diagnosis of diabetes. The model has four stages consists of Pre-processing, Feature sub-selection, Classification, and Performance. In the classification technique, ensemble techniques such as bagging, boosting, stacking, and voting were used. We considered both states with/without for pre-processing stage to reveal the high performance of our model. Two experiments were conducted to reveal the performance of the model for the diagnosis of diabetics Mellitus. The results confirmed the superiority of the proposed method over the state-of-the-art systems, and the best accuracy and F1 achieved 97.12% and 97.40%, respectively. تفاصيل المقالة -
حرية الوصول المقاله
36 - Improving Students' Performance Prediction using LSTM and Neural Network
Hussam Abduljabar Salim Ahmed Razieh AsgarnezhadEducational data mining utilizes information from academic fields to develop renewed techniques and spot unusual patterns to gauge students' academic achievement. Evaluating student learning is a complicated issue. Data mining in this field enables to predict students' أکثرEducational data mining utilizes information from academic fields to develop renewed techniques and spot unusual patterns to gauge students' academic achievement. Evaluating student learning is a complicated issue. Data mining in this field enables to predict students' performance to recommend performance in universities. Therefore, the current authors have recently seen the rapid growth of data mining and knowledge extraction as tools used by academic institutions to optimize student learning processes. Here, a method based on a certain kind of artificial neural network called Long Short Term Memory recurrent neural network for prediction will operate. The proposed approach tries to use the educational characteristics of different people to predict the best educational process future educational. It career for students and thereby take steps to improve the effectiveness of the educational system. For comparison, one of the newest algorithms presented in this field was implemented using the proposed technique. The evaluations' findings were performed in the form of two scenarios with different data sizes and different amounts of test and training data. For the evaluation, the dataset taken from an online educational system was used. The evaluation results are presented in the form of four well-known criteria precision, recall, accuracy, and F1, which demonstrate the superiority of the proposed method. تفاصيل المقالة -
حرية الوصول المقاله
37 - مقایسه روش های طبقه بندی در تخمین تلاش توسعه نرم افزار
صادق انصاری پور تقی جاودانی گندمانینادرست بودن تخمین هزینه نرم افزار یکی از دلایل مهم ناامیدی متخصصان نرم افزار و محققان تخمین هزینه بوده است و علیرغم تلاش های فراوانی که برای بهبود آن انجام شده است اما هنوز هم دقت تخمین پایین است. عدم تجزیه و تحلیل مناسب در ابتدای شروع به کار پروژه و همچنین عدم به روز آ أکثرنادرست بودن تخمین هزینه نرم افزار یکی از دلایل مهم ناامیدی متخصصان نرم افزار و محققان تخمین هزینه بوده است و علیرغم تلاش های فراوانی که برای بهبود آن انجام شده است اما هنوز هم دقت تخمین پایین است. عدم تجزیه و تحلیل مناسب در ابتدای شروع به کار پروژه و همچنین عدم به روز آن در حین انجام پروژه یکی از مهم ترین دلایل شکست پروژه ها محسوب می شود. اگر چه زمانی که یک پروژهها بسته میشوند، بازخورد های آن ایجاد میشود، اما اگر تخمینها و واقعیات ثبتشده با پروژه انجامشده به طور کامل مطابقت نداشته باشند، آنگاه نمی توان انتظار تخمین دقیقی را داشت. بنابراین جمع آورده داده های پروژه بر اساس ویژگی های مشخص امری ضروری است و در اینجاست که می توان به نقش پررنگ پروژه های انجام شده در گذشته و مجموعه داده هایی که می توان با استفاده از آنها ایجاد نمود پی برد. در این مطالعه سعی بر این است که به بررسی نقش روش های مختلف طبقه بندی در تخمین تلاش نرم افزار بپردازیم. تفاصيل المقالة -
حرية الوصول المقاله
38 - کاربرد داده کاوی آموزشی جهت شناسایی عوامل مؤثر بر افت تحصیلی دانش آموزان
محمود نجفی مهدی افضلی محمود مرادیاستخراج دانش یکی از مهمترین مسائل دادهکاوی میباشد. قوانینی که بهصورت اگر - آنگاه مطرح میگردند، این توانایی را دارند که به صورت اعداد حقیقی در هر جزء به صورت تمام مقادیری که در مجموعه داده میتواند وجود داشته باشد، قرار بگیرند. روش پیشنهادی در این مقاله استفاده از ا أکثراستخراج دانش یکی از مهمترین مسائل دادهکاوی میباشد. قوانینی که بهصورت اگر - آنگاه مطرح میگردند، این توانایی را دارند که به صورت اعداد حقیقی در هر جزء به صورت تمام مقادیری که در مجموعه داده میتواند وجود داشته باشد، قرار بگیرند. روش پیشنهادی در این مقاله استفاده از الگوریتمهای درخت تصمیم و خوشهبندی و قوانین انجمنی برای استخراج قوانین میباشد. در روش پیشنهادی استخراج قوانین را به صورت یک مسئله بهینهسازی در آورده و هدف به دست آوردن قانونی با اطمینان بالا، عمومیت و قابلیت درک بالا میباشد. الگوریتم پیشنهادی برای استخراج قوانین ازمجموعه داده افت تحصیلی از اطلاعات فردی256 دانشآموزان هنرستانها در زنجان جمعآوری شده و تست گردید. از نتایج به دست آمده از این تحقیق می توان برای پیشگیری از افت تحصیلی دانشآموزان و بهبود کیفیت ارتباط مسوولین و والدین با دانشآموزان و آموزش هر چه بهتر آنان استفاده کرد. تفاصيل المقالة -
حرية الوصول المقاله
39 - طراحی مدل ترکیبی برای طبقهبندی دادههای نامتوازن در رشته بیمه شخص ثالث
مهناز منطقی پور پریسا رحیم خانیبخش عمده پورتفوی صنعت بیمه کشور ایران را رشته بیمه اجباری مسئولیت مدنی دارندگان وسایل نقلیه موتوری زمینی در مقابل اشخاص ثالث، تشکیل داده است. توانایی پیش بینی وقوع و یا عدم وقوع خسارت به ویژه خسارتهای جانی نه تنها برای شرکتهای بیمه بلکه برای تصمیم گیرندگان در حوزههای أکثربخش عمده پورتفوی صنعت بیمه کشور ایران را رشته بیمه اجباری مسئولیت مدنی دارندگان وسایل نقلیه موتوری زمینی در مقابل اشخاص ثالث، تشکیل داده است. توانایی پیش بینی وقوع و یا عدم وقوع خسارت به ویژه خسارتهای جانی نه تنها برای شرکتهای بیمه بلکه برای تصمیم گیرندگان در حوزههای افزایش امنیت جادهها اهمیت بسیاری دارد. به منظور پیش بینی برچسب وقوع یا عدم وقوع خسارت از روشهای طبقه بندی استفاده میشود که در واقع یک مساله طبقه بندی نامتوازن است. این نامتوازن بودن شدید، ناشی از ماهیت کسب و کار بیمه است. نامتوازن بودن دادههای صنعت بیمه باعث ایجاد چالشهای بسیاری در تجزیه و تحلیل دادههای مربوطه میشود. در این پژوهش، ما به طبقهبندی دادههای نامتوازن بیمه شخص ثالث در یک شرکت بیمه معتبر میپردازیم. در این راستا دو روش ترکیبی برای رفع مشکل نامتوازن بودن دادهها براساس 5 مدل پایه گاوسین بیز، بردارهای پشتیبان، لجستیک رگرسیون، درخت تصمیم، نزدیکترین همسایگی به منظور طبقهبندی موثرتر دادههای مربوطه ارائه میشود. نتایج بدست آمده نشان میدهد که مدلهای ترکیبی ارائه شده بهتر از سایر الگوریتمهای دادهکاوی برای دادههای مربوطه جواب میدهند و استفاده از درخت تصمیم در تجمیع مدلهای پایه برای ساخت مدل ترکیبی نتایج بهتری نسبت به رای گیری ساده مدلها ارائه میکند. همچنین ابر پارامتر تعداد مدلهای لازم در رای گیری بر اساس استراتژی شرکت قابل تنظیم است. تعداد ویژگیهای ثبت شده از بیمه نامهها در شرکتهای بیمه محدود است با تکمیل این ویژگیها به ویژه اضافه شدن سوابق رانندگی و سایر ویژگیهای فردی میتوان به مدل بهتری دست یافت. تفاصيل المقالة -
حرية الوصول المقاله
40 - روشی نوین جهت خوشه بندی داده مبتنی بر ترکیب الگوریتمهای بهینهسازی ژنتیک و کرم شبتاب
مهسا افسردیر منصوره افسردیریکی ازمسائل مهم دردادهکاوی خوشهبندی است که بدون هدف ازپیش تعیین شدهای دادهها را بر اساس شباهت درون خوشهها تقسیمبندی میکند. از روشهای متداول خوشهبندی الگوریتم k-means است که بادریافت ورودی، دادههارابه k خوشه تقسیمبندی میکند. یکی ازمعایب این روش حساسیت به شرای أکثریکی ازمسائل مهم دردادهکاوی خوشهبندی است که بدون هدف ازپیش تعیین شدهای دادهها را بر اساس شباهت درون خوشهها تقسیمبندی میکند. از روشهای متداول خوشهبندی الگوریتم k-means است که بادریافت ورودی، دادههارابه k خوشه تقسیمبندی میکند. یکی ازمعایب این روش حساسیت به شرایط اولیه است که منجربه کاهش دقت درخوشهبندی میشود. از روشهای بهبود عملکرد k-means میتوان استفاده ازالگوریتمهای فراابتکاری را نام برد. در این پژوهش به دو روش بهینهسازی ژنتیک و کرم شبتاب پرداخته شده است و الگوریتم جدیدی تحت عنوان الگوریتم ژنتیکی کرمشبتاب جهت بهینهسازی خوشهبندی k-means ارائه شده است. الگوریتم کرمشبتاب از الگوریتمهای هوش جمعی است که از ویژگی نورچشمک زن کرمشبتاب الهام گرفته است و الگوریتم ژنتیک نوعی از الگوریتمهای فراابتکاری است که از تکنیک-های زیستشناسی مانند وراثت و جهش استفاده میکند. در الگوریتم k-means برای اینکه مراکز خوشه به صورت تصادفی انتخاب می شوند، خوشهبندی دقت لازم را ندارد. با استفاده از الگوریتمهای فراابتکاری سعی در بدست آوردن مراکز دقیق خوشهها داشته و در نتیجه آن، خوشه-بندی صحیح میباشیم. در روش پیشنهادی، ابتدا الگوریتم k-means را روی دادههای ورودی اجراکرده و خوشهبندی انجام میشود. سپس مضربی از مراکز خوشه که دراین الگوریتم بدست آمده است را به عنوان حد پایین و حد بالای الگوریتم پیشنهادی استفاده میکنیم. جمعیت اولیه به صورت تصادفی بین حد پایین و حد بالا تولید میشود. در حلقه اصلی الگوریتم جمعیت را به دو دسته جمعیت مساوی تقسیم می نماییم، بر روی دسته اول الگوریتم ژنتیک را اجرا میکنیم، بر روی دسته دوم بر اساس الگوریتم کرمشبتاب موقعیتهای جدید را بدست میآوریم. حال جمعیت قبلی و جمعیت جدید بدست امده از الگوریتم ژنتیک و جمعیت جدید بدست امده از الگوریتم کرمشبتاب را تلفیق کرده وآنها را از خوب به بد مرتب میکنیم و به تعداد مورد نیاز از آنها را انتخاب و به ابتدای حلقه میرویم. این فرایند را تا برقراری شرط توقف ادامه میدهیم. درپایان الگوریتم k-means، الگوریتم کرم شبتاب، الگوریتم ژنتیک و الگوریتم پیشنهادی بر روی سه مجموعه داده اعمال شده و نتایج مورد مقایسه قرار گرفته است.نتایج شبیهسازی نشان میدهد که الگوریتم ژنتیکی کرمشبتاب عملکرد بهتری در مقایسه با سایر روشها داشته است. تفاصيل المقالة -
حرية الوصول المقاله
41 - ارایه یک رویکرد شبه نظارتی برای بهبود عملکرد آموزش الکترونیکی
فرهاد قره باغی علی امیریدر عصر اطلاعات جهتگیری بسیاری از سامانهها به سمت شخصیسازی اطلاعات برای کاربر است. یادگیری الکترونیکی نیز از این قاعده مستثنی نبوده و یکی از ملزومات آن وجود مکانیزمی شخصیشده برای کمک به یادگیری مؤثر یادگیرنده است. در سالهای اخیر از روشهای دادهکاوی به طور گسترده د أکثردر عصر اطلاعات جهتگیری بسیاری از سامانهها به سمت شخصیسازی اطلاعات برای کاربر است. یادگیری الکترونیکی نیز از این قاعده مستثنی نبوده و یکی از ملزومات آن وجود مکانیزمی شخصیشده برای کمک به یادگیری مؤثر یادگیرنده است. در سالهای اخیر از روشهای دادهکاوی به طور گسترده در زمینه یادگیری الکترونیکی استفاده شده است. در واقع محققین مختلف با استفاده از روشهای دادهکاوی سعی در شناخت هر چه بیشتر یادگیرندگان و در نتیجه ایجاد یادگیری تطبیقی داشتهاند. در تحقیقات مختلف از یادگیری نظارت شده برای شناخت یادگیرندگان استفاده شده است. با توجه به معایب الگوریتم های یادگیری نظارت شده در این تحقیق جهت شناسایی سطح دانش یادگیرندگان یک مدل داده کاوی شبه نظارتی پیشنهادشده است تا بتواند با شخصیسازی و هوشمندسازی محیط یادگیری الکترونیکی، عملکرد یادگیری و رضایت مندی یادگیرندگان را بهبود بخشد. در این مقاله با استفاده از رویکرد دادهکاوی شبه نظارتی به شناسایی سطح دانش یادگیرندگان پرداخته شده است. به این منظور برای ایجاد مدل پیشنهادی از الگوریتم شبه نظارتی LP-MLTSVM استفاده شده است. در ساخت مدل پیشنهادی از داده های واقعی استفاده شده است. به منظور ارزیابی، در یک دوره مجازی از مدل پیشنهاد شده استفاده شد. نتایج حاصل از دوره موفقیت و رضایت تحصیلی یادگیرندگان با مدل پیشنهادی را نشان میدهد. تفاصيل المقالة -
حرية الوصول المقاله
42 - ارائه رهیافت جدید برای استخراج لینک های مفهومی پرتکرار از شبکه های اجتماعی
محبوبه فریمانی سامان پور سیاه حمید طباطبایی حسین سلامیچکیده: لینک های مفهومی یکی از رهیافت های جدید برای توصیف شبکه های اجتماعی است که دانش نهفته در شبکه های اجتماعی را از طریق یک ساختار خلاصه شده با عنوان دیدگاه مفهومی ارائه می نماید. مهمترین چالش در بدست آوردن دیدگاه مفهومی از یک شبکه اجتماعی استخراج لینک های مفهومی پرتک أکثرچکیده: لینک های مفهومی یکی از رهیافت های جدید برای توصیف شبکه های اجتماعی است که دانش نهفته در شبکه های اجتماعی را از طریق یک ساختار خلاصه شده با عنوان دیدگاه مفهومی ارائه می نماید. مهمترین چالش در بدست آوردن دیدگاه مفهومی از یک شبکه اجتماعی استخراج لینک های مفهومی پرتکرار است که این امر برای شبکه های با مقیاس بزرگ بسیار زمانبر است. در این نوشتار، روش جدیدی برای استخراج لینک های مفهومی پرتکرار از شبکه های اجتماعی ارائه شده است که با بکارگیری مفهوم وابستگی ها، سعی در تسریع فرآیند استخراج لینک های مفهومی دارد. روش پیشنهادی قادر خواهد بود در صورت وجود وابستگی ها در بین داده ها، این فرآیند را تسریع بخشد. تفاصيل المقالة -
حرية الوصول المقاله
43 - Presenting a Model for Financial Reporting Fraud Detection using Genetic Algorithm
Mahmood Mohammadi Shohreh Yazdani Mohammadhamed Khanmohammadiboth academic and auditing firms have been searching for ways to detect corporate fraud. The main objective of this study was to present a model to detect financial reporting fraud by companies listed on Tehran Stock Exchange (TSE) using genetic algorithm. For this purp أکثرboth academic and auditing firms have been searching for ways to detect corporate fraud. The main objective of this study was to present a model to detect financial reporting fraud by companies listed on Tehran Stock Exchange (TSE) using genetic algorithm. For this purpose, consistent with theoretical foundations, 21 variables were selected to predict fraud in financial reporting that finally, using statistical tests, 9 variables including SALE/EMP, RECT/SALE, LT/CEQ, INVT/SALE, SALE/TA, NI/CEQ, NI/SALE, LT/XINT, and AT/LT were selected as the potential financial reporting fraud indexes. Then, using genetic algorithm, the final model of fraud detection in financial reporting was presented. The statistical population of this study included 66 companies including 33 fraudulent and 33 non-fraudulent companies from 2011 to 2016. The results showed that the presented model with the accuracy of 91.5% can detect fraudulent companies. These findings extend financial statement fraud research and can be used by practitioners and regulators to improve fraud risk models. تفاصيل المقالة -
حرية الوصول المقاله
44 - A Combined Model for Prediction of Financial Software Learning Rate based on the Accounting Students’ Characteristics
Bahareh Banitalebi Dehkordi Hamed Samarghandi Sara Hosseinzadeh Kassani Hamidreza malekhossiniThe accounting software is considered to be of the most critical components of accounting information system, with particular significance as of accounting and financial systems. the most important problems with accounting education systems is that students do not adequ أکثرThe accounting software is considered to be of the most critical components of accounting information system, with particular significance as of accounting and financial systems. the most important problems with accounting education systems is that students do not adequately learn the financial software required by the accounting profession, which, in turn, reduces the credibility and position of the accounting profession. That the main objective of accounting software education is to educate skilled and expert accountants to enter the accounting profession, which is considered as of the success factors of country’s economy. In this study, employ data mining techniques to investigate the accuracy, precision, and recall performance measures and to predict the rate of financial software learning based on accounting students’ emotional intelligence (EI), gender and education level. Accordingly, a machine-learning-based multivariate statistical analysis is performed on 100 Iranian accounting students. The results show that emotional intelligence has the most impact on the rate of financial software learning among the variables. Gender and education level were influential. Also, among the five algorithms, the highest precision and recall are achieved by both Decision Tree and XGBoost and are presented as the most appropriate models for the prediction rate of financial software learning. تفاصيل المقالة -
حرية الوصول المقاله
45 - Computing the Efficiency of Bank Branches with Financial Indexes, an Application of Data Envelopment Analysis (DEA) and Big Data
Fahimeh Jabbari-Moghadam Farhad Hosseinzadeh Lotfi Mohsen Rostamy-Malkhalifeh Masoud Sanei Bijan Rahmani-ParchkolaeiIn traditional Data Envelopment Analysis (DEA) techniques, in order to calculate the efficiency or performance score, for each decision-making unit (DMU), specific and individual DEA models are designed and resolved. When the number of DMUs are immense, due to an increa أکثرIn traditional Data Envelopment Analysis (DEA) techniques, in order to calculate the efficiency or performance score, for each decision-making unit (DMU), specific and individual DEA models are designed and resolved. When the number of DMUs are immense, due to an increase in complications, the skewed or outdated, calculating methods to compute efficiency, ranking and …. may not prove to be economical. The key objective of the proposed algorithm is to segregate the efficient units from that of the other units. In order to gain access to this objective, effectual indexes were created; and taken to assist, in regards the DEA concepts and the type of business (under study), to survey the indexes, which were relatively operative. Subsequently, with the help of one of the clustering techniques and the ‘concept of dominance’, the efficient units were absolved from the inefficient ones and a DEA model was developed from an aggregate of the efficient units. By eliminating the inefficient units, the number of units which played a role in the construction of a DEA model, diminished. As a result, the speed of the computational process of the scores related to the efficient units increased. The algorithm designed to measure the various branches of one of the mercantile banks of Iran with financial indexes was implemented; resulting in the fact that, the algorithm has the capacity of gaining expansion towards big data. تفاصيل المقالة -
حرية الوصول المقاله
46 - Mining a Set of Rules for Determining the Waiting Time for Selling Residential Units
Farshid Abdi Shaghayegh AbolmakaremBeing aware of the waiting time for selling residential units is one of the important issues in the housing sector for the majority of people, especially investors. There are several factors affecting the waiting time for selling residential units. Determining the influ أکثرBeing aware of the waiting time for selling residential units is one of the important issues in the housing sector for the majority of people, especially investors. There are several factors affecting the waiting time for selling residential units. Determining the influential factors on the time period of selling real estates can lead to an informed decision making by real estate consultants, sellers as well as those seeking to buy real estates. Using a real estate database in Iran, the present paper proposes a two-module procedure. The first module deals with implementation of association rule mining. Using the well-known association rule mining techniques namely FP-Growth, several association rules have been extracted which indicate the effective factors on the waiting time for selling residential units. Generated association rules have been evaluated based on metrics such as support, confidence and lift and finally the best rules are selected. The main objective of the second module is to develop a fuzzy inference system which can determine the factors influencing the waiting time for selling residential units from historical data, so that the model can be used to estimate the time it to sell the property for a real estate agency. Several IF-THEN rules are extracted from this module. Extracted rules can be used by real estate agencies as well as buyers and sellers of residential units to make better decisions in their investments. In conclusion section, a number of suggestions for future studies are presented. For example, machine learning algorithms such as neural networks, decision trees, etc. can also be used to predict the duration of residential units’ sale.The main objective of the second module is to develop a fuzzy inference system which can learn about the factors that influence the waiting time for selling residential units from historical data, so that the model can be used to estimate the time it takes to sell the property for a real estate agency. Several IF-THEN rules are extracted from this module. Extracted rules can be used by real estate agencies as well as buyers and sellers of residential units to make better decisions in their investments. تفاصيل المقالة -
حرية الوصول المقاله
47 - Identification of influencing factors on implementation of smart city plans based on approach of technical and social system
Ali Safarzadeh Ghasemali Bazaei Mehdi FaghihiThe current research seeks to identify the influencing factors on implementation of smart city plans based on approach of technical and social systems. For this goal, the library study is done and then based on that a research plan is written that include using expert o أکثرThe current research seeks to identify the influencing factors on implementation of smart city plans based on approach of technical and social systems. For this goal, the library study is done and then based on that a research plan is written that include using expert opinions and data mining technique, feature selection ,clustering and also Delphi technique to identify and screen factors and then using clustering, the final factors are leveled. Here the aim is not ranking but is leveling. Meanwhile because of high numbers of factors, screening them in both steps using Delphi and feature selection is conducted. Delphi is one of the classic tests in qualitative approaches and feature selection include data mining techniques. Finally leveling factors include technical and social factors and the most influencing ones are determined. technical factors including digital infrastructure, ICT base transportation, ICT based logistic, building alarm systems, energy consumption adjustment, ICT based process are placed in level one. Social factors including digital and smart innovation, knowledge sharing, smart education, participation in sustainable development, access to educational plans, waste recycling, pollution control, productivity and flexibility of labor market are placed in level one. تفاصيل المقالة -
حرية الوصول المقاله
48 - Parallel Machine Scheduling with Controllable Processing Time Considering Energy Cost and Machine Failure Prediction
Yousef Rabbani Ali Qorbani Reza Kamran RadPredicting unexpected incidents and energy consumption decline is one of the current problems in the industry. The extant study addressed parallel machine scheduling by consideration of failures and energy consumption decline. Moreover, the present paper aimed at minimi أکثرPredicting unexpected incidents and energy consumption decline is one of the current problems in the industry. The extant study addressed parallel machine scheduling by consideration of failures and energy consumption decline. Moreover, the present paper aimed at minimizing early and late delivery penalties, and enhancing tasks. This research designed a mathematical model for this problem that considered processing times, delivery time, rotation speed and torque, failure time, and machine availability after repair and maintenance. Failure times have been predicated on using machine learning algorithms. The results indicated that the proposed model can be suitably solved for the size of 10 jobs or tasks and five machines. This research addresses the problem in two parts: the first part predicts failures, and the second part includes the sequence of parallel machine scheduling operations. After the previous data were received in the first step, machine failure was predicted by using machine learning algorithms, and a set of rules were obtained to correct the process. The obtained rules were used in the model to improve the machining process. In the second step, scheduling mode was used to determine operations sequence by consideration of these failures and machinery unavailability to achieve the optimal sequence. Moreover, it is supposed to reduce energy consumption and failures. This study used the Light GBM algorithm and achieved 85% precision in failure prediction. The rules obtained from this algorithm contributed to cost reduction. تفاصيل المقالة -
حرية الوصول المقاله
49 - تبیین دسته بندهای ماشین بردار پشتیبان و شبکه عصبی جهت درجه بندی شعب بانک
davod khosroanjom mohamamd elyasi behzad keshanchi Bahare Boobanian shovana abdollahiدر صنعت بانکداری اطلاعات زیادی وجود دارد که شناسایی آن از اهمیت ویژهای برخوردار است. استفاده از تکنیک های داده کاوی نه تنها کیفیت را بهبود می بخشد بلکه منجر به مزایای رقابتی و ارتقای جایگاه بازار نیز می گردد. با استفاده از داده کاوی و به منظور تجزیه و تحلیل الگوها و رو أکثردر صنعت بانکداری اطلاعات زیادی وجود دارد که شناسایی آن از اهمیت ویژهای برخوردار است. استفاده از تکنیک های داده کاوی نه تنها کیفیت را بهبود می بخشد بلکه منجر به مزایای رقابتی و ارتقای جایگاه بازار نیز می گردد. با استفاده از داده کاوی و به منظور تجزیه و تحلیل الگوها و روندها، بانکها می توانند صحت این را پیش بینی کنند درجه بندی شعب بانک چگونه است. در این مقاله درجه بندی شعب یکی از بانکهای بزرگ تجاری (تعداد شعب انتخاب شده 1825 شعبه و تعداد ویژگی های مورد استفاده 57 ویژگی) با استفاده از دسته بندهای ماشین بردار پشتیبان و شبکه عصبی چند لایه پرسپترون برروی داده های واقعی انجام گرفت. نتایج ارزیابی مربوط به ماشین بردار پشتیبان نشان داد که این دسته بند دارای کارایی پایین تری برای روش پیشنهادی است. اما استفاده از شبکه های عصبی و ترکیب آن با PCA نشان داد که دارای معیارهای کارایی بالایی است. مقادیر مربوط به کارایی و صحت با استفاده از شبکه عصبی با دقت بسیار بالایی بدست آمد. تفاصيل المقالة -
حرية الوصول المقاله
50 - شناسایی عوامل تاثیرگذار در رویگردانی مشتریان شرکت مخابرات کردستان و ارائه مدل هایی برای پیش بینی رویگردانی با استفاده از الگوریتم های یادگیری ماشین
vida sadeghi Anvar Bahrampour Seyed Ali Hosseiniمشتریان منبع اصلی درآمد و دارایی مهم برای هر سازمان هستند. با این دیدگاه، امروزه شرکتها تلاش بیشتری را برای حفظ مشتریان موجود آغاز کردهاند. از آنجا که در بسیاری از شرکتها هزینه بهدست آوردن مشتری جدید بسیار بالاتر از هزینه ایجاد رضایتمندی مشتری فعلی است، رویگردانی مش أکثرمشتریان منبع اصلی درآمد و دارایی مهم برای هر سازمان هستند. با این دیدگاه، امروزه شرکتها تلاش بیشتری را برای حفظ مشتریان موجود آغاز کردهاند. از آنجا که در بسیاری از شرکتها هزینه بهدست آوردن مشتری جدید بسیار بالاتر از هزینه ایجاد رضایتمندی مشتری فعلی است، رویگردانی مشتری به حوزه اصلی نگرانی این شرکتها تبدیل شده است. لذا شرکتهای مبتنی بر مشتری از جمله شرکتهای فعال در صنعت مخابرات به دلیل رویگردانی مشتریان با چالش بزرگی روبرو هستند. با توسعه سریع صنعت مخابرات، پیشبینی رویگردانی به عنوان یکی از فعالیتهای اصلی در به دست آوردن مزیت رقابتی در بازار محسوب میشود. پیشبینی رویگردانی مشتری به اپراتورها اجازه میدهد تا قبل از مهاجرت مشتریان فعلی به اپراتورهای دیگر، یک دوره زمانی برای اصلاح و اجرای یک سری اقدامات پیشگیرانه داشته باشند. در این پژوهش یک سیستم پشتیبانی تصمیم برای پیشبینی و تخمین رویگردانی مشتریان شرکت مخابرات استان کردستان (دارای 529000 مشترک) با روشهای مختلف دادهکاوی و یادگیری ماشین (شامل رگرسیون خطی چندگانه (MLR)، رگرسیون چند جمله-ای(PR)، رگرسیون لجستیک، شبکههای عصبی مصنوعی، آدابوست و جنگل تصادفی) ارایه شده است. نتایج ارزیابیهای انجام شده بر روی مجموعه دادههای شرکت مخابرات استان کردستان عملکرد بالای روشهای شبکههای عصبی مصنوعی با دقت 99.9% ، آدابووست با دقت 100% و جنگل تصادفی با دقت 100% را نشان میدهد. تفاصيل المقالة -
حرية الوصول المقاله
51 - ارایه یک رویکرد جدید به منظور افزایش اثربخشی و انتخاب بحرانی ترین تجهیز به کمک رویکرد تلفیقی Data Mining, Fuzzy DEMATEL, FMEA و FTA (مطالعه موردی: پتروشیمی شازند)
Mohammad Ehsanifar Nima Hamta Parisa Bolhasaniطی دهه های اخیر به دلایل زیادی، شاهد توجه رو به رشدی به مقوله قابلیت اطمینان و مدیریت نگهداری و تعمیرات بودهایم. مقاله حاضر با هدف معرفی و تلفیق رویکردهای داده کاوی، دیمتل فازی، تجزیه و تحلیل حالات خطا و درخت خطا به منظور بهبود قابلیت اطمینان و افزایش اثربخشی برنامه ری أکثرطی دهه های اخیر به دلایل زیادی، شاهد توجه رو به رشدی به مقوله قابلیت اطمینان و مدیریت نگهداری و تعمیرات بودهایم. مقاله حاضر با هدف معرفی و تلفیق رویکردهای داده کاوی، دیمتل فازی، تجزیه و تحلیل حالات خطا و درخت خطا به منظور بهبود قابلیت اطمینان و افزایش اثربخشی برنامه ریزی تعمیرات در مجتمع پتروشیمی شازند انجام شده است..نخست با استفاده از تکنیک داده کاوی بحرانی ترین خوشه از میان خوشه های تشکیل شده توسط نرم افزار مربوطه مشخص می شود، سپس با بهره گیری از رویکرد دیمتل فازی مجموعه ای از بحرانی ترین و تاثیر گزار ترین تجهیزات در خوشه بحرانی، تحت شرایط فازی شناسایی میشوند، در نهایت توسط تکنیک های FMEA وFTA عدد ریسک و علل اصلی خرابی شناسایی خواهد شد و راهکار های مریوطه برای حل مشکلات و بهبود سیستم پیشنهاد خواهد شد. تفاصيل المقالة -
حرية الوصول المقاله
52 - روش جدیدی برای رتبهبندی قواعد حاصل از دادهکاوی با استفاده از تحلیل پوششی دادهها
Hossein Aziziتکنیکهای دادهکاوی، یعنی استخراج الگوها از پایگاههای دادهای بزرگ، در تجارت به صورت گستردهای مورد استفاده قرار میگیرند. با استفاده از این تکنیکها ممکن است قواعد زیادی حاصل شوند و فقط تعداد کمی از آنها به دلیل محدودیت بودجه و منابع برای پیادهسازی در نظر گرفته شوند. أکثرتکنیکهای دادهکاوی، یعنی استخراج الگوها از پایگاههای دادهای بزرگ، در تجارت به صورت گستردهای مورد استفاده قرار میگیرند. با استفاده از این تکنیکها ممکن است قواعد زیادی حاصل شوند و فقط تعداد کمی از آنها به دلیل محدودیت بودجه و منابع برای پیادهسازی در نظر گرفته شوند. ارزیابی و رتبهبندی جالب بودن و مفید بودن قواعد انجمنی در دادهکاوی اهمیت زیادی دارد. در مطالعات قبلی که در مورد شناسایی قواعد انجمنی جالب از نظر ذهنی انجام شده است، اکثر روشها مستلزم وارد کردن دستی یا پرسیدن از کاربر برای افتراق صریح قواعد جالب از ناجالب بوده است. این روشها نیازمند محاسبات بسیار زیادی هستند و حتی ممکن است به نتیجهگیریهای ناسازگار منتهی شوند. برای غلبه بر این مشکلات، این مقاله پیشنهاد میکند که از رویکرد تحلیل پوششی دادهها (DEA) با مرز دوگانه برای انتخاب کارآترین قاعدهی انجمنی استفاده شود. در این رویکرد علاوه بر بهترین کارآیی نسبی هر قاعدهی انجمنی، بدترین کارآیی نسبی آن نیز در نظر گرفته میشود. در مقایسه با DEAی سنتی، رویکرد DEA با مرز دوگانه میتواند کارآترین قاعدهی انجمنی را به درستی و به آسانی شناسایی کند. به عنوان یک مزیت، رویکرد پیشنهادی از نظر محاسباتی کارآمدتر از کارهای قبلی در این زمینه است. با استفاده از مثالی از تحلیل سبد بازار، قابلیت کاربرد روش مبتنی بر DEAی ما برای اندازهگیری کارآیی قواعد انجمنی با معیارهای چندگانه نشان داده خواهد شد. تفاصيل المقالة -
حرية الوصول المقاله
53 - ارائه یک روش ترکیبی از تحلیل پوششی داده ها و داده کاوی جهت ارزیابی واحدهای تصمیم گیرنده
Alireza Alinezhad Javad Khaliliکارایی از موضوعهای مهمی است که علاوه بر مدیران شرکتها و سازمانهای مختلف، مشتریان استفادهکننده از خدمات این شرکتها و سازمانها نیز به آن علاقهمند هستند. هدف این پژوهش، بررسی کارایی شرکتهای داروسازی پذیرفتهشده در سازمان بورس اوراق بهادار با استفاده از تحلیل پوششی أکثرکارایی از موضوعهای مهمی است که علاوه بر مدیران شرکتها و سازمانهای مختلف، مشتریان استفادهکننده از خدمات این شرکتها و سازمانها نیز به آن علاقهمند هستند. هدف این پژوهش، بررسی کارایی شرکتهای داروسازی پذیرفتهشده در سازمان بورس اوراق بهادار با استفاده از تحلیل پوششی دادهها و سپس ارائه قواعدی با استفاده از داده کاوی است. شاخص مالم کوئیست با امکانپذیر ساختن ترکیب مشاهدات سری زمانی و مقطعی، تا حدودی مشکل ناکافی بودن مشاهدات را برطرف میکند و برای یافتن روندهای عملکرد یک واحد در طول زمان مفید است. در این پژوهش، ارزیابی کارایی 22 شرکت داروسازی پذیرفتهشده در سازمان بورس اوراق بهادار با توجه به ورودیها و خروجیها و با استفاده از شاخص مالم کوئیست ورودی محور در طول سالهای 1395-1391 صورت گرفته است و سپس نتایج حاصل از آن به عنوان برچسب دسته واحدهای تصمیمگیرنده که در واقع ورودی روش درخت تصمیم است، مورد استفاده قرار میگیرند. درنهایت، با استفاده از درخت تصمیم، قواعد مستتر در دادهها استخراج میشود. تفاصيل المقالة -
حرية الوصول المقاله
54 - Designing an Intelligent Intrusion Detection System in the Electronic Banking Industry Using Fuzzy Logic
Adel JahanbaniOne of the most important obstacles to using Internet banking is the lack of Stability of transactions and some misuse in the course of transactions it is financial. That is why preventing unauthorized access Crime detection is one of the major issues in financial insti أکثرOne of the most important obstacles to using Internet banking is the lack of Stability of transactions and some misuse in the course of transactions it is financial. That is why preventing unauthorized access Crime detection is one of the major issues in financial institutions and banks. In this article, a system of intelligence has been designed that recognizes Suspicious and unusual behaviors for users in the Internet banking system. Because the behavior of different users is accompanied by ambiguity and uncertainty, this system is designed based on fuzzy logic to identify user behavior and categorize suspicious behaviors of varying severity. The system applies a diagnostic process based on KDD data. The results show that in all validation algorithms, 2 to 5 percent improvement in detection is provided. تفاصيل المقالة -
حرية الوصول المقاله
55 - Comparison of information transfer delay in standard Apriori algorithm and improved Apriori algorithm
Hooman Bavarsad Salehpour Seyed Hamid Seyed Javadi Parvaneh Asghari Mohammad Ebrahim Shiri Ahmad AbadiOne of the most famous algorithms in the field of focused exploration of data mining correlation rules is the Apriori algorithm and its many developed versions. But what can be raised as a major challenge in this field is the proper application of this algorithm in the أکثرOne of the most famous algorithms in the field of focused exploration of data mining correlation rules is the Apriori algorithm and its many developed versions. But what can be raised as a major challenge in this field is the proper application of this algorithm in the distributed environments of today's world. In this research, a parallelization-based approach is proposed to improve the performance of the Apriori algorithm in the process of exploring recurring patterns on network topologies. The proposed approach includes two major features: (1) combining the node centrality criterion and the Apriori algorithm to identify frequent patterns, (2) using the mapping/reduction method in order to create parallel processing and achieve optimal values in the shortest time. Also, this approach pursues three main goals: reducing the temporal and spatial complexity of the Apriori algorithm, improving the process of extracting dependency rules and identifying recurring patterns, comparing the performance of the proposed approach on different network topologies in order to determine the advantages and disadvantages of each topology. To prove the superiority of the proposed method, a comparison has been made between our approach and the basic Apriori algorithm. The evaluation results of the methods prove that the proposed approach provides an acceptable performance in terms of execution time criteria compared to other methods. تفاصيل المقالة -
حرية الوصول المقاله
56 - Detected Source-based fake news via Word2vec algorithm
Hamid Sharifi Heris Jafar Sheykhzadehtoday and regarding the increase of social media platforms and the people welcoming these networks has led to share different data throughout the world without the confirmation by the platforms. This has increased the incorrect data frequency and has had great effects o أکثرtoday and regarding the increase of social media platforms and the people welcoming these networks has led to share different data throughout the world without the confirmation by the platforms. This has increased the incorrect data frequency and has had great effects on political, economic, and social fields. such incorrect data are called fake news. This has changed into one of the topical issues in today’s society. Through the proposal of an appropriate solution and first through analyzing the news resources in the dataset called BuzzfeedNews, we have concluded that websites with better fames propagate less fake news. We changed the data into vector using Word2vec and investigated the similarity of the taught data and the tagged data in the dataset and got the least precision amounting to 0.60 and the highest precision amounting to 0.94 out of 1 and the results showed that our algorithm has been very helpful in discovering the qualified news. تفاصيل المقالة -
حرية الوصول المقاله
57 - Reliability Measurement’s in Depression Detection Using a Data Mining Approach Based on Fuzzy-Genetics
Mohammad Nadjafi Sepideh Jenabi Adel Najafi Ghasem KaheDeveloping a reliable data mining method is one of the most challenging issues in the features of advanced computer-based systems. Model reliability in depression disorder detection is the determining p-value or confidence limit for accuracy score. In this regard, data أکثرDeveloping a reliable data mining method is one of the most challenging issues in the features of advanced computer-based systems. Model reliability in depression disorder detection is the determining p-value or confidence limit for accuracy score. In this regard, data mining evaluation metrics provide a path to knowledge discovery and feature extraction is an important process for discovering patterns in data by exploring and modeling big data. The present paper discussed the data mining approach about detection in depression disorder characterized by symptoms such as sadness, feeling empty, anxiety, and sleep symptoms as well as the loss of initiative and interest inactivity. In this survey, a unique dataset containing sensor data collected from patients with depression was used. For each patient, sensor data were measured over several days. In this respect, the represented dataset could be useful for a better understanding of the relationship between depression and motor activity. On the other hand, to overcome the uncertainties raised from wearable sensors (that caused a significant amount of error in similar previous studies using conventional learning methods such as SVM, LR, NB), and also to increase the efficiency and accuracy of the results and to develop a reliable decision-making framework, the evolutionary hybrid machine learning method (fuzzy-genetic algorithm) will be used. The results show the high accuracy of the proposed method compared to other existing methods. تفاصيل المقالة -
حرية الوصول المقاله
58 - A Novel Ensemble Approach for Anomaly Detection in Wireless Sensor Networks Using Time-overlapped Sliding Windows
Zahra Malmir Mohammad Hossein RezvaniOne of the most important issues concerning the sensor data in the Wireless Sensor Networks (WSNs) is the unexpected data which are acquired from the sensors. Today, there are numerous approaches for detecting anomalies in the WSNs, most of which are based on machine le أکثرOne of the most important issues concerning the sensor data in the Wireless Sensor Networks (WSNs) is the unexpected data which are acquired from the sensors. Today, there are numerous approaches for detecting anomalies in the WSNs, most of which are based on machine learning methods. In this research, we present a heuristic method based on the concept of “ensemble of classifiers” of data mining. Our proposed algorithm, at first applies a fuzzy clustering approach using the well-known C-means clustering method to create the clusters. In the classification step, we created some base classifiers, each of which utilizes the data of overlapping windows to utilize the correlation among data over time by creating time-overlapped batches of data. By aggregating these batches, the classifier proceeds to find an appropriate label for future incoming instance. The concept of “Ensemble of Classifiers” with majority voting scheme has been used in order to combine the judgment of all classifiers. The results of our implementation with MATLAB toolboxes shows that the proposed majority-based ensemble learning method attains more efficiency compared to the case of the single classifier method. Our proposed method enhances the performance of the system in terms of major criteria such as False Positive Rate, True Positive Rate, False Negative Rate, True Negative Rate, Sensitivity, Specificity and also the ROC curve. تفاصيل المقالة -
حرية الوصول المقاله
59 - Persistent K-Means: Stable Data Clustering Algorithm Based on K-Means Algorithm
Rasool Azimi Hedieh SajediIdentifying clusters or clustering is an important aspect of data analysis. It is the task of grouping a set of objects in such a way those objects in the same group/cluster are more similar in some sense or another. It is a main task of exploratory data mining, and a c أکثرIdentifying clusters or clustering is an important aspect of data analysis. It is the task of grouping a set of objects in such a way those objects in the same group/cluster are more similar in some sense or another. It is a main task of exploratory data mining, and a common technique for statistical data analysis This paper proposed an improved version of K-Means algorithm, namely Persistent K-Means, which alters the convergence method of K-Means algorithm to provide more accurate clustering results than the K-means algorithm and its variants by increasing the clusters’ coherence. Persistent K-Means uses an iterative approach to discover the best result for consecutive iterations of K-Means algorithm. تفاصيل المقالة -
حرية الوصول المقاله
60 - ارائه الگوی داده کاوی مبتنی بر شاخص توسعه پایدار در مدیریت شهری کلانشهر تهران متاثر از همهگیری کووید-19
عباس ملکی صادق عابدی علیرضا ایرج پوربا اعمال محدودیتهای ناشی از همهگیری کووید-19، به نظر میرسد تغییراتی در غلظت آلایندههای CO، O3،NO ، NO2، SO2، PM2.5، PM10 و AQI در دورههای قبل و بعد از همهگیری دیده شود. از این رو، تغییرات آلایندههای هوا و محدودیتهای ترافیکی به عنوان یکی از زیرمجموعه-های شاخص زی أکثربا اعمال محدودیتهای ناشی از همهگیری کووید-19، به نظر میرسد تغییراتی در غلظت آلایندههای CO، O3،NO ، NO2، SO2، PM2.5، PM10 و AQI در دورههای قبل و بعد از همهگیری دیده شود. از این رو، تغییرات آلایندههای هوا و محدودیتهای ترافیکی به عنوان یکی از زیرمجموعه-های شاخص زیست محیطی توسعه پایدار شهری در بازه زمانی 01/11/1396 تا 29/12/1400 در ایستگاههای تحت نظارت شهر تهران مورد بررسی قرار میگیرد. ابتدا دادهها جمع آوری، پردازش و پاکسازی میشوند. بر روی ویژگیهای موثر انتخاب شده با استفاده از روش بهینه سازی ازدحام ذرات، روشهای یادگیری ماشین شامل درخت تصمیم، جنگل تصادفی، ماشین بردار پشتیبان، شبکه بیزین و شبکه عصبی پرسپترون اعمال میشود. بررسیها نشان داد که مدل پیش بینی با استفاده از درخت تصمیم و جنگل تصادفی بهترین عملکرد را برای هر دو معیار صحت و فراخوانی داشت. نتایج تحقیق نشان داد که غلظت آلایندهها در دوران کووید-19 نسبت به قبل از آن، در بعضی از ایستگاهها افزایشی و در برخی دیگر کاهشی میباشد و همچنین اعمال محدودیتهای ترافیکی در دوره همهگیری، تاثیر قابل توجه و محسوسی در کاهش غلظت آلایندههای هوا نداشته است. همچنین با بررسی روند مرگ و میر در دوره همهگیری مشخص شد که کاهش و یا افزایش آلایندهها ارتباط معناداری با روند مرگ و میر ناشی از کووید-19 ندارد. تفاصيل المقالة -
حرية الوصول المقاله
61 - ارائه یک الگوی پیش بینی فرار مالیاتی مشاغل مبتنی بر تکنیک های داده کاوی
محمد قاسمی صادق عابدی علی محتشمیدر این پژوهش با توجه به اهمیت موضوع و خلای پژوهش های پیشین، یک مدل پیش بینی فرار مالیاتی اصناف مبتنی بر تکنیک های داده کاوی ارائه می گردد. داده های مورد تحلیل شامل بررسی 5600 پرونده مالیاتی کلیه اصناف دارای کد مالیاتی در استان قزوین طی سال های ۹۳ تا ۹۸ می باشد. پرونده م أکثردر این پژوهش با توجه به اهمیت موضوع و خلای پژوهش های پیشین، یک مدل پیش بینی فرار مالیاتی اصناف مبتنی بر تکنیک های داده کاوی ارائه می گردد. داده های مورد تحلیل شامل بررسی 5600 پرونده مالیاتی کلیه اصناف دارای کد مالیاتی در استان قزوین طی سال های ۹۳ تا ۹۸ می باشد. پرونده مالیاتی مرتبط با اصناف در پنج گروه مالیاتی شامل گروه صنفی صاحبان دفاتر رسمی، گروه صنفی مشاورین املاک، گروه صنفی تالارهای پذیرایی، رستوران و مشاغل وابسته، گروه صنفی خدمات ارتباطی و گروه صنفی نمایشگاه و فروشگاه لوازم خودرویی و مشاغل وابسته می باشند. جهت مدل سازی از الگوی کلاس بندی شامل الگوریتم درخت تصمیم استفاده گردید. نتایج نشان می دهد، معیار پوشش برابر 68 %، معیار کاپا برابر 0.612 بدست آمده است که عملکرد خوب مدل ساز را نشان می دهد. همچنین با استفاده از تکنیک Cross Validation صحت اعتبار مدل پیش بینی مورد آزمون قرار گرفت تا با اطمینان بیشتری درصد عملکرد مدل سازی تخمین زده شود. معیار صحت برابر 67.79% نشان از قابلیت اطمینان مناسب جهت مدل پیش بینی می باشد. نتایج حاصل از این پژوهش می تواند در تدوین راهبردهای عملیاتی مبتنی بر داده کاوی جهت پیش بینی فرار مالیاتی اصناف در استان ها مورد بهره برداری قرار گیرد. تفاصيل المقالة -
حرية الوصول المقاله
62 - مدل ترکیبی تحلیل پوششی دادههای شبکه ای و داده کاوی برای پیش بینی کارایی در زنجیره تامین سبز
طاهره ترکاشوند فاطمه ثقفی محمدحسین درویش متولی نازنین پیله وریتحلیل و پیشبینی کارایی در صنایع، به منظورارزیابی عملکرد واحدها و برنامهریزی برای بهبود عملکرد آن ها از اهمیت زیادی برخوردار است. صنعت طیور به عنوان یکی از صنایع استراتژیک و پیچیده سهم مهمی از سبد زنجیره غذایی جوامع را به خود اختصاص داده است و از این روی تحلیل شبکه تام أکثرتحلیل و پیشبینی کارایی در صنایع، به منظورارزیابی عملکرد واحدها و برنامهریزی برای بهبود عملکرد آن ها از اهمیت زیادی برخوردار است. صنعت طیور به عنوان یکی از صنایع استراتژیک و پیچیده سهم مهمی از سبد زنجیره غذایی جوامع را به خود اختصاص داده است و از این روی تحلیل شبکه تامین آن بسیار با اهمیت است.در این پژوهش با استفاده از مدل تحلیل پوششی دادههای شبکه ای و داده کاوی، شکافهای تحقیق در زمینه اندازهگیری و پیش بینی کارایی زنجیره تامین سبز در صنعت طیور پوشش داده شده است. این پژوهش از نظر هدف کاربردی و به لحاظ ماهیت اجرا توصیفی و پیمایشی می باشد که با توسعه مدل های ریاضی در حوزه تحلیل پوششی داده ها انجام می شود.ابتدا با استفاده از رویکرد دلفی، شاخص های موثر بر اساس نظر خبرگان شناسایی و غربالگری شده اند، و سپس مدل ریاضی جدید بر اساس تحلیل پوششی داده های شبکه ای ارائه گردید. در ادامه با استفاده از روش الفا کات بر روی روش تحلیل پوششی داده ها ی فازی، در پنج سال کارایی 9 زنجیره ارزیابی شد. نتایج نشان داد مدل ارائه شده قادر است کارایی زنجیره تامین سبز و چند سطحی صنعت طیور را در سال های متوالی مورد ارزیابی قرار دهد. تفاصيل المقالة -
حرية الوصول المقاله
63 - ارزیابی ریسک اعتباری در سیستمهای بانکی با استفاده از تکنیکهای دادهکاوی
نیما همتا محمد احسانیفر بهاره محمدیاین مقاله با هدف شناسایی عوامل مؤثر بر ریسک اعتباری و ارائه مدلی جهت پیش بینی ریسک اعتباری و رتبه بندی اعتباری مشتریان حقوقی متقاضی تسهیلات بانک سپه شهرستان دزفول، با استفاده از روش های خوشه بندی، شبکه عصبی و ماشین بردار پشتیبان انجام گرفته است. در این مقاله، 27 متغیر ت أکثراین مقاله با هدف شناسایی عوامل مؤثر بر ریسک اعتباری و ارائه مدلی جهت پیش بینی ریسک اعتباری و رتبه بندی اعتباری مشتریان حقوقی متقاضی تسهیلات بانک سپه شهرستان دزفول، با استفاده از روش های خوشه بندی، شبکه عصبی و ماشین بردار پشتیبان انجام گرفته است. در این مقاله، 27 متغیر توضیح دهنده شامل متغیرهای مالی و غیرمالی مورد بررسی قرار گرفت که از بین این متغیرها، 8 متغیر تأثیرگذار بر ریسک اعتباری انتخاب گردید که به وسیله روش خوشه بندی مجموعه داده ها به خوشه ها دسته بندی شدند. هم چنین متغیرهای انتخابی به عنوان بردار ورودی شبکه عصبی پرسپترون 3 لایه وارد مدل شد و در نهایت با استفاده از ماشین بردار پشتیبان، به منظور پیش بینی عملکرد مالی مشتریان حقوقی بانک ارائه گردید. نتایج حاصل از مدل شبکه عصبی و ماشین بردار پشتیبان حاکی از آن است که مدل شبکه عصبی در پیش بینی ریسک اعتباری مشتریان حقوقی و رتبه بندی اعتباری از کارایی بیشتری برخودار است. تفاصيل المقالة -
حرية الوصول المقاله
64 - Integrating AHP and data mining for effective retailer segmentation based on retailer lifetime value
Amin Parvaneh Hossein Abbasimehr Mohammad Jafar TarokhData mining techniques have been used widely in the area of customer relationship management (CRM). In this study, we have applied data mining techniques to address a problem in business-to-business (B2B) setting. In a manufacturer-retailer-consumer chain, a manufacture أکثرData mining techniques have been used widely in the area of customer relationship management (CRM). In this study, we have applied data mining techniques to address a problem in business-to-business (B2B) setting. In a manufacturer-retailer-consumer chain, a manufacturer should improve its relationship with retailers to continue its business. Segmentation is a useful tool for identifying groups of similar retailers in order to improve retailer loyalty by developing and implementing segment-specific marketing strategies. In this study, we have proposed a methodology for retailer segmentation based on their LRFM variables (relation Length, Recency, Frequency and Monetary) and analytical hierarchy process (AHP). The proposed methodology has been implemented by using data of a firm from a hygienic industry in Iran. The empirical results indicated that there are six groups of retailers. After analyzing each segment according to LRFM values, we labeled each retailer group according to its performance. Furthermore, we provided some possible actions that can be taken in order to improve the relationship between the firm and retailers. تفاصيل المقالة -
حرية الوصول المقاله
65 - Using the Hybrid Model for Credit Scoring (Case Study: Credit Clients of microloans, Bank Refah-Kargeran of Zanjan, Iran)
Abdollah Nazari Mohammadreza Mehregan Reza TehraniIn any country, commercial banks lay the groundwork for economic growth by collecting national resources and capitals and allocating them to different economic sectors. Optimal allocation of resources is especially important in achieving this goal. Banks with an effecti أکثرIn any country, commercial banks lay the groundwork for economic growth by collecting national resources and capitals and allocating them to different economic sectors. Optimal allocation of resources is especially important in achieving this goal. Banks with an effective and dynamic system of customer assessment can efficiently allocate their resources to customers regardless of their geographic area. Following[M1] a linear programming optimization approach, this research employs the UTilités Additives DIScriminantes (UTADIS) model for credit scoring of bank customers. The advantages of the proposed technique are high flexibility, mutual interaction with decision makers, and the ability to update under various macroeconomic conditions. The chosen environment is a branch of Bank Refah Kargaran, one of the popular banks in Iran. According to the experimental results, the proposed technique demonstrates high effectiveness. Also, the results indicate that the initial credit score and age of the applicants are the most influential factors for credit scoring of customers. تفاصيل المقالة -
حرية الوصول المقاله
66 - A Data Mining approach for forecasting failure root causes: A case study in an Automated Teller Machine (ATM) manufacturing company
Seyedehpardis Bagherighadikolaei Rouzbeh Ghousi Abdolrahman HaeriBased on the findings of Massachusetts Institute of Technology, organizations’ data double every five years. However, the rate of using data is 0.3. Nowadays, data mining tools have greatly facilitated the process of knowledge extraction from a welter of data. Thi أکثرBased on the findings of Massachusetts Institute of Technology, organizations’ data double every five years. However, the rate of using data is 0.3. Nowadays, data mining tools have greatly facilitated the process of knowledge extraction from a welter of data. This paper presents a hybrid model using data gathered from an ATM manufacturing company. The steps of the research are based on CRISP-DM. Therefore, based on the first step, business understanding, the company and its different units were studied. After business understanding, the data collected from sale's unit were prepared for preprocess. While preprocessing, data from some columns of dataset, based on their types and purpose of the research, were either categorized or coded. Then, the data have been inserted into Clementine software, which resulted in modeling and pattern discovery. The results clearly state that, the same Machines’ Code and the same customers in different provinces are struggling with significantly different Problems’ Code, that could be due to weather condition, culture of using ATMs, and likewise. Moreover, the same Machines’ Code and the same Problems’ Code, as well as differences in Technicians' expertise, seems to be some causes to significantly different Repair Time. This could be due to Technicians' training background level of their expertise and such. At last, the company can benefit from the outputs of this model in terms of its strategic decision-making. تفاصيل المقالة -
حرية الوصول المقاله
67 - Diabetes detection via machine learning using four implemented spanning tree algorithms
Yas Ghiasi Mehdi Seif Barghy Davar PISHVAThis paper considers an accurate and efficient diabetes detection scheme via machine learning. It uses the science of data mining and pattern matching in its diabetes diagnosis process. It implements and evaluates 4 machine learning classification algorithms, namely De أکثرThis paper considers an accurate and efficient diabetes detection scheme via machine learning. It uses the science of data mining and pattern matching in its diabetes diagnosis process. It implements and evaluates 4 machine learning classification algorithms, namely Decision tree, Random Forest, XGBoost and LGBM. Then selects and introduces the one that performs the best towards its objective using multi-criteria decision-making methods. Its results reveal that Random Forest algorithm outperformed other algorithms with higher accuracy. It also examines the details of features that have a greater effect on diabetes detection. Considering that diabetes is one of the most deadly, disabling, and costly diseases observed today, its alarmingly increasing rates, and difficulty of its diagnosis because of many vague signs and symptoms, utilization of such approach can help doctors increase accuracy of their diagnosis and treatment schemes. Hence, this paper uses the science of data mining as a tool to gather and analyze existing data on diabetes and help doctors with its diagnosis and treatment process. The main contribution of this paper can therefore be its applied nature to an essential field and accuracy of its pattern recognition via several analytical approaches. تفاصيل المقالة -
حرية الوصول المقاله
68 - Application of Rough Set Theory in Data Mining for Decision SupportSystems (DSSs)
Mohammad Hossein Fazel Zarandi Abolfazl KazemiDecision support systems (DSSs) are prevalent information systems for decision making in many competitive business environments. In a DSS, decision making process is intimately related to some factors which determine the quality of information systems and their relate أکثرDecision support systems (DSSs) are prevalent information systems for decision making in many competitive business environments. In a DSS, decision making process is intimately related to some factors which determine the quality of information systems and their related products. Traditional approaches to data analysis usually cannot be implemented in sophisticated Companies, where managers need some DSS tools for rapid decision making. In traditional approaches to decision making, usually scientific expertise together with statistical techniques are needed to support the managers. However, these approaches are not able to handle the huge amount of real data, and the processes are usually very slow. Recently, several innovative facilities have been presented for decision making process in enterprises. Presenting new techniques for development of huge databases, together with some heuristic models have enhanced the capabilities of DSSs to support managers in all levels of organizations. Today, data mining and knowledge discovery is considered as the main module of development of advanced DSSs. In this research, we use rough set theory for data mining for decision making process in a DSS. The proposed approach concentrates on individual objects rather than population of the objects. Finally, a rule extracted from a data set and the corresponding features (attributes) is considered in modeling data mining. تفاصيل المقالة -
حرية الوصول المقاله
69 - A New Algorithm for Optimization of Fuzzy Decision Tree in Data Mining
Abolfazl Kazemi Elahe MehrzadeganDecision-tree algorithms provide one of the most popular methodologies for symbolic knowledge acquisition. The resulting knowledge, a symbolic decision tree along with a simple inference mechanism, has been praised for comprehensibility. The most comprehensible decision أکثرDecision-tree algorithms provide one of the most popular methodologies for symbolic knowledge acquisition. The resulting knowledge, a symbolic decision tree along with a simple inference mechanism, has been praised for comprehensibility. The most comprehensible decision trees have been designed for perfect symbolic data. Classical crisp decision trees (DT) are widely applied to classification tasks. Nevertheless, there are still a lot of problems especially when dealing with numerical (continuous valued) attributes. Some of those problems can be solved using fuzzy decision trees (FDT). Over the years, additional methodologies have been investigated and proposed to deal with continuous or multi-valued data, and with missing or noisy features. Recently, with the growing popularity of fuzzy representation, a few researchers independently have proposed to utilize fuzzy representation in decision trees to deal with similar situations. Fuzzy representation bridges the gap between symbolic and non symbolic data by linking qualitative linguistic terms with quantitative data. In this paper, a new method of fuzzy decision trees is presented. This method proposed a new method for handling continuous valued attributes with user defined membership. The results of crisp and fuzzy decision trees are compared at the end. تفاصيل المقالة -
حرية الوصول المقاله
70 - Modelling Customer Attraction Prediction in Customer Relation Management using Decision Tree: A Data Mining Approach
Abolfazl Kazemi Mohammad Esmaeil BabaeiIn Today’s quality- based competitive world, known as knowledge age, customer attraction is of ultimate importance. In respect to the slogan “customer is always right”, customer relation management is the core of an organizational strategy playing an i أکثرIn Today’s quality- based competitive world, known as knowledge age, customer attraction is of ultimate importance. In respect to the slogan “customer is always right”, customer relation management is the core of an organizational strategy playing an important role in four aspects of customer identification, customer attraction, customer retaining, and customer satisfaction. Commercial organizations have perceived increased value of customers through analysis of customers’ life cycle. Data storing and data mining tools along with other customer relation management methods have provided new opportunities for the business. This paper tries to help organizations determine the criteria needed for the identification of potential customers in the competitive environment of their business by employing data mining in practice. It also provides a mechanism for the identification of potential customers liable to becoming real customers. Using Decision Tree tool, the main criteria are identified and their importance are determine din this paper and then assuming that each main criterion consists of several sub-criteria, their importance in turning potential customers into real ones is in turn determined. By utilizing the identified criteria and sub- criteria, organizations are able to drive selling processes in each attendance in a direction which results in attendants’ (future customers) purchase. تفاصيل المقالة -
حرية الوصول المقاله
71 - بررسی میزان بهرهوری مدل فرآیند خدمات مددکاری و توانمندسازی با استفاده از تکنیکهای دادهکاوی
مهرداد محمدزاده علمداری منصور اسماعیل پور علیرضا اسلامبولچی فرهاد سلیمانیان قره چیقفرآیند خدمات مددکاری و توانمندسازی در نهادهای حمایتی از جمله کمیته امداد امام خمینی(ره) جامع و گسترده است و با تحقیق، پذیرش و ارائه خدمات مددکاری برای نیازمندان شروع و بعد از حمایت هدفمند و زماندار، با آموزش و توانمندسازی مددجویان و خروج آنان از چتر حمایتی به پایان می ر أکثرفرآیند خدمات مددکاری و توانمندسازی در نهادهای حمایتی از جمله کمیته امداد امام خمینی(ره) جامع و گسترده است و با تحقیق، پذیرش و ارائه خدمات مددکاری برای نیازمندان شروع و بعد از حمایت هدفمند و زماندار، با آموزش و توانمندسازی مددجویان و خروج آنان از چتر حمایتی به پایان می رسد. از این رو بهره گیری از تکنیک های نوین جهت بررسی میزان بهره وری مدل پیاده سازی شده رورت دارد تا اهداف سازمانی از جمله اصلاح فرآیندهای جاری برای رعایت عدالت اجتماعی در حمایت از نیازمندان واقعی و خروج از چرخه حمایت مددجویان توانمند، تأمین شود. در این مطالعه پژوهشگران به دنبال پاسخ به این سؤال هستند که آیا مدل فرایند خدمات مددکاری و توانمندسازی بهره وری لازم جهت نیل به اهداف سازمانی را دارا بوده یا نیاز به بازطراحی دارد؟ در این راستا داده های مربوط به میزان تحقق اهداف کاربردی بعد از پیاده سازی مدل فرآیند خدمات مددکاری و توانمندسازی از جنبه شناسایی، راهنمایی، پذیرش، نیازسنجی، اولویت بندی، میزان خدمات عمومی و تخصصی قابل ارائه به نیازمندان واجد شرایط با رویکرد توانمندسازی، با استفاده از پرسشنامه جمع آوری و با استفاده از متدولوژی کریسپ-داده کاوی[1]مراحل مختلف مبتنی بر داده کاوی انجام گردید. در نهایت جمع بندی نتایج حاصل از داده کاوی با استفاده از رافست[2] 0.86، درخت تصمیم گیری[3] 0.80، تئوری بیز[4] 0.70، شبکه های عصبی مصنوعی[5]0.85 میزان دقت مدل را پیش بینی نمود. لذا مدل موجود بهره وری لازم جهت تحقق اهداف سازمانی را در حدمطلوب دارا بوده و با بازطراحی مجدد مدل موجود توسط پژوهشگران آتی با بهره گیری از نتایج پژوهش حاضر، امکان ارائه مدل بهینه جهت الگوبرداری سایر سازمان های مردم نهاد غیردولتی[6]در داخل و خارج از کشور فراهم خواهد شد. تفاصيل المقالة -
حرية الوصول المقاله
72 - ارائه الگوریتم خوشهبندی جدید بهمنظور بهرهوری در عملیات دادهکاوی (مطالعه دادههای استاندارد یوسیآی)
ژیلا نصیری روشتی فرزین مدرس خیابانی نیما آذر میر شتربانیروشهای خوشهبندی و بهرهوری آنها در عملیات دادهکاوی توسعه زیادی یافتهاند. نیاز مدیران به دادههای دستهبندیشده و بهرهوری روشهای خوشهبندی در امر مدیریت و تصمیمگیری، به گسترش روشهای دادهکاوی ضرورت بخشیده است. الگوریتم بهینهسازی نهنگ روش عمومی است که در حل مسائل أکثرروشهای خوشهبندی و بهرهوری آنها در عملیات دادهکاوی توسعه زیادی یافتهاند. نیاز مدیران به دادههای دستهبندیشده و بهرهوری روشهای خوشهبندی در امر مدیریت و تصمیمگیری، به گسترش روشهای دادهکاوی ضرورت بخشیده است. الگوریتم بهینهسازی نهنگ روش عمومی است که در حل مسائل متعددی کاربرد دارد. در این الگوریتم جوابهای آغازین بهصورت تصادفی انتخاب میشوند. الگوریتم کی-میانگین یک روش خوشهبندی پرکاربرد است که به دلیل سادگی و کوتاه بودن مراحل، بسیار موردتوجه محققان قرار میگیرد. در این مقاله این مزیت الگوریتم کی- میانگین را برای افزایش توانایی الگوریتم بهینهسازی نهنگ در خوشهبندی دادهها بهکاررفته است. الگوریتم پیشنهادی ترکیبی از الگوریتمهای کی-میانگین و خوشهبندی نهنگ است. در این پژوهش الگوریتم جدید و چند الگوریتم خوشهبندی دیگر را بر روی مجموعه دادههای واقعی و شناخته شده اجرا شده است. نتایج عددی نشان میدهد که الگوریتم جدید ازنظر کیفیت جوابها و انحراف استاندارد مقادیر جوابهای نهایی، نتایج مطلوبی نشان میدهد. تفاصيل المقالة -
حرية الوصول المقاله
73 - طبقه بندی مشتریان بانک صادرات براساس ارزش مشتری با استفاده از درخت تصمیم
حسین بیورانی محرم عظیمیبا توجه به اینکه امروزه کسب رضایت مشتری در محیط تجاری اهمیت زیادی پیدا کرده است ، بسیاری از شرکتها به منظور افزایش سود و رضایت مشتری بر روی ارزش مشتری تمرکز دارند. مدیریت ارتباط با مشتری 3(CRM) ابزار بالا بردن ارتباط مشتری به عنوان اصل رقابت در شرکتها ظهور پیدا کرده أکثربا توجه به اینکه امروزه کسب رضایت مشتری در محیط تجاری اهمیت زیادی پیدا کرده است ، بسیاری از شرکتها به منظور افزایش سود و رضایت مشتری بر روی ارزش مشتری تمرکز دارند. مدیریت ارتباط با مشتری 3(CRM) ابزار بالا بردن ارتباط مشتری به عنوان اصل رقابت در شرکتها ظهور پیدا کرده است. ساختار موفق ‎CRM‎ در شرکتها از شناسایی ارزش درست مشتری شروع میشود، زیرا ارزش مشتری اطلاعات مهمی را به منظور گسترش هدف و مدیریت فراهم میکند. ‎‎تکنیکهایی مثل داده کاوی سبب شده است که مدیریت ارتباط با مشتری در حوزه جدید رقابت پیشرفت کند به طوری که شرکتها بتوانند در رقابت تجاری سود داشته باشند. از طریق داده کاوی -کشف دانش پنهان از پایگاه داده- سازمانها میتوانند مشتری ارزشمندشان را بشناسند و رفتار آینده آنها را پیشبینی و تصمیمات مفید و دانش محور را اتخاذ کنند. هدف از انجام این تحقیق بدست آوردن معیارهای موثر در انتخاب مشتری ارزشمند است که بتوان مشتریان را براساس ویژگیهای جمعیت شناختیشان و سایر متغیرهای مربوط به معاملات به طبقات سود خیلی کم، کم سود ، سودبالا و سود خیلی بالا طبقه بندی کرد. در این تحقیق تاثیر ویژگیهای جمعیت شناختی افراد از جمله سن ، تحصیلات و شغل افراد همچنین تاثیر درجه شعبه، مکان شعبه بانک و تعداد تراکنش افراد برروی ارزش مشتری بررسی می شود. متغیر وابسته در این تحقیق مقدار ارزش مشتری است که به چهار طبقه دسته بندی شده است. جامعه آماری در این تحقیق مشتریان دارای حساب جاری فعال نزد بانک صادرات ایران در شهر تبریز است و مشتریانی را در نظر گرفتیم که حداقل یک سال سابقه فعالیت بانکی نزد بانک صادرات دارند. برای بررسی هدف موردنظر، درخت تصمیم CHAID یکی از الگوریتم های داده کاوی مورد استفاده قرار گرفت. نتایج نشان داد متغیرهای سن، تحصیلات مشتری و درجه شعبه بانک تاثیر معنی داری بر ارزش مشتری ندارند. تعداد تراکنش مشتری با بانک موثرترین ویژگی مشتری در تشخیص طبقه مشتری می باشد. 3- Customer Relationship Management تفاصيل المقالة -
حرية الوصول المقاله
74 - Using Fuzzy C-means to Discover Concept-drift Patterns for Membership Functions
Tzung-Pei Hong Chun-Hao Chen Yan-Kang Li Min-Thai WuPeople often change their minds at different times and at different places. It is important and valuable to indicate concept-drift patterns in unexpected ways for shopping behaviours for commercial applications. Research about concept drift has been growing in recent ye أکثرPeople often change their minds at different times and at different places. It is important and valuable to indicate concept-drift patterns in unexpected ways for shopping behaviours for commercial applications. Research about concept drift has been growing in recent years. Many algorithms dealt with concept-drift information and detected new market trends. This paper proposes an approach based on fuzzy c-means (FCM) to mine the concept drift of fuzzy membership functions. The proposed algorithm is subdivided into two stages. In the first stage, individual fuzzy membership functions are generated from different training databases by the proposed FCM-based approach. Then, the proposed algorithm will mine the concept-drift patterns from the sets of fuzzy membership functions in the second stage. Experiments on simulated datasets were also conducted to show the effectiveness of the approach. تفاصيل المقالة -
حرية الوصول المقاله
75 - Forecasting Of Tehran Stock Exchange Index by Using Data Mining Approach Based on Artificial Intelligence Algorithms
Mohammad Mahmoodi Akbar GhasemiUncertainty in the capital market means the difference between the expected values and the amounts that actually occur. Designing different analytical and forecasting methods in the capital market is also less likely due to the high amount of this and the need to know أکثرUncertainty in the capital market means the difference between the expected values and the amounts that actually occur. Designing different analytical and forecasting methods in the capital market is also less likely due to the high amount of this and the need to know future prices with greater certainty or uncertainty. In order to capitalize on the capital market, investors have always sought to find the right share for investment and the right price to buy and sell, and so all the predicted models always seek to answer the three basic questions, i.e., which share, to what extent When and at what price to buy or sell. Before answering the answers given to these questions, you have to answer a more serious question. Including whether forecasting financial markets is possible. Accordingly, in this research, using data mining, we proposed a method for predicting changes in the total stock index of Tehran stock exchanges. The purpose of this research is in the field of applied research. In terms of its implementation, the research is based on a causal research that is carried out using a data collection database. Based on the results obtained from this study on the best decision tree algorithm with respect to the accuracy of 94% of the C & R Tree algorithm, it can be said that this algorithm can be better than predicting stock price changes. Also, using decision tree can also predict changes in the price of the payment. تفاصيل المقالة -
حرية الوصول المقاله
76 - Sport Result Prediction Using Classification Methods
Arash Mazidi Mehdi Golsorkhtabaramiri Naznoosh EtminanTraditional sport was based on the ability of the players and less science and knowledge was considered. However, sport has become a profession and an industry. Therefore, the use of technology and analysis on data in order to achieve goals is very important. Classifica أکثرTraditional sport was based on the ability of the players and less science and knowledge was considered. However, sport has become a profession and an industry. Therefore, the use of technology and analysis on data in order to achieve goals is very important. Classification is one of technologies to classify new incoming samples. Furthermore, sports produce considerable information about each season, teams, matches and players. Classification on sport data helps managers and coaches in order to predict the match result, evaluate the player performance, predict the player injury, identify the sports talent and evaluate the match strategy. There are many algorithms to predict the basketball results, track the health of players and determine the strategy of the match against different opponents, which help coaches a lot. Further, preprocessing procedure makes better dataset. In this paper, we use classification methods on sport dataset using preprocessing procedure and without preprocessing. The results show an improvement was obtained results using preprocessing. تفاصيل المقالة -
حرية الوصول المقاله
77 - Identification and Clustering Outsourcing Risks of Aviation Part- Manufacturing Projects in Aviation Industries Organization Using Kmeans Method
Alireza Abbasi Mehrdad NikbakhtThe purpose of this paper is to identify and clustering strategic risks in the outsourcing field of partmanufacturingprojects of aviation products, that whit survey carried out through the study ofliterature and experts opinion, meanwhile, identification risk groups in أکثرThe purpose of this paper is to identify and clustering strategic risks in the outsourcing field of partmanufacturingprojects of aviation products, that whit survey carried out through the study ofliterature and experts opinion, meanwhile, identification risk groups in this area through interview,identified cases and factors of risks through FMEA technique, finally, 50 strategic risks identified in7 titles. In the following to resolve problems of traditional FMEA method, with definition threeindicators risk include, risk intensity, occurrence probability, and confrontation frequency by aquestionnaire and considering from three factors outsourcing assess contain cost, time and quality,risks of this area were clustered to K-means clustering and using SPSS software in 4 cluster includeof significant risks, high level of risks, medium level of risks and low level of risks. Thus, theclustering of risks for decision-making and planning of suggested actions at the time of theiroccurrence, basis for future improvements will be provided to carry out the continuousimprovement process at appropriate intervals with assessment of actions taken, the rate ofimprovement identified and therefore appropriate decisions are achieved. تفاصيل المقالة -
حرية الوصول المقاله
78 - مدلی برای پیشبینی عملکرد دانشجویان دانشگاه جامع علمی کاربردی در آزمون متمرکز مبتنی بر دادهکاوی
مصطفی یوسفی طزرجان اسرافیل علاء مریم ملاباقرهدف این پژوهش، ارائه الگویی جهت پیشبینی نمرات دانشجویان دانشگاه جامع علمی کاربردی در آزمونهای متمرکز، در نیمسالهای آتی دانشگاه بوده است. بدین منظور وضعیت نمرات 207/19 دانشجو/ درس در 8 عنوان درسی در 6 استان و 120 مرکز آموزشی که به صورت متمرکز در مقطع کاردانی و کارشن أکثرهدف این پژوهش، ارائه الگویی جهت پیشبینی نمرات دانشجویان دانشگاه جامع علمی کاربردی در آزمونهای متمرکز، در نیمسالهای آتی دانشگاه بوده است. بدین منظور وضعیت نمرات 207/19 دانشجو/ درس در 8 عنوان درسی در 6 استان و 120 مرکز آموزشی که به صورت متمرکز در مقطع کاردانی و کارشناسی و همزمان در سراسر کشور در نیمسال دوم تحصیلی 98-1397 برگزار شده ، مورد مطالعه قرار گرفته است و با استفاده از روش انتخاب ویژگی، مؤثرترین آنها انتخاب شدند. برای روشنتر شدن روابط بین ویژگیهای انتخاب شده با استفاده از مدل درخت تصمیمگیری و الگوریتم C5.0 ، با استفاده از نرمافزار SPSS Modeler و 10 شاخص مؤثر، مدلی برای پیشبینی نمرات دانشجویان در نیمسال آتی در دروس مصوب آزمون متمرکز ارائه شده است. این الگوی پیشبینی میتواند برای کارآمدتر ساختن فرآیند یادگیری در سیستم دانشگاهی مؤثر باشد. از نتایج این مدل میتوان به پیشنهادهایی برای اصلاح فرآیند آزمون، یافتن دانشجویان و مراکز و شرایط خارج از الگو جهت نظارت بیشتر و شناسایی مراکزی که میانگین معدل دانشجویانشان بالا بوده اما در آزمون متمرکز عملکرد ضعیف ضعیفی داشتند، اشاره کرد. تفاصيل المقالة -
حرية الوصول المقاله
79 - Eco-Efficiency Evaluation in Two-Stage Network Structure: Case Study: Cement Companies
Mirpouya MirmozaffariThe cement industry, as a primary trade, plays an important role in the development of a country's organization. This industry in Iran, however, despite of profuse benefits such as high-value mines, faces many challenges. Problems such as exploitation of the production أکثرThe cement industry, as a primary trade, plays an important role in the development of a country's organization. This industry in Iran, however, despite of profuse benefits such as high-value mines, faces many challenges. Problems such as exploitation of the production require the need for doing research into this area. The main purpose of this paper is to examine the Eco-efficiency in Iran's 22 local cement companies over 2012-2016. This paper develops a Charnes, Cooper & Rhodes input oriented (CCRIO) Data Envelopment Analysis (DEA) approach for measuring the efficiency of decision processes which can be separated into two stages. The first stage uses its specific inputs to produce outputs, which part of them are consequently considered as the inputs of the second stage. The first stage is considered as the production stage and the second stage as the pollution control stage. A novel converting two-stage to one stage model is proposed to obtain the Eco-efficiency. Consequently, Malmquist productivity index (MPI) is computed to assess productivity. Although DEA is a respected method for evaluating, it fails to extract unknown information. In this study data mining decision tree and Apriori algorithms are used to extract hidden rules, and to remove unrelated data. تفاصيل المقالة -
حرية الوصول المقاله
80 - Improved Automatic Clustering Using a Multi-Objective Evolutionary Algorithm With New Validity measure and application to Credit Scoring
مجید محمدی راد مهدی افضلیIn data mining, clustering is one of the important issues for separation and classification with groups like unsupervised data. In this paper, an attempt has been made to improve and optimize the application of clustering heuristic methods such as Genetic, PSO algorithm أکثرIn data mining, clustering is one of the important issues for separation and classification with groups like unsupervised data. In this paper, an attempt has been made to improve and optimize the application of clustering heuristic methods such as Genetic, PSO algorithm, Artificial bee colony algorithm, Harmony Search algorithm and Differential Evolution on the unlabeled data of an Iranian bank with the credit scoring approach. A survey was also used to measure the clustering validity index which resulted in a new validity index. Finally, the results were compared to identify the best algorithm and validity measure. تفاصيل المقالة -
حرية الوصول المقاله
81 - بهبود دقت روش هارگریوز در برآورد تبخیر- تعرق مرجع به کمک ضریب اصلاحی با مدل شبکه عصبی مصنوعی و درخت تصمیم M5
امید محترمی سید محمدرضا حسینی روح الله فتاحی تیمور سهرابیتبخیر- تعرق یکی از مهم ترین اجزای چرخه هیدرولوژی است که مدلسازی آن در مدیریت منابع آب نقش مهمی دارد. در تحقیق حاضر امکان بهبود دقت برآورد تبخیر- تعرق روش هارگریوز به کمک ضریب اصلاحیK با استفاده از مدل شبکه عصبی مصنوعی و مدل درخت تصمیم M5 مورد بررسی قرار گرفت. این ضریب ب أکثرتبخیر- تعرق یکی از مهم ترین اجزای چرخه هیدرولوژی است که مدلسازی آن در مدیریت منابع آب نقش مهمی دارد. در تحقیق حاضر امکان بهبود دقت برآورد تبخیر- تعرق روش هارگریوز به کمک ضریب اصلاحیK با استفاده از مدل شبکه عصبی مصنوعی و مدل درخت تصمیم M5 مورد بررسی قرار گرفت. این ضریب برابر با نسبت تبخیر- تعرق مدل پنمن مونتیث فائو به روش هارگریوز می باشد. داده های مورد استفاده این تحقیق عبارت از دمای حداکثر و حداقل و رطوبت نسبی در بازه ی زمانی 2013-2004 از ایستگاه فرخشهر و فرودگاه در منطقه ی خشک سرد شهرکرد می باشد. شبکه طراحی شده یک شبکه پرسپترون چند لایه با الگوریتم آموزشی لونبرگ مارکوات و تابع تانژانت سیگموئید در لایه پنهان می باشد. مدل درخت تصمیمم به کمک نرم افزار WEKA طراحی گردید. نتایج نشان می دهد که شبکه عصبی و مدل درخت تصمیمم عملکرد خوبی در مدلسازی ضریب اصلاحی دارند، ولی عملکرد مدل شبکه عصبی دقیق تر است. نتایج نشان داد که قبل از استفاده از ضریب اصلاحی دقت مدل هارگریوز RMSE=0.90 (ریشه میانگین مربعات خطا) نسبت به روش پنمن مونتیث فائو بود که این مقدار بعد از استفاده از ضریب اصلاحی به کمک شبکه عصبی به RMSE=0.69 و با از استفاده از ضریب اصلاحی به کمک درخت تصمیمم به RMSE=0.72 رسید. به طور کلی نتایج نشان داد که بعد از استفاده از ضریب اصلاحی عملکرد مدل هارگریوز بهبود یافته است. تفاصيل المقالة -
حرية الوصول المقاله
82 - کشف دانش حاکم بر ویژگیهای جمعیتشناختی مشتریان در انتخاب بانکها با استفاده از قوانین انجمنی در داده کاوی
ناصر قبولی علیرضا بافنده زنده صمد عالیهدف از پژوهش حاضر کشف دانش حاکم بر ویژگی های جمعیت شناختی مشتریان در انتخاب بانکها با استفاده از قوانین انجمنی در داده کاوی است تصمیم گیری مؤثر و یادگیری در دنیای در حال رشد و با پیچیدگی های چشمگیر علاوه بر وجود مدیران و رهبرانی متفکر، نیاز به ابزارهایی جهت درک ساختاره أکثرهدف از پژوهش حاضر کشف دانش حاکم بر ویژگی های جمعیت شناختی مشتریان در انتخاب بانکها با استفاده از قوانین انجمنی در داده کاوی است تصمیم گیری مؤثر و یادگیری در دنیای در حال رشد و با پیچیدگی های چشمگیر علاوه بر وجود مدیران و رهبرانی متفکر، نیاز به ابزارهایی جهت درک ساختارهای سیستم های پیچیده و تلخیص انبوه داده ها و تولید دانش برای تصمیم گیری دارند. اکثر کسبوکارها، مشتریان کلیدی خود را از طریق ویژگی جمعیت شناختی متنوع شناسایی می کنند. کسبوکارها همچنین مصرف کنندگان خود را به وسیلۀ ویژگی های مشابه در تبلیغات و ترفیعات برنامه های بازاریابی خود هدف قرار میدهند. هدف گیری مصرف کنندگان با ویژگی های جمعیت شناختی مشابه به حداکثرسازی فروش و سودآوری کسبوکار کمک می نماید. بانکها نیز به عنوان بخش مهمی از اقتصاد یک کشور از این قاعده مستثنی نیستند. دادهکاوی این مسأله را با فراهم کردن روشها و نرمافزارهایی برای خودکارسازی تحلیلها و اکتشاف از مجموعۀ دادههای بزرگ و پیچیده حل میکند. این پژوهش بر اساس استاندارد CRISP-DM انجام گرفته و داده ها با پرسشنامه جمع آوری شده و نتایج آن بهصورت بانک اطلاعاتی به یک نود منبع تبدیل و سپس با استفاده از نرمافزار spss modeler قوانین انجمنی مربوط به رفتار مشتریان آن بانک استخراج شده است. قوانین استخراج نشاندهندۀ تغییر ها، چه تأثیری در سایر عوامل و در نهایت در دستیابی به اهداف دارند. تفاصيل المقالة -
حرية الوصول المقاله
83 - Feature Selection And Clustering By Multi-objective Optimization
Seyedeh Mohtaram Daryabari Farhad RamezaniIn this paper, feature selection and clustering is formulated simultaneously by using evolutional multi-objective algorithm. Archived multi-objective NSGA-II is hybridized with k-medoids algorithm to use global searching capabilities of GA with local searching capabilit أکثرIn this paper, feature selection and clustering is formulated simultaneously by using evolutional multi-objective algorithm. Archived multi-objective NSGA-II is hybridized with k-medoids algorithm to use global searching capabilities of GA with local searching capabilities of k-medoids for suitable centers of clusters and selecting suitable subset of features identifying the correct partitioning. Number of clusters should be determined as an input parameter by user. After determining number of clusters, archive string be generate randomly. In every solution of archived, center of clusters and features is determined. Objective functions are inter-cluster distance, intra-cluster distance and number of feature selection. Three objective functions are optimized simultaneously for partitioning and feature selection. Crossover and mutation operators are modified to solve the problem. In order to selecting final solution from pareto front, are modified to solve the problem is calculated. The Proposed algorithm were compared with other three clustering algorithms on seven UCI standard datasets and could improve results averagely 0.09 percent compared to FeaClusMoo, 0.28 percent compared to VGAPS-Clustering and 0.49 percent compared to K-means. تفاصيل المقالة -
حرية الوصول المقاله
84 - SRV: A Striking Model based on Meta-Classifier for Improving Diagnosis Type 2 Diabetes
Razieh AsgarnezhadDiagnosis of diabetes is a classification problem that attracts more in recent years. Diabetes mellitus happens when the whole body cannot provide an adequate quantity of insulin to adjust glucose levels. In the low insulin level, food products in glucose are turned int أکثرDiagnosis of diabetes is a classification problem that attracts more in recent years. Diabetes mellitus happens when the whole body cannot provide an adequate quantity of insulin to adjust glucose levels. In the low insulin level, food products in glucose are turned into glucose, improving the sugar to a more than average level. All existing works show that many techniques are successful for this disease, Artificial Intelligence. There exist many classification models to aim the prediction of diabetes. We introduce a novel model to investigate the role of pre-processing and data reduction for classification problems in the diagnosis of diabetes. The model has four steps consisting of Pre-processing, Feature sub-selection, Classification, and Performance. In the classification technique, we apply the voting technique with three classifiers. Many experiments were conducted to reveal the performance of the proposed work for the diagnosis of diabetics. The results confirmed the superiority of our model over its counterparts, and the best accuracy, precision, recall, and F1 were achieved at 96.67, 100, 100, and 94.01%, respectively. تفاصيل المقالة -
حرية الوصول المقاله
85 - NSE: An effective model for investigating the role of pre-processing using ensembles in sentiment classification
Razieh Asgarnezhad Amirhassan MonadjemiWith the extensive Internet applications, review sentiment classification has attracted increasing interest among text mining experts. Traditional bag of words approaches did not indicate multiple relationships connecting words while emphasizing the pre-processing phase أکثرWith the extensive Internet applications, review sentiment classification has attracted increasing interest among text mining experts. Traditional bag of words approaches did not indicate multiple relationships connecting words while emphasizing the pre-processing phase and data reduction techniques, making a huge performance difference in classification. This study suggests a model as a different efficient model for multi-class sentiment classification using sampling techniques, feature selection methods, and ensemble supervised classification to increase the performance of text classification. The feature selection phase of our model has applied n-grams, a computational method that optimizes feature selection procedure by extracting features based on the relationships of the words to improve a candidate selection of features. The proposed model classifies the sentiment of tweets and online reviews through ensemble methods, including boosting, bagging, stacking, and voting in conjunction with supervised methods. Besides, two sampling techniques were applied in the pre-processing phase. In the experimental study, a comprehensive range of comparative experiments was conducted to assess the effectiveness of our model using the best existing works in the literature on well-known movie reviews and Twitter datasets. The highest accuracy and f-measure for our model obtained 92.95 and 92.65% on the movie dataset, 90.61 and 87.73% on the Twitter dataset, respectively. تفاصيل المقالة -
حرية الوصول المقاله
86 - A Review of Different Data Mining Techniques in Customer Segmentation
Tannane Parsa Kord Asiabi Reza TavoliCustomers are the most valuable asset of an organization. Due to high contest in the business field, it is necessary to regard the Customer Relationship Management (CRM) of the enterprise. Data Mining and Machine Learning methods been utilized by businesses in recent ye أکثرCustomers are the most valuable asset of an organization. Due to high contest in the business field, it is necessary to regard the Customer Relationship Management (CRM) of the enterprise. Data Mining and Machine Learning methods been utilized by businesses in recent years in order to improve CRM. CRM is the strategy for building, managing, and strengthening loyal and long lasting customer relationship. Data mining is the knowledge discovery process by analyzing the large volumes of data from various perspectives and summarizing it into useful information. Data mining have a several techniques in CRM but in this article we present the basic classification and clustering techniques that used. The target of this survey is to provide extensive review of different classification and clustering techniques in customer segmentation. تفاصيل المقالة -
حرية الوصول المقاله
87 - Double Clustering Method in Hiding Association Rules
Zahra Kiani Abari Mohammad Naderi DehkordiAssociation rules are among important techniques in data mining which are used for extracting hidden patterns and knowledge in large volumes of data. Association rules help individuals and organizations take strategic decisions and improve their business processes. Extr أکثرAssociation rules are among important techniques in data mining which are used for extracting hidden patterns and knowledge in large volumes of data. Association rules help individuals and organizations take strategic decisions and improve their business processes. Extracted association rules from a database contain important and confidential information that if published, the privacy of individuals may be threatened. Therefore, the process of hiding sensitive association rules should be performed prior to sharing the database. This is done through changing the database transactions. These changes must be made in such a way that all sensitive association rules are hidden and a maximum number of non-sensitive association rules are extractable from the sanitized database. In fact, a balance is to be established between hiding the sensitive rules and extracting the non-sensitive rules. A new algorithm is presented in this paper to create a balance between preserving privacy and extracting knowledge. The items of sensitive rules are clustered in the proposed algorithm, in order to reduce changes. In fact, reduction of changes and clustering of rules are applied in order to reduce the side effects of the hiding process on non-sensitive rules. تفاصيل المقالة -
حرية الوصول المقاله
88 - Proposing a Method to Classify Texts Using Data Mining
Mohammad Rostami Seyed Saeed Ayat Iman Attarzadeh Farid SaghariToday a significant part of available data is saved in text database or text documents. The most important thing is to organize these documents. One way to organize text documents is to classify them. To classify texts is to assign text documents to their actual categor أکثرToday a significant part of available data is saved in text database or text documents. The most important thing is to organize these documents. One way to organize text documents is to classify them. To classify texts is to assign text documents to their actual categories. This has two main steps, i.e. feature- and learning algorithm selection. There have been several methods suggested to classify text documents. In this paper, we propose a combined method to do this more efficiently. When selecting features, the proposed method uses filtering in order to reduce complexity and it is implemented using naïve Bayes and decision tree categories. Results indicate advantages of this combined method to individual classifying. تفاصيل المقالة -
حرية الوصول المقاله
89 - Customer Behavior Mining Framework (CBMF) using clustering and classification techniques
Farshid Abdi Shaghayegh AbolmakaremThe present study proposes a Customer Behavior Mining Framework on the basis of data mining techniques in a telecom company. This framework takes into account the customers’ behavior patterns and predicts the way they may act in the future. Firstly, clustering tec أکثرThe present study proposes a Customer Behavior Mining Framework on the basis of data mining techniques in a telecom company. This framework takes into account the customers’ behavior patterns and predicts the way they may act in the future. Firstly, clustering technique is used to implement portfolio analysis and previous customers are divided based on socio-demographic features usingk-means algorithm. Then, the cluster analysis is conducted based on two criteria, i.e., the number of hours the telecom services used and the number of the services selected by customers of each group. Six groups of customers are identified in three levels of attractiveness according to the results ofthecustomer portfolio analysis. The second phase has been devoted to mining the future behavior of the customers. Predicting the level of attractiveness of newcomer customers and also the churn behavior of these customers are accomplished in the second phase. This framework effectively helps the telecom managers mine the behavior of their customers. This may lead to develop appropriate tactics according to customers’ attractiveness and their churn behavior. Improving managers’ abilities in customer relationship management is one of the obtained results of the study. تفاصيل المقالة -
حرية الوصول المقاله
90 - Application of Kansei engineering and data mining in the Thai ceramic manufacturing
Chaiwat Kittidecha Koichi YamadaCeramic is one of the highly competitive products in Thailand. Many Thai ceramic companies are attempting to know the customer needs and perceptions for making favorite products. To know customer needs is the target of designers and to develop a product that must satisf أکثرCeramic is one of the highly competitive products in Thailand. Many Thai ceramic companies are attempting to know the customer needs and perceptions for making favorite products. To know customer needs is the target of designers and to develop a product that must satisfy customers. This research is applied Kansei Engineering (KE) and Data Mining (DM) into the customer driven product design process. KE can translate customer emotions into the product attributes. This method determines the relationships between customer feelings or Kansei words and the design attributes. Decision tree J48 and Class association rule which implemented through Waikato Environment for Knowledge Analysis (WEKA) software are used to generate a predictive model and to find the appropriate rules. In this experiment, the emotion scores were rated by 37 participants for training data and 16 participants for test data. 6 Kansei words were selected, namely, attractive, ease of drinking, ease of handing, quality, modern and durable. 10 mugs were selected as product samples. The results of this study indicate that the proposed models and rules can interpret the design product elements affecting the customer emotions. Finally, this study provides useful understanding for the application DM in KE and can be applied to a variety of design cases. تفاصيل المقالة -
حرية الوصول المقاله
91 - Development of an evolutionary fuzzy expert system for estimating future behavior of stock price
Azam Goodarzi Amirhossein Amiri Shervin Asadzadeh Farhad Mehmanpazir Shahrokh AsadiThe stock market has always been an attractive area for researchers since no method has been found yet to predict the stock price behavior precisely. Due to its high rate of uncertainty and volatility, it carries a higher risk than any other investment area, thus the st أکثرThe stock market has always been an attractive area for researchers since no method has been found yet to predict the stock price behavior precisely. Due to its high rate of uncertainty and volatility, it carries a higher risk than any other investment area, thus the stock price behavior is difficult to simulation. This paper presents a “data mining-based evolutionary fuzzy expert system” (DEFES) approach to estimate the behavior of stock price. This tool is developed in seven-stage architecture. Data mining is used in three stages to reduce the complexity of the whole data space. The first stage, noise filtering, is used to make our raw data clean and smooth. Variable selection is second stage; we use stepwise regression analysis to choose the key variables been considered in the model. In the third stage,K-means is used to divide the data into sub-populations to decrease the effects of noise and rebate complexity of the patterns. At next stage, extraction of Mamdani type fuzzy rule-based system will be carried out for each cluster by means of genetic algorithm and evolutionary strategy. In the fifth stage, we use binary genetic algorithm to rule filtering to remove the redundant rules in order to solve over learning phenomenon. In the sixth stage, we utilize the genetic tuning process to slightly adjust the shape of the membership functions. Last stage is the testing performance of tool and adjusts parameters. This is the first study on using an approximate fuzzy rule base system and evolutionary strategy with the ability of extracting the whole knowledge base of fuzzy expert system for stock price forecasting problems. The superiority and applicability of DEFES are shown for International Business Machines Corporation and compared the outcome with the results of the other methods. Results with MAPE metric and Wilcoxon signed ranks test indicate that DEFES provides more accuracy and outperforms all previous methods, so it can be considered as a superior tool for stock price forecasting problems. تفاصيل المقالة -
حرية الوصول المقاله
92 - Customer lifetime value model in an online toy store
B Nikkhahan A Habibi Badrabadi M.J TarokhBusiness all around the world uses different approaches to know their customers, segment them and formulate suitable strategies for them. One of these approaches is calculating the value of each customer for the company. In this paper by calculating Customer Lifetime Va أکثرBusiness all around the world uses different approaches to know their customers, segment them and formulate suitable strategies for them. One of these approaches is calculating the value of each customer for the company. In this paper by calculating Customer Lifetime Value (CLV) for individual customers of an online toy store named Alakdolak, three customer segments are extracted. The level of profitability for customers is identified, and finally suitable marketing strategies for each segment are developed. The results indicate that the company should increase its low price products and develop special programs for those that buy high price products and have high loyalty. Logistic regression as a data mining technique is used to present the customer defection and future purchase probability models and for each model, verification and validation is done. تفاصيل المقالة -
حرية الوصول المقاله
93 - بررسی وبسایتهای شهرداری تهران و ارایه راهکارهای مناسب دادهکاوی
شایسته شجاعی کاریزکی سودابه شاپوری هاجر زارعیهدف: هدف اصلی این پژوهش، شناسایی و تجزیه و تحلیل انواع دادههای وبسایت شهرداری تهران و ارایه راهکارهای مناسب دادهکاوی است. روش پژوهش: این پژوهش بنیادی است و از لحاظ ماهیت میتوان آن را تحلیلی در نظر گرفت. روش گردآوری دادههای به صورت میدانی بودهاست و جامعه آماری 47 أکثرهدف: هدف اصلی این پژوهش، شناسایی و تجزیه و تحلیل انواع دادههای وبسایت شهرداری تهران و ارایه راهکارهای مناسب دادهکاوی است. روش پژوهش: این پژوهش بنیادی است و از لحاظ ماهیت میتوان آن را تحلیلی در نظر گرفت. روش گردآوری دادههای به صورت میدانی بودهاست و جامعه آماری 47 سایت که از 220 دامنه شهرداری تهران انتخاب شدهاست و برای تجزیه و تحلیل از تکنیکهای دادهکاوی استفاده شدهاست و منبع گردآوری دادهها وبسنجی و ابزار مورد استفاده گوگل آنالیتیکس میباشد. یافتهها: میزان دقت الگوریتم شبکه عصبی معمولی برابر با 25/99% و در نهایت معیار آر.ام.اس.ای الگوریتم شبکه عصبی معمولی برابر با 159/0 است. میزان دقت الگوریتم درخت تصمیم برابر با 99.80% ؛ معیار ام.اس.ای الگوریتم درخت تصمیم برابر با 003/0 و در نهایت معیار آر.ام.اس.ای الگوریتم درخت تصمیم برابر با 045/0است. میزان دقت الگوریتم کی.ان.ان برابر با 81/99% و در نهایت معیار آر.ام.اس.ای الگوریتم کی.ان.ان برابر با 035/0 است نتیجهگیری: بر اساس یافتههای بدست آمده روش دی.بی.اسکن با سایر روشهای پایه جهت تجزیه و تحلیل دادههای وبسایتهای شهرداری تهران برابر و نسبت به سایر روشها از دقت بالاتری برخوردار است. تفاصيل المقالة -
حرية الوصول المقاله
94 - شناسایی روابط موضوعی بین منابع مورد استفاده توسط کاربران مرکز منطقهای اطلاع رسانی علوم و فناوری با استفاده از تکنیک متن کاوی
خجسته شعبانی عاصفه عاصمیهدف: هدف اصلی پژوهش حاضر بررسی روابط موضوعی در عناوین منابع مورد استفاده توسط کاربران رایسست با استفاده از تکنیک متن کاوی بود. بنابراین، به بازتاب چگونگی روابط موضوعی در منابع اطلاعاتی کاربران در مرکز رایسست مبادرت شده، تا از طریق شناخت به رفتار و احساس استفاده کنندگان أکثرهدف: هدف اصلی پژوهش حاضر بررسی روابط موضوعی در عناوین منابع مورد استفاده توسط کاربران رایسست با استفاده از تکنیک متن کاوی بود. بنابراین، به بازتاب چگونگی روابط موضوعی در منابع اطلاعاتی کاربران در مرکز رایسست مبادرت شده، تا از طریق شناخت به رفتار و احساس استفاده کنندگان دست یابند.روش پژوهش: روش پژوهش مبتنی بر متن کاوی بود، که به داده کاوی بر روی متن، تحلیل متن و به منظور فرایند استخراج اطلاعات با کیفیت از متن اشاره دارد. دسترسی اطلاعات به متن کامل مقالات مجلات علمی – پژوهشی، علمی – ترویجی، مجموعه مقالات کنفرانسها و همایشهای علمی، کتابهای لاتین و فارسی جامعه آماری پژوهش را تشکیل داده، که با استفاده از روش سرشماری، کلیه دادههای حاصل از گزارشگیری توسط رایسست بررسی گردید. به منظور تجزیه و تحلیل دادهها و تحلیل متن از نرم افزار ویانت، و برای پاکسازی و نرمال سازی دادهها از نرم افزار پایتون بهره جویی گردید.یافته ها: براساس یافتهها از دادههای حاصل شده، 21 کلمه و 160 کلمه موضوعی پرتکرار از منبع مورد استفاده در پایگاه اطلاعاتی رایسست مشخص گردید. دور نمای لوم از چگونگی توزیع کلمات موضوعی با تکرار بالا تهیه شده و ضریب همبستگی تکرار موضوعات پر استفاده در عنوانهای منابع اطلاعاتی تدوین شد. به منظور تدوین نمایه درهم کرد کلمات موضوعی پر تکرار ترند (Trend) استفاده شد.نتیجهگیری: نتایج نشان داد که تدوین پژوهش در مجموعه سازی منابع الکترونیکی پایگاههای اطلاعاتی و پیشنگری در آینده این دسته از منابع به مدیران مراکز اطلاع رسانی و کاربران آنها مفید است. تفاصيل المقالة -
حرية الوصول المقاله
95 - تعیین مهم ترین ویژگی های کمی و کیفی متمایزکننده سرده Rubus L. در ایران با استفاده از الگوریتم های دسته بندی و انتخاب ویژگی
محمد جواد شیخ زادهجنس سرده Rubus L. متعلق به تیره Rosaceae و زیرتیره Rosoideae شامل حدود 750 گونه در دنیا است. این جنس در اکثر نواحی جهان پراکنش دارد. در فلور ایران تعداد هشت گونه و پنج هیبرید (دو رگه) گزارش شده است. تمشک یکی از پر چالشترین جنسها در بین گیاهان گلدار میباشد. وجود عوام أکثرجنس سرده Rubus L. متعلق به تیره Rosaceae و زیرتیره Rosoideae شامل حدود 750 گونه در دنیا است. این جنس در اکثر نواحی جهان پراکنش دارد. در فلور ایران تعداد هشت گونه و پنج هیبرید (دو رگه) گزارش شده است. تمشک یکی از پر چالشترین جنسها در بین گیاهان گلدار میباشد. وجود عواملی از جمله پلیپلوئیدی، آپومیکسی و دورگهگیری زیاد در این جنس باعث مشکلاتی در تشخیص از نظر ریخت شناسی شده است. جمع آوری دادههای کمی و کیفی جهت تشخیص گونهها و روشهای جمعآوری مولفههای ریخت شناسی بسیار زمانبر و پر هزینه است. بنابراین، بکارگیری روش-های متفاوت در جهت کاهش زمان و هزینهها همواره مطرح میباشد. در بسیاری از موارد، جهت آنالیز دادههای زیستی روشهای داده کاوی بکار گرفته میشود. در این مقاله، از ترکیب الگوریتمهای مختلف انتخاب ویژگی و دستهبندی برای تشخیص ویژگیهای متمایزکننده بین گونههای سرده Rubus L. استفاده شد. با بکارگیری روش دستهبندی Random Forest و مدل انتخاب ویژگی InfoGainAttributeEval با تعداد 28 ویژگی به دقت 05/94 درصد در دستهبندی رسیدیم که بهترین الگوریتم از نظر دقت میباشد و با استفاده از روش MLP و مدل انتخاب ویژگی SymetricalAttributeEval، با تعداد 4 ویژگی دقت دستهبندی 32/84 درصد حاصل شد که بهترین الگوریتم از نظر تعداد اندک ویژگیهای انتخاب شده است. چهار ویژگی فوق توسط اکثر الگوریتمهای استفاده شده در این مقاله انتخاب شدند. تمامی این ویژگیها کیفی هستند و جهت بدست آوردن آنها نیازی به هزینه اندازهگیری آزمایشگاهی نمیباشد. بنابراین می-توانند معیار مناسبی جهت کلید شناسایی باشند. تفاصيل المقالة -
حرية الوصول المقاله
96 - Application of Satellite Data and Data Mining Algorithms in Estimating Coverage Percent (Case study: Nadoushan Rangelands, Ardakan Plain, Yazd, Iran)
Zinab Mirshekari Majid Sadeghinia Saeideh Kalantari Maryam AsadiAssessing and monitoring rangelands in arid regions are important and essential tasks in order to manage the desired regions. Nowadays, satellite images are used as an approximately economical and fast way to study the vegetation in a variety of scales. This research ai أکثرAssessing and monitoring rangelands in arid regions are important and essential tasks in order to manage the desired regions. Nowadays, satellite images are used as an approximately economical and fast way to study the vegetation in a variety of scales. This research aims to estimate the coverage percent using the digital data given by ETM+ Landsat satellite. In late May and early June 2018, the vegetation was measured in Ardakan plain, Yazd province, Iran. Information was obtained by 320 plots in 40 transects and also, the satellite images in terms of sampling time were downloaded and processed in USGS website. 16 indices involving NDVI, NIR, MSI, SS, IR1, MIRV1, NVI, TVI, RAI, SAVI, LWC, PD322, PD321, PD312, PD311 and IR2 were estimated. Through estimating the indices and extracting the values in order to conduct index-based predictions, six data mining models of Artificial Neural Network (ANN), the K Nearest Neighbor (KNN), Gaussian Process (GP), Linear Regression (LR), Support Vector Machine (SVM) and Decision Tree (DT M5) have been applied. Model assessment results indicated high vegetation estimate efficiency based on the indices but the model KNN with Root Mean Square Error (RMSE= 2.520) and Coefficient of determination (R2= 0.94) and (RMSE= 2.872 and R2= 0.96) had the highest accuracy in the training and data sets, respectively. As well, to determine the weight and importance of parameters, and to estimate the coverage percent, the weighing process were conducted based on support vector machine. Weighing results indicated that the KNN model and the Simple Subtraction (SS) index had higher weight and importance in terms of vegetation percent. تفاصيل المقالة -
حرية الوصول المقاله
97 - ارایه الگوی دسته بندی مشتریان با رویکرد داده کاوی ترکیبی( مورد مطالعه صنعت محصولات بهداشتی و آرایشی)
امید بشردوست عزت اله اصغری زاده محمدعلی افشار کاظمیبا توجه به حجم انباشته شده اطلاعات خرید مشتریان و پیچیدگی رقابت در عصر حاضر اهمیت ایجاد بستری برای تحلیل دادههای به روز ودقیق مشتریان، باهدف ایجاد ارتباطهای مؤثر با مشتریان فعلی و وفادار، بیش از پیش برای سازمانها به عنوان یک مزیت رقابتی جلوهگر شده است. هدف این پژوهش أکثربا توجه به حجم انباشته شده اطلاعات خرید مشتریان و پیچیدگی رقابت در عصر حاضر اهمیت ایجاد بستری برای تحلیل دادههای به روز ودقیق مشتریان، باهدف ایجاد ارتباطهای مؤثر با مشتریان فعلی و وفادار، بیش از پیش برای سازمانها به عنوان یک مزیت رقابتی جلوهگر شده است. هدف این پژوهش بررسی الگوهای رفتاری خرید مشتریان محصولهای بهداشتی به منظور دستهبندی آنها براساس مدل WRFMبا استفاده از روشهای ترکیبی دادهکاوی است. از میان مشتریان استان تهران که در بازه سالهای 1396- 1397 از شرکت خرید داشته اند از پایگاه داده های مشتریان 65534 نمونه، با روش نمونه گیری هدفمند در دسترس جمع آوری شده و به کمک SPSS مقدار RFM موزون با توجه به نظر خبرگان صنعت مشخص و سپس این فیلد به دیگر داده های پژوهش اضافه شده و توسط نرم افزار دادهکاوی کلمنتاین بر اساس70 درصد داده ها، خوشه بندی مشتریان صورت گرفته است؛ همچنین به منظور بررسی کیفیت خوشهبندی از معیارهای امتیازجینی، درصد خطا، اطلاعات متقابل نرمالشده (NMI) استفاده شده است. نتایج پژوهش حکایت ازکارایی بالای روش خوشهبندی Kمیانگین با تعداد چهارخوشه با درصد خلوص (0/761)، برای بخش بندی مشتریان داشته است تفاصيل المقالة -
حرية الوصول المقاله
98 - A Machine Learning Approach to Detect Energy Fraud in Smart Distribution Network
Mahdi Emadaleslami Mahmoud-Reza HaghifamElectricity utility have long sought to identify and reduce energy fraud as a significant part of non-technical losses (NTL). Generally, to determine customer’s honesty in consumption on-site inspection is vital. Since, inspecting all customers is expensive, utili أکثرElectricity utility have long sought to identify and reduce energy fraud as a significant part of non-technical losses (NTL). Generally, to determine customer’s honesty in consumption on-site inspection is vital. Since, inspecting all customers is expensive, utilities look for new ways to reduce inspection’s range to cases with a higher probability of fraud. One way to reduce the scope of inspection is to use machine learning (ML) algorithms to analysis consumption pattern. But, their performance is not satisfactory due to insufficiency of fraudulent customers. In this paper, a new two-stage ML-based model is presented to detect fraud in distribution network. . In the first stage, an Artificial Neural Network (ANN) is trained to model fraudulent customers, which is used to predict theft scenarios for normal consumers to handle data insufficiency. In the second stage, a Support Vector Machine (SVM) classifier is trained to distinguish normal and suspicious consumers. Assessment and comparison of the proposed algorithm to those of conventional models on a real data set with more than 5000 customers shows its high performance. تفاصيل المقالة -
حرية الوصول المقاله
99 - Comparing the speed and time of association extraction from database with cuckoo search and genetic algorithms
Payam Abdolmohammadi Roham FarahaniThis paper aims to study the appropriate data mining method to extract the rules from a data set and examining the benefits of using the cuckoo algorithm to extract association rules and compare the execution time of the cuckoo algorithm and genetic algorithm (GA). Ther أکثرThis paper aims to study the appropriate data mining method to extract the rules from a data set and examining the benefits of using the cuckoo algorithm to extract association rules and compare the execution time of the cuckoo algorithm and genetic algorithm (GA). Therefore, an algorithm is proposed that includes two parts: preprocessing and mining. The first part presents the procedures related to the calculation of cuckoo fit values and in the second part of the algorithm, which is the main achievement of this research. Support and confidence The best position can show the least confidence and support.These mining results can be used to continue mining the association rules. The proposed algorithm is based on the cuckoo search. It hides the sensitive relationship rules with a lower time cost and, at the same time, controls the peripheral effects of non-sensitive rules in a better way. This aim is achieved using recurring to the objective function. The GA is set to be the evaluation criterion to show the prominence of the proposed method. In this method, we compare the speed of the cuckoo algorithm with the genetic algorithm, which uses genetic evolution as a problem-solving model. In general, it is an algorithm based on repetition, most of its parts are selected as random processes, and these algorithms are part of the fitting function. It was chosen as a criterion and we paid .It is scientifically proven that the cuckoo algorithm outperforms the GA in the execution time. تفاصيل المقالة -
حرية الوصول المقاله
100 - Efficient Data Mining with Evolutionary Algorithms for Cloud Computing Application
Hamid Malmir Fardad Farokhi Reza Sabbaghi-NadooshanWith the rapid development of the internet, the amount of information and data which are produced, are extremely massive. Hence, client will be confused with huge amount of data, and it is difficult to understand which ones are useful. Data mining can overcome this prob أکثرWith the rapid development of the internet, the amount of information and data which are produced, are extremely massive. Hence, client will be confused with huge amount of data, and it is difficult to understand which ones are useful. Data mining can overcome this problem. While data mining is using on cloud computing, it is reducing time of processing, energy usage and costs. As the speed of data mining is very important, this paper proposes four faster classification algorithms in comparison with each other. In this paper, A Multi-Layer perceptron (MLP) Network is trained with Imperialist Competitive Algorithm (ICA), Particle Swarm Optimization (PSO), Differential Evolution (DE), and Invasive Weed Optimization (IWO) separately. The classifications are done on Wisconsin Breast Cancer (WBC) data base. At the end, to illustrate the speed and accuracy of these classifiers, they are compared with each other and two other types of Genetic algorithm classifiers (GA). تفاصيل المقالة -
حرية الوصول المقاله
101 - Predicting the Next State of Traffic by Data Mining Classification Techniques
S.Mehdi Hashemi Mehrdad Almasi Roozbeh Ebrazi Mohsen JahanshahiTraffic prediction systems can play an essential role in intelligent transportation systems (ITS). Prediction and patterns comprehensibility of traffic characteristic parameters such as average speed, flow, and travel time could be beneficiary both in advanced traveler أکثرTraffic prediction systems can play an essential role in intelligent transportation systems (ITS). Prediction and patterns comprehensibility of traffic characteristic parameters such as average speed, flow, and travel time could be beneficiary both in advanced traveler information systems (ATIS) and in ITS traffic control systems. However, due to their complex nonlinear patterns, these systems are burdensome. In this paper, we have applied some supervised data mining techniques (i.e. Classification Tree, Random Forest, Naïve Bayesian and CN2) to predict the next state of Traffic by a categorical traffic variable (level of service (LOS)) in different short-time intervals and also produce simple and easy handling if-then rules to reveal road facility characteristic. The analytical results show prediction accuracy of 80% on average by using methods تفاصيل المقالة -
حرية الوصول المقاله
102 - باز طراحی مدل فرآیند خدمات مددکاری و توانمندسازی با استفاده از تکنیک های داده کاوی و فرآیندکاوی (مطالعه موردی: کمیته امداد امام خمینی (ره) استان آذربایجان غربی)
مهرداد محمدزاده علمداری منصور اسماعیل پور علیرضا اسلامبولچی کامران سرهنگیاین پژوهش به بررسی میزان موفقیت مدل پیاده سازی شده فرایند خدمات مددکاری و توانمندسازی در بزرگترین نهاد حمایتی کشور پرداخته و با بهره گیری از تکنیک های نوین، نسبت به بازطراحی مدل اولیه اقدام نموده است. در این تحقیق داده های مربوط به منظور سنجش میزان تحقق اهداف کاربردی با أکثراین پژوهش به بررسی میزان موفقیت مدل پیاده سازی شده فرایند خدمات مددکاری و توانمندسازی در بزرگترین نهاد حمایتی کشور پرداخته و با بهره گیری از تکنیک های نوین، نسبت به بازطراحی مدل اولیه اقدام نموده است. در این تحقیق داده های مربوط به منظور سنجش میزان تحقق اهداف کاربردی با توزیع پرسش نامه در بین 100نفر از همکاران کمیته امداد در سطح 21 شهرستان استان آذربایجان غربی جمع آوری و با استفاده از متدولوژی CRISP-DM مراحل مختلف مبتنی بر داده کاوی انجام گردید. در ادامه به منظور پاسخگویی به سوال اصلی تحقیق، داده های مربوط به تعداد4687مددجویی که فرایند موجود را طی نموده بودند از طریق تکنیک های فرایندکاوی مورد بررسی قرار گرفت.نتایج حاصل نشان داد که مدل پیاده سازی شده، معیارهای 4 گانه کیفی را از جنبه سادگی محقق، ولی به منظور دستیابی کامل به مطابقت، عمومیت و دقت، نیاز به بازطراحی دارد. در این راستا با حذف حلقه تکرار در مسیر ۳، مدل اولیه بازطراحی گردید تا ضمن تحقق کامل اهداف کاربردی، با مد نظر قرار دادن مطالبات اقشار آسیب پذیر اجتماعی،ضمن تکریم و افزایش سطح رضایت مندی جامعه هدف، به عنوان الگویی موفق توسط سایر سازمانهای مردم نهاد غیردولتی در داخل و خارج کشور مورد بهره برداری قرار گیرد. تفاصيل المقالة -
حرية الوصول المقاله
103 - ارائه مدل ارزیابی عملکرد بانکهای بورسی کشور با رهیافت داده کاوی
الهام آدخ عارفه فدوی اصغری محمد ابراهیم پورزرندیبا رشد بانکهای خصوصی و مؤسسات مالی و اعتباری،رقابت بین آنها به منظور ارائه خدمات بهتر افزایش یافته است. با توجه به اهمیت موضوع،تدوین یک الگوی جامع و کامل برای ارزیابی بانکها ضروری به نظر می رسد. هر سازمان برای آگاهی از نقاط قوت و ضعف خود به ویژه در محیط های پویا نیازمند أکثربا رشد بانکهای خصوصی و مؤسسات مالی و اعتباری،رقابت بین آنها به منظور ارائه خدمات بهتر افزایش یافته است. با توجه به اهمیت موضوع،تدوین یک الگوی جامع و کامل برای ارزیابی بانکها ضروری به نظر می رسد. هر سازمان برای آگاهی از نقاط قوت و ضعف خود به ویژه در محیط های پویا نیازمند ارزیابی عملکرد می باشد. موضوع ارزیابی عملکرد آنقدر مورد توجه است که حتی در این باره صاحبنظران مدیریت معتقدند: "آنچه را که نتوان ارزیابی نمود، نمی توان مدیریت کرد".بنابراین بانک ها نیز همانند سایرسازمان ها در ایران برای ارائه خدمات متنوع تر و سریع ترو همچنین توسعه خود ، نیازمند ارزیابی عملکرد می باشند.[6]هدف اصلی این مقاله ارائه مدلی به منظور ارزیابی عملکرد بانکهای بورسی کشور با استفاده از روشهای داده کاوی می باشد. در این پژوهش، 4 مدل داده کاوی درخت تصمیم C5.0، درخت تصمیم C4.5، الگوریتم بیز و جنگل تصادفی، به منظور ارزیابی عملکرد بانک های پذیرفته شده در بورس اوراق بهادار تهران پیاده سازی و با یکدیگر مقایسه می گردند. بدین منظور نمونه ای مشتمل بر 28 نسبت مالی شامل نسبت های سودآوری، نقدینگی، حوزه کیفیت مدیریت ، حوزه کیفیت دارایی و کفایت سرمایه در 18 بانک بورس اوراق بهادار تهران درفاصله بین سالهای 1393 تا 1396 به عنوان متغیرهای مستقل و عملکرد بانکها درسه دسته قابل قبول، غیرقابل قبول ومتوسط به عنوان متغیر وابسته انتخاب گردیدند. نتایج حاکی از آن است که در بین کلیه مدلها درخت تصمیم C5.0 با صحت 94.4% بهترین مدل ارائه شده در این پژوهش می باشد. تفاصيل المقالة -
حرية الوصول المقاله
104 - ارزیابی عملکرد شعب بانک با رویکرد داده کاوی و سیستم خبره
حمید اسلامی نصرت آبادی محمدجعفر تارخ علیرضا پورابراهیمیشعب بانک یکی از ارکان مهم بانکداری دیجیتال است و بررسی عملکرد آنها نقش مهمی در سودآوری و تحقق اهداف بانک در پیدارد. این پژوهش به ارزیابی عملکرد شعب بانک با استفاده از روشهای نوآورانه میپردازد. نخست به شناسایی شاخصهای مهم در خصوص ارزیابی عملکرد شعب پرداخته شده است. سپس أکثرشعب بانک یکی از ارکان مهم بانکداری دیجیتال است و بررسی عملکرد آنها نقش مهمی در سودآوری و تحقق اهداف بانک در پیدارد. این پژوهش به ارزیابی عملکرد شعب بانک با استفاده از روشهای نوآورانه میپردازد. نخست به شناسایی شاخصهای مهم در خصوص ارزیابی عملکرد شعب پرداخته شده است. سپس روش پیشنهادی برروی دادههای شعب بانک در قالب مطالعه موردی پیادهسازی گردیده است. بدین منظور ابتدا خوشه بندی انجام گردید تا شعب کارا و نیمه کارا و ناکارا از یکدیگر تفکیک گردند. سپس بر اساس برچسب ایجاد شده بر روی دادهای شعب از الگوریتمهای طبقه بندی و درخت تصمیم استفاده گردید تا قوانین موجود در دادههای شعب کارا و ناکارا و نیمه کارا استخراج گردد. در تحقیق حاضر از مدل ارائه شده از الگوریتم C5.0 بدلیل بدست آوردن بالاترین میزان صحت در مقایسه با سایر الگوریتمها مورد استفاده قرار گرفت. در انتها براساس قواعد استخراج شده به طراحی یک سیستم خبره برای ارزیابی عملکرد شعب بانکی پرداخته شد. برای طراحی سیستم خبره از نرم افزار کلیپس استفاده شد. در بانک مورد مطالعه شاخص درصد متوسط افزایش سپردههای ارزان قیمت طی دوره به افزایش مانده هدف دارای بیشترین تاثیر در عملکرد را دارا بود. تفاصيل المقالة -
حرية الوصول المقاله
105 - پیش بینی ورشکستگی شرکتها با استفاده از ترکیب مدلهای داده کاوی مبتنی بر جریمه دسته بندی نادرست
عطیه ترکمن امیرعباس نجفییکی از ابزارهای قدرتمند در مسائل پیش بینی ورشکستگی که در دهه های اخیر مورد توجه بسیاری از سرمایه گذاران، مدیران و محققان قرارگرفته است؛ داده کاوی و به طور خاص ماشین بردار پشتیبان است. اما مطالعات نشان می دهد این روش نسبت به انتخاب پارامترها و متغیرهای ورودی از حساسیت ب أکثریکی از ابزارهای قدرتمند در مسائل پیش بینی ورشکستگی که در دهه های اخیر مورد توجه بسیاری از سرمایه گذاران، مدیران و محققان قرارگرفته است؛ داده کاوی و به طور خاص ماشین بردار پشتیبان است. اما مطالعات نشان می دهد این روش نسبت به انتخاب پارامترها و متغیرهای ورودی از حساسیت بالایی برخوردار است. لذا هدف از تحقیق حاضر ترکیب مدل توسعه یافته ماشین بردار پشتیبان و k-نزدیکترین همسایه جهت حذف ورودی های دارای خطا و متعاقبا افزایش دقت پیش بینی ورشکستگی است. به این منظور ابتدا با استفاده از 5 نسبت مالی شامل نسبت جاری، حاشیه سود خالص، نسبت بدهی، بازده دارایی ها و بازده سرمایه مرتبط به 150 شرکت حاضر در بورس اوراق بهادار تهران در بازه 10 ساله 1389-1398و الگوریتم k-نزدیکترین همسایگی داده های آموزش پالایش شده و سپس با تکیه بر ماشین بردار پشتیبان مبتنی بر جریمه دسته بندی، جهت ساخت مدل پیش بینی به کار گرفته می شوند. پس از برآورد پارامترهای بهینه، اعتبارسنجی مدل با استفاده از داده های آزمایش صورت خواهد گرفت. در نهایت نتایج بدست آمده از مدل پیشنهادی و مدل های کلاسیک مورد مقایسه قرار خواهدگرفت. نتایج نشان می دهد با ترکیب مدل های k-نزدیکترین همسایه و ماشین بردار پشتیبان خطای کلی پیش بینی کاهش یافته و ضرایب جریمه ماشین بردار پشتیبان با سطح احتمال بالایی معنادار هستند. تفاصيل المقالة -
حرية الوصول المقاله
106 - کاوش قوانین پیوستگی کمی در بازار سهام با استفاده از الگوریتم های فراابتکاری چندهدفه مبتنی بر الگوریتم ژنتیک
مصطفی زندیه سیما مردانلوپیش بینی بازده سهام موضوعی مهم در حوزه مالی است که توجه محققان را برای سالهای بسیاری به خود جلب کرده است. سرمایه گذاران همواره در تلاش برای پیدا کردن راهی برای پیش بینی قیمت سهام و پیدا کردن سهام و زمان مناسب برای خرید و یا فروش هستند. اخیرا، از تکنیک های داده کاوی و تک أکثرپیش بینی بازده سهام موضوعی مهم در حوزه مالی است که توجه محققان را برای سالهای بسیاری به خود جلب کرده است. سرمایه گذاران همواره در تلاش برای پیدا کردن راهی برای پیش بینی قیمت سهام و پیدا کردن سهام و زمان مناسب برای خرید و یا فروش هستند. اخیرا، از تکنیک های داده کاوی و تکنیک های هوش مصنوعی در این حوزه استفاده می شود. کشف قوانین پیوستگی یکی از رایج ترین روش های داده کاوی مورد استفاده جهت استخراج دانش از مجموعه داده های بزرگ است. برخی محققین کاوش قوانین پیوستگی را به عنوان یک مسئله چند هدفه بیان کرده اند، که به طور مشترک چند معیار را برای به دست آوردن یک مجموعه با قوانین جالب تر و دقیق تر بهینه سازی می کند. در این پژوهش، یک مدل تکاملی چند هدفه جدید ارائه می دهیم که قابلیت درک، جالب بودن و کارایی را به منظور کاوش مجموعه ای از قوانین پیوستگی کمی از داده های مالی، شامل 10 تا از رایج ترین نشانگرهای تحلیل تکنیکی، حداکثر می کند. برای این منظور، این مدل، دو الگوریتم تکاملی چندهدفه معروف الگوریتم ژنتیک مرتب سازی نامغلوب II و الگوریتم ژنتیک رتبه بندی شده نامغلوب را برای انجام فراگیری تکاملی فواصل ویژگی ها و انتخاب شرایط برای هر قانون گسترش می دهد. علاوه براین، مدل ارائه شده، یک جمعیت خارجی و یک فرایند شروع مجدد را برای مدل تکاملی به منظور ذخیره تمام قوانین نامغلوب یافته شده و بهبود تنوع مجموعه قوانین به دست آمده معرفی می کند. نتایج به دست آمده بر روی داده های سهام در دنیای واقعی، اثربخشی روش ارائه شده را نشان می دهد. تفاصيل المقالة -
حرية الوصول المقاله
107 - انتخاب آنلاین سبد سرمایه گذاری به روش تطابق با الگوی طیفی
متین عبدی امیرعباس نجفیبا توجه به افزایش حجم و سرعت معاملات در بازارهای مالی امروز، افزایش سرعت در تحلیلها و تصمیمگیریها اجتناب ناپذیر است. انجام تحلیلهای سریع و عاری از خطاهای رفتاری توسط انسان غیر ممکن است. از این رو بازارهای مالی به سمت داد و ستدهای الگوریتمیدر حرکت هستند که در آن‎ أکثربا توجه به افزایش حجم و سرعت معاملات در بازارهای مالی امروز، افزایش سرعت در تحلیلها و تصمیمگیریها اجتناب ناپذیر است. انجام تحلیلهای سریع و عاری از خطاهای رفتاری توسط انسان غیر ممکن است. از این رو بازارهای مالی به سمت داد و ستدهای الگوریتمیدر حرکت هستند که در آن‎ها از تکنیک‎هایی از قبیل یادگیری ماشینی و دادهکاویاستفاده میشود. انتخاب آنلاین سبد سرمایهگذاری یکی از تکنیکهای نوین در داد و ستد الگوریتمی است به این صورت که سرمایه را به تعداد مشخصی سهم تخصیص داده و در ابتدای هر دوره با استفاده از تکنیکهایی پرتفو را به روز رسانی میکند. در واقع در این تکنیکها انسان در انتخاب پرتفو دخالتی نداشته و الگوریتم نحوهی سرمایهگذاری را در هر دوره مشخص میکند. در این مقاله الگوریتمی توسعه داده شده است که از اصل تطابق با الگودر انتخاب آنلاین سبد سرمایهگذاری پیروی میکند. در این اصل، پرتفو بر اساس الگوهای تاریخی مشابه انتخاب میشود که در این مقاله برای یافتن الگوهای تاریخی مشابه از روش خوشهبندی طیفیدر داده کاوی استفاده شده است. در این خصوص یک مثال عددی با استفاده از ۲۰ سهم فعالتر در بورس نیویورک ارائه شده و نتایج آن با الگوریتمهای دیگر در این حوزه مقایسه شده است. تفاصيل المقالة -
حرية الوصول المقاله
108 - ارائه رویکردی نوین مبتنی بر قوائد انجمنی جهت بررسی ارتباطات بازار نفت با بازارهای جهانی
رضا خسروی احسان محمدیان امیری پوریا رضایی سیدبابک ابراهیمیدر عصر کنونی بررسی ارتباطات میان بازارهای مختلف و تاثیرگذاری آنان بر روی یکدیگر به یک امر ضروری برای سرمایهگذاران خرد و کلان تبدیل گشته است. با بررسی ارتباط بین بازارها علاوه بر آنکه شخص سرمایهگذار میتواند در خصوص میزان تاثیرات بازارها، اطلاعات خود را بدست آورد، در أکثردر عصر کنونی بررسی ارتباطات میان بازارهای مختلف و تاثیرگذاری آنان بر روی یکدیگر به یک امر ضروری برای سرمایهگذاران خرد و کلان تبدیل گشته است. با بررسی ارتباط بین بازارها علاوه بر آنکه شخص سرمایهگذار میتواند در خصوص میزان تاثیرات بازارها، اطلاعات خود را بدست آورد، در زمینه شناسایی ریسکهای مختلف نیز به او کمک شایانی مینماید. بر حسب اهمیت موضوع، در این مقاله سعی بر بررسی ارتباط میان بازار نفت با بازارهای طلا، دلار، شرکتها و صندوقهای فعال در حوزه انرژی با استفاده از رویکرد نوین قوائد انجمنی و الگوریتم آپریوری، شده است. استفاده از قوائد انجمنی سبب بررسی صریح ارتباطات بین فیلدهای پایگاههای داده شده و روابط و وابستگیهای متقابل بین مجموعه بزرگی از اقلام دادهای را مشخص میسازد. نتایج این تحقیق حاکی از رابطه مستقیم بازار نفت با شرکتها و صندوقهای فعال در حوزه انرژی و رابطهای معکوس با شاخص دلار میباشد. همچنین رابطه محسوسی بین بازار نفت و طلا نیز یافت نشد. تفاصيل المقالة -
حرية الوصول المقاله
109 - Clustering with K-Means Hybridization Ant Colony Optimization (K-ACO)
Dewi RatnaningsihOne of well-known techniques in data mining is clustering. Clustering method which is very popular is K-means cluster because its algorithm is very easy and simple. However, K-means cluster has some weaknesses, one of which is that the cluster result is sensitive toward أکثرOne of well-known techniques in data mining is clustering. Clustering method which is very popular is K-means cluster because its algorithm is very easy and simple. However, K-means cluster has some weaknesses, one of which is that the cluster result is sensitive towards centroid initialization so that the cluster result tends to local optimal. This paper explains the modification of K-means cluster, that is, K-means hybridization with ant colony optimization (K-ACO). Ant Colony Optimization (ACO) is optimization algorithm based on ant colony behavior. Through K-ACO, the weaknesses of cluster result which tends to local optimal can be overcome well. The application of hybrid method of K-ACO with the use of R program gives better accuracy compared to K-means cluster. K-means cluster accuracy yielded by Minitab, Mathlab, and SAS at iris data is 89%. Meanwhile, K-ACO hybrid clustering with R program simulated on 38 treatments with 3-time repetitions gives accuracy result of 93,10%. تفاصيل المقالة -
حرية الوصول المقاله
110 - ارائه مدل پیش بینی رضایت مشتریان از خدمات پشتیبانی نرم افزار شرکت همکاران سیستم با رویکرد دادهکاوی
بابک سهرابی ایمان رئیسی وانانی سمانه کشاورزیکیفیت کار خود قلمداد میکنند. از آنجا که تقریباً کلیه سازمانهای امروزی نیازمند رقابت در عرصههای مختلف از جمله خدمات هستند، ارائه خدمات با کیفیت در دستیابی به مزیت رقابتی پایدار از اهمیت قابل ملاحظهای برخوردار است. سازمانها و شرکتها جهت بقاء و موفقیت در بازارهای رقا أکثرکیفیت کار خود قلمداد میکنند. از آنجا که تقریباً کلیه سازمانهای امروزی نیازمند رقابت در عرصههای مختلف از جمله خدمات هستند، ارائه خدمات با کیفیت در دستیابی به مزیت رقابتی پایدار از اهمیت قابل ملاحظهای برخوردار است. سازمانها و شرکتها جهت بقاء و موفقیت در بازارهای رقابتی، ناگزیرند خدماتی با کیفیت به مشتریان ارائه کنند. نتایج بسیاری از پژوهش ها نشان میدهد کیفیت خدمات مقدمهای برای رضایت مشتری است. با این وجود، بسیاری از شرکتهای مشتریمدار در فرآیند تشخیص و ارزیابی ترجیحات مشتریان با مشکل مواجه شده و اغلب درک اشتباهی از خواستهها و انتظارات مشتریان دارند، زیرا ارائه خدمات با کیفیت بالاتر مستلزم شناخت روابط بین خواستههای مشتریان و کیفیت خدمات ارایهشده توسط شرکت است. سازمان ها و شرکت های ارائه دهنده خدمات نرم افزاری نیز از این قائده مستثنی نیستند. هدف از این پژوهش ارائه مدلی در جهت پیش بینی میزان رضایت مشتریان از خدمات پشتیبانی ارائهشده، تعیین میزان تأثیر هر یک از متغیرهای اثرگذار بر رضایت مشتریان و اطلاع از سطح رضایت مشتریان از خدمات پشتیبانی در شرکت مذکور است. که بدین منظور الگوریتم های پیش بینی در داده کاوی از جمله الگوریتم های طبقه بندی و رگرسیون و با استفاده از نرم افزار رپیدماینر بر روی داده ها اجرا شدند. از میان این روش ها آنهایی که بالاترین میزان دقت و کمترین میزان خطا را داشتند بهعنوان روش های منتخب، برگزیده شدند. همچنین از روش وزن دهی برای مشخص کردن موثرترین متغیر ها در رضایت مشتری استفاده شد تا نتایج حاصل از اینها بهمنظور اتخاذ تصمیمات و پیادهسازی راهکارهای بهبود رضایت مشتری در اختیار مدیران شرکت قرار گیرد. تفاصيل المقالة -
حرية الوصول المقاله
111 - The Application of Combined Fuzzy Clustering Model and Neural Networks to Measure Valuably of Bank Customers
Raheleh Nasiri Sharifi Maryam RastgarpourCurrently, acquisition of resources in banks is subject to attraction of the resources of banking customers. Meanwhile, the Bank’s valuable customers are one of the best resources to make profit for banks. Several different models are introduced for evaluation of أکثرCurrently, acquisition of resources in banks is subject to attraction of the resources of banking customers. Meanwhile, the Bank’s valuable customers are one of the best resources to make profit for banks. Several different models are introduced for evaluation of profitability of the customers; but most of them are classical models and they are unable to evaluate the customers in complete and optimized manner. In this way, the conditions are ready to enter artificial intelligence to this scope. In this study, we tried to design an intellectual system for identification of valuable customers of Bank. Such a model is capable of reasoning and explaining the expert system together with adaptation and learning capability of neural network at the same time. Expertise is added to it through data mining. As a result, evaluating the proposed model is done through transaction data of the customer, and accuracy of 95.46 percent is gained. تفاصيل المقالة -
حرية الوصول المقاله
112 - Identification of Fraud in Banking Data and Financial Institutions Using Classification Algorithms
Ardavan RajaeiIn recent years, due to the expansion of financial institutions,as well as the popularity of the World Wide Weband e-commerce, a significant increase in the volume offinancial transactions observed. In addition to the increasein turnover, a huge increase in the number o أکثرIn recent years, due to the expansion of financial institutions,as well as the popularity of the World Wide Weband e-commerce, a significant increase in the volume offinancial transactions observed. In addition to the increasein turnover, a huge increase in the number of fraud by user’sabnormality is resulting in billions of dollars in lossesover the world. Therefore, fraud detection techniques toidentify users motivated to do a lot of scientific research.To check the volume of such information data miningtechniques used. Data mining, knowledge discovery processthat finding patterns in large data sets by combiningtechniques from statistics, artificial intelligence, databasemanagement and etc. In data mining techniques we examineand analyze information to discover uncertaincommunication and hidden patterns of data. This studyaimed to detect fraud in banking data using classificationalgorithms. تفاصيل المقالة -
حرية الوصول المقاله
113 - تعیین مدلی جهت ارزیابی سیستم مدیریت دانش در جهت بهبود صنایع با محوریت فناوری آموزشی و بکارگیری مفاهیم داده کاوی
کمیل اکبرنژادبائی محمود محمدی عبدالله کولوبندی محمد تقی پورمدیریت دانش مشتری تلفیقی از مدیریت دانش و مدیریت ارتباط با مشتریان میباشد که برای توسعه بخشیدن در راهبرد تجاری سازمان و درنتیجه بهسازی فعالیتهای سازمانی و نائل شدن به مزیت رقابتی، اهمیت پیدا میکند. با توسعه و گسترش دانش و فناوری اطلاعات، محیط پروژهها از پیچیدگی بیشت أکثرمدیریت دانش مشتری تلفیقی از مدیریت دانش و مدیریت ارتباط با مشتریان میباشد که برای توسعه بخشیدن در راهبرد تجاری سازمان و درنتیجه بهسازی فعالیتهای سازمانی و نائل شدن به مزیت رقابتی، اهمیت پیدا میکند. با توسعه و گسترش دانش و فناوری اطلاعات، محیط پروژهها از پیچیدگی بیشتری برخوردار شدهاند. هدف تحقیق تعیین مدلی جهت ارزیابی سیستم مدیریت دانش در جهت بهبود صنایع با محوریت فناوری آموزشی و بکارگیری مفاهیم داده کاوی می باشد. روش تحقیق کمی و اطلاعات موردنیاز این تحقیق از پایگاه داده واحدهای صنعتی از جمله شرکت خودروسازی جمعآوری شد. جامعه آماری تحقیق شامل کلیه خریداران خودرو در طی سالهای 1399 و 1400 میباشد که روش نمونه گیری به صورت تصادفی ساده بود. جهت جمع آوری داده ها از پرسشنامهها و جهت تجزیه و تحلیل داده ها از روش دادهکاوی و الگوریتمهای kmens و روش شبکه عصبی و ماشین بردار پشتیبان استفاده گردید. نتایج بهدستآمده نشان میدهد استفاده از مدیریت دانش و مفاهیم فناوری آموزشی بهخوبی توانسته انواع مشتریها و روندهای فروش را در آینده پیشبینی نماید و انتظار میرود نتایج بهدستآمده در بهبود صنایع و مدیریت ساخت و تولید در کشور، مفید واقع شود. تفاصيل المقالة -
حرية الوصول المقاله
114 - کاربرد تحلیل خوشهای به منظور دادهکاوی در پژوهشهای روانشناسی
زهرا نقش اعظم مقدمزمینه: دادهکاوی فرایند مرتبسازی و طبقهبندی دادههای حجیم است. هدف این مقاله معرفی تحلیل خوشهای به عنوان یکی از تکنیکهای دادهکاوی و ارایه نمونهای از کاربرد آن در خوشهبندی افراد تعللورز است. روش: بدین منظور ضمن معرفی تحلیل خوشهای و انواع رویکردهای آن، نحوه انتخا أکثرزمینه: دادهکاوی فرایند مرتبسازی و طبقهبندی دادههای حجیم است. هدف این مقاله معرفی تحلیل خوشهای به عنوان یکی از تکنیکهای دادهکاوی و ارایه نمونهای از کاربرد آن در خوشهبندی افراد تعللورز است. روش: بدین منظور ضمن معرفی تحلیل خوشهای و انواع رویکردهای آن، نحوه انتخاب هر یک و گامهای اجرای آن در یک نمونه معرف ارایه میشود این نمونه متشکل از 200 دانشجوی دانشگاه تهران (100 پسر و 100 دختر) که در تعللورزی بر اساس مقیاس سولومون و روثبلوم (1984) نمرات بالایی به دست آورده بودند انتخاب و به مقیاسهای پرسشنامه خودتنظیمی گرین و میلر (2004)، خودکارآمدی میدلتن و میگلی (1997)، مقیاس باورهای ناکامی هرینگتون (2005) و باورهای غیرمنطقی کوپمنز و همکاران (1994) پاسخ دادند. یافتهها: نتایج این پژوهش بیانگر وجود خوشههای مختلف از تعللورزان است که با شناسایی گروههای تعللورزان و ویژگیهای هر یک از گروهها میتوان راهکارهای موثرتری برای کاهش تعللورزی هر گروه ارایه کرد. تفاصيل المقالة -
حرية الوصول المقاله
115 - مدل سازی و تاثیر کاربرد سیستم مدیریت دانش به منظور بهبود حاکمیت فناوری در صنعت خودروسازی کشور با استفاده از محیط دادهکاوی
کمیل اکبرنژاد بائی محمود محمدی عبداله کولوبندی محمد تقی پورزمینه و هدف: مدیریت دانش مشتری تلفیقی از مدیریت دانش و مدیریت ارتباط با مشتریان میباشد که برای توسعه بخشیدن در راهبرد تجاری سازمان و درنتیجه بهسازی فعالیتهای سازمانی و نائل شدن به مزیت رقابتی، اهمیت پیدا میکند. با توسعه و گسترش دانش و فناوری اطلاعات، محیط پروژهها از أکثرزمینه و هدف: مدیریت دانش مشتری تلفیقی از مدیریت دانش و مدیریت ارتباط با مشتریان میباشد که برای توسعه بخشیدن در راهبرد تجاری سازمان و درنتیجه بهسازی فعالیتهای سازمانی و نائل شدن به مزیت رقابتی، اهمیت پیدا میکند. با توسعه و گسترش دانش و فناوری اطلاعات، محیط پروژهها از پیچیدگی بیشتری برخوردار شدهاند. روش شناسی: ازآنجاکه مدیریت دانش یکی از مهمترین رویکردهایی است که در این راستا موردتوجه قرارگرفته است لذا مسئله تحقیق حاضر بررسی تأثیر مدیریت دانش و هر یک از فرایندهای تشکیلدهنده آن (خلق، کاربرد، تسهیم و ذخیره دانش) بر حاکمیت فناوری اطلاعات در صنعت خودروسازی است. یافته ها: با توجه به اینکه تأثیر فرایندهای دانش در محیط پروژهای بررسی میگردد، روش این تحقیق کمی و اطلاعات موردنیاز این پژوهش از پایگاه داده شرکتهای خودروسازی جمعآوری شد. سطح خرید خودرو بهعنوان متغیر وابسته و اطلاعات مربوط به سن، جنسیت، سطح درآمد، شغل، سطح تحصیلات، سابقه داشتن خودرو، وضعیت تأهل بهعنوان متغیر مستقل در نظر گرفتهشده است. با استفاده از روش دادهکاوی و الگوریتمهای kmens و روش شبکه عصبی و ماشین بردار پشتیبان مورد تجزیهوتحلیل قرار گرفت. نتایج: نتایج بهدستآمده نشان میدهد استفاده از مدیریت دانش بهخوبی توانسته است انواع مشتریها و روندهای فروش را در آینده پیشبینی کند و انتظار میرود نتایج بهدستآمده در مدیریت ساخت و تولید صنایع خودروسازی کشور مؤثر واقع شود. تفاصيل المقالة