• فهرس المقالات Data mining

      • حرية الوصول المقاله

        1 - پیش بینی قیمت سهام با استفاده از روش داده کاوی
        مجتبی حاجی غلامی
        این مقاله به بررسی روش‌های داده کاوی برای پیش‌بینی بازار های مالی و تحلیل توسعه پایدار موضوعات مالی و پیش‌بینی روند با استفاده از داده کاوی می‌پردازد. این مقاله همچنین به بررسی تأثیر استفاده از روش‌های داده کاوی در بازار سهام و کارایی آن در این زمینه می‌پردازد. در این ت أکثر
        این مقاله به بررسی روش‌های داده کاوی برای پیش‌بینی بازار های مالی و تحلیل توسعه پایدار موضوعات مالی و پیش‌بینی روند با استفاده از داده کاوی می‌پردازد. این مقاله همچنین به بررسی تأثیر استفاده از روش‌های داده کاوی در بازار سهام و کارایی آن در این زمینه می‌پردازد. در این تحقیق یک رویکرد یادگیری ماشینی معرفی میشود که اطلاعات را با استفاده از داده های موجودی عمومی میسازد و از آن اطلاعات برای پیشبینی دقیق استفاده میکند. همچنین به بررسی گونه‌های متنوعی از روش‌های داده کاوی می‌پردازد که در حوزه تجزیه و تحلیل بازارهای مالی کاربرد دارند و به طور ویژه تمرکز خود را بر پیش‌بینی روندهای بازار سهام معطوف می‌دارد. مطالعه ما نشان می‌دهد که از آنجایی که بازارهای مالی پویا و متغیر هستند و همواره تحت تأثیر عوامل اقتصادی، سیاسی و اجتماعی قرار دارند، استفاده از روش‌های یادگیری ماشینی و داده کاوی می‌تواند در پیش‌بینی دقیق‌تر حرکات قیمتی سهام مؤثر واقع شود. با توجه به داده‌های گسترده و پیچیده موجود در بازارهای مالی، روش‌های داده کاوی می‌توانند پتانسیل فراوانی در کشف الگوهای پنهان و تعیین ارتباط میان متغیرهای مختلف داشته باشند. در این راستا، الگوریتم‌های مختلف یادگیری ماشینی مانند شبکه‌های عصبی مصنوعی، ماشین‌های بردار پشتیبان و جنگل‌های تصادفی به عنوان مثال مورد استفاده قرار گرفته و در کنار آنالیزهای آماری، به بهبود قابلیت‌های تحلیل‌گران و سرمایه‌گذاران در تصمیم‌گیری‌های اقتصادی کمک می‌کنند. استفاده از داده‌های بزرگ و تحلیل‌های پیچیده همچنین به توسعه استراتژی‌های معاملاتی هوشمندانه که می‌توانند به بهینه‌سازی بازگشت سرمایه کمک کنند، کمک نموده است. برای نمونه، تحلیلگران می‌توانند با ادغام داده‌های احساسی حاصل از شبکه‌های اجتماعی در مدل‌های پیش‌بینی خود، دقت تخمین‌های خود را ارتقا بدهند. این مطالعه تأکید دارد که توسعه پایدار در بازارهای مالی نیازمند تحلیلی دقیق‌تری از داده‌ها است که در نهایت منجر به تصمیم‌گیری‌های مبتنی بر داده و فرآیندهای معاملاتی قوی تر می‌شود. تفاصيل المقالة
      • حرية الوصول المقاله

        2 - ارائه یک مدل جدید برای سناریو سازی تقاضای دستگاه‌های خودپرداز (مورد مطالعه : دستگاه‌های خودپرداز شهر تهران)
        علیرضا آقا قلیزاده سیار محمد رضا معتدل علیرضا پور ابراهیمی
        در دنیای رقابتی امروز توانایی شناخت و پیش بینی تقاضای مشتریان یک مقوله مهم جهت موفقیت سازمانها به شمار می‌رود.و از انجا که دستگاههای خود پرداز یکی از مهم ترین کانالهای توزیع وجه نقد و یکی از اساسی ترین معیارهای ارزیابی سطح خدمات برای بانکها بشمار میروند در این مقاله ویژ أکثر
        در دنیای رقابتی امروز توانایی شناخت و پیش بینی تقاضای مشتریان یک مقوله مهم جهت موفقیت سازمانها به شمار می‌رود.و از انجا که دستگاههای خود پرداز یکی از مهم ترین کانالهای توزیع وجه نقد و یکی از اساسی ترین معیارهای ارزیابی سطح خدمات برای بانکها بشمار میروند در این مقاله ویژگیهای مربوط به دستگاه های خودپرداز با توجه به زمان های مراجعه و مکان قرار گیری دستگاه‌ها بررسی می گردد . این مقاله به دنبال یافتن مدلی پویا و کاربردی جهت سناریو سازی تقاضای دستگاههای خود پرداز می باشد . از این رو مورد کاوی بر روی ۳۷۸ دستگاه خودپرداز در سراسر شهر تهران در بازه زمانی یک ماه که شامل ۶۹۴۱۸ رکورد می باشد انجام گرفت . این مدل در نهایت با خوشه بندی داده های آماری در بعد زمانی و مکانی موفق به یادگیری الگوی موجود در داده های کلان شده و بر همین مبنای درخت تصمیم ارائه شده قادر به پیش بینی تعداد مراجعه کننده به هر دستگاه می باشد که پس از ارایه سناریو های ایجاد شده در جهت ارتقای کیفیت خدمات دهی بانکی و ارتقای عملکرد شبکه خودپردازها ترکیب بهینه مکانی دستگاههای خودپرداز در بعد مکانی و زمانی ارایه میگردد. تفاصيل المقالة
      • حرية الوصول المقاله

        3 - تجارب داخلی و بین المللی در زمینه سامانه های آینده پژوهی ـ پویش محیطی وب محور
        مرتضی تیزچنگ هرزندی مینا ابراهیمی
        پویش محیطی، در سال‌های اخیر به‌صورت چشم‌گیری مورد استفاده در سراسر جهان قرار گرفته است. اگرچه تعریف دقیق و شفافی برای این مفهوم وجود ندارد، ولی در کل می‌توان این‌گونه بیان کرد که این فرآیند، استفاده سیستماتیک از بهترین اطلاعات موجود برای انتخاب بهترین تصمیم ممکن را فراه أکثر
        پویش محیطی، در سال‌های اخیر به‌صورت چشم‌گیری مورد استفاده در سراسر جهان قرار گرفته است. اگرچه تعریف دقیق و شفافی برای این مفهوم وجود ندارد، ولی در کل می‌توان این‌گونه بیان کرد که این فرآیند، استفاده سیستماتیک از بهترین اطلاعات موجود برای انتخاب بهترین تصمیم ممکن را فراهم می کند. جستجویی سیستماتیک برای گرایش‌های نوین، فرصت‌ها و محدودیت‌هایی که در مسیر رسیدن به اهداف تعیین شده مدیریتی اثرگذار هستند. اهداف صریح پویش محیطی برای مسائل نوین و تکوینی، دانش و داده‌های ذخیره شده درباره آن‌ها و در نهایت آگاهی از تصمیمات حیاتی است. در این راستا می توان به راهکارهای کلیدی فنی به‌کار گرفته شده در فرآیندهای پویش محیطی نظیر وبگردی، شاخص گذاری، نگاشت دانش، هم استنادی، هم واژگانی، هم رخدادی، الگوریتم رتبه صفحه، الگوریتم اچ.آی.تی.اس، داده کاوی، دسته بندی و خوشه بندی اشاره کرد. در مدت زمان نگارش این پژوهش تلاش شده است تا موسسات و کمپانی های در حال بهره بردن و یا خدمت رساندن در زمینه پویش محیطی وب محور شناسایی و اهداف و راهکارهای آن‌ها مورد بررسی قرار بگیرد و همچنین تکنیک ها و ابزارهایی که استفاده می کنند شناسایی و مطالعه شوند. تفاصيل المقالة
      • حرية الوصول المقاله

        4 - مدلی برای پیش بینی نیاز به جراحی ارتوپدی با استفاده از تکنیک های داده کاوی
        سید سینا فاطمی رضوی سید عبداله امین موسوی
        با گسترش استفاده از رایانه در جنبه های مختلف زندگی افراد، حجم بسیار زیادی از داده ها تولید می شود که در بسیاری از اوقات این داده ها شامل اطلاعات ارزشمندی هستند. برای استخراج این اطلاعات و بهره بردن از آنها می توان از علم داده کاوی1 بهره برد. با استفاده از داده کاوی می ت أکثر
        با گسترش استفاده از رایانه در جنبه های مختلف زندگی افراد، حجم بسیار زیادی از داده ها تولید می شود که در بسیاری از اوقات این داده ها شامل اطلاعات ارزشمندی هستند. برای استخراج این اطلاعات و بهره بردن از آنها می توان از علم داده کاوی1 بهره برد. با استفاده از داده کاوی می توان، الگوهای پنهان موجود در داده ها را کشف نمود و برای پیش بینی موارد جدید مورد استفاده قرار داد. از جمله حوزه هایی که با تولید حجم انبوه داده ها روبرو می باشد، حوزه ی درمان است. در این پژوهش به طور خاص در زمینه ی ارتوپدی تمرکز خواهد شد. این تحقیق به دنبال این است که با استفاده از تکنولوژی و تکنیک های داده کاوی بتواند از داده موجود در دیتابیس بیمارستان به اطلاعات ارزشمندی دست یابد و از طریق آن اطلاعات بتواند احتمال شکستگی و همچنین نیازمند بودن بیمار به جراحی را پیش بینی کند و تصمیم گیری را برای پزشکان ساده تر و سریع تر کند. بدین صورت می توان با سرعت و دقت بالاتری نسبت به روش های موجود به تفکیک بیماران و ارائه ی خدمات به آن ها پرداخت. این پژوهش بر مبنای متدولوژی CRISP بنا نهاده شده است و نتایج حاصل از تحقیق بیانگر این امر است که استفاده ی تلفیقی از الگوریتم های CHAID و شبکه ی عصبی2 تقویت شده با روش تجمعی3 Boosting، می تواند دقت مطلوبی در پیش بینی نیاز به جراحی در بیماران ارتوپدی را ارائه دهد. تفاصيل المقالة
      • حرية الوصول المقاله

        5 - ارائه مدلی جهت پیش بینی و بهبود کیفیت تولید با استفاده از الگوریتم های درخت تصمیم و برنامه ریزی خطی ( مورد مطالعه: شرکتهای تولید کننده موج گیرتیبا در ایران)
        نادره سادات راست قلم رویا محمدعلی پور اهری احمد رضا شکرچی زاده عاطفه امین دوست
        امروز در اکثر صنایع کشور از ابزار کنترل کیفیت آماری جهت بهبود کیفیت محصولات استفاده می‌نمایند ولی با توجه به حجم بالای داده‌ها در حال حاضر نیاز به ابزاری قوی‌تر می‌باشد که بتواند فرایندهای کنترل کیفیت آماری را تحت کنترل قرار دهد با توجه به گستردگی الگوریتم‌های داده‌کاوی أکثر
        امروز در اکثر صنایع کشور از ابزار کنترل کیفیت آماری جهت بهبود کیفیت محصولات استفاده می‌نمایند ولی با توجه به حجم بالای داده‌ها در حال حاضر نیاز به ابزاری قوی‌تر می‌باشد که بتواند فرایندهای کنترل کیفیت آماری را تحت کنترل قرار دهد با توجه به گستردگی الگوریتم‌های داده‌کاوی در این تحقیق از ابزار داده‌کاوی جهت بهبود فرایند استفاده شده است و همچنین هدف اصلی تحقیق ارائه روشی جهت کشف اقلام معیوب قبل از تولید کامل آنها و جلوگیری از تولید اقلام معیوب می‌باشد. روش کار بدین گونه است که در ابتدا پایگاه داده خرابی تشکیل می‌گردد و پس از جمع آوری داده های کنترل کیفیت، با استفاده از الگوریتم‌های مختلف درخت تصمیم دقت پیش بینی کیفیت قطعات تعیین می‌گردد و در مرحله بعد با استفاده از مدل-تحلیل‌پوششی‌داده‌ها هر یک از قوانین ارزیابی می گردد و در نهایت با استفاده از قوانینی که در هر ایستگاه کاری صدق می‌کنند ارزیابی ایستگاه های کاری انجام می گیرد. بر این اساس در این پژوهش جامعه آماری تمامی قطعات تولیدی موج‌گیر تیبا در سال 1398 می‌باشد. خصیصه ها شامل 9 ایستگاه کاری هستند، بر اساس نتایج بدست آمده بهترین الگوریتم در پیش‌بینی خرابی C5 می‌باشد و مهم‌ترین خصیصه‌های انتخابی توسط آن تعیین می‌گردند عبارت‌اند از: کیفیت خنک کاری، کیفیت سوراخ کاری و کیفیت برش. همچنین ارزیابی قوانین نیز با استفاده از مدل‌تحلیل‌پوششی‌داده‌ها انجام شده و مهم‌ترین قوانین استخراج شده‌اند و در نهایت بر اساس حل مدل دستگاه‌هایی که در اولویت اصلاحی برای سال جاری قرار گیرند عبارتند از: رولینگ، لحیم کاری و برش تفاصيل المقالة
      • حرية الوصول المقاله

        6 - طبقه بندی متقاضیان تسهیلات اعتباری بانکها با استفاده از تکنیک ماشین بردار پشتیبان
        دکتر عباس طلوعی اشلقی دکتر هاشم نیکومرام فرناز مقدوری شربیانی
        در صنعت بانکداری یکی از موضوعاتی که همواره بایستی مدنظر سیاستگذاران اعتباری قرار دا شته باشد، مبحث مدیریتریسک است. در بین ریسک های مختلفی که بان کها با آن مواجهند, ریسک اعتباری از با اهمیت ترین آن ها است که اززیان های ناشی از ناتوانی یا عدم تمایل مشتری به ایفای تعهدات خ أکثر
        در صنعت بانکداری یکی از موضوعاتی که همواره بایستی مدنظر سیاستگذاران اعتباری قرار دا شته باشد، مبحث مدیریتریسک است. در بین ریسک های مختلفی که بان کها با آن مواجهند, ریسک اعتباری از با اهمیت ترین آن ها است که اززیان های ناشی از ناتوانی یا عدم تمایل مشتری به ایفای تعهدات خویش در برابر بانک حاصل م یگردد.جهت مدیریت و کنترل ریسک مذکور , سیستم های طبقه بندی اعتباری مشتریان ضرورتی انکار ناپذیر است . چنین سیستمی،براساس سوابق و اطلاعات موجود، طبقه مشتریان را تعیین می کند. بدیهی است بهره گیری از چنین سیستمی بانک را درگزینش مطلوب مشتریان خود یاری نموده و ضمن کنترل و کاهش ریسک اعتباری، سطح بهره وری فرایند اعطای تسهیلاتبانکی را ارتقا میدهد.در مقاله حاضر مدل طبقه بندی مبتنی بر ماشین بردار پشتیبان با رویکرد هوش مصنوعی، به منظور پیش بینی عملکرد مالیمشتریان حقوقی بانک ها ارائه گردیده است . در واقع، در این نوشتار ماشین بردار پشتیبان به همراه دیگر مک انیزمها از جملهتکنیکهایF-score وGrid searchجهت طبقهبندی متقاضیان تسهیلات اعتباری بانکی وافزایش کارایی مدل استفاده شده است . نتایج، حاکی از افزایش صحت طبقه بندی است و نشان می دهد که ماشین بردار پشتیبان در مقایسه با دیگرمدلهای طبقه بندی دارای صحت بیشتری است. تفاصيل المقالة
      • حرية الوصول المقاله

        7 - Diagnosis of hyperlipidemia in patients based on an artificial neural network with pso algorithm
        asma naeimi minoo soltanshahi amir rajabi
        One of the most common and most dangerous diseases of blood fats are such as heart disease, diabetes and stroke, heart and brain. It can control the timely diagnosis, treatment and then prevention of complications is become very effective even without using medicine. He أکثر
        One of the most common and most dangerous diseases of blood fats are such as heart disease, diabetes and stroke, heart and brain. It can control the timely diagnosis, treatment and then prevention of complications is become very effective even without using medicine. Heart disease and diabetes file if patients has useful information that can be used to estimate blood fat timely diagnosis. In this paper we introduce a method based on data mining according to the information of patients' medical records to predict and detect blood lipid cardiovascular. And to identify patients with high blood lipids,we use a category based on neural network without feedback and pso algorithm to train the neural network to determine the appropriate value to reduce error the weights of the neural network . Simulation is done in MATLAB environment by using Body Fat data set, it shows the accuracy of 93.22 percent compared to the same methods, which means high accurate, higher detection sensitivity and Democrats. تفاصيل المقالة
      • حرية الوصول المقاله

        8 - Developing A Fault Diagnosis Approach Based On Artificial Neural Network And Self Organization Map For Occurred ADSL Faults
        Vahid Golmah Mina Tashakori
        Telecommunication companies have received a great deal of research attention, which have many advantages such as low cost, higher qualification, simple installation and maintenance, and high reliability. However, the using of technical maintenance approaches in Telecomm أکثر
        Telecommunication companies have received a great deal of research attention, which have many advantages such as low cost, higher qualification, simple installation and maintenance, and high reliability. However, the using of technical maintenance approaches in Telecommunication companies could improve system reliability and users' satisfaction from Asymmetric digital subscriber line (ADSL) services. In ADSL systems, there are many variables giving some noise for classification and there are many fault patterns with overlapping data. Therefore, this paper proposes a multilayer perceptron (MLP) classifier integrated with Self Organization Map (SOM) models for fault detection and diagnosis (FDD) of occurred ADSL systems. The interest of this paper is to improve the performance of single MLP by dividing the fault pattern space into a few smaller sub-spaces using SOM clustering technique and triggering the right local classifier by designing a supervisor agent. The performances of this method are evaluated on the fault data of Iranian Telecommunication Company which develop ADSL services and then the proposed algorithm is also compared against single MLP. Finally, the results obtained by this algorithm are analyzed to increase user's satisfaction with reducing occurred faults for them with predicting before they face it. تفاصيل المقالة
      • حرية الوصول المقاله

        9 - Document Analysis And Classification Based On Passing Window
        ZAHER BAMASOOD
        In this paper we present Document analysis and classification system to segment and classify contents of Arabic document images. This system includes preprocessing, document segmentation, feature extraction and document classification. A document image is enhanced in th أکثر
        In this paper we present Document analysis and classification system to segment and classify contents of Arabic document images. This system includes preprocessing, document segmentation, feature extraction and document classification. A document image is enhanced in the preprocessing by removing noise, binarization, and detecting and correcting image skew. In document segmentation, an algorithm is proposed to segment a document image into homogenous regions. In document classification, Neural Network (Multilayer Perceptron- Back propagation) classifier is applied to classify each region to text or non text based on a number of features extracted in feature extraction. These features are collected from different other researchers’ works. Experiments were conducted on 398 document images selected randomly from printed Arabic text database (PATDB) which was selected from various printing forms which are advertisements, book chapters, magazines, newspapers, letters and reports documents. As results, the proposed segmentation algorithm achieved only 0.814% as ratio of the overlapping areas of the merged zones to the total size of zones and 1.938% as the ratio of missed areas to total size of zones. The features, that show the best accuracy individually, are Background Vertical Run Length (RL) Mean, and Standard Deviation of foreground. تفاصيل المقالة
      • حرية الوصول المقاله

        10 - Prediction of Student Learning Styles using Data Mining Techniques
        Esther Khakata Vincent Omwenga Simon Msanjila
        This paper focuses on the prediction of student learning styles using data mining techniques within their institutions. This prediction was aimed at finding out how different learning styles are achieved within learning environments which are specifically influenced by أکثر
        This paper focuses on the prediction of student learning styles using data mining techniques within their institutions. This prediction was aimed at finding out how different learning styles are achieved within learning environments which are specifically influenced by already existing factors. These learning styles, have been affected by different factors that are mainly engraved and found within the students learning environment. To obtain the learning styles, a data mining technique was used and this explicitly involved the use of pattern analysis in order to identify the underlying learning styles in the data collected from the learners. This paper highlights the five major learning styles that describe the patterns extracted from the collected data. Therefore, considering the changed learning ecosystem, it is clear that prediction of student learning styles can be done when the various factor inputs within the student environment are brought together and analyzed to focus on learning within internet-mediated environments. تفاصيل المقالة
      • حرية الوصول المقاله

        11 - Optimization of weighting-based approach to predict and deal with cold start of web recommender systems using cuckoo algorithm
        reza molaee fard
        Recommending systems are systems that, by taking limited information from the user and features such as what the user has searched for in the past and what product they have rated, can correctly identify the user and the desired items Offer the user. The user's desired أکثر
        Recommending systems are systems that, by taking limited information from the user and features such as what the user has searched for in the past and what product they have rated, can correctly identify the user and the desired items Offer the user. The user's desired items are suggested to him through the user profile. In this research, a new method is presented to recommend the user's interests in the form of the user's personalized profile. The way to do this is to use other users' searched information in the form of a database to recommend to new users. The procedure is that we first collect a log file from the items searched by users, then we pre-process this log file to remove the data from the raw state and clean it. Then, using data weighting and using the score function, we extract the most searched items of users in the past and provide them to the user in the form of a recommendation system based on participatory filtering. Finally, we use our data using an algorithm. We optimize the cuckoo that this information can be of interest to the user. The results of this study showed 99% accuracy and 97% frequency, which can to a large extent correctly predict the user's favorite items and pages and start with the problem that is the problem of most recommender systems To confront. تفاصيل المقالة
      • حرية الوصول المقاله

        12 - بررسی امکان مدل سازی میزان تغییرات کالبدی بافت های شهر با استفاده از داده کاوی
        ناجی پژمان ضیایی محمد نقی زاده سید مصطفی مختاباد
        پیش‌بینی آهنگ تغییرات کالبدی بافت‌های شهری یکی از عوامل تاثیرگذار بر کیفیت طراحی و برنامه‌ریزی شهری به‌شمار می‌رود. هدف از انجام این پژوهش تدوین شیوه‌ای برای مدلسازی آهنگ تغییرات کالبدی بافت‌های شهری است به‌گونه‌ای که علاوه بر سهولت استفاده، امکان پیش‌بینی تغییرات را از أکثر
        پیش‌بینی آهنگ تغییرات کالبدی بافت‌های شهری یکی از عوامل تاثیرگذار بر کیفیت طراحی و برنامه‌ریزی شهری به‌شمار می‌رود. هدف از انجام این پژوهش تدوین شیوه‌ای برای مدلسازی آهنگ تغییرات کالبدی بافت‌های شهری است به‌گونه‌ای که علاوه بر سهولت استفاده، امکان پیش‌بینی تغییرات را از طریق پایش دوره‌های پیشین فراهم سازد. از این رو با استفاده از تحلیل رگراسیونی خطی، آهنگ تغییرات فرم بافت برای یک دوره زمانی خاص مدل شده و میزان تغییرات آن مشخص گردید. در راستای آزمودن این شیوه، قسمتی از بافت محله فیض آباد شهر کرمانشاه مورد مطالعه قرار گرفته و بواسطه استخراج اطلاعات مربوط به چهار دوره از روی تصاویر هوایی، وضعیت بافت برای سال هدف مدل گردید. مقایسه اطلاعات مدل شده با وضعیت واقعی بافت نشان داد که مدل ایجاد شده کاربرد پذیر بوده و در مناطق مصون از تغییرات مبتنی بر طرح‌های شهری منطقه مورد مطالعه از دقت بیش از 70 درصد برخوردار می‌باشد. تفاصيل المقالة
      • حرية الوصول المقاله

        13 - یک رویکرد جدید مبتنی بر تحلیل پوششی داده‌ها با مرز دوگانه برای رتبه‌بندی قواعد کشف شده از داده‌کاوی
        حسین عزیزی
        تحلیل پوششی داده‌ها (DEA) یک رویکرد نسبتاً جدید با ماهیت داده‌ای برای ارزیابی عملکرد مجموعه‌ای از موجودیت‌های همتا به نام واحدهای تصمیم‌گیری (DMUها) است که چندین ورودی را به چندین خروجی تبدیل می‌کنند. DEA در دوره‌ی زمانی نسبتاً محدودی تبدیل به ابزار کمّی و تحلیلی قدرتمن أکثر
        تحلیل پوششی داده‌ها (DEA) یک رویکرد نسبتاً جدید با ماهیت داده‌ای برای ارزیابی عملکرد مجموعه‌ای از موجودیت‌های همتا به نام واحدهای تصمیم‌گیری (DMUها) است که چندین ورودی را به چندین خروجی تبدیل می‌کنند. DEA در دوره‌ی زمانی نسبتاً محدودی تبدیل به ابزار کمّی و تحلیلی قدرتمندی برای اندازه‌گیری و ارزیابی عملکرد شده است. در مقاله‌ای به قلم طلوع و همکاران [5]، آنها یک مدل DEAی جدید برای پیدا کردن کارآترین قاعده‌ی ارتباطی در داده‌کاوی پیشنهاد کردند. آنگاه، با استفاده از این مدل، آلگوریتمی برای رتبه‌بندی قواعد ارتباطی با در نظر گرفتن معیارهای متعدد ایجاد کردند. در این مقاله، ما نشان می‌دهیم که مدل آنها تنها یک قاعده‌ی ارتباطی کارآی خوشبینانه را به طور شانسی انتخاب می‌کند و کاملاً وابسته به روش حل یا برنامه‌ی نرم‌افزاری است که برای حل مسئله استفاده می‌شود. به علاوه، نشان داده می‌شود که آلگوریتم پیشنهادی آنها تنها می‌تواند قواعد کارآی خوشبینانه را به طور تصادفی رتبه‌بندی کند، و قادر به رتبه‌بندی DMUهای غیرکارآی خوشبینانه نیست. همچنین، به معایب دیگری در این مقاله، اشاره می‌کنیم و رویکرد جدید «DEA با مرز دوگانه» را برای ایجاد یک رتبه‌بندی کامل قواعد ارتباطی پیشنهاد می‌کنیم. یک مثال عددی برخی از محتویات مقاله را توضیح خواهد داد. تفاصيل المقالة
      • حرية الوصول المقاله

        14 - طراحی یک مدل هوشمند جهت تعیین سیگنال های معاملات سهام با رویکرد داده کاوی
        پانته آ ملکی مقدم اکبر عالم تبریز اسماعیل نجفی
        یکی از مهمترین مسائل در بازارهای مالی مدرن یافتن راههای کارآمد برای تلخیص و تجسم کردن اطلاعات بازار بورس می‌باشد. با حجم انبوه از داده‌هایی که در بازار بورس تهران در هر لحظه ایجاد می‌گردد برای بررسی روابط میان داده‌ها و دست یافتن به اطلاعات نهفته آنها که تاثیر قابل ملاح أکثر
        یکی از مهمترین مسائل در بازارهای مالی مدرن یافتن راههای کارآمد برای تلخیص و تجسم کردن اطلاعات بازار بورس می‌باشد. با حجم انبوه از داده‌هایی که در بازار بورس تهران در هر لحظه ایجاد می‌گردد برای بررسی روابط میان داده‌ها و دست یافتن به اطلاعات نهفته آنها که تاثیر قابل ملاحظه‌ای در تصمیمات سرمایه-گذاران دارد به مدل‌هایی دست یافتیم. با استفاده از کلان داده‌های ارزشمند تولید شده توسط بازار سهام با استفاده از روش خوشه بندی افرازی و به کمک الگوریتم k-means به تعیین نقاط سیگنال معاملات سهام ‌پرداخته شده است. در این پژوهش از داده های صنایع خودرو و فرآورده های نفتی طی سال 1387 تا 1396 که با کمک بیست شاخص تکنیکی مدل سازی انجام پذیرفت. نتایج این پژوهش نشان داد که مدل مورد استفاده در شناسایی و پیش بینی سیگنال‌های فروش صادره در نقاط حداکثری دارای عملکرد قابل توجهی بوده و با دقت قابل قبولی قابل پیش بینی می‌باشند. در واقع این سیگنالها دارای خطای کمتری بوده و بهتر پیش‌بینی گردیده است. تفاصيل المقالة
      • حرية الوصول المقاله

        15 - استفاده از داده کاوی و سه الگوریتم درخت تصمیم‌گیری جهت بهینه‌سازی فرآیند تعمیرات و نگهداری
        محمد ایزدی خواه دنیا گرشاسبی
        هدف از این تحقیق پیش­بینی خرابی دستگاه­ها با استفاده از ابزار داده کاوی می­باشد که بدین منظور در ابتدا پایگاه داده مناسب متشکل از 392 رکورد از خرابی­های به وقوع پیوسته در یک شرکت داروسازی در سال 1394 تشکیل شده است، در مرحله بعد با تعیین 9 خصیصه و نوع خرا أکثر
        هدف از این تحقیق پیش­بینی خرابی دستگاه­ها با استفاده از ابزار داده کاوی می­باشد که بدین منظور در ابتدا پایگاه داده مناسب متشکل از 392 رکورد از خرابی­های به وقوع پیوسته در یک شرکت داروسازی در سال 1394 تشکیل شده است، در مرحله بعد با تعیین 9 خصیصه و نوع خرابی بعنوان کلاس پایگاه داده، تحلیل­ها صورت پذیرفته است که در این راستا از 3 الگوریتم درخت تصمیم برای تعیین مهمترین خصیصه­ها و تعیین قوانین موثر بر خرابی استفاده شده است. بر اساس نتایج بدست آمده از انتخاب خصیصه هر سه الگوریتم مورد استفاده خصیصه­های عمر دستگاه، نام ماشین و مدت زمان تا آخرین خرابی بعنوان مهمترین خصیصه­ها در نظر گرفته شده­اند. بر این اساس عمر دستگاه از اهمیت ویژه­ای برخوردار است. از آنجائی که استهلاک در صنعت داروسازی در حد بالائی می­باشد لذا عمر دستگاه­های مورد استفاده در تعمیرات و نگهداری اثرات ویژه­ای دارد. در این راستا دستگاه­های که دارای عمر بیش از 20 سال می­باشند استهلاک و خرابی آنها بسیار بالا می­باشد و نیاز است تا علاوه بر تعمیرات معمول بازبینی­ها و تعمیرات ویژه­ای در مورد آنها اعمال گردد. تفاصيل المقالة
      • حرية الوصول المقاله

        16 - ارائه‌ی یک مدل دو مرحله‌ی مبتنی بر داده کاوی جهت ارزیابی عملکرد مشتریان مشترک بانک و بیمه
        حمیدرضا امیر حسنخانی عباس طلوعی اشلقی علیرضا پورابراهیمی رضا رادفر
        اکتشاف دانش از پایگاه داده و داده کاوی یکی از مهم ترین ابزار های مدیریت ارتباط با مشتری است که می تواند به سازمان با تاکید بر یافتن اطلاعات مفید یا دانش مورد علاقه آن کمک کند. امروزه بانک ها و بیمه ها از پایگاه های اطلاعاتی متعدد و گسترده ای برخوردار هستند که حاوی اطلاع أکثر
        اکتشاف دانش از پایگاه داده و داده کاوی یکی از مهم ترین ابزار های مدیریت ارتباط با مشتری است که می تواند به سازمان با تاکید بر یافتن اطلاعات مفید یا دانش مورد علاقه آن کمک کند. امروزه بانک ها و بیمه ها از پایگاه های اطلاعاتی متعدد و گسترده ای برخوردار هستند که حاوی اطلاعات مربوط به مبادلات و جزئیات دیگر مربوط به مشتریانشان هستند. اطلاعات ارزشمند تجاری از درون همین ذخایر داده ای قابل بازیابی است. اما پشتیبانی از این دست تحلیل ها و تصمیم گیری با استفاده از زبان های گزارش گیری سنتی امکان پذیر نخواهد بود. بنابراینبا توجه به اهمیت اطلاعات مشتریان مشترک بانک و بیمه باید آنها را هرچه دقیق تر تحلیل نمود. در این تحقیق با گردآوری و تجزیه و تحلیل اطلاعات مشتریان مشترک بانک و بیمه یک متدولوژی مبتنی بر داده کاوی جهت ارزیابی مشتریان بر اساس شاخص های عملکردی آنها در حوزه بانکی و بیمه ای ارائه می شود. همچنین با تحلیل رفتار مشتریان با استفاده از یه رویکرد دو مرحله ای مبتنی بر یادگیری بدون نظارت و یادگیری با نظارت اقدام به پیش بینی رفتار مشتریان جدیدالورود خواهیم نمود. تفاصيل المقالة
      • حرية الوصول المقاله

        17 - A hybrid Model on the Basis of Data Envelopment Analysis and Data Mining Techniques to Analyze the Investment Behavior in Stock Exchange: A Real Case Study in Tehran Stock Exchange
        Saiedeh Molla Hosseinagha Kaveh Khalili-Damghani
        Stock exchange, which is the core of investment market, transfers scattered resources to the productive sector of the service and industry. The analysis of stock exchange has attracted lots of researches in recent decades. The issue concern both of securities and invest أکثر
        Stock exchange, which is the core of investment market, transfers scattered resources to the productive sector of the service and industry. The analysis of stock exchange has attracted lots of researches in recent decades. The issue concern both of securities and investors. More formally both sides of investment (i.e., behavior of investors and fluctuations of returns on securities) form the markets. In this paper, a hybrid model on the basis of data envelopment analysis and data mining techniques is proposed to analyze the investment behavior in stock exchange. The proposed approach is applied in Tehran stock exchange. First, the financial data of investments on selective companies during 2013-2014 are analyzed using data mining approaches to recognize the behavioral patterns of investors and securities.Second, customers are clustered in 3 selling and 4 buying groups using data mining techniques. Then, the efficiency of active companies in stock exchange is evaluated using and input-oriented Data Envelopment Analysis model considering variable returns-to-scale assumption. Data mining techniques and DEA model are codified using MATLAB and LINGO software, respectively. The obtained results indicate that in 2013 and 2014,nine and six companies are efficient, respectively.Among these companies, six companies are efficient in both years. The most visited companies in reference sets are determined during periods of this study. The reference set of inefficient companies are determined in order to project them toward efficient frontier. The results of this study can provide insightful vision to investors in order to illustrate the behavior of previous investors and securities. تفاصيل المقالة
      • حرية الوصول المقاله

        18 - داده کاوی الگوی نامشهود تراکنش‌های رفتارهای اطلاع‌یابی و اطلاع درمانی متخصصان بیماری‌های نقص ایمنی
        صدیقه محمداسماعیل شیبا کیانمهر
        مقدمه: پژوهش حاضر با هدف تحلیل رفتار اطلاع درمانی ایمونولوژیست‌های کشور، بر مبنای مدل شبکه عصبی خودسازمان‌ده کوهونن انجام شده است. روش پژوهش: پژوهش کاربردی، به روش پیمایشی توصیفی و با استفاده از تکنیک شبکه عصبی انجام شده است. ابزار پرسش‌نامه‌ای است محقق‌ساخته که بین ۱۴۹ أکثر
        مقدمه: پژوهش حاضر با هدف تحلیل رفتار اطلاع درمانی ایمونولوژیست‌های کشور، بر مبنای مدل شبکه عصبی خودسازمان‌ده کوهونن انجام شده است. روش پژوهش: پژوهش کاربردی، به روش پیمایشی توصیفی و با استفاده از تکنیک شبکه عصبی انجام شده است. ابزار پرسش‌نامه‌ای است محقق‌ساخته که بین ۱۴۹ نفر توزیع شد. به منظور خوشه‌بندی با استفاده از نرم‌افزارMATLAB ‌متخصصان بر اساس مؤلفه‌های اصلی پژوهش خوشه‌بندی و سپس با حذف هر یک از زیرمؤلفه‌های اصلی، مؤثرترین و کم‌اثرترین گزینه تعیین گردید. یافته‌ها: تحلیل ها نشان داد در مهارت‌های اطلاع‌یابی؛ 63/75 درصد از افراد جامعه در خوشه اول با میانگین 29/88 و در خوشه دوم 36/24 درصد با میانگین نمرات‌ 30/22، قرار دارند و مهم ترین مولفه استفاده از کلیدواژه‌ها و اصطلاحات مرتبط با اطلاعات مورد نیاز است. در مورد راه‌های اطلاع‌یابی؛ 22/14 درصد جامعه با میانگین نمرات 54/36 در خوشه اول، 18/12 درصد افراد با میانگین 48/11 در خوشه دوم، 14/09 درصد با میانگین 43/28 در خوشه سوم، 16/1 درصد با میانگین 49/04 در خوشه چهارم و 29/53 درصد افراد با میانگین نمرات 53/72 در خوشه پنجم قرار داشته، و مهم‌ترین راه‌های اطلاع یابی، استفاده از منابع اطلاعات الکترونیک بوده است. بر مبنای میزان استفاده از انواع خدمات اطلاعاتی؛46 درصد افراد با میانگین نمرات 54/85 در خوشه اول، 20/66 درصد با میانگین 49/38 در خوشه دوم و 32/66 درصد با میانگین 43/08 در خوشه سوم قرار داشته و مهم ترین مولفه خدمات اطلاع درمانی، آشنایی با انواع منابع و خدمات اطلاعاتی رشته تخصصی بوده است نتیجه‌گیری: خوشه‌بندی عصبی رفتارهای اطلاع درمانی جامعه مورد مطالعه و تراکنش های اطلاعاتی حاصل از آن، علاوه بر منتج شدن به آگاهی از نیازها و منابع اطلاعاتی مورد نیاز کاربران، به عنوان روشی در دسترس و کم هزینه که ارتقای سطح کیفیت اطلاعات متخصصین سیستم نقص ایمنی را در پی دارد و به ارایه خدمات درمانی موثرتر به بیماران منتهی می‌گردد، زمینه لازم جهت پیش بینی تمهیدات و تصمیم‌گیری‌های اطلاعات‌گرا را جهت تامین نیازها و محمل های اطلاعاتی مورد درخواست کاربران پایگاه های داده‌های پزشکی فراهم و در اختیار مدیران و دست‌اندرکاران این حوزه قرار می دهد، و به عنوان راهبردی موثر با حداکثر سطح استانداردهای ممکن، به کشف الگوی نامشهود رفتار های اطلاع‌یابی کاربران حوزه سلامت منتهی، و به فرد مخاطب می‌آموزد تا هوشمندانه از محمل‌های اطلاعاتی بهره گیرد. تفاصيل المقالة
      • حرية الوصول المقاله

        19 - Customer Retention Based on the Number of Purchase: A Data Mining Approach
        Sahar Mehregan Reza Samizadeh
        Purpose: this study wants to find any relationship between the numbers of purchase and the income the customer brings to the company. The attempt is to find those customers who buy more than one life insurance policy and represent the signs of good payments at the same أکثر
        Purpose: this study wants to find any relationship between the numbers of purchase and the income the customer brings to the company. The attempt is to find those customers who buy more than one life insurance policy and represent the signs of good payments at the same time by the help of data mining tools. Design/ methodology/ approach: the approach of this research is to use data mining tools based on CRISP-DM methodology. The classification is based on the K-means algorithm and prediction is applied by a proposed formula by the researcher in Excel worksheet. Findings: By selecting the customers who bought more than one policy, and filtering the Income bringer customers, the researcher could extract some simple rules to predict which customer belongs to which cluster. Based on the prediction, the company can change its strategies in relation to different customers. Originality/value: Utilizing data mining approach to classify different customers in life insurance and prediction based on the classification is a new approach amongIran insurance companies. There is not enough research and implementation in relation to the CRM and data mining in the insurance industry. Especially CRISP-DM methodology was used very hardly before in a life insurance investigation. تفاصيل المقالة
      • حرية الوصول المقاله

        20 - Retaining Customers Using Clustering and Association Rules in Insurance Industry: A Case Study
        R. Samizadeh S. Mehregan
        This study clusters customers and finds the characteristics of different groups in a life insurance company in order to find a way for prediction of customer behavior based on payment. The approach is to use clustering and association rules based on CRISP-DM methodology أکثر
        This study clusters customers and finds the characteristics of different groups in a life insurance company in order to find a way for prediction of customer behavior based on payment. The approach is to use clustering and association rules based on CRISP-DM methodology in data mining. The researcher could classify customers of each policy in three different clusters, using association rules. At the end of study the characteristics are defined and given to the company, so they could implement CRM strategies based on the newly found differences. Attention to the income and cash earning comes before paying attention to other problems. In most of the companies in developing countries, infrastructural problems of the company like earning enough income prevent the company from effective research implementation on advanced strategies. So this study focuses on basic problems. Utilizing data mining approach to classify customers in life insurance is a new approach among insurance companies in Iran. There are some research in relation to the CRM and data mining, but the contribution of this study is to investigate two new attributes plus those common attributes used before in studying customer behavior; the two attributes are "payment type" and the "purchaser". In order to have a framework, all the process is embedded in CRISP-DM methodology. تفاصيل المقالة
      • حرية الوصول المقاله

        21 - A Study to Improve the Response in Email Campaigning by Comparing Data Mining Segmentation Approaches in Aditi Technologies
        P. Theerthaana S. Sharad
        Email marketing is increasingly recognized as an effective Internet marketing tool. In this study, a questionnaire is constructed and distributed to a sample of 146 prospects of Aditi Technologies to find the factors associated with higher response rates. The collected أکثر
        Email marketing is increasingly recognized as an effective Internet marketing tool. In this study, a questionnaire is constructed and distributed to a sample of 146 prospects of Aditi Technologies to find the factors associated with higher response rates. The collected data is analyzed using Factor Analysis and the 11 factors, From Line, Subject Line, Personalization of the subject line, Timings for sending mails, Frequency of mailing, Length of the Emails, Incentives to respond, Pre-existing Business Relationship, Permission based emails, Links and Image are extracted and it explains 78.363% of variance. These 11 factors is analyzed using Multiple Linear Regression and the .922 R square value indicates that 9 independent variables, Permission based emails, Length of Email, Timings, From Line, Frequency of mailing, Preexisting Business, Personalization, Incentives to respond, Subject Line contributes to higher response rate. This study also investigates marketing campaigns of Aditi Technologies using RFM, CHAID, and logistic regression segmentation methods. One-way ANOVA is used to analyze the data and it is found that there exists no difference between the three approaches. The study concludes that RFM is the most commonly used segmentation approach, however RFM may focus too much attention on transaction information (recency, frequency, and monetary value) and ignore individual difference information (e.g., values, motivations, lifestyles) that may help a firm to better market to their customers. This consideration would favor analytical techniques such as CHAID and logistic regression that can accommodate a variety of personality and individual difference information. تفاصيل المقالة
      • حرية الوصول المقاله

        22 - شناسایی عوامل مؤثر بر موفقیت بازاریابی در یکی از شعب بانک تجارت با استفاده از تکنیک‌های داده‌کاوی
        مهدی غضنفری اقدس بدیعی فاطمه مصلحی
        با توجه به بازار رقابتی موجود در صنعت بانکداری، اهمیت مدیریت ارتباط با مشتری روزبه‌روز افزایش می‌یابد که یکی از مهم‌ترین ارکان آن، بازاریابی فعال و مؤثر است. از این رو، در این پژوهش تلاش شده است با توجه به کاربرد ابزارهای داده‌کاوی، عوامل مؤثر بر موفقیت فعالیت بازاریابی أکثر
        با توجه به بازار رقابتی موجود در صنعت بانکداری، اهمیت مدیریت ارتباط با مشتری روزبه‌روز افزایش می‌یابد که یکی از مهم‌ترین ارکان آن، بازاریابی فعال و مؤثر است. از این رو، در این پژوهش تلاش شده است با توجه به کاربرد ابزارهای داده‌کاوی، عوامل مؤثر بر موفقیت فعالیت بازاریابی در یکی از شعب بانک تجارت، شناسایی و بررسی شود. عواملی که باعث می شوند مشتریان بانک، تمایل بیشتری به بهره مندی از سپرده‌های بلند مدت در بانک از خود نشان دهند. در حقیقت، نتایج این پژوهش به افزایش نرخ بازگشت در بازاریابی مستقیم در صنعت بانکداری کمک خواهد کرد که در مطالعات پیشین کمتر مورد توجه قرار گرفته بود. به این منظور، مجموعه‌ داده‌ای مربوط به کمپین بازاریابی تلفنی صورت گرفته در یکی از شعب بانک تجارت در بازه زمانی اردیبهشت 1395 الی شهریور 1397 دریافت شده است. تحقیق حاضر از حیث طبقه بندی تحقیقات بر مبنای هدف از نوع کاربردی است و از دیدگاه روش شناسی تحقیق، از نوع آمیخته می باشد. متغیر هدف این مسئله، نتیجه موفقیت یا شکست فعالیت بازاریابی تلفنی صورت گرفته است. ابتدا به جهت شناسایی مشتریان با استفاده از الگوریتم خوشه‌بندی K-Means داده ها به شش خوشه تقسیم شده اند. در مرحله بعد، به‌ منظور شناسایی عوامل مؤثر بر موفقیت کمپین بازاریابی، از الگوریتم‌های درخت تصمیم C5 و CART استفاده شده است. به‌عنوان نتیجه‌گیری کلی از اجرای سه الگوریتم ذکرشده می‌توان عنوان کرد که در مقایسه با سایر متغیرها، متغیر مدت‌زمان مکالمه با مشتری، بیشترین تأثیر را در تصمیم‌گیری شخص در مورد افتتاح سپرده داشته است. لازم به ذکر است از آن جا که دوره زمانی و مکان جمع آوری داده در این پژوهش محدود بوده است، احتمالاً نتایج این پژوهش قابل تعمیم به سایر بانک ها نیست. تفاصيل المقالة
      • حرية الوصول المقاله

        23 - ارائه مدل بهینه ساز هزینه های کنترل موجودی دستگاه های خودپرداز شهر تهران
        علیرضا آقا قلیزاده سیار حسین شیرازی مهدی ایزدیار محمدمهدی فتاح دماوندی
        ازآنجا که مدیریت هزینه ها یکی از مهمترین وظایف سازمان ها هستند ، مدیریت هزینه های سیستم کنترل موجودی دستگاههای خود پرداز نیز یکی از اساسی ترین وظایف بانکها بشمار میروند. این مقاله به دنبال ارائه مدلی پویا و بهینه برای کنترل هزینه های موجودی دستگاههای خودپرداز، با توجه ب أکثر
        ازآنجا که مدیریت هزینه ها یکی از مهمترین وظایف سازمان ها هستند ، مدیریت هزینه های سیستم کنترل موجودی دستگاههای خود پرداز نیز یکی از اساسی ترین وظایف بانکها بشمار میروند. این مقاله به دنبال ارائه مدلی پویا و بهینه برای کنترل هزینه های موجودی دستگاههای خودپرداز، با توجه به شرایط زمانی و مکانی هر دستگاه میباشد .بنابر این از داده های کل جامعه آماری، مربوط به بانک متبوع در شهر تهران که شامل 368 دستگاه خودپرداز می گردد استفاده شد . بررسی رفتار دستگاه ها در بازه زمانی سه ماهه در سال 1396 انجام شده است. این مدل با خوشه بندی داده های آماری در ابعاد زمانی و مکانی موفق به یادگیری الگوی موجود در کلان داده ها شده و بر همین مبنا درخت تصمیم ارائه شده قادر به پیش بینی تعداد مراجعه کننده به هر دستگاه می باشد . سپس با استفاده از تابع هزینه ها برای سناریوهای بدست آمده هزینه های سیستم مشخص میگردند.هزینه ی کل سیستم شامل مجموع هزینه های نگهداری پول ، کمبود پول و سفارش دهی پول برای هر دستگاه میباشد . در نهایت با ارائه الگوی بهینه سازی شده کنترل موجودی برای هر سناریو، هزینه های کل سیستم به طور میانگین 5/16 درصد ، یعنی به مقدار 38 میلیون تومان در ماه کاهش پیدا میکند. تفاصيل المقالة
      • حرية الوصول المقاله

        24 - بررسی تاثیر روش های مختلف خوشه بندی داده ها بر روی دقت مدل های مربوط به برآوردی های حسابداری از طریق مقایسه روش های خوشه بندی سنتی و کلاسیک
        سید محسن صالحی وزیری جمال برزگری خانقاه
        امروزه استفاده از برآورد اطلاعات حسابداری همانند سایر رشته ها بدلیل عدم دسترسی به تمام اطلاعات، لازم و ضروری می باشد. به همین دلیل در این پژوهش سعی شده با استفاده از روش های مختلف خوشه بندی دقت مدل های مربوط به برآورد های حسابداری مورد بررسی قرار گیرد تا مشخص گردد روش ه أکثر
        امروزه استفاده از برآورد اطلاعات حسابداری همانند سایر رشته ها بدلیل عدم دسترسی به تمام اطلاعات، لازم و ضروری می باشد. به همین دلیل در این پژوهش سعی شده با استفاده از روش های مختلف خوشه بندی دقت مدل های مربوط به برآورد های حسابداری مورد بررسی قرار گیرد تا مشخص گردد روش های مختلف خوشه بندی به چه میزان دقت مدل های مدنظر را افزایش میدهند و روش ارجح تر در میان روش های مختلف خوشه بندی در افزایش دقت مدل ها کدام روش می تواند باشد. نمونه آماری پژوهش بدین منظور شامل 99 شرکت پذیرفته شده در بورس اوراق بهادار تهران بوده و به منظور جمع آوری داده های مورد نیاز، از اطلاعات صورت های مالی و یادداشت های دوره 9 ساله (1387-1395) شرکت های مورد نظر استفاده شده است. نتایج حاصل از تحقیق نشان داد که استفاده از روش های مختلف خوشه بندی دقت مدل های مربوط به برآوردهای حسابداری را در اکثر موارد افزایش می دهد ولی از میان روش های خوشه بندی مورد استفاده در تحقیق، روش خوشه بندی کلاسیک روش مناسب تری نسبت به روش سنتی در افزایش دقت مدل های مربوط به برآورد های حسابداری می باشد. تفاصيل المقالة
      • حرية الوصول المقاله

        25 - Machine learning clustering algorithms based on Data Envelopment Analysis in the presence of uncertainty
        Reza Ghasempour Feremi Mohsen Rostamy-Malkhalifeh
        This study combines Data Envelopment Analysis (DEA) with machine learning clustering method in datamining for finding the most efficient Decision Making Unit (DMU) and the best clustering algorithm, respectively. The problem of assessment of units by using DEA may not b أکثر
        This study combines Data Envelopment Analysis (DEA) with machine learning clustering method in datamining for finding the most efficient Decision Making Unit (DMU) and the best clustering algorithm, respectively. The problem of assessment of units by using DEA may not be straightforward due to the data uncertainty. Several scholars have been attracted to develop methods which incorporate uncertainty into input/output values in the DEA literature. On the other hand, in many real world applications, the data is reported in the form of intervals. This means that each input/output value is selected from a symmetric box. In the DEA literature, this type of uncertainty has been addressed as Interval DEA approaches. The main goal of this study is to evaluate the efficiency of banks in the case of data uncertainty with cross-efficiency method in the DEA literature. For this purpose, we consider the BCC-CCR and CCR-BCC models in the presence of uncertain data to find the superior model. After applying the optimization models, in machine learning step, clustering method is applied. Clustering is a procedure for grouping similar items together which this group is called the cluster. Also, the different clustering algorithms can be used according to the behavior of data. In this study, we apply the farthest first and expectation maximization algorithms and show that, in the case of data uncertainty, the BCC-CCR and farthest first algorithms are as a superior optimization model and machine learning algorithm, respectively. تفاصيل المقالة
      • حرية الوصول المقاله

        26 - ارزیابی عملکرد روش‌های مدل درختی M5 و رگرسیون بردار پشتیبان در مدل‌سازی رسوب معلق رودخانه
        محمدتقی ستاری علی رضازاده جودی فروغ صفدری فراز قهرمانیان
        همواره پدیده انتقال رسوب، بسیاری از سازه‌‌های رودخانه‌‌ای و سازه‌های عمرانی را تحت تاثیر قرار داده و عدم اطلاع از میزان دقیق آن خسارات بسیاری را موجب می‌شود. از این جهت برآورد صحیح بار رسوبی در رودخانه‌ها از نقطه نظر رسوب، فرسایش و کنترل سیلاب بسیار حایز اهمیت است. در ا أکثر
        همواره پدیده انتقال رسوب، بسیاری از سازه‌‌های رودخانه‌‌ای و سازه‌های عمرانی را تحت تاثیر قرار داده و عدم اطلاع از میزان دقیق آن خسارات بسیاری را موجب می‌شود. از این جهت برآورد صحیح بار رسوبی در رودخانه‌ها از نقطه نظر رسوب، فرسایش و کنترل سیلاب بسیار حایز اهمیت است. در این تحقیق، از دو روش نوین داده‌کاوی شامل مدل درختی M5 و رگرسیون بردار پشتیبان برای برآورد بار رسوبی معلق رودخانه اهرچای در مقایسه با روش کلاسیک منحنی سنجه رسوب استفاده گردید. جهت ارزیابی عملکرد روش‌های استفاده شده از سه آماره شامل ‌‌ضریب همبستگی، جذر میانگین مربعات خطا و میانگین خطای مطلق استفاده گردید. با انجام تحلیل حساسیت مدل‌ها به متغیر ورودی مشخص گردید، متغیر دبی جریان در ماه جاری دارای بیشترین تاثیر بر روی میزان بار رسوبی معلق می‌باشد. در حالت کلی نتایج بدست آمده بیانگر دقت بسیار بالای روش‌های داده‌کاوی نسبت به منحنی سنجه رسوب می‌باشد. اگرچه هر دو روش داده‌کاوی بررسی شده دقت بیشتر و خطای کمتری نسبت به روش متداول منحنی سنجه رسوب داشته‌اند، اما با توجه به روابط خطی ساده و قابل فهم ارائه شده توسط مدل درختی M5، کاربرد این روش کارآمد در موارد مشابه توصیه می‌گردد. تفاصيل المقالة
      • حرية الوصول المقاله

        27 - مدلسازی رواناب ماهانه با استفاده از روشهای داده کاوی براساس الگوریتم های انتخاب ویژگی
        محمدتقی ستاری علی رضازاده جودی
        باتوجه به اهمیت مقدار جریان خروجی از حوضه آبریز جهت مدیریت آب های سطحی، فهم دقیق ارتباط بین مقدار رواناب با پارامترهای اقلیمی همچون بارش و دما و شناسائی موثرترین پارامتر در فرآیند مدل سازی بسیار مهم می‌باشد. در این تحقیق پس از آزمون همگنی داده‌های بارش، دما و رواناب ماه أکثر
        باتوجه به اهمیت مقدار جریان خروجی از حوضه آبریز جهت مدیریت آب های سطحی، فهم دقیق ارتباط بین مقدار رواناب با پارامترهای اقلیمی همچون بارش و دما و شناسائی موثرترین پارامتر در فرآیند مدل سازی بسیار مهم می‌باشد. در این تحقیق پس از آزمون همگنی داده‌های بارش، دما و رواناب ماهانه حوضه آبریز ناورود، ابتدا براساس دو الگوریتم رلیف و همبستگی دو ترکیب مختلف از پارامترهای موثر در رواناب مورد توجه قرار گرفت. الگوریتم جدید رلیف با استفاده از میانگین بردار وزنی مرتبط بین داده‌ها و یک مقدار آستانه، ویژگی‌های موثر در بین یک مجموعه از داده‌ها را به ویژه در شرایطی که تعداد داده‌ها کم باشد، به ترتیب اهمیت شناسایی می‌کند. سپس با استفاده از دو روش رگرسیون بردار پشتیبان و نزدیک‌ترین همسایگی رواناب ماهانه مبتنی بر دو ترکیب ورودی پیشنهادی مدل سازی گردید. نتایج به‌دست آمده نشان داد، روش رگرسیون بردار پشتیبان با بهره گیری از تابع کرنل شعاع محور نسبت به روش نزدیک‌ترین همسایگی از دقت بالا و خطای کمتری در برآورد رواناب به خصوص در مقادیر جریان‌های سیلابی برخوردار است. تفاصيل المقالة
      • حرية الوصول المقاله

        28 - طراحی مدل هوشمند پیش بینی توانگری مالی در شرکتهای بیمه (رویکرد داده‏ کاوی)
        فاطمه شاه بازاده ابراهیم عباسی حسین دیده خانی علی خوزین
        هدف از این پژوهش ارائه یک مدل هوشمند جهت پیش‌بینی توانگری مالی در شرکتهای بیمه،به عنوان یک سیستم پشتیبان تصمیم می‌باشد.بدین منظور با بررسی پیشینه تعداد 17متغیر به عنوان متغیر پیش بین جهت پیش بینی طبقه توانگری مالی از منابع معتبر سایت بیمه مرکزی ج.ا.ا ، طی سال 1390 تا 13 أکثر
        هدف از این پژوهش ارائه یک مدل هوشمند جهت پیش‌بینی توانگری مالی در شرکتهای بیمه،به عنوان یک سیستم پشتیبان تصمیم می‌باشد.بدین منظور با بررسی پیشینه تعداد 17متغیر به عنوان متغیر پیش بین جهت پیش بینی طبقه توانگری مالی از منابع معتبر سایت بیمه مرکزی ج.ا.ا ، طی سال 1390 تا 1395 استخراج ‌شده است. در این پژوهش ابتدا نتایج حاصل از به‌کارگیری مدل های مختلف پیش‌بینی مبتنی بر داده‌کاوی مورد مقایسه قرار گرفته و در مرحله بعد رتبه‌بندی الگوریتم‌های پیش‌بینی شونده مورد بررسی قرار گرفت. نتایج حاصل از این پژوهش نشان داد که توانگری مالی با دقت قابل قبول پیش‌بینی پذیرند و مدل استخراج شده بااستفاده از درخت تصمیم دقت و قابلیت بسیار بالایی در تخمین را داراست. تفاصيل المقالة
      • حرية الوصول المقاله

        29 - تبیین نقش ویژگی‌های شخصیتی و ساختاری مدیریت بر توان رقابت‌پذیری در بازار محصولات شرکت‌های پذیرفته شده در بورس اوراق بهادار تهران: تاکیدی بر مدل‌های داده کاوی و تحلیل پوششی داده‌ها
        امیر فریدنیا محسن لطفی بهروز اسکندرپور
        این پژوهش به بررسی تاثیر مجموعه‌ای از ویژگی‌های شخصیتی و ساختاری مدیریت (شامل کوته‌بینی، خوش‌بینی، محافظه‌کاری، استقلال، تنوع جنسیت هیئت مدیره، ثبات و توانایی مدیریت) بر توان رقابت‌پذیری در بازار محصولات شرکت‌های پذیرفته شده در بورس اوراق بهادار تهران پرداخته است. این پ أکثر
        این پژوهش به بررسی تاثیر مجموعه‌ای از ویژگی‌های شخصیتی و ساختاری مدیریت (شامل کوته‌بینی، خوش‌بینی، محافظه‌کاری، استقلال، تنوع جنسیت هیئت مدیره، ثبات و توانایی مدیریت) بر توان رقابت‌پذیری در بازار محصولات شرکت‌های پذیرفته شده در بورس اوراق بهادار تهران پرداخته است. این پژوهش با استفاده از نمونه‌ای شامل 144 شرکت پذیرفته شده در‌ بورس اوراق بهادار تهران در دوره زمانی سال‌های 1386 تا 1397 و بکارگیری روش‌های آماری همچون تحلیل پوششی داده‌ها، مدل رگرسیونی مبتنی بر داده‌های پانلی و روش‌های داده‌کاوی(مدل شبکه‌های عصبی و درخت تصمیم) انجام گرفته است. یافته‌های روش‌های رگرسیونی نشان داد که از بین متغیرهای مورد بررسی متغیرهای کوته‌بینی، استقلال هیئت مدیره، ثبات و توانایی مدیریت تاثیری معنادار بر توان رقابت‌پذیری در بازار محصولات را داشته است. مقایسه‌ نتایج روش‌های رگرسیونی و مدل‌های داده‌کاوی نشان داد که از میان ویژگی‌های مدیریت، تنها متغیرهای کوته‌بینی، توانایی و استحکام مدیریت تاثیری معنادار بر رقابت‌پذیری در بازار محصولات شرکت‌ها داشته است. تفاصيل المقالة
      • حرية الوصول المقاله

        30 - طراحی مدل هوشمند ترکیبی جهت پیش‌بینی نقاط طلایی قیمت سهام
        محمد مشاری حسین دیده خانی کاوه خلیلی دامغانی ابراهیم عباسی
        هدف از این پژوهش ارائه یک مدل هوشمند جهت پیش‌بینی نقاط طلایی در نمودار قیمت سهام ،به عنوان یک سیستم پشتیبان تصمیم می‌باشد.جهت انجام این پژوهش از داده‌های صنعت خودرو، و ساخت قطعات طی سال 1380 تا 1395 استفاده‌شده است.در این پژوهش ابتدا نتایج حاصل از به‌کارگیری مدل های مخت أکثر
        هدف از این پژوهش ارائه یک مدل هوشمند جهت پیش‌بینی نقاط طلایی در نمودار قیمت سهام ،به عنوان یک سیستم پشتیبان تصمیم می‌باشد.جهت انجام این پژوهش از داده‌های صنعت خودرو، و ساخت قطعات طی سال 1380 تا 1395 استفاده‌شده است.در این پژوهش ابتدا نتایج حاصل از به‌کارگیری مدل های مختلف پیش‌بینی مبتنی بر داده‌کاوی مقایسه قرار گرفت،در مرحله بعد متغیرهای پژوهش به وسیله الگوریتم ژنتیک بهینه‌سازی شد و مجددا مدل‌سازی انجام پذیرفت.نتایج حاصل از این پژوهش نشان داد که نقاط طلایی با دقت قابل قبول پیش‌بینی پذیرند و بهینه‌سازی در همه مدل ها باعث افزایش دقت پیش‌بینینمی‌گردد اما خطای فاحش را به میزان قابل توجهی کاهش می‌دهد. تفاصيل المقالة
      • حرية الوصول المقاله

        31 - استفاده از تکنیک‌های داده‌کاوی برای سنجش ریسک مالیاتی مؤدیان مالیات بر ارزش افزوده
        محمد مسیحی احمد یعقوب نژاد امیررضا کیقبادی تقی ترابی
        در این مقاله با استفاده از تکنیک‌های داده‌کاوی ریسک مالیاتی مؤدیان در نظام مالیات بر ارزش افزوده مورد مطالعه قرار می‌گیرد. اهمیت ارزیابی ریسک مالیاتی مؤدیان مالیات بر ارزش افزوده به منظور تدوین طرح مؤثر انتخاب مؤدیان برای حسابرسی مالیاتی با هدف افزایش کارایی و اثر بخشی أکثر
        در این مقاله با استفاده از تکنیک‌های داده‌کاوی ریسک مالیاتی مؤدیان در نظام مالیات بر ارزش افزوده مورد مطالعه قرار می‌گیرد. اهمیت ارزیابی ریسک مالیاتی مؤدیان مالیات بر ارزش افزوده به منظور تدوین طرح مؤثر انتخاب مؤدیان برای حسابرسی مالیاتی با هدف افزایش کارایی و اثر بخشی در نظام مالیات بر ارزش افزوده کشور می‌باشد. مؤدیان مالیاتی در این تحقیق به سه گروه مؤدیان فاقد ریسک، با ریسک پایین و پر ریسک طبقه بندی شده‌اند به منظور ارزیابی ریسک مالیاتی از دو تکنیک داده‌کاوی ماشین بردار پشتیبان و رگرسیون لجستیک استفاده شده است. جامعه آماری پژوهش شامل اشخاص حقوقی بزرگ در شهر تهران می‌باشد که در سال های 1390 تا 1393 مورد حسابرسی مالیاتی در نظام مالیات بر ارزش افزوده قرار گرفته‌اند در این تحقیق متغیرها شامل ساز و کارهای حاکمیت شرکتی، ویژگی‌های خاص شرکتی، ماهیت فعالیت مؤدیان سیستم کنترلی مؤدیان و نسبت‌های مالی می‌باشد که به منظور آموزش و آزمون مدل استفاده شده‌اند نتایج تحقیق نشان می‌دهد دو تکنیک LSVM و Logistic از توان صحت ارزیابی70% برخوردار هستند و نوعی ادغام در نتایج این دو تکنیک توانسته است با کسب نزدیک به 83% صحت ارزیابی از توان بالاتری برخوردار باشد. تفاصيل المقالة
      • حرية الوصول المقاله

        32 - A Hybrid DEA Based CHAID and Imperialist Competitive Algorithm for Stock ‎Selection
        F. Faezy Razi
        In this paper, the investment portfolio is formed based on the data mining algorithm of CHAID on the basis of the risk status criteria. In the next step, the second investment portfolio is created based on the decision rules extracted by the DEA-BCC model. The final por أکثر
        In this paper, the investment portfolio is formed based on the data mining algorithm of CHAID on the basis of the risk status criteria. In the next step, the second investment portfolio is created based on the decision rules extracted by the DEA-BCC model. The final portfolio is created through a two-objective mathematical programming model based on the Imperialist Competitive algorithm. تفاصيل المقالة
      • حرية الوصول المقاله

        33 - بررسی عوامل مدیریتی تأثیرگذار بر شاخص‌های تنوع زیستی علف‌هرز و عملکرد مزارع گندم با استفاده از درخت تصمیم‌گیری CART در شهرستان چناران
        ستایش خردمند بهنام کامکار جاوید قرخلو محمد حسن هادی زاده قربانعلی رسام
        به منظور بررسی عواملمدیریتی و محیطی مؤثر برتراکم و غالبیت علف‌های هرز مزارع گندم آبی(Triticum aestivum L) مطالعه‌های در دو سال متوالی در سال‌های 1393-1394 در 200 مزرعه از بیست روستا واقع در چهار جهت شهرستان چناران صورت گرفت. برای این منظور نمونه‌برداری به روش (w) و با پ أکثر
        به منظور بررسی عواملمدیریتی و محیطی مؤثر برتراکم و غالبیت علف‌های هرز مزارع گندم آبی(Triticum aestivum L) مطالعه‌های در دو سال متوالی در سال‌های 1393-1394 در 200 مزرعه از بیست روستا واقع در چهار جهت شهرستان چناران صورت گرفت. برای این منظور نمونه‌برداری به روش (w) و با پرتاب کوآدرات 25/0 متر‌مربعی انجام و گونه‌‌های علف‌‌های هرز هرکادر به تفکیک جنس و گونه شناسایی و تعداد آنها تعیین گردید. سپس شاخص‌‌های تنوع شانن واینر و شاخص یکنواختی سیمپسون برای اندازه‌گیری تنوع زیستی مورد محاسبه قرار گرفت. عوامل کمی و کیفی مدیریتی در قالب پرسش‌نامه از کشاورزان تهیه شد. بدین منظور تمام اطلاعات مربوط به مدیریت زراعی شامل مساحت اراضی، سابقه کشاورزان، عملیات تهیه بستر بـذر ، روش مبارزه با علف هرز و ... در قالب پرسشنامه و در طول فصل رشد از طریق پرسش از کشاورزان جمع‌آوری و تکمیل شد، در پایان فصل رشـد نیـز میـزان عملکـرد واقعـی برداشت شده توسط کشاورزان، ثبت گردید. تجزیه و تحلیل داد‌ه‌ها با روش درخت تصمیم‌گیری CART (Classification and Regression Trees) نشان داد که از میان پارامترهای مختلف مورد بررسی تجربه کشاورزی، تعداد استفاده از علف‌کش دو منظوره، نیتروژن، پتاسیم، کشت تابستان دو سال قبل و استفاده از بذرپاش سانتریفوژ، سن کشاورز، بر تغییرات شاخص شانون –وینر و سیمپسون اثرگذار بوده است. عوامل مدیریتی مهم اثر گذار بر روی عملکرد گندم شامل سه عامل مدیریتی تقسیط بندی کودپاشی، تعداد استفاده از علف‌‌کش دو منظوره و کودپتاسیم و همچنین تناوب و سطح تحصیلات بوداست.نتایج این تحقیق نشان داد که مقدار مناسب کود پتاسیم و نیتروژن و انتخاب تناوب مناسب راهکارهای مدیریتی موثر در بهبود عملکرد گندم و افزایش تنوع آن در شهرستان چناران هستند. تفاصيل المقالة
      • حرية الوصول المقاله

        34 - بهبود سیستم های تشخیص نفوذ باکاهش ویژگی مبتنی بر الگوریتم ژنتیک و تکنیک‌های داده‌کاوی
        مهدی کشاورزی حسین مومن زاده حقیقی
        امروزه سیستم های کامپیوتری مبتنی بر شبکه، نقش حیاتی در جامعه مدرن امروزی دارند و به همین علت ممکن است هدف دشمنی و یا نفوذ قرار گیرند. به منظور ایجاد امنیت کامل در یک سیستم کامپیوتری متصل به شبکه، استفاده از دیوار آتش و سایر مکانیزم های جلوگیری از نفوذ همیشه کافی نیست و أکثر
        امروزه سیستم های کامپیوتری مبتنی بر شبکه، نقش حیاتی در جامعه مدرن امروزی دارند و به همین علت ممکن است هدف دشمنی و یا نفوذ قرار گیرند. به منظور ایجاد امنیت کامل در یک سیستم کامپیوتری متصل به شبکه، استفاده از دیوار آتش و سایر مکانیزم های جلوگیری از نفوذ همیشه کافی نیست و این نیاز احساس می شود تا از سیستم های دیگری به نام سیستم های تشخیص نفوذ استفاده شود. سیستم تشخیص نفوذرا می توان مجموعه ای از ابزارها، روش ها و مدارکی در نظر گرفت که به شناسایی، تعیین و گزارش فعالیت های غیرمجاز یا تائید نشده تحت شبکه، کمک میکند. سیستم های تشخیص نفوذ به صورت سیستم های نرم افزاری و سخت افزاری ایجاد شده و هر کدام مزایا و معایب خاص خود را دارند. به دلیل وجود مشخصه های زیاد در داده های مربوط به سیستم های تشخیص نفوذ در این تحقیق ما مشخصه های مطلوب و موثر را با استفاده از الگوریتم ژنتیک بهبود یافته انتخاب می کنیم. سپس با استفاده از تکنیک های داده کاوی استاندارد، مدلی برای طبقه بندی داده ها ارائه می دهیم. برای ارزیابی عملکرد روش پیشنهادی از پایگاه داده NSL-KDD که نسبتبه سایر داده های تشخیص نفوذ از رکوردهای واقعی تری برخورد دار است، استفاده خواهیم کرد. تفاصيل المقالة
      • حرية الوصول المقاله

        35 - Improving of Diabetes Diagnosis using Ensembles and Machine Learning Methods
        Razieh Asgarnezhad Karrar Ali Mohsin Alhameedawi
        Diabetes is one of the most common metabolic diseases, and diagnosis of it is a classification problem. The most challenge is this area is missing value problem. Artificial Intelligence techniques have been successfully implemented over medical disease diagnoses. Classi أکثر
        Diabetes is one of the most common metabolic diseases, and diagnosis of it is a classification problem. The most challenge is this area is missing value problem. Artificial Intelligence techniques have been successfully implemented over medical disease diagnoses. Classification systems aim clinicians to predict the risk factors that cause diabetes. To address this challenge, we introduce a novel model to investigate the role of pre-processing and data reduction for classification problems in the diagnosis of diabetes. The model has four stages consists of Pre-processing, Feature sub-selection, Classification, and Performance. In the classification technique, ensemble techniques such as bagging, boosting, stacking, and voting were used. We considered both states with/without for pre-processing stage to reveal the high performance of our model. Two experiments were conducted to reveal the performance of the model for the diagnosis of diabetics Mellitus. The results confirmed the superiority of the proposed method over the state-of-the-art systems, and the best accuracy and F1 achieved 97.12% and 97.40%, respectively. تفاصيل المقالة
      • حرية الوصول المقاله

        36 - Improving Students' Performance Prediction using LSTM and Neural Network
        Hussam Abduljabar Salim Ahmed Razieh Asgarnezhad
        Educational data mining utilizes information from academic fields to develop renewed techniques and spot unusual patterns to gauge students' academic achievement. Evaluating student learning is a complicated issue. Data mining in this field enables to predict students' أکثر
        Educational data mining utilizes information from academic fields to develop renewed techniques and spot unusual patterns to gauge students' academic achievement. Evaluating student learning is a complicated issue. Data mining in this field enables to predict students' performance to recommend performance in universities. Therefore, the current authors have recently seen the rapid growth of data mining and knowledge extraction as tools used by academic institutions to optimize student learning processes. Here, a method based on a certain kind of artificial neural network called Long Short Term Memory recurrent neural network for prediction will operate. The proposed approach tries to use the educational characteristics of different people to predict the best educational process future educational. It career for students and thereby take steps to improve the effectiveness of the educational system. For comparison, one of the newest algorithms presented in this field was implemented using the proposed technique. The evaluations' findings were performed in the form of two scenarios with different data sizes and different amounts of test and training data. For the evaluation, the dataset taken from an online educational system was used. The evaluation results are presented in the form of four well-known criteria precision, recall, accuracy, and F1, which demonstrate the superiority of the proposed method. تفاصيل المقالة
      • حرية الوصول المقاله

        37 - مقایسه روش های طبقه بندی در تخمین تلاش توسعه نرم افزار
        صادق انصاری پور تقی جاودانی گندمانی
        نادرست بودن تخمین هزینه نرم افزار یکی از دلایل مهم ناامیدی متخصصان نرم افزار و محققان تخمین هزینه بوده است و علیرغم تلاش های فراوانی که برای بهبود آن انجام شده است اما هنوز هم دقت تخمین پایین است. عدم تجزیه و تحلیل مناسب در ابتدای شروع به کار پروژه و همچنین عدم به روز آ أکثر
        نادرست بودن تخمین هزینه نرم افزار یکی از دلایل مهم ناامیدی متخصصان نرم افزار و محققان تخمین هزینه بوده است و علیرغم تلاش های فراوانی که برای بهبود آن انجام شده است اما هنوز هم دقت تخمین پایین است. عدم تجزیه و تحلیل مناسب در ابتدای شروع به کار پروژه و همچنین عدم به روز آن در حین انجام پروژه یکی از مهم ترین دلایل شکست پروژه ها محسوب می شود. اگر چه زمانی که یک پروژه‌ها بسته می‌شوند، بازخورد های آن ایجاد می‌شود، اما اگر تخمین‌ها و واقعیات ثبت‌شده با پروژه انجام‌شده به طور کامل مطابقت نداشته باشند، آنگاه نمی توان انتظار تخمین دقیقی را داشت. بنابراین جمع آورده داده های پروژه بر اساس ویژگی های مشخص امری ضروری است و در اینجاست که می توان به نقش پررنگ پروژه های انجام شده در گذشته و مجموعه داده هایی که می توان با استفاده از آنها ایجاد نمود پی برد. در این مطالعه سعی بر این است که به بررسی نقش روش های مختلف طبقه بندی در تخمین تلاش نرم افزار بپردازیم. تفاصيل المقالة
      • حرية الوصول المقاله

        38 - کاربرد داده کاوی آموزشی جهت شناسایی عوامل مؤثر بر افت تحصیلی دانش آموزان
        محمود نجفی مهدی افضلی محمود مرادی
        استخراج دانش یکی از مهمترین مسائل داده‌کاوی می‌باشد. قوانینی که به‌صورت اگر - آنگاه مطرح می‌گردند، این توانایی را دارند که به صورت اعداد حقیقی در هر جزء به صورت تمام مقادیری که در مجموعه‌ داده می‌تواند وجود داشته باشد، قرار بگیرند. روش پیشنهادی در این مقاله استفاده از ا أکثر
        استخراج دانش یکی از مهمترین مسائل داده‌کاوی می‌باشد. قوانینی که به‌صورت اگر - آنگاه مطرح می‌گردند، این توانایی را دارند که به صورت اعداد حقیقی در هر جزء به صورت تمام مقادیری که در مجموعه‌ داده می‌تواند وجود داشته باشد، قرار بگیرند. روش پیشنهادی در این مقاله استفاده از الگوریتم‌های درخت تصمیم و خوشه‌بندی و قوانین انجمنی برای استخراج قوانین می‌باشد. در روش پیشنهادی استخراج قوانین را به صورت یک مسئله بهینه‌سازی در آورده و هدف به دست آوردن قانونی با اطمینان بالا، عمومیت و قابلیت درک بالا می‌باشد. الگوریتم پیشنهادی برای استخراج قوانین ازمجموعه داده افت تحصیلی از اطلاعات فردی256 دانش‌آموزان هنرستان‌ها در زنجان جمع‌آوری شده و تست گردید. از نتایج به دست آمده از این تحقیق می توان برای پیشگیری از افت تحصیلی دانش‌آموزان و بهبود کیفیت ارتباط مسوولین و والدین با دانش‌آموزان و آموزش هر چه بهتر آنان استفاده کرد. تفاصيل المقالة
      • حرية الوصول المقاله

        39 - طراحی مدل ترکیبی برای طبقه‌بندی داده‌های نامتوازن در رشته بیمه شخص ثالث
        مهناز منطقی پور پریسا رحیم خانی
        بخش عمده پورتفوی صنعت بیمه کشور ایران را رشته بیمه اجباری مسئولیت مدنی دارندگان وسایل نقلیه موتوری زمینی در مقابل اشخاص ثالث، تشکیل داده است. توانایی پیش بینی وقوع و یا عدم وقوع خسارت به ویژه خسارت‌های جانی نه تنها برای شرکت‌های بیمه بلکه برای تصمیم گیرندگان در حوزه‌های أکثر
        بخش عمده پورتفوی صنعت بیمه کشور ایران را رشته بیمه اجباری مسئولیت مدنی دارندگان وسایل نقلیه موتوری زمینی در مقابل اشخاص ثالث، تشکیل داده است. توانایی پیش بینی وقوع و یا عدم وقوع خسارت به ویژه خسارت‌های جانی نه تنها برای شرکت‌های بیمه بلکه برای تصمیم گیرندگان در حوزه‌های افزایش امنیت جاده‌ها اهمیت بسیاری دارد. به منظور پیش بینی برچسب وقوع یا عدم وقوع خسارت از روش‌های طبقه بندی استفاده می‌شود که در واقع یک مساله طبقه بندی نامتوازن است. این نامتوازن بودن شدید، ناشی از ماهیت کسب و کار بیمه است. نامتوازن بودن داده‌های صنعت بیمه باعث ایجاد چالش‌های بسیاری در تجزیه و تحلیل داده‌های مربوطه می‌شود. در این پژوهش، ما به طبقه‌بندی داده‌های نامتوازن بیمه شخص ثالث در یک شرکت بیمه معتبر می‌پردازیم. در این راستا دو روش ترکیبی برای رفع مشکل نامتوازن بودن داده‌ها براساس 5 مدل پایه گاوسین بیز، بردارهای پشتیبان، لجستیک رگرسیون، درخت تصمیم، نزدیکترین همسایگی به منظور طبقه‌بندی موثرتر داده‌های مربوطه ارائه می‌شود. نتایج بدست آمده نشان می‌دهد که مدل‌های ترکیبی ارائه شده بهتر از سایر الگوریتم‌های داده‌کاوی برای داده‌های مربوطه جواب می‌دهند و استفاده از درخت تصمیم در تجمیع مدل‌های پایه برای ساخت مدل ترکیبی نتایج بهتری نسبت به رای گیری ساده مدل‌ها ارائه می‌کند. همچنین ابر پارامتر تعداد مدل‌های لازم در رای گیری بر اساس استراتژی شرکت قابل تنظیم است. تعداد ویژگی‌های ثبت شده از بیمه نامه‌ها در شرکت‌های بیمه محدود است با تکمیل این ویژگی‌ها به ویژه اضافه شدن سوابق رانندگی و سایر ویژگی‌های فردی می‌توان به مدل بهتری دست یافت. تفاصيل المقالة
      • حرية الوصول المقاله

        40 - روشی نوین جهت خوشه بندی داده مبتنی بر ترکیب الگوریتم‌های بهینه‌سازی ژنتیک و کرم شب‌تاب
        مهسا افسردیر منصوره افسردیر
        یکی ازمسائل مهم درداده‌کاوی خوشه‌بندی است که بدون هدف ازپیش تعیین شده‌ای داده‌ها را بر اساس شباهت درون خوشه‌ها تقسیم‌بندی می‌کند. از روش‌های متداول خوشه‌بندی الگوریتم k-means است که بادریافت ورودی، داده‌هارابه k خوشه تقسیم‌بندی می‌کند. یکی ازمعایب این روش حساسیت به شرای أکثر
        یکی ازمسائل مهم درداده‌کاوی خوشه‌بندی است که بدون هدف ازپیش تعیین شده‌ای داده‌ها را بر اساس شباهت درون خوشه‌ها تقسیم‌بندی می‌کند. از روش‌های متداول خوشه‌بندی الگوریتم k-means است که بادریافت ورودی، داده‌هارابه k خوشه تقسیم‌بندی می‌کند. یکی ازمعایب این روش حساسیت به شرایط اولیه است که منجربه کاهش دقت درخوشه‌بندی می‌شود. از روش‌های بهبود عملکرد k-means می‌توان استفاده ازالگوریتم‌های فراابتکاری را نام برد. در این پژوهش به دو روش بهینه‌سازی ژنتیک و کرم شب‌تاب پرداخته شده است و الگوریتم جدیدی تحت عنوان الگوریتم ژنتیکی کرم‌شب‌تاب جهت بهینه‌سازی خوشه‌بندی k-means ارائه شده است. الگوریتم کرم‌شب‌تاب از الگوریتم‌های هوش جمعی است که از ویژگی نورچشمک زن کرم‌شب‌تاب الهام گرفته است و الگوریتم ژنتیک نوعی از الگوریتم‌های فراابتکاری است که از تکنیک-های زیست‌شناسی مانند وراثت و جهش استفاده می‌کند. در الگوریتم k-means برای اینکه مراکز خوشه به صورت تصادفی انتخاب می شوند، خوشه‌بندی دقت لازم را ندارد. با استفاده از الگوریتم‌های فراابتکاری سعی در بدست آوردن مراکز دقیق خوشه‌ها داشته و در نتیجه آن، خوشه-بندی صحیح می‌باشیم. در روش پیشنهادی، ابتدا الگوریتم k-means را روی داده‌های ورودی اجراکرده و خوشه‌بندی انجام می‌شود. سپس مضربی از مراکز خوشه که دراین الگوریتم بدست آمده است را به عنوان حد پایین و حد بالای الگوریتم پیشنهادی استفاده می‌کنیم. جمعیت اولیه به صورت تصادفی بین حد پایین و حد بالا تولید می‌شود. در حلقه اصلی الگوریتم جمعیت را به دو دسته جمعیت مساوی تقسیم می نماییم، بر روی دسته اول الگوریتم ژنتیک را اجرا می‌کنیم، بر روی دسته دوم بر اساس الگوریتم کرم‌شب‌تاب موقعیت‌های جدید را بدست می‌آوریم. حال جمعیت قبلی و جمعیت جدید بدست امده از الگوریتم ژنتیک و جمعیت جدید بدست امده از الگوریتم کرم‌شب‌تاب را تلفیق کرده وآن‌ها را از خوب به بد مرتب می‌کنیم و به تعداد مورد نیاز از آن‌ها را انتخاب و به ابتدای حلقه می‌رویم. این فرایند را تا برقراری شرط توقف ادامه می‌دهیم. درپایان الگوریتم k-means، الگوریتم کرم‌ شب‌تاب، الگوریتم ژنتیک و الگوریتم پیشنهادی بر روی سه مجموعه داده اعمال شده و نتایج مورد مقایسه قرار گرفته است.نتایج شبیه‌سازی نشان می‌دهد که الگوریتم ژنتیکی کرم‌شب‌تاب عملکرد بهتری در مقایسه با سایر روش‌ها داشته است. تفاصيل المقالة
      • حرية الوصول المقاله

        41 - ارایه یک رویکرد شبه نظارتی برای بهبود عملکرد آموزش الکترونیکی
        فرهاد قره باغی علی امیری
        در عصر اطلاعات جهت‌گیری بسیاری از سامانه‌ها به سمت شخصی‌سازی اطلاعات برای کاربر است. یادگیری الکترونیکی نیز از این قاعده مستثنی نبوده و یکی از ملزومات آن وجود مکانیزمی شخصی‌شده برای کمک به یادگیری مؤثر یادگیرنده است. در سال‌های اخیر از روش‌های داده‌کاوی به طور گسترده د أکثر
        در عصر اطلاعات جهت‌گیری بسیاری از سامانه‌ها به سمت شخصی‌سازی اطلاعات برای کاربر است. یادگیری الکترونیکی نیز از این قاعده مستثنی نبوده و یکی از ملزومات آن وجود مکانیزمی شخصی‌شده برای کمک به یادگیری مؤثر یادگیرنده است. در سال‌های اخیر از روش‌های داده‌کاوی به طور گسترده در زمینه‌ یادگیری الکترونیکی استفاده شده است. در واقع محققین مختلف با استفاده از روش‌های داده‌کاوی سعی در شناخت هر چه بیشتر یادگیرندگان و در نتیجه ایجاد یادگیری تطبیقی داشته‌اند. در تحقیقات مختلف از یادگیری نظارت شده برای شناخت یادگیرندگان استفاده شده است. با توجه به معایب الگوریتم های یادگیری نظارت شده در این تحقیق جهت شناسایی سطح دانش یادگیرندگان یک مدل داده کاوی شبه نظارتی پیشنهادشده است تا بتواند با شخصی‌سازی و هوشمندسازی محیط یادگیری الکترونیکی، عملکرد یادگیری و رضایت مندی یادگیرندگان را بهبود بخشد. در این مقاله با استفاده از رویکرد داده‌کاوی شبه نظارتی به شناسایی سطح دانش یادگیرندگان پرداخته شده است. به این منظور برای ایجاد مدل پیشنهادی از الگوریتم شبه نظارتی LP-MLTSVM استفاده شده است. در ساخت مدل پیشنهادی از داده های واقعی استفاده شده است. به منظور ارزیابی، در یک دوره مجازی از مدل پیشنهاد شده استفاده شد. نتایج حاصل از دوره موفقیت و رضایت تحصیلی یادگیرندگان با مدل پیشنهادی را نشان می‌دهد. تفاصيل المقالة
      • حرية الوصول المقاله

        42 - ارائه رهیافت جدید برای استخراج لینک های مفهومی پرتکرار از شبکه های اجتماعی
        محبوبه فریمانی سامان پور سیاه حمید طباطبایی حسین سلامی
        چکیده: لینک های مفهومی یکی از رهیافت های جدید برای توصیف شبکه های اجتماعی است که دانش نهفته در شبکه های اجتماعی را از طریق یک ساختار خلاصه شده با عنوان دیدگاه مفهومی ارائه می نماید. مهمترین چالش در بدست آوردن دیدگاه مفهومی از یک شبکه اجتماعی استخراج لینک های مفهومی پرتک أکثر
        چکیده: لینک های مفهومی یکی از رهیافت های جدید برای توصیف شبکه های اجتماعی است که دانش نهفته در شبکه های اجتماعی را از طریق یک ساختار خلاصه شده با عنوان دیدگاه مفهومی ارائه می نماید. مهمترین چالش در بدست آوردن دیدگاه مفهومی از یک شبکه اجتماعی استخراج لینک های مفهومی پرتکرار است که این امر برای شبکه های با مقیاس بزرگ بسیار زمانبر است. در این نوشتار، روش جدیدی برای استخراج لینک های مفهومی پرتکرار از شبکه های اجتماعی ارائه شده است که با بکارگیری مفهوم وابستگی ها، سعی در تسریع فرآیند استخراج لینک های مفهومی دارد. روش پیشنهادی قادر خواهد بود در صورت وجود وابستگی ها در بین داده ها، این فرآیند را تسریع بخشد. تفاصيل المقالة
      • حرية الوصول المقاله

        43 - Presenting a Model for Financial Reporting Fraud Detection using Genetic Algorithm
        Mahmood Mohammadi Shohreh Yazdani Mohammadhamed Khanmohammadi
        both academic and auditing firms have been searching for ways to detect corporate fraud. The main objective of this study was to present a model to detect financial reporting fraud by companies listed on Tehran Stock Exchange (TSE) using genetic algorithm. For this purp أکثر
        both academic and auditing firms have been searching for ways to detect corporate fraud. The main objective of this study was to present a model to detect financial reporting fraud by companies listed on Tehran Stock Exchange (TSE) using genetic algorithm. For this purpose, consistent with theoretical foundations, 21 variables were selected to predict fraud in financial reporting that finally, using statistical tests, 9 variables including SALE/EMP, RECT/SALE, LT/CEQ, INVT/SALE, SALE/TA, NI/CEQ, NI/SALE, LT/XINT, and AT/LT were selected as the potential financial reporting fraud indexes. Then, using genetic algorithm, the final model of fraud detection in financial reporting was presented. The statistical population of this study included 66 companies including 33 fraudulent and 33 non-fraudulent companies from 2011 to 2016. The results showed that the presented model with the accuracy of 91.5% can detect fraudulent companies. These findings extend financial statement fraud research and can be used by practitioners and regulators to improve fraud risk models. تفاصيل المقالة
      • حرية الوصول المقاله

        44 - A Combined Model for Prediction of Financial Software Learning Rate based on the Accounting Students’ Characteristics
        Bahareh Banitalebi Dehkordi Hamed Samarghandi Sara Hosseinzadeh Kassani Hamidreza malekhossini
        The accounting software is considered to be of the most critical components of accounting information system, with particular significance as of accounting and financial systems. the most important problems with accounting education systems is that students do not adequ أکثر
        The accounting software is considered to be of the most critical components of accounting information system, with particular significance as of accounting and financial systems. the most important problems with accounting education systems is that students do not adequately learn the financial software required by the accounting profession, which, in turn, reduces the credibility and position of the accounting profession. That the main objective of accounting software education is to educate skilled and expert accountants to enter the accounting profession, which is considered as of the success factors of country’s economy. In this study, employ data mining techniques to investigate the accuracy, precision, and recall performance measures and to predict the rate of financial software learning based on accounting students’ emotional intelligence (EI), gender and education level. Accordingly, a machine-learning-based multivariate statistical analysis is performed on 100 Iranian accounting students. The results show that emotional intelligence has the most impact on the rate of financial software learning among the variables. Gender and education level were influential. Also, among the five algorithms, the highest precision and recall are achieved by both Decision Tree and XGBoost and are presented as the most appropriate models for the prediction rate of financial software learning. تفاصيل المقالة
      • حرية الوصول المقاله

        45 - Computing the Efficiency of Bank Branches with Financial Indexes, an Application of Data Envelopment Analysis (DEA) and Big Data
        Fahimeh Jabbari-Moghadam Farhad Hosseinzadeh Lotfi Mohsen Rostamy-Malkhalifeh Masoud Sanei Bijan Rahmani-Parchkolaei
        In traditional Data Envelopment Analysis (DEA) techniques, in order to calculate the efficiency or performance score, for each decision-making unit (DMU), specific and individual DEA models are designed and resolved. When the number of DMUs are immense, due to an increa أکثر
        In traditional Data Envelopment Analysis (DEA) techniques, in order to calculate the efficiency or performance score, for each decision-making unit (DMU), specific and individual DEA models are designed and resolved. When the number of DMUs are immense, due to an increase in complications, the skewed or outdated, calculating methods to compute efficiency, ranking and …. may not prove to be economical. The key objective of the proposed algorithm is to segregate the efficient units from that of the other units. In order to gain access to this objective, effectual indexes were created; and taken to assist, in regards the DEA concepts and the type of business (under study), to survey the indexes, which were relatively operative. Subsequently, with the help of one of the clustering techniques and the ‘concept of dominance’, the efficient units were absolved from the inefficient ones and a DEA model was developed from an aggregate of the efficient units. By eliminating the inefficient units, the number of units which played a role in the construction of a DEA model, diminished. As a result, the speed of the computational process of the scores related to the efficient units increased. The algorithm designed to measure the various branches of one of the mercantile banks of Iran with financial indexes was implemented; resulting in the fact that, the algorithm has the capacity of gaining expansion towards big data. تفاصيل المقالة
      • حرية الوصول المقاله

        46 - Mining a Set of Rules for Determining the Waiting Time for Selling Residential Units
        Farshid Abdi Shaghayegh Abolmakarem
        Being aware of the waiting time for selling residential units is one of the important issues in the housing sector for the majority of people, especially investors. There are several factors affecting the waiting time for selling residential units. Determining the influ أکثر
        Being aware of the waiting time for selling residential units is one of the important issues in the housing sector for the majority of people, especially investors. There are several factors affecting the waiting time for selling residential units. Determining the influential factors on the time period of selling real estates can lead to an informed decision making by real estate consultants, sellers as well as those seeking to buy real estates. Using a real estate database in Iran, the present paper proposes a two-module procedure. The first module deals with implementation of association rule mining. Using the well-known association rule mining techniques namely FP-Growth, several association rules have been extracted which indicate the effective factors on the waiting time for selling residential units. Generated association rules have been evaluated based on metrics such as support, confidence and lift and finally the best rules are selected. The main objective of the second module is to develop a fuzzy inference system which can determine the factors influencing the waiting time for selling residential units from historical data, so that the model can be used to estimate the time it to sell the property for a real estate agency. Several IF-THEN rules are extracted from this module. Extracted rules can be used by real estate agencies as well as buyers and sellers of residential units to make better decisions in their investments. In conclusion section, a number of suggestions for future studies are presented. For example, machine learning algorithms such as neural networks, decision trees, etc. can also be used to predict the duration of residential units’ sale.The main objective of the second module is to develop a fuzzy inference system which can learn about the factors that influence the waiting time for selling residential units from historical data, so that the model can be used to estimate the time it takes to sell the property for a real estate agency. Several IF-THEN rules are extracted from this module. Extracted rules can be used by real estate agencies as well as buyers and sellers of residential units to make better decisions in their investments. تفاصيل المقالة
      • حرية الوصول المقاله

        47 - Identification of influencing factors on implementation of smart city plans based on approach of technical and social system
        Ali Safarzadeh Ghasemali Bazaei Mehdi Faghihi
        The current research seeks to identify the influencing factors on implementation of smart city plans based on approach of technical and social systems. For this goal, the library study is done and then based on that a research plan is written that include using expert o أکثر
        The current research seeks to identify the influencing factors on implementation of smart city plans based on approach of technical and social systems. For this goal, the library study is done and then based on that a research plan is written that include using expert opinions and data mining technique, feature selection ,clustering and also Delphi technique to identify and screen factors and then using clustering, the final factors are leveled. Here the aim is not ranking but is leveling. Meanwhile because of high numbers of factors, screening them in both steps using Delphi and feature selection is conducted. Delphi is one of the classic tests in qualitative approaches and feature selection include data mining techniques. Finally leveling factors include technical and social factors and the most influencing ones are determined. technical factors including digital infrastructure, ICT base transportation, ICT based logistic, building alarm systems, energy consumption adjustment, ICT based process are placed in level one. Social factors including digital and smart innovation, knowledge sharing, smart education, participation in sustainable development, access to educational plans, waste recycling, pollution control, productivity and flexibility of labor market are placed in level one. تفاصيل المقالة
      • حرية الوصول المقاله

        48 - Parallel Machine Scheduling with Controllable Processing Time Considering Energy Cost and Machine Failure Prediction
        Yousef Rabbani Ali Qorbani Reza Kamran Rad
        Predicting unexpected incidents and energy consumption decline is one of the current problems in the industry. The extant study addressed parallel machine scheduling by consideration of failures and energy consumption decline. Moreover, the present paper aimed at minimi أکثر
        Predicting unexpected incidents and energy consumption decline is one of the current problems in the industry. The extant study addressed parallel machine scheduling by consideration of failures and energy consumption decline. Moreover, the present paper aimed at minimizing early and late delivery penalties, and enhancing tasks. This research designed a mathematical model for this problem that considered processing times, delivery time, rotation speed and torque, failure time, and machine availability after repair and maintenance. Failure times have been predicated on using machine learning algorithms. The results indicated that the proposed model can be suitably solved for the size of 10 jobs or tasks and five machines. This research addresses the problem in two parts: the first part predicts failures, and the second part includes the sequence of parallel machine scheduling operations. After the previous data were received in the first step, machine failure was predicted by using machine learning algorithms, and a set of rules were obtained to correct the process. The obtained rules were used in the model to improve the machining process. In the second step, scheduling mode was used to determine operations sequence by consideration of these failures and machinery unavailability to achieve the optimal sequence. Moreover, it is supposed to reduce energy consumption and failures. This study used the Light GBM algorithm and achieved 85% precision in failure prediction. The rules obtained from this algorithm contributed to cost reduction. تفاصيل المقالة
      • حرية الوصول المقاله

        49 - تبیین دسته بندهای ماشین بردار پشتیبان و شبکه عصبی جهت درجه بندی شعب بانک
        davod khosroanjom mohamamd elyasi behzad keshanchi Bahare Boobanian shovana abdollahi
        در صنعت بانکداری اطلاعات زیادی وجود دارد که شناسایی آن از اهمیت ویژه‌ای برخوردار است. استفاده از تکنیک های داده کاوی نه تنها کیفیت را بهبود می بخشد بلکه منجر به مزایای رقابتی و ارتقای جایگاه بازار نیز می گردد. با استفاده از داده کاوی و به منظور تجزیه و تحلیل الگوها و رو أکثر
        در صنعت بانکداری اطلاعات زیادی وجود دارد که شناسایی آن از اهمیت ویژه‌ای برخوردار است. استفاده از تکنیک های داده کاوی نه تنها کیفیت را بهبود می بخشد بلکه منجر به مزایای رقابتی و ارتقای جایگاه بازار نیز می گردد. با استفاده از داده کاوی و به منظور تجزیه و تحلیل الگوها و روندها، بانکها می توانند صحت این را پیش بینی کنند درجه بندی شعب بانک چگونه است. در این مقاله درجه بندی شعب یکی از بانکهای بزرگ تجاری (تعداد شعب انتخاب شده 1825 شعبه و تعداد ویژگی های مورد استفاده 57 ویژگی) با استفاده از دسته بندهای ماشین بردار پشتیبان و شبکه عصبی چند لایه پرسپترون برروی داده های واقعی انجام گرفت. نتایج ارزیابی مربوط به ماشین بردار پشتیبان نشان داد که این دسته بند دارای کارایی پایین تری برای روش پیشنهادی است. اما استفاده از شبکه های عصبی و ترکیب آن با PCA نشان داد که دارای معیارهای کارایی بالایی است. مقادیر مربوط به کارایی و صحت با استفاده از شبکه عصبی با دقت بسیار بالایی بدست آمد. تفاصيل المقالة
      • حرية الوصول المقاله

        50 - شناسایی عوامل تاثیرگذار در رویگردانی مشتریان شرکت مخابرات کردستان و ارائه مدل هایی برای پیش بینی رویگردانی با استفاده از الگوریتم های یادگیری ماشین
        vida sadeghi Anvar Bahrampour Seyed Ali Hosseini
        مشتریان منبع اصلی درآمد و دارایی مهم برای هر سازمان هستند. با این دیدگاه، امروزه شرکت‌ها تلاش بیشتری را برای حفظ مشتریان موجود آغاز کرده‌اند. از آنجا که در بسیاری از شرکت‌ها هزینه به‌دست آوردن مشتری جدید بسیار بالاتر از هزینه ایجاد رضایتمندی مشتری فعلی است، رویگردانی مش أکثر
        مشتریان منبع اصلی درآمد و دارایی مهم برای هر سازمان هستند. با این دیدگاه، امروزه شرکت‌ها تلاش بیشتری را برای حفظ مشتریان موجود آغاز کرده‌اند. از آنجا که در بسیاری از شرکت‌ها هزینه به‌دست آوردن مشتری جدید بسیار بالاتر از هزینه ایجاد رضایتمندی مشتری فعلی است، رویگردانی مشتری به حوزه اصلی نگرانی این شرکت‌ها تبدیل شده است. لذا شرکت‌های مبتنی بر مشتری از جمله شرکت‌های فعال در صنعت مخابرات به دلیل رویگردانی مشتریان با چالش بزرگی روبرو هستند. با توسعه سریع صنعت مخابرات، پیش‌بینی رویگردانی به عنوان یکی از فعالیتهای اصلی در به ‌دست آوردن مزیت رقابتی در بازار محسوب می‌شود. پیش‌بینی رویگردانی مشتری به اپراتورها اجازه می‌دهد تا قبل از مهاجرت مشتریان فعلی به اپراتورهای دیگر، یک دوره زمانی برای اصلاح و اجرای یک سری اقدامات پیشگیرانه داشته باشند. در این پژوهش یک سیستم پشتیبانی تصمیم برای پیش‌بینی و تخمین رویگردانی مشتریان شرکت مخابرات استان کردستان (دارای 529000 مشترک) با روش‌های مختلف داده‌کاوی و یادگیری ماشین (شامل رگرسیون خطی چندگانه (MLR)، رگرسیون چند جمله-ای(PR)، رگرسیون لجستیک، شبکه‌های عصبی مصنوعی، آدابوست و جنگل تصادفی) ارایه شده است. نتایج ارزیابی‌های انجام شده بر روی مجموعه داده‌های شرکت مخابرات استان کردستان عملکرد بالای روش‌های شبکه‌های عصبی مصنوعی با دقت 99.9% ، آدابووست با دقت 100% و جنگل تصادفی با دقت 100% را نشان می‌دهد. تفاصيل المقالة
      • حرية الوصول المقاله

        51 - ارایه یک رویکرد جدید به منظور افزایش اثربخشی و انتخاب بحرانی ترین تجهیز به کمک رویکرد تلفیقی Data Mining, Fuzzy DEMATEL, FMEA و FTA (مطالعه موردی: پتروشیمی شازند)
        Mohammad Ehsanifar Nima Hamta Parisa Bolhasani
        طی دهه های اخیر به دلایل زیادی، شاهد توجه رو به رشدی به مقوله قابلیت اطمینان و مدیریت نگهداری و تعمیرات بوده‌ایم. مقاله حاضر با هدف معرفی و تلفیق رویکردهای داده کاوی، دیمتل فازی، تجزیه و تحلیل حالات خطا و درخت خطا به منظور بهبود قابلیت اطمینان و افزایش اثربخشی برنامه ری أکثر
        طی دهه های اخیر به دلایل زیادی، شاهد توجه رو به رشدی به مقوله قابلیت اطمینان و مدیریت نگهداری و تعمیرات بوده‌ایم. مقاله حاضر با هدف معرفی و تلفیق رویکردهای داده کاوی، دیمتل فازی، تجزیه و تحلیل حالات خطا و درخت خطا به منظور بهبود قابلیت اطمینان و افزایش اثربخشی برنامه ریزی تعمیرات در مجتمع پتروشیمی شازند انجام شده است..نخست با استفاده از تکنیک داده کاوی بحرانی ترین خوشه از میان خوشه های تشکیل شده توسط نرم افزار مربوطه مشخص می شود، سپس با بهره گیری از رویکرد دیمتل فازی مجموعه ای از بحرانی ترین و تاثیر گزار ترین تجهیزات در خوشه بحرانی، تحت شرایط فازی شناسایی میشوند، در نهایت توسط تکنیک های FMEA وFTA عدد ریسک و علل اصلی خرابی شناسایی خواهد شد و راهکار های مریوطه برای حل مشکلات و بهبود سیستم پیشنهاد خواهد شد. تفاصيل المقالة
      • حرية الوصول المقاله

        52 - روش جدیدی برای رتبه‌بندی قواعد حاصل از داده‌کاوی با استفاده از تحلیل پوششی داده‌ها
        Hossein Azizi
        تکنیک‌های داده‌کاوی، یعنی استخراج الگوها از پایگاه‌های داده‌ای بزرگ، در تجارت به صورت گسترده‌ای مورد استفاده قرار می‌گیرند. با استفاده از این تکنیک‌ها ممکن است قواعد زیادی حاصل شوند و فقط تعداد کمی از آنها به دلیل محدودیت بودجه و منابع برای پیاده‌سازی در نظر گرفته شوند. أکثر
        تکنیک‌های داده‌کاوی، یعنی استخراج الگوها از پایگاه‌های داده‌ای بزرگ، در تجارت به صورت گسترده‌ای مورد استفاده قرار می‌گیرند. با استفاده از این تکنیک‌ها ممکن است قواعد زیادی حاصل شوند و فقط تعداد کمی از آنها به دلیل محدودیت بودجه و منابع برای پیاده‌سازی در نظر گرفته شوند. ارزیابی و رتبه‌بندی جالب بودن و مفید بودن قواعد انجمنی در داده‌کاوی اهمیت زیادی دارد. در مطالعات قبلی که در مورد شناسایی قواعد انجمنی جالب از نظر ذهنی انجام شده است، اکثر روش‌ها مستلزم وارد کردن دستی یا پرسیدن از کاربر برای افتراق صریح قواعد جالب از ناجالب بوده است. این روش‌ها نیازمند محاسبات بسیار زیادی هستند و حتی ممکن است به نتیجه‌گیری‌های ناسازگار منتهی شوند. برای غلبه بر این مشکلات، این مقاله پیشنهاد می‌کند که از رویکرد تحلیل پوششی داده‌ها (DEA) با مرز دوگانه برای انتخاب کارآترین قاعده‌ی انجمنی استفاده شود. در این رویکرد علاوه بر بهترین کارآیی نسبی هر قاعده‌ی انجمنی، بدترین کارآیی نسبی آن نیز در نظر گرفته می‌شود. در مقایسه با DEAی سنتی، رویکرد DEA با مرز دوگانه می‌تواند کارآترین قاعده‌ی انجمنی را به درستی و به آسانی شناسایی کند. به عنوان یک مزیت، رویکرد پیشنهادی از نظر محاسباتی کارآمدتر از کارهای قبلی در این زمینه است. با استفاده از مثالی از تحلیل سبد بازار، قابلیت کاربرد روش مبتنی بر DEAی ما برای اندازه‌گیری کارآیی قواعد انجمنی با معیارهای چندگانه نشان داده خواهد شد. تفاصيل المقالة
      • حرية الوصول المقاله

        53 - ارائه یک روش ترکیبی از تحلیل پوششی داده ها و داده کاوی جهت ارزیابی واحدهای تصمیم گیرنده
        Alireza Alinezhad Javad Khalili
        کارایی از موضوع‌های مهمی است که علاوه بر مدیران شرکت‌ها و سازمان‌های مختلف، مشتریان استفاده‌کننده از خدمات این شرکت‌ها و سازمان‌ها نیز به آن علاقه‌مند هستند. هدف این پژوهش، بررسی کارایی شرکت‌های داروسازی پذیرفته‌شده در سازمان بورس اوراق بهادار با استفاده از تحلیل پوششی أکثر
        کارایی از موضوع‌های مهمی است که علاوه بر مدیران شرکت‌ها و سازمان‌های مختلف، مشتریان استفاده‌کننده از خدمات این شرکت‌ها و سازمان‌ها نیز به آن علاقه‌مند هستند. هدف این پژوهش، بررسی کارایی شرکت‌های داروسازی پذیرفته‌شده در سازمان بورس اوراق بهادار با استفاده از تحلیل پوششی داده‌ها و سپس ارائه قواعدی با استفاده از داده کاوی است. شاخص مالم کوئیست با امکان‌پذیر ساختن ترکیب مشاهدات سری زمانی و مقطعی، تا حدودی مشکل ناکافی بودن مشاهدات را برطرف می‌کند و برای‌ یافتن روندهای عملکرد‌ یک واحد در طول زمان مفید است. در این پژوهش، ارزیابی کارایی 22 شرکت داروسازی پذیرفته‌شده در سازمان بورس اوراق بهادار با توجه به ورودی‌ها و خروجی‌ها و با استفاده از شاخص مالم کوئیست ورودی محور در طول سال‌های 1395-1391 صورت گرفته است و سپس نتایج حاصل از آن به عنوان برچسب دسته واحدهای تصمیم‌گیرنده که در واقع ورودی روش درخت تصمیم است، مورد استفاده قرار می‌گیرند. درنهایت، با استفاده از درخت تصمیم، قواعد مستتر در داده‌ها استخراج می‌شود. تفاصيل المقالة
      • حرية الوصول المقاله

        54 - Designing an Intelligent Intrusion Detection System in the Electronic Banking Industry Using Fuzzy Logic
        Adel Jahanbani
        One of the most important obstacles to using Internet banking is the lack of Stability of transactions and some misuse in the course of transactions it is financial. That is why preventing unauthorized access Crime detection is one of the major issues in financial insti أکثر
        One of the most important obstacles to using Internet banking is the lack of Stability of transactions and some misuse in the course of transactions it is financial. That is why preventing unauthorized access Crime detection is one of the major issues in financial institutions and banks. In this article, a system of intelligence has been designed that recognizes Suspicious and unusual behaviors for users in the Internet banking system. Because the behavior of different users is accompanied by ambiguity and uncertainty, this system is designed based on fuzzy logic to identify user behavior and categorize suspicious behaviors of varying severity. The system applies a diagnostic process based on KDD data. The results show that in all validation algorithms, 2 to 5 percent improvement in detection is provided. تفاصيل المقالة
      • حرية الوصول المقاله

        55 - Comparison of information transfer delay in standard Apriori algorithm and improved Apriori algorithm
        Hooman Bavarsad Salehpour Seyed Hamid Seyed Javadi Parvaneh Asghari Mohammad Ebrahim Shiri Ahmad Abadi
        One of the most famous algorithms in the field of focused exploration of data mining correlation rules is the Apriori algorithm and its many developed versions. But what can be raised as a major challenge in this field is the proper application of this algorithm in the أکثر
        One of the most famous algorithms in the field of focused exploration of data mining correlation rules is the Apriori algorithm and its many developed versions. But what can be raised as a major challenge in this field is the proper application of this algorithm in the distributed environments of today's world. In this research, a parallelization-based approach is proposed to improve the performance of the Apriori algorithm in the process of exploring recurring patterns on network topologies. The proposed approach includes two major features: (1) combining the node centrality criterion and the Apriori algorithm to identify frequent patterns, (2) using the mapping/reduction method in order to create parallel processing and achieve optimal values in the shortest time. Also, this approach pursues three main goals: reducing the temporal and spatial complexity of the Apriori algorithm, improving the process of extracting dependency rules and identifying recurring patterns, comparing the performance of the proposed approach on different network topologies in order to determine the advantages and disadvantages of each topology. To prove the superiority of the proposed method, a comparison has been made between our approach and the basic Apriori algorithm. The evaluation results of the methods prove that the proposed approach provides an acceptable performance in terms of execution time criteria compared to other methods. تفاصيل المقالة
      • حرية الوصول المقاله

        56 - Detected Source-based fake news via Word2vec algorithm
        Hamid Sharifi Heris Jafar Sheykhzadeh
        today and regarding the increase of social media platforms and the people welcoming these networks has led to share different data throughout the world without the confirmation by the platforms. This has increased the incorrect data frequency and has had great effects o أکثر
        today and regarding the increase of social media platforms and the people welcoming these networks has led to share different data throughout the world without the confirmation by the platforms. This has increased the incorrect data frequency and has had great effects on political, economic, and social fields. such incorrect data are called fake news. This has changed into one of the topical issues in today’s society. Through the proposal of an appropriate solution and first through analyzing the news resources in the dataset called BuzzfeedNews, we have concluded that websites with better fames propagate less fake news. We changed the data into vector using Word2vec and investigated the similarity of the taught data and the tagged data in the dataset and got the least precision amounting to 0.60 and the highest precision amounting to 0.94 out of 1 and the results showed that our algorithm has been very helpful in discovering the qualified news. تفاصيل المقالة
      • حرية الوصول المقاله

        57 - Reliability Measurement’s in Depression Detection Using a Data Mining Approach Based on Fuzzy-Genetics
        Mohammad Nadjafi Sepideh Jenabi Adel Najafi Ghasem Kahe
        Developing a reliable data mining method is one of the most challenging issues in the features of advanced computer-based systems. Model reliability in depression disorder detection is the determining p-value or confidence limit for accuracy score. In this regard, data أکثر
        Developing a reliable data mining method is one of the most challenging issues in the features of advanced computer-based systems. Model reliability in depression disorder detection is the determining p-value or confidence limit for accuracy score. In this regard, data mining evaluation metrics provide a path to knowledge discovery and feature extraction is an important process for discovering patterns in data by exploring and modeling big data. The present paper discussed the data mining approach about detection in depression disorder characterized by symptoms such as sadness, feeling empty, anxiety, and sleep symptoms as well as the loss of initiative and interest inactivity. In this survey, a unique dataset containing sensor data collected from patients with depression was used. For each patient, sensor data were measured over several days. In this respect, the represented dataset could be useful for a better understanding of the relationship between depression and motor activity. On the other hand, to overcome the uncertainties raised from wearable sensors (that caused a significant amount of error in similar previous studies using conventional learning methods such as SVM, LR, NB), and also to increase the efficiency and accuracy of the results and to develop a reliable decision-making framework, the evolutionary hybrid machine learning method (fuzzy-genetic algorithm) will be used. The results show the high accuracy of the proposed method compared to other existing methods. تفاصيل المقالة
      • حرية الوصول المقاله

        58 - A Novel Ensemble Approach for Anomaly Detection in Wireless Sensor Networks Using Time-overlapped Sliding Windows
        Zahra Malmir Mohammad Hossein Rezvani
        One of the most important issues concerning the sensor data in the Wireless Sensor Networks (WSNs) is the unexpected data which are acquired from the sensors. Today, there are numerous approaches for detecting anomalies in the WSNs, most of which are based on machine le أکثر
        One of the most important issues concerning the sensor data in the Wireless Sensor Networks (WSNs) is the unexpected data which are acquired from the sensors. Today, there are numerous approaches for detecting anomalies in the WSNs, most of which are based on machine learning methods. In this research, we present a heuristic method based on the concept of “ensemble of classifiers” of data mining. Our proposed algorithm, at first applies a fuzzy clustering approach using the well-known C-means clustering method to create the clusters. In the classification step, we created some base classifiers, each of which utilizes the data of overlapping windows to utilize the correlation among data over time by creating time-overlapped batches of data. By aggregating these batches, the classifier proceeds to find an appropriate label for future incoming instance. The concept of “Ensemble of Classifiers” with majority voting scheme has been used in order to combine the judgment of all classifiers. The results of our implementation with MATLAB toolboxes shows that the proposed majority-based ensemble learning method attains more efficiency compared to the case of the single classifier method. Our proposed method enhances the performance of the system in terms of major criteria such as False Positive Rate, True Positive Rate, False Negative Rate, True Negative Rate, Sensitivity, Specificity and also the ROC curve. تفاصيل المقالة
      • حرية الوصول المقاله

        59 - Persistent K-Means: Stable Data Clustering Algorithm Based on K-Means Algorithm
        Rasool Azimi Hedieh Sajedi
        Identifying clusters or clustering is an important aspect of data analysis. It is the task of grouping a set of objects in such a way those objects in the same group/cluster are more similar in some sense or another. It is a main task of exploratory data mining, and a c أکثر
        Identifying clusters or clustering is an important aspect of data analysis. It is the task of grouping a set of objects in such a way those objects in the same group/cluster are more similar in some sense or another. It is a main task of exploratory data mining, and a common technique for statistical data analysis This paper proposed an improved version of K-Means algorithm, namely Persistent K-Means, which alters the convergence method of K-Means algorithm to provide more accurate clustering results than the K-means algorithm and its variants by increasing the clusters’ coherence. Persistent K-Means uses an iterative approach to discover the best result for consecutive iterations of K-Means algorithm. تفاصيل المقالة
      • حرية الوصول المقاله

        60 - ارائه الگوی داده کاوی مبتنی بر شاخص توسعه پایدار در مدیریت شهری کلان‌شهر تهران متاثر از همه‌گیری کووید-19
        عباس ملکی صادق عابدی علیرضا ایرج پور
        با اعمال محدودیت‌های ناشی از همه‌گیری کووید-19، به نظر می‌رسد تغییراتی در غلظت‌ آلاینده‌های CO، O3،NO ، NO2، SO2، PM2.5، PM10 و AQI در دوره‌های قبل و بعد از همه‌گیری دیده شود. از این رو، تغییرات آلاینده‌های هوا و محدودیت‌های ترافیکی به عنوان یکی از زیرمجموعه-های شاخص زی أکثر
        با اعمال محدودیت‌های ناشی از همه‌گیری کووید-19، به نظر می‌رسد تغییراتی در غلظت‌ آلاینده‌های CO، O3،NO ، NO2، SO2، PM2.5، PM10 و AQI در دوره‌های قبل و بعد از همه‌گیری دیده شود. از این رو، تغییرات آلاینده‌های هوا و محدودیت‌های ترافیکی به عنوان یکی از زیرمجموعه-های شاخص زیست محیطی توسعه پایدار شهری در بازه زمانی 01/11/1396 تا 29/12/1400 در ایستگاه‌های تحت نظارت شهر تهران مورد بررسی ‌قرار می‌گیرد. ابتدا داده‌ها جمع آوری، پردازش و پاکسازی می‌شوند. بر روی ویژگی‌های موثر انتخاب شده با استفاده از روش بهینه سازی ازدحام ذرات، روش‌های یادگیری ماشین شامل درخت تصمیم، جنگل تصادفی، ماشین بردار پشتیبان، شبکه بیزین و شبکه عصبی پرسپترون اعمال می‌شود. بررسی‌ها نشان داد که مدل پیش بینی با استفاده از درخت تصمیم و جنگل تصادفی بهترین عملکرد را برای هر دو معیار صحت و فراخوانی داشت. نتایج تحقیق نشان داد که غلظت آلاینده‌ها در دوران کووید-19 نسبت به قبل از آن، در بعضی از ایستگاه‌ها افزایشی و در برخی دیگر کاهشی می‌باشد و همچنین اعمال محدودیت‌های ترافیکی در دوره همه‌گیری، تاثیر قابل توجه و محسوسی در کاهش غلظت آلاینده‌های هوا نداشته است. همچنین با بررسی روند مرگ و میر در دوره همه‌گیری مشخص شد که کاهش و یا افزایش آلاینده‌ها ارتباط معناداری با روند مرگ و میر ناشی از کووید-19 ندارد. تفاصيل المقالة
      • حرية الوصول المقاله

        61 - ارائه یک الگوی پیش بینی فرار مالیاتی مشاغل مبتنی بر تکنیک های داده کاوی
        محمد قاسمی صادق عابدی علی محتشمی
        در این پژوهش با توجه به اهمیت موضوع و خلای پژوهش های پیشین، یک مدل پیش بینی فرار مالیاتی اصناف مبتنی بر تکنیک های داده کاوی ارائه می گردد. داده های مورد تحلیل شامل بررسی 5600 پرونده مالیاتی کلیه اصناف دارای کد مالیاتی در استان قزوین طی سال های ۹۳ تا ۹۸ می باشد. پرونده م أکثر
        در این پژوهش با توجه به اهمیت موضوع و خلای پژوهش های پیشین، یک مدل پیش بینی فرار مالیاتی اصناف مبتنی بر تکنیک های داده کاوی ارائه می گردد. داده های مورد تحلیل شامل بررسی 5600 پرونده مالیاتی کلیه اصناف دارای کد مالیاتی در استان قزوین طی سال های ۹۳ تا ۹۸ می باشد. پرونده مالیاتی مرتبط با اصناف در پنج گروه مالیاتی شامل گروه صنفی صاحبان دفاتر رسمی، گروه صنفی مشاورین املاک، گروه صنفی تالارهای پذیرایی، رستوران و مشاغل وابسته، گروه صنفی خدمات ارتباطی و گروه صنفی نمایشگاه و فروشگاه لوازم خودرویی و مشاغل وابسته می باشند. جهت مدل سازی از الگوی کلاس بندی شامل الگوریتم درخت تصمیم استفاده گردید. نتایج نشان می دهد، معیار پوشش برابر 68 %، معیار کاپا برابر 0.612 بدست آمده است که عملکرد خوب مدل ساز را نشان می دهد. همچنین با استفاده از تکنیک Cross Validation صحت اعتبار مدل پیش بینی مورد آزمون قرار گرفت تا با اطمینان بیشتری درصد عملکرد مدل سازی تخمین زده شود. معیار صحت برابر 67.79% نشان از قابلیت اطمینان مناسب جهت مدل پیش بینی می باشد. نتایج حاصل از این پژوهش می تواند در تدوین راهبردهای عملیاتی مبتنی بر داده کاوی جهت پیش بینی فرار مالیاتی اصناف در استان ها مورد بهره برداری قرار گیرد. تفاصيل المقالة
      • حرية الوصول المقاله

        62 - مدل ترکیبی تحلیل پوششی داده‌های شبکه ای و داده کاوی برای پیش بینی کارایی در زنجیره تامین سبز
        طاهره ترکاشوند فاطمه ثقفی محمدحسین درویش متولی نازنین پیله وری
        تحلیل و پیش‌بینی کارایی در صنایع، به منظورارزیابی عملکرد واحدها و برنامه‌ریزی برای بهبود عملکرد آن ها از اهمیت زیادی برخوردار است. صنعت طیور به عنوان یکی از صنایع استراتژیک و پیچیده سهم مهمی از سبد زنجیره غذایی جوامع را به خود اختصاص داده است و از این روی تحلیل شبکه تام أکثر
        تحلیل و پیش‌بینی کارایی در صنایع، به منظورارزیابی عملکرد واحدها و برنامه‌ریزی برای بهبود عملکرد آن ها از اهمیت زیادی برخوردار است. صنعت طیور به عنوان یکی از صنایع استراتژیک و پیچیده سهم مهمی از سبد زنجیره غذایی جوامع را به خود اختصاص داده است و از این روی تحلیل شبکه تامین آن بسیار با اهمیت است.در این پژوهش با استفاده از مدل تحلیل پوششی داده‌های شبکه ای و داده کاوی، شکاف‌های تحقیق در زمینه اندازه‌گیری و پیش بینی کارایی زنجیره تامین سبز در صنعت طیور پوشش داده شده است. این پژوهش از نظر هدف کاربردی و به لحاظ ماهیت اجرا توصیفی و پیمایشی می باشد که با توسعه مدل های ریاضی در حوزه تحلیل پوششی داده ها انجام می شود.ابتدا با استفاده از رویکرد دلفی، شاخص های موثر بر اساس نظر خبرگان شناسایی و غربالگری شده اند، و سپس مدل ریاضی جدید بر اساس تحلیل پوششی داده های شبکه ای ارائه گردید. در ادامه با استفاده از روش الفا کات بر روی روش تحلیل پوششی داده ها ی فازی، در پنج سال کارایی 9 زنجیره ارزیابی شد. نتایج نشان داد مدل ارائه شده قادر است کارایی زنجیره تامین سبز و چند سطحی صنعت طیور را در سال های متوالی مورد ارزیابی قرار دهد. تفاصيل المقالة
      • حرية الوصول المقاله

        63 - ارزیابی ریسک اعتباری در سیستم‌های بانکی با استفاده از تکنیک‌های داده‌کاوی
        نیما همتا محمد احسانی‌فر بهاره محمدی
        این مقاله با هدف شناسایی عوامل مؤثر بر ریسک اعتباری و ارائه مدلی جهت پیش بینی ریسک اعتباری و رتبه بندی اعتباری مشتریان حقوقی متقاضی تسهیلات بانک سپه شهرستان دزفول، با استفاده از روش های خوشه بندی، شبکه عصبی و ماشین بردار پشتیبان انجام گرفته است. در این مقاله، 27 متغیر ت أکثر
        این مقاله با هدف شناسایی عوامل مؤثر بر ریسک اعتباری و ارائه مدلی جهت پیش بینی ریسک اعتباری و رتبه بندی اعتباری مشتریان حقوقی متقاضی تسهیلات بانک سپه شهرستان دزفول، با استفاده از روش های خوشه بندی، شبکه عصبی و ماشین بردار پشتیبان انجام گرفته است. در این مقاله، 27 متغیر توضیح دهنده شامل متغیرهای مالی و غیرمالی مورد بررسی قرار گرفت که از بین این متغیرها، 8 متغیر تأثیرگذار بر ریسک اعتباری انتخاب گردید که به وسیله روش خوشه بندی مجموعه داده ها به خوشه ها دسته بندی شدند. هم چنین متغیرهای انتخابی به عنوان بردار ورودی شبکه عصبی پرسپترون 3 لایه وارد مدل شد و در نهایت با استفاده از ماشین بردار پشتیبان، به منظور پیش بینی عملکرد مالی مشتریان حقوقی بانک ارائه گردید. نتایج حاصل از مدل شبکه عصبی و ماشین بردار پشتیبان حاکی از آن است که مدل شبکه عصبی در پیش بینی ریسک اعتباری مشتریان حقوقی و رتبه بندی اعتباری از کارایی بیشتری برخودار است. تفاصيل المقالة
      • حرية الوصول المقاله

        64 - Integrating AHP and data mining for effective retailer segmentation based on retailer lifetime value
        Amin Parvaneh Hossein Abbasimehr Mohammad Jafar Tarokh
        Data mining techniques have been used widely in the area of customer relationship management (CRM). In this study, we have applied data mining techniques to address a problem in business-to-business (B2B) setting. In a manufacturer-retailer-consumer chain, a manufacture أکثر
        Data mining techniques have been used widely in the area of customer relationship management (CRM). In this study, we have applied data mining techniques to address a problem in business-to-business (B2B) setting. In a manufacturer-retailer-consumer chain, a manufacturer should improve its relationship with retailers to continue its business. Segmentation is a useful tool for identifying groups of similar retailers in order to improve retailer loyalty by developing and implementing segment-specific marketing strategies. In this study, we have proposed a methodology for retailer segmentation based on their LRFM variables (relation Length, Recency, Frequency and Monetary) and analytical hierarchy process (AHP). The proposed methodology has been implemented by using data of a firm from a hygienic industry in Iran. The empirical results indicated that there are six groups of retailers. After analyzing each segment according to LRFM values, we labeled each retailer group according to its performance. Furthermore, we provided some possible actions that can be taken in order to improve the relationship between the firm and retailers. تفاصيل المقالة
      • حرية الوصول المقاله

        65 - Using the Hybrid Model for Credit Scoring (Case Study: Credit Clients of microloans, Bank Refah-Kargeran of Zanjan, Iran)
        Abdollah Nazari Mohammadreza Mehregan Reza Tehrani
        In any country, commercial banks lay the groundwork for economic growth by collecting national resources and capitals and allocating them to different economic sectors. Optimal allocation of resources is especially important in achieving this goal. Banks with an effecti أکثر
        In any country, commercial banks lay the groundwork for economic growth by collecting national resources and capitals and allocating them to different economic sectors. Optimal allocation of resources is especially important in achieving this goal. Banks with an effective and dynamic system of customer assessment can efficiently allocate their resources to customers regardless of their geographic area. Following[M1] a linear programming optimization approach, this research employs the UTilités Additives DIScriminantes (UTADIS) model for credit scoring of bank customers. The advantages of the proposed technique are high flexibility, mutual interaction with decision makers, and the ability to update under various macroeconomic conditions. The chosen environment is a branch of Bank Refah Kargaran, one of the popular banks in Iran. According to the experimental results, the proposed technique demonstrates high effectiveness. Also, the results indicate that the initial credit score and age of the applicants are the most influential factors for credit scoring of customers. تفاصيل المقالة
      • حرية الوصول المقاله

        66 - A Data Mining approach for forecasting failure root causes: A case study in an Automated Teller Machine (ATM) manufacturing company
        Seyedehpardis Bagherighadikolaei Rouzbeh Ghousi Abdolrahman Haeri
        Based on the findings of Massachusetts Institute of Technology, organizations’ data double every five years. However, the rate of using data is 0.3. Nowadays, data mining tools have greatly facilitated the process of knowledge extraction from a welter of data. Thi أکثر
        Based on the findings of Massachusetts Institute of Technology, organizations’ data double every five years. However, the rate of using data is 0.3. Nowadays, data mining tools have greatly facilitated the process of knowledge extraction from a welter of data. This paper presents a hybrid model using data gathered from an ATM manufacturing company. The steps of the research are based on CRISP-DM. Therefore, based on the first step, business understanding, the company and its different units were studied. After business understanding, the data collected from sale's unit were prepared for preprocess. While preprocessing, data from some columns of dataset, based on their types and purpose of the research, were either categorized or coded. Then, the data have been inserted into Clementine software, which resulted in modeling and pattern discovery. The results clearly state that, the same Machines’ Code and the same customers in different provinces are struggling with significantly different Problems’ Code, that could be due to weather condition, culture of using ATMs, and likewise. Moreover, the same Machines’ Code and the same Problems’ Code, as well as differences in Technicians' expertise, seems to be some causes to significantly different Repair Time. This could be due to Technicians' training background level of their expertise and such. At last, the company can benefit from the outputs of this model in terms of its strategic decision-making. تفاصيل المقالة
      • حرية الوصول المقاله

        67 - Diabetes detection via machine learning using four implemented spanning tree algorithms
        Yas  Ghiasi Mehdi Seif Barghy Davar PISHVA
        This paper considers an accurate and efficient diabetes detection scheme via machine learning. It uses the science of data mining and pattern matching in its diabetes diagnosis process. It implements and evaluates 4 machine learning classification algorithms, namely De أکثر
        This paper considers an accurate and efficient diabetes detection scheme via machine learning. It uses the science of data mining and pattern matching in its diabetes diagnosis process. It implements and evaluates 4 machine learning classification algorithms, namely Decision tree, Random Forest, XGBoost and LGBM. Then selects and introduces the one that performs the best towards its objective using multi-criteria decision-making methods. Its results reveal that Random Forest algorithm outperformed other algorithms with higher accuracy. It also examines the details of features that have a greater effect on diabetes detection. Considering that diabetes is one of the most deadly, disabling, and costly diseases observed today, its alarmingly increasing rates, and difficulty of its diagnosis because of many vague signs and symptoms, utilization of such approach can help doctors increase accuracy of their diagnosis and treatment schemes. Hence, this paper uses the science of data mining as a tool to gather and analyze existing data on diabetes and help doctors with its diagnosis and treatment process. The main contribution of this paper can therefore be its applied nature to an essential field and accuracy of its pattern recognition via several analytical approaches. تفاصيل المقالة
      • حرية الوصول المقاله

        68 - Application of Rough Set Theory in Data Mining for Decision SupportSystems (DSSs)
        Mohammad Hossein Fazel Zarandi Abolfazl Kazemi
        Decision support systems (DSSs) are prevalent information systems for decision making in many competitive business environments. In a DSS, decision making process is intimately related to some factors which determine the quality of information systems and their relate أکثر
        Decision support systems (DSSs) are prevalent information systems for decision making in many competitive business environments. In a DSS, decision making process is intimately related to some factors which determine the quality of information systems and their related products. Traditional approaches to data analysis usually cannot be implemented in sophisticated Companies, where managers need some DSS tools for rapid decision making. In traditional approaches to decision making, usually scientific expertise together with statistical techniques are needed to support the managers. However, these approaches are not able to handle the huge amount of real data, and the processes are usually very slow. Recently, several innovative facilities have been presented for decision making process in enterprises. Presenting new techniques for development of huge databases, together with some heuristic models have enhanced the capabilities of DSSs to support managers in all levels of organizations. Today, data mining and knowledge discovery is considered as the main module of development of advanced DSSs. In this research, we use rough set theory for data mining for decision making process in a DSS. The proposed approach concentrates on individual objects rather than population of the objects. Finally, a rule extracted from a data set and the corresponding features (attributes) is considered in modeling data mining. تفاصيل المقالة
      • حرية الوصول المقاله

        69 - A New Algorithm for Optimization of Fuzzy Decision Tree in Data Mining
        Abolfazl Kazemi Elahe Mehrzadegan
        Decision-tree algorithms provide one of the most popular methodologies for symbolic knowledge acquisition. The resulting knowledge, a symbolic decision tree along with a simple inference mechanism, has been praised for comprehensibility. The most comprehensible decision أکثر
        Decision-tree algorithms provide one of the most popular methodologies for symbolic knowledge acquisition. The resulting knowledge, a symbolic decision tree along with a simple inference mechanism, has been praised for comprehensibility. The most comprehensible decision trees have been designed for perfect symbolic data. Classical crisp decision trees (DT) are widely applied to classification tasks. Nevertheless, there are still a lot of problems especially when dealing with numerical (continuous valued) attributes. Some of those problems can be solved using fuzzy decision trees (FDT). Over the years, additional methodologies have been investigated and proposed to deal with continuous or multi-valued data, and with missing or noisy features. Recently, with the growing popularity of fuzzy representation, a few researchers independently have proposed to utilize fuzzy representation in decision trees to deal with similar situations. Fuzzy representation bridges the gap between symbolic and non symbolic data by linking qualitative linguistic terms with quantitative data. In this paper, a new method of fuzzy decision trees is presented. This method proposed a new method for handling continuous valued attributes with user defined membership. The results of crisp and fuzzy decision trees are compared at the end. تفاصيل المقالة
      • حرية الوصول المقاله

        70 - Modelling Customer Attraction Prediction in Customer Relation Management using Decision Tree: A Data Mining Approach
        Abolfazl Kazemi Mohammad Esmaeil Babaei
        In Today’s quality- based competitive world, known as knowledge age, customer attraction is of ultimate importance. In respect to the slogan “customer is always right”, customer relation management is the core of an organizational strategy playing an i أکثر
        In Today’s quality- based competitive world, known as knowledge age, customer attraction is of ultimate importance. In respect to the slogan “customer is always right”, customer relation management is the core of an organizational strategy playing an important role in four aspects of customer identification, customer attraction, customer retaining, and customer satisfaction. Commercial organizations have perceived increased value of customers through analysis of customers’ life cycle. Data storing and data mining tools along with other customer relation management methods have provided new opportunities for the business. This paper tries to help organizations determine the criteria needed for the identification of potential customers in the competitive environment of their business by employing data mining in practice. It also provides a mechanism for the identification of potential customers liable to becoming real customers. Using Decision Tree tool, the main criteria are identified and their importance are determine din this paper and then assuming that each main criterion consists of several sub-criteria, their importance in turning potential customers into real ones is in turn determined. By utilizing the identified criteria and sub- criteria, organizations are able to drive selling processes in each attendance in a direction which results in attendants’ (future customers) purchase. تفاصيل المقالة
      • حرية الوصول المقاله

        71 - بررسی میزان بهره‌وری مدل فرآیند خدمات مددکاری و توانمندسازی با استفاده از تکنیک‌های داده‌کاوی
        مهرداد محمدزاده علمداری منصور اسماعیل پور علیرضا اسلامبولچی فرهاد سلیمانیان قره چیق
        فرآیند خدمات مددکاری و توانمندسازی در نهادهای حمایتی از جمله کمیته امداد امام خمینی(ره) جامع و گسترده است و با تحقیق، پذیرش و ارائه خدمات مددکاری برای نیازمندان شروع و بعد از حمایت هدفمند و زماندار، با آموزش و توانمندسازی مددجویان و خروج آنان از چتر حمایتی به پایان می ر أکثر
        فرآیند خدمات مددکاری و توانمندسازی در نهادهای حمایتی از جمله کمیته امداد امام خمینی(ره) جامع و گسترده است و با تحقیق، پذیرش و ارائه خدمات مددکاری برای نیازمندان شروع و بعد از حمایت هدفمند و زماندار، با آموزش و توانمندسازی مددجویان و خروج آنان از چتر حمایتی به پایان می رسد. از این رو بهره گیری از تکنیک های نوین جهت بررسی میزان بهره وری مدل پیاده سازی شده رورت دارد تا اهداف سازمانی از جمله اصلاح فرآیندهای جاری برای رعایت عدالت اجتماعی در حمایت از نیازمندان واقعی و خروج از چرخه حمایت مددجویان توانمند، تأمین شود. در این مطالعه پژوهشگران به دنبال پاسخ به این سؤال هستند که آیا مدل فرایند خدمات مددکاری و توانمندسازی بهره وری لازم جهت نیل به اهداف سازمانی را دارا بوده یا نیاز به بازطراحی دارد؟ در این راستا داده های مربوط به میزان تحقق اهداف کاربردی بعد از پیاده سازی مدل فرآیند خدمات مددکاری و توانمندسازی از جنبه شناسایی، راهنمایی، پذیرش، نیازسنجی، اولویت بندی، میزان خدمات عمومی و تخصصی قابل ارائه به نیازمندان واجد شرایط با رویکرد توانمندسازی، با استفاده از پرسشنامه جمع آوری و با استفاده از متدولوژی کریسپ-داده کاوی[1]مراحل مختلف مبتنی بر داده کاوی انجام گردید. در نهایت جمع بندی نتایج حاصل از داده کاوی با استفاده از رافست[2] 0.86، درخت تصمیم گیری[3] 0.80، تئوری بیز[4] 0.70، شبکه های عصبی مصنوعی[5]0.85 میزان دقت مدل را پیش بینی نمود. لذا مدل موجود بهره وری لازم جهت تحقق اهداف سازمانی را در حدمطلوب دارا بوده و با بازطراحی مجدد مدل موجود توسط پژوهشگران آتی با بهره گیری از نتایج پژوهش حاضر، امکان ارائه مدل بهینه جهت الگوبرداری سایر سازمان های مردم نهاد غیردولتی[6]در داخل و خارج از کشور فراهم خواهد شد. تفاصيل المقالة
      • حرية الوصول المقاله

        72 - ارائه الگوریتم خوشه‌بندی جدید به‌منظور بهره‌وری در عملیات داده‌کاوی (مطالعه داده‌های استاندارد یوسی‌آی)
        ژیلا نصیری روشتی فرزین مدرس خیابانی نیما آذر میر شتربانی
        روش‌های خوشه‌بندی و بهره‌وری آنها در عملیات داده‌کاوی توسعه زیادی یافته‌اند. نیاز مدیران به داده‌های دسته‌بندی‌شده و بهره‌وری روش‌های خوشه‌بندی در امر مدیریت و تصمیم‌گیری، به گسترش روش‌های داده‌کاوی ضرورت بخشیده است. الگوریتم بهینه‌سازی نهنگ روش عمومی است که در حل مسائل أکثر
        روش‌های خوشه‌بندی و بهره‌وری آنها در عملیات داده‌کاوی توسعه زیادی یافته‌اند. نیاز مدیران به داده‌های دسته‌بندی‌شده و بهره‌وری روش‌های خوشه‌بندی در امر مدیریت و تصمیم‌گیری، به گسترش روش‌های داده‌کاوی ضرورت بخشیده است. الگوریتم بهینه‌سازی نهنگ روش عمومی است که در حل مسائل متعددی کاربرد دارد. در این الگوریتم جواب‌های آغازین به‌صورت تصادفی انتخاب می‌شوند. الگوریتم کی-میانگین یک روش خوشه‌بندی پرکاربرد است که به دلیل سادگی و کوتاه بودن مراحل، بسیار موردتوجه محققان قرار می‌گیرد. در این مقاله این مزیت الگوریتم کی- میانگین را برای افزایش توانایی الگوریتم بهینه‌سازی نهنگ در خوشه‌بندی داده‌ها به‌کاررفته است. الگوریتم پیشنهادی ترکیبی از الگوریتم‌های کی-میانگین و خوشه‌بندی نهنگ است. در این پژوهش الگوریتم جدید و چند الگوریتم خوشه‌بندی دیگر را بر روی مجموعه داده‌های واقعی و شناخته شده اجرا شده است. نتایج عددی نشان می‌دهد که الگوریتم جدید ازنظر کیفیت جواب‌ها و انحراف استاندارد مقادیر جواب‌های نهایی، نتایج مطلوبی نشان می‌دهد. تفاصيل المقالة
      • حرية الوصول المقاله

        73 - طبقه بندی مشتریان بانک صادرات براساس ارزش مشتری با استفاده از درخت تصمیم
        حسین بیورانی محرم عظیمی
        با توجه به اینکه امروزه کسب رضایت مشتری در محیط تجاری اهمیت زیادی پیدا کرده است ، بسیاری از شرکت‌ها به منظور افزایش سود و رضایت مشتری بر روی ارزش مشتری تمرکز دارند. مدیریت ارتباط با مشتری 3(CRM) ابزار بالا بردن ارتباط مشتری به عنوان اصل رقابت در شرکت‌ها ظهور پیدا کرده أکثر
        با توجه به اینکه امروزه کسب رضایت مشتری در محیط تجاری اهمیت زیادی پیدا کرده است ، بسیاری از شرکت‌ها به منظور افزایش سود و رضایت مشتری بر روی ارزش مشتری تمرکز دارند. مدیریت ارتباط با مشتری 3(CRM) ابزار بالا بردن ارتباط مشتری به عنوان اصل رقابت در شرکت‌ها ظهور پیدا کرده است. ساختار موفق ‎CRM‎ در شرکت‌ها از شناسایی ارزش درست مشتری شروع می‌شود، زیرا ارزش مشتری اطلاعات مهمی را به منظور گسترش هدف و مدیریت فراهم می‌کند. ‎‎تکنیک‌هایی مثل داده کاوی سبب شده است که مدیریت ارتباط با مشتری در حوزه جدید رقابت پیشرفت کند به طوری که شرکت‌ها بتوانند در رقابت تجاری سود داشته باشند. از طریق داده کاوی -کشف دانش پنهان از پایگاه داده- سازمان‌ها می‌توانند مشتری ارزشمندشان را بشناسند و رفتار آینده آنها را پیش‌بینی و تصمیمات مفید و دانش محور را اتخاذ کنند. هدف از انجام این تحقیق بدست آوردن معیار‌های موثر در انتخاب مشتری ارزشمند است که بتوان مشتریان را براساس ویژگی‌های جمعیت شناختی‌شان و سایر متغیرهای مربوط به معاملات به طبقات سود خیلی کم، کم سود ، سودبالا و سود خیلی بالا طبقه بندی کرد. در این تحقیق تاثیر ویژگی‌های جمعیت شناختی افراد از جمله سن ، تحصیلات و شغل افراد همچنین تاثیر درجه شعبه، مکان شعبه بانک و تعداد تراکنش افراد برروی ارزش مشتری بررسی می شود. متغیر وابسته در این تحقیق مقدار ارزش مشتری است که به چهار طبقه دسته بندی شده است. جامعه آماری در این تحقیق مشتریان دارای حساب جاری فعال نزد بانک صادرات ایران در شهر تبریز است و مشتریانی را در نظر گرفتیم که حداقل یک سال سابقه فعالیت بانکی نزد بانک صادرات دارند. برای بررسی هدف موردنظر، درخت تصمیم CHAID یکی از الگوریتم های داده کاوی مورد استفاده قرار گرفت. نتایج نشان داد متغیرهای سن، تحصیلات مشتری و درجه شعبه بانک تاثیر معنی داری بر ارزش مشتری ندارند. تعداد تراکنش مشتری با بانک موثرترین ویژگی مشتری در تشخیص طبقه مشتری می باشد. 3- Customer Relationship Management تفاصيل المقالة
      • حرية الوصول المقاله

        74 - Using Fuzzy C-means to Discover Concept-drift Patterns for Membership Functions
        Tzung-Pei Hong Chun-Hao Chen Yan-Kang Li Min-Thai Wu
        People often change their minds at different times and at different places. It is important and valuable to indicate concept-drift patterns in unexpected ways for shopping behaviours for commercial applications. Research about concept drift has been growing in recent ye أکثر
        People often change their minds at different times and at different places. It is important and valuable to indicate concept-drift patterns in unexpected ways for shopping behaviours for commercial applications. Research about concept drift has been growing in recent years. Many algorithms dealt with concept-drift information and detected new market trends. This paper proposes an approach based on fuzzy c-means (FCM) to mine the concept drift of fuzzy membership functions. The proposed algorithm is subdivided into two stages. In the first stage, individual fuzzy membership functions are generated from different training databases by the proposed FCM-based approach. Then, the proposed algorithm will mine the concept-drift patterns from the sets of fuzzy membership functions in the second stage. Experiments on simulated datasets were also conducted to show the effectiveness of the approach. تفاصيل المقالة
      • حرية الوصول المقاله

        75 - Forecasting Of Tehran Stock Exchange Index by Using Data Mining Approach Based on Artificial Intelligence Algorithms
        Mohammad Mahmoodi Akbar Ghasemi
        Uncertainty in the capital market means the difference between the expected values ​​and the amounts that actually occur. Designing different analytical and forecasting methods in the capital market is also less likely due to the high amount of this and the need to know أکثر
        Uncertainty in the capital market means the difference between the expected values ​​and the amounts that actually occur. Designing different analytical and forecasting methods in the capital market is also less likely due to the high amount of this and the need to know future prices with greater certainty or uncertainty. In order to capitalize on the capital market, investors have always sought to find the right share for investment and the right price to buy and sell, and so all the predicted models always seek to answer the three basic questions, i.e., which share, to what extent When and at what price to buy or sell. Before answering the answers given to these questions, you have to answer a more serious question. Including whether forecasting financial markets is possible. Accordingly, in this research, using data mining, we proposed a method for predicting changes in the total stock index of Tehran stock exchanges. The purpose of this research is in the field of applied research. In terms of its implementation, the research is based on a causal research that is carried out using a data collection database. Based on the results obtained from this study on the best decision tree algorithm with respect to the accuracy of 94% of the C & R Tree algorithm, it can be said that this algorithm can be better than predicting stock price changes. Also, using decision tree can also predict changes in the price of the payment. تفاصيل المقالة
      • حرية الوصول المقاله

        76 - Sport Result Prediction Using Classification Methods
        Arash Mazidi Mehdi Golsorkhtabaramiri Naznoosh Etminan
        Traditional sport was based on the ability of the players and less science and knowledge was considered. However, sport has become a profession and an industry. Therefore, the use of technology and analysis on data in order to achieve goals is very important. Classifica أکثر
        Traditional sport was based on the ability of the players and less science and knowledge was considered. However, sport has become a profession and an industry. Therefore, the use of technology and analysis on data in order to achieve goals is very important. Classification is one of technologies to classify new incoming samples. Furthermore, sports produce considerable information about each season, teams, matches and players. Classification on sport data helps managers and coaches in order to predict the match result, evaluate the player performance, predict the player injury, identify the sports talent and evaluate the match strategy. There are many algorithms to predict the basketball results, track the health of players and determine the strategy of the match against different opponents, which help coaches a lot. Further, preprocessing procedure makes better dataset. In this paper, we use classification methods on sport dataset using preprocessing procedure and without preprocessing. The results show an improvement was obtained results using preprocessing. تفاصيل المقالة
      • حرية الوصول المقاله

        77 - Identification and Clustering Outsourcing Risks of Aviation Part- Manufacturing Projects in Aviation Industries Organization Using Kmeans Method
        Alireza Abbasi Mehrdad Nikbakht
        The purpose of this paper is to identify and clustering strategic risks in the outsourcing field of partmanufacturingprojects of aviation products, that whit survey carried out through the study ofliterature and experts opinion, meanwhile, identification risk groups in أکثر
        The purpose of this paper is to identify and clustering strategic risks in the outsourcing field of partmanufacturingprojects of aviation products, that whit survey carried out through the study ofliterature and experts opinion, meanwhile, identification risk groups in this area through interview,identified cases and factors of risks through FMEA technique, finally, 50 strategic risks identified in7 titles. In the following to resolve problems of traditional FMEA method, with definition threeindicators risk include, risk intensity, occurrence probability, and confrontation frequency by aquestionnaire and considering from three factors outsourcing assess contain cost, time and quality,risks of this area were clustered to K-means clustering and using SPSS software in 4 cluster includeof significant risks, high level of risks, medium level of risks and low level of risks. Thus, theclustering of risks for decision-making and planning of suggested actions at the time of theiroccurrence, basis for future improvements will be provided to carry out the continuousimprovement process at appropriate intervals with assessment of actions taken, the rate ofimprovement identified and therefore appropriate decisions are achieved. تفاصيل المقالة
      • حرية الوصول المقاله

        78 - مدلی برای پیش‌بینی عملکرد دانشجویان دانشگاه جامع علمی کاربردی در آزمون متمرکز مبتنی بر داده‌کاوی
        مصطفی یوسفی طزرجان اسرافیل علاء مریم ملاباقر
        هدف این پژوهش، ارائه الگویی جهت پیش‌بینی نمرات دانشجویان دانشگاه جامع علمی کاربردی در آزمون‌های متمرکز، در نیم‌سال‌های آتی دانشگاه بوده است. بدین منظور وضعیت نمرات 207/19 دانشجو/ درس در 8 عنوان درسی در 6 استان و 120 مرکز آموزشی که به صورت متمرکز در مقطع کاردانی و کارشن أکثر
        هدف این پژوهش، ارائه الگویی جهت پیش‌بینی نمرات دانشجویان دانشگاه جامع علمی کاربردی در آزمون‌های متمرکز، در نیم‌سال‌های آتی دانشگاه بوده است. بدین منظور وضعیت نمرات 207/19 دانشجو/ درس در 8 عنوان درسی در 6 استان و 120 مرکز آموزشی که به صورت متمرکز در مقطع کاردانی و کارشناسی و هم‌زمان در سراسر کشور در نیم‌سال دوم تحصیلی 98-1397 برگزار شده ، مورد مطالعه قرار گرفته است و با استفاده از روش انتخاب ویژگی، مؤثرترین آن‌ها انتخاب شدند. برای روشن‌تر شدن روابط بین ویژگی‌های انتخاب شده با استفاده از مدل درخت تصمیم‌گیری و الگوریتم C5.0 ، با استفاده از نرم‌افزار SPSS Modeler و 10 شاخص مؤثر، مدلی برای پیش‌بینی نمرات دانشجویان در نیم‌سال‌ آتی در دروس مصوب آزمون متمرکز ارائه شده است. این الگوی پیش‌بینی می‌تواند برای کارآمدتر ساختن فرآیند یادگیری در سیستم دانشگاهی مؤثر باشد. از نتایج این مدل می‌توان به پیشنهادهایی برای اصلاح فرآیند آزمون، یافتن دانشجویان و مراکز و شرایط خارج از الگو جهت نظارت بیش‌تر و شناسایی مراکزی که میانگین معدل دانشجویان‌شان بالا بوده اما در آزمون متمرکز عملکرد ضعیف ضعیفی داشتند، اشاره کرد. تفاصيل المقالة
      • حرية الوصول المقاله

        79 - Eco-Efficiency Evaluation in Two-Stage Network Structure: Case Study: Cement Companies
        Mirpouya Mirmozaffari
        The cement industry, as a primary trade, plays an important role in the development of a country's organization. This industry in Iran, however, despite of profuse benefits such as high-value mines, faces many challenges. Problems such as exploitation of the production أکثر
        The cement industry, as a primary trade, plays an important role in the development of a country's organization. This industry in Iran, however, despite of profuse benefits such as high-value mines, faces many challenges. Problems such as exploitation of the production require the need for doing research into this area. The main purpose of this paper is to examine the Eco-efficiency in Iran's 22 local cement companies over 2012-2016. This paper develops a Charnes, Cooper & Rhodes input oriented (CCRIO) Data Envelopment Analysis (DEA) approach for measuring the efficiency of decision processes which can be separated into two stages. The first stage uses its specific inputs to produce outputs, which part of them are consequently considered as the inputs of the second stage. The first stage is considered as the production stage and the second stage as the pollution control stage. A novel converting two-stage to one stage model is proposed to obtain the Eco-efficiency. Consequently, Malmquist productivity index (MPI) is computed to assess productivity. Although DEA is a respected method for evaluating, it fails to extract unknown information. In this study data mining decision tree and Apriori algorithms are used to extract hidden rules, and to remove unrelated data. تفاصيل المقالة
      • حرية الوصول المقاله

        80 - Improved Automatic Clustering Using a Multi-Objective Evolutionary Algorithm With New Validity measure and application to Credit Scoring
        مجید محمدی راد مهدی افضلی
        In data mining, clustering is one of the important issues for separation and classification with groups like unsupervised data. In this paper, an attempt has been made to improve and optimize the application of clustering heuristic methods such as Genetic, PSO algorithm أکثر
        In data mining, clustering is one of the important issues for separation and classification with groups like unsupervised data. In this paper, an attempt has been made to improve and optimize the application of clustering heuristic methods such as Genetic, PSO algorithm, Artificial bee colony algorithm, Harmony Search algorithm and Differential Evolution on the unlabeled data of an Iranian bank with the credit scoring approach. A survey was also used to measure the clustering validity index which resulted in a new validity index. Finally, the results were compared to identify the best algorithm and validity measure. تفاصيل المقالة
      • حرية الوصول المقاله

        81 - بهبود دقت روش هارگریوز در برآورد تبخیر- تعرق مرجع به کمک ضریب اصلاحی با مدل شبکه عصبی مصنوعی و درخت تصمیم M5
        امید محترمی سید محمدرضا حسینی روح الله فتاحی تیمور سهرابی
        تبخیر- تعرق یکی از مهم ترین اجزای چرخه هیدرولوژی است که مدلسازی آن در مدیریت منابع آب نقش مهمی دارد. در تحقیق حاضر امکان بهبود دقت برآورد تبخیر- تعرق روش هارگریوز به کمک ضریب اصلاحیK با استفاده از مدل شبکه عصبی مصنوعی و مدل درخت تصمیم M5 مورد بررسی قرار گرفت. این ضریب ب أکثر
        تبخیر- تعرق یکی از مهم ترین اجزای چرخه هیدرولوژی است که مدلسازی آن در مدیریت منابع آب نقش مهمی دارد. در تحقیق حاضر امکان بهبود دقت برآورد تبخیر- تعرق روش هارگریوز به کمک ضریب اصلاحیK با استفاده از مدل شبکه عصبی مصنوعی و مدل درخت تصمیم M5 مورد بررسی قرار گرفت. این ضریب برابر با نسبت تبخیر- تعرق مدل پنمن مونتیث فائو به روش هارگریوز می باشد. داده های مورد استفاده این تحقیق عبارت از دمای حداکثر و حداقل و رطوبت نسبی در بازه ی زمانی 2013-2004 از ایستگاه فرخشهر و فرودگاه در منطقه ی خشک سرد شهرکرد می باشد. شبکه طراحی شده یک شبکه پرسپترون چند لایه با الگوریتم آموزشی لونبرگ مارکوات و تابع تانژانت سیگموئید در لایه پنهان می باشد. مدل درخت تصمیمم به کمک نرم افزار WEKA طراحی گردید. نتایج نشان می دهد که شبکه عصبی و مدل درخت تصمیمم عملکرد خوبی در مدلسازی ضریب اصلاحی دارند، ولی عملکرد مدل شبکه عصبی دقیق تر است. نتایج نشان داد که قبل از استفاده از ضریب اصلاحی دقت مدل هارگریوز RMSE=0.90 (ریشه میانگین مربعات خطا) نسبت به روش پنمن مونتیث فائو بود که این مقدار بعد از استفاده از ضریب اصلاحی به کمک شبکه عصبی به RMSE=0.69 و با از استفاده از ضریب اصلاحی به کمک درخت تصمیمم به RMSE=0.72 رسید. به طور کلی نتایج نشان داد که بعد از استفاده از ضریب اصلاحی عملکرد مدل هارگریوز بهبود یافته است. تفاصيل المقالة
      • حرية الوصول المقاله

        82 - کشف دانش حاکم بر ویژگی‌های جمعیت‌شناختی مشتریان در انتخاب بانک‌ها با استفاده از قوانین انجمنی در داده کاوی
        ناصر قبولی علیرضا بافنده زنده صمد عالی
        هدف از پژوهش حاضر کشف دانش حاکم بر ویژگی های جمعیت شناختی مشتریان در انتخاب بانک‌ها با استفاده از قوانین انجمنی در داده کاوی است تصمیم گیری مؤثر و یادگیری در دنیای در حال رشد و با پیچیدگی های چشمگیر علاوه بر وجود مدیران و رهبرانی متفکر، نیاز به ابزارهایی جهت درک ساختاره أکثر
        هدف از پژوهش حاضر کشف دانش حاکم بر ویژگی های جمعیت شناختی مشتریان در انتخاب بانک‌ها با استفاده از قوانین انجمنی در داده کاوی است تصمیم گیری مؤثر و یادگیری در دنیای در حال رشد و با پیچیدگی های چشمگیر علاوه بر وجود مدیران و رهبرانی متفکر، نیاز به ابزارهایی جهت درک ساختارهای سیستم های پیچیده و تلخیص انبوه داده ها و تولید دانش برای تصمیم گیری دارند. اکثر کسب‌وکارها، مشتریان کلیدی خود را از طریق ویژگی جمعیت شناختی متنوع شناسایی می کنند. کسب‌وکارها همچنین مصرف کنندگان خود را به وسیلۀ ویژگی های مشابه در تبلیغات و ترفیعات برنامه های بازاریابی خود هدف قرار می‌دهند. هدف گیری مصرف کنندگان با ویژگی های جمعیت شناختی مشابه به حداکثرسازی فروش و سودآوری کسب‌وکار کمک می نماید. بانک‌ها نیز به عنوان بخش مهمی از اقتصاد یک کشور از این قاعده مستثنی نیستند. داده‌کاوی این مسأله را با فراهم کردن روش‌ها و نرم‌افزارهایی برای خودکارسازی تحلیل‌ها و اکتشاف از مجموعۀ داده‌های بزرگ و پیچیده حل می‌کند. این پژوهش بر اساس استاندارد CRISP-DM انجام گرفته و داده ها با پرسشنامه جمع آوری شده و نتایج آن به‌صورت بانک اطلاعاتی به یک نود منبع تبدیل و سپس با استفاده از نرم‌افزار spss modeler قوانین انجمنی مربوط به رفتار مشتریان آن بانک استخراج شده است. قوانین استخراج نشان‌دهندۀ تغییر ها، چه تأثیری در سایر عوامل و در نهایت در دستیابی به اهداف دارند. تفاصيل المقالة
      • حرية الوصول المقاله

        83 - Feature Selection And Clustering By Multi-objective Optimization
        Seyedeh Mohtaram Daryabari Farhad Ramezani
        In this paper, feature selection and clustering is formulated simultaneously by using evolutional multi-objective algorithm. Archived multi-objective NSGA-II is hybridized with k-medoids algorithm to use global searching capabilities of GA with local searching capabilit أکثر
        In this paper, feature selection and clustering is formulated simultaneously by using evolutional multi-objective algorithm. Archived multi-objective NSGA-II is hybridized with k-medoids algorithm to use global searching capabilities of GA with local searching capabilities of k-medoids for suitable centers of clusters and selecting suitable subset of features identifying the correct partitioning. Number of clusters should be determined as an input parameter by user. After determining number of clusters, archive string be generate randomly. In every solution of archived, center of clusters and features is determined. Objective functions are inter-cluster distance, intra-cluster distance and number of feature selection. Three objective functions are optimized simultaneously for partitioning and feature selection. Crossover and mutation operators are modified to solve the problem. In order to selecting final solution from pareto front, are modified to solve the problem is calculated. The Proposed algorithm were compared with other three clustering algorithms on seven UCI standard datasets and could improve results averagely 0.09 percent compared to FeaClusMoo, 0.28 percent compared to VGAPS-Clustering and 0.49 percent compared to K-means. تفاصيل المقالة
      • حرية الوصول المقاله

        84 - SRV: A Striking Model based on Meta-Classifier for Improving Diagnosis Type 2 Diabetes
        Razieh Asgarnezhad
        Diagnosis of diabetes is a classification problem that attracts more in recent years. Diabetes mellitus happens when the whole body cannot provide an adequate quantity of insulin to adjust glucose levels. In the low insulin level, food products in glucose are turned int أکثر
        Diagnosis of diabetes is a classification problem that attracts more in recent years. Diabetes mellitus happens when the whole body cannot provide an adequate quantity of insulin to adjust glucose levels. In the low insulin level, food products in glucose are turned into glucose, improving the sugar to a more than average level. All existing works show that many techniques are successful for this disease, Artificial Intelligence. There exist many classification models to aim the prediction of diabetes. We introduce a novel model to investigate the role of pre-processing and data reduction for classification problems in the diagnosis of diabetes. The model has four steps consisting of Pre-processing, Feature sub-selection, Classification, and Performance. In the classification technique, we apply the voting technique with three classifiers. Many experiments were conducted to reveal the performance of the proposed work for the diagnosis of diabetics. The results confirmed the superiority of our model over its counterparts, and the best accuracy, precision, recall, and F1 were achieved at 96.67, 100, 100, and 94.01%, respectively. تفاصيل المقالة
      • حرية الوصول المقاله

        85 - NSE: An effective model for investigating the role of pre-processing using ensembles in sentiment classification
        Razieh Asgarnezhad Amirhassan Monadjemi
        With the extensive Internet applications, review sentiment classification has attracted increasing interest among text mining experts. Traditional bag of words approaches did not indicate multiple relationships connecting words while emphasizing the pre-processing phase أکثر
        With the extensive Internet applications, review sentiment classification has attracted increasing interest among text mining experts. Traditional bag of words approaches did not indicate multiple relationships connecting words while emphasizing the pre-processing phase and data reduction techniques, making a huge performance difference in classification. This study suggests a model as a different efficient model for multi-class sentiment classification using sampling techniques, feature selection methods, and ensemble supervised classification to increase the performance of text classification. The feature selection phase of our model has applied n-grams, a computational method that optimizes feature selection procedure by extracting features based on the relationships of the words to improve a candidate selection of features. The proposed model classifies the sentiment of tweets and online reviews through ensemble methods, including boosting, bagging, stacking, and voting in conjunction with supervised methods. Besides, two sampling techniques were applied in the pre-processing phase. In the experimental study, a comprehensive range of comparative experiments was conducted to assess the effectiveness of our model using the best existing works in the literature on well-known movie reviews and Twitter datasets. The highest accuracy and f-measure for our model obtained 92.95 and 92.65% on the movie dataset, 90.61 and 87.73% on the Twitter dataset, respectively. تفاصيل المقالة
      • حرية الوصول المقاله

        86 - A Review of Different Data Mining Techniques in Customer Segmentation
        Tannane Parsa Kord Asiabi Reza Tavoli
        Customers are the most valuable asset of an organization. Due to high contest in the business field, it is necessary to regard the Customer Relationship Management (CRM) of the enterprise. Data Mining and Machine Learning methods been utilized by businesses in recent ye أکثر
        Customers are the most valuable asset of an organization. Due to high contest in the business field, it is necessary to regard the Customer Relationship Management (CRM) of the enterprise. Data Mining and Machine Learning methods been utilized by businesses in recent years in order to improve CRM. CRM is the strategy for building, managing, and strengthening loyal and long lasting customer relationship. Data mining is the knowledge discovery process by analyzing the large volumes of data from various perspectives and summarizing it into useful information. Data mining have a several techniques in CRM but in this article we present the basic classification and clustering techniques that used. The target of this survey is to provide extensive review of different classification and clustering techniques in customer segmentation. تفاصيل المقالة
      • حرية الوصول المقاله

        87 - Double Clustering Method in Hiding Association Rules
        Zahra Kiani Abari Mohammad Naderi Dehkordi
        Association rules are among important techniques in data mining which are used for extracting hidden patterns and knowledge in large volumes of data. Association rules help individuals and organizations take strategic decisions and improve their business processes. Extr أکثر
        Association rules are among important techniques in data mining which are used for extracting hidden patterns and knowledge in large volumes of data. Association rules help individuals and organizations take strategic decisions and improve their business processes. Extracted association rules from a database contain important and confidential information that if published, the privacy of individuals may be threatened. Therefore, the process of hiding sensitive association rules should be performed prior to sharing the database. This is done through changing the database transactions. These changes must be made in such a way that all sensitive association rules are hidden and a maximum number of non-sensitive association rules are extractable from the sanitized database. In fact, a balance is to be established between hiding the sensitive rules and extracting the non-sensitive rules. A new algorithm is presented in this paper to create a balance between preserving privacy and extracting knowledge. The items of sensitive rules are clustered in the proposed algorithm, in order to reduce changes. In fact, reduction of changes and clustering of rules are applied in order to reduce the side effects of the hiding process on non-sensitive rules. تفاصيل المقالة
      • حرية الوصول المقاله

        88 - Proposing a Method to Classify Texts Using Data Mining
        Mohammad Rostami Seyed Saeed Ayat Iman Attarzadeh Farid Saghari
        Today a significant part of available data is saved in text database or text documents. The most important thing is to organize these documents. One way to organize text documents is to classify them. To classify texts is to assign text documents to their actual categor أکثر
        Today a significant part of available data is saved in text database or text documents. The most important thing is to organize these documents. One way to organize text documents is to classify them. To classify texts is to assign text documents to their actual categories. This has two main steps, i.e. feature- and learning algorithm selection. There have been several methods suggested to classify text documents. In this paper, we propose a combined method to do this more efficiently. When selecting features, the proposed method uses filtering in order to reduce complexity and it is implemented using naïve Bayes and decision tree categories. Results indicate advantages of this combined method to individual classifying. تفاصيل المقالة
      • حرية الوصول المقاله

        89 - Customer Behavior Mining Framework (CBMF) using clustering and classification techniques
        Farshid Abdi Shaghayegh Abolmakarem
        The present study proposes a Customer Behavior Mining Framework on the basis of data mining techniques in a telecom company. This framework takes into account the customers’ behavior patterns and predicts the way they may act in the future. Firstly, clustering tec أکثر
        The present study proposes a Customer Behavior Mining Framework on the basis of data mining techniques in a telecom company. This framework takes into account the customers’ behavior patterns and predicts the way they may act in the future. Firstly, clustering technique is used to implement portfolio analysis and previous customers are divided based on socio-demographic features usingk-means algorithm. Then, the cluster analysis is conducted based on two criteria, i.e., the number of hours the telecom services used and the number of the services selected by customers of each group. Six groups of customers are identified in three levels of attractiveness according to the results ofthecustomer portfolio analysis. The second phase has been devoted to mining the future behavior of the customers. Predicting the level of attractiveness of newcomer customers and also the churn behavior of these customers are accomplished in the second phase. This framework effectively helps the telecom managers mine the behavior of their customers. This may lead to develop appropriate tactics according to customers’ attractiveness and their churn behavior. Improving managers’ abilities in customer relationship management is one of the obtained results of the study. تفاصيل المقالة
      • حرية الوصول المقاله

        90 - Application of Kansei engineering and data mining in the Thai ceramic manufacturing
        Chaiwat Kittidecha Koichi Yamada
        Ceramic is one of the highly competitive products in Thailand. Many Thai ceramic companies are attempting to know the customer needs and perceptions for making favorite products. To know customer needs is the target of designers and to develop a product that must satisf أکثر
        Ceramic is one of the highly competitive products in Thailand. Many Thai ceramic companies are attempting to know the customer needs and perceptions for making favorite products. To know customer needs is the target of designers and to develop a product that must satisfy customers. This research is applied Kansei Engineering (KE) and Data Mining (DM) into the customer driven product design process. KE can translate customer emotions into the product attributes. This method determines the relationships between customer feelings or Kansei words and the design attributes. Decision tree J48 and Class association rule which implemented through Waikato Environment for Knowledge Analysis (WEKA) software are used to generate a predictive model and to find the appropriate rules. In this experiment, the emotion scores were rated by 37 participants for training data and 16 participants for test data. 6 Kansei words were selected, namely, attractive, ease of drinking, ease of handing, quality, modern and durable. 10 mugs were selected as product samples. The results of this study indicate that the proposed models and rules can interpret the design product elements affecting the customer emotions. Finally, this study provides useful understanding for the application DM in KE and can be applied to a variety of design cases. تفاصيل المقالة
      • حرية الوصول المقاله

        91 - Development of an evolutionary fuzzy expert system for estimating future behavior of stock price
        Azam Goodarzi Amirhossein Amiri Shervin Asadzadeh Farhad Mehmanpazir Shahrokh Asadi
        The stock market has always been an attractive area for researchers since no method has been found yet to predict the stock price behavior precisely. Due to its high rate of uncertainty and volatility, it carries a higher risk than any other investment area, thus the st أکثر
        The stock market has always been an attractive area for researchers since no method has been found yet to predict the stock price behavior precisely. Due to its high rate of uncertainty and volatility, it carries a higher risk than any other investment area, thus the stock price behavior is difficult to simulation. This paper presents a “data mining-based evolutionary fuzzy expert system” (DEFES) approach to estimate the behavior of stock price. This tool is developed in seven-stage architecture. Data mining is used in three stages to reduce the complexity of the whole data space. The first stage, noise filtering, is used to make our raw data clean and smooth. Variable selection is second stage; we use stepwise regression analysis to choose the key variables been considered in the model. In the third stage,K-means is used to divide the data into sub-populations to decrease the effects of noise and rebate complexity of the patterns. At next stage, extraction of Mamdani type fuzzy rule-based system will be carried out for each cluster by means of genetic algorithm and evolutionary strategy. In the fifth stage, we use binary genetic algorithm to rule filtering to remove the redundant rules in order to solve over learning phenomenon. In the sixth stage, we utilize the genetic tuning process to slightly adjust the shape of the membership functions. Last stage is the testing performance of tool and adjusts parameters. This is the first study on using an approximate fuzzy rule base system and evolutionary strategy with the ability of extracting the whole knowledge base of fuzzy expert system for stock price forecasting problems. The superiority and applicability of DEFES are shown for International Business Machines Corporation and compared the outcome with the results of the other methods. Results with MAPE metric and Wilcoxon signed ranks test indicate that DEFES provides more accuracy and outperforms all previous methods, so it can be considered as a superior tool for stock price forecasting problems. تفاصيل المقالة
      • حرية الوصول المقاله

        92 - Customer lifetime value model in an online toy store
        B Nikkhahan A Habibi Badrabadi M.J Tarokh
        Business all around the world uses different approaches to know their customers, segment them and formulate suitable strategies for them. One of these approaches is calculating the value of each customer for the company. In this paper by calculating Customer Lifetime Va أکثر
        Business all around the world uses different approaches to know their customers, segment them and formulate suitable strategies for them. One of these approaches is calculating the value of each customer for the company. In this paper by calculating Customer Lifetime Value (CLV) for individual customers of an online toy store named Alakdolak, three customer segments are extracted. The level of profitability for customers is identified, and finally suitable marketing strategies for each segment are developed. The results indicate that the company should increase its low price products and develop special programs for those that buy high price products and have high loyalty. Logistic regression as a data mining technique is used to present the customer defection and future purchase probability models and for each model, verification and validation is done. تفاصيل المقالة
      • حرية الوصول المقاله

        93 - بررسی وب‌سایت‌های شهرداری تهران و ارایه راه‌کارهای مناسب داده‌کاوی
        شایسته شجاعی کاریزکی سودابه شاپوری هاجر زارعی
        هدف: هدف اصلی این پژوهش، شناسایی و تجزیه و تحلیل انواع داده‌های وب‌سایت شهرداری تهران و ارایه راه‌کارهای مناسب داده‌کاوی است. روش پژوهش: این پژوهش بنیادی است و از لحاظ ماهیت می‌توان آن را تحلیلی در نظر گرفت. روش گردآوری داده‌های به صورت میدانی بوده‌است و جامعه آماری 47 أکثر
        هدف: هدف اصلی این پژوهش، شناسایی و تجزیه و تحلیل انواع داده‌های وب‌سایت شهرداری تهران و ارایه راه‌کارهای مناسب داده‌کاوی است. روش پژوهش: این پژوهش بنیادی است و از لحاظ ماهیت می‌توان آن را تحلیلی در نظر گرفت. روش گردآوری داده‌های به صورت میدانی بوده‌است و جامعه آماری 47 سایت که از 220 دامنه شهرداری تهران انتخاب شده‌است و برای تجزیه و تحلیل از تکنیک‌های داده‌کاوی استفاده شده‌است و منبع گردآوری داده‌ها وب‌سنجی و ابزار مورد استفاده گوگل آنالیتیکس می‌باشد. یافته‌ها: میزان دقت الگوریتم شبکه عصبی معمولی برابر با 25/99%  و در نهایت معیار آر.ام.اس.ای الگوریتم شبکه عصبی معمولی برابر با 159/0 است. میزان دقت الگوریتم درخت تصمیم برابر با 99.80% ؛  معیار ام.اس.ای الگوریتم درخت تصمیم برابر با 003/0 و در نهایت معیار آر.ام.اس.ای الگوریتم درخت تصمیم برابر با 045/0است. میزان دقت الگوریتم کی.ان.ان برابر با 81/99%  و در نهایت معیار آر.ام.اس.ای الگوریتم کی.ان.ان برابر با 035/0 است نتیجه‌گیری: بر اساس یافته‌های بدست آمده روش دی.بی.اسکن با سایر روش‌های پایه جهت تجزیه و تحلیل داده‌های وب‌سایت‌های شهرداری تهران برابر و نسبت به سایر روش‌ها از دقت بالاتری برخوردار است. تفاصيل المقالة
      • حرية الوصول المقاله

        94 - شناسایی روابط موضوعی بین منابع مورد استفاده توسط کاربران مرکز منطقه‌ای اطلاع رسانی علوم و فناوری با استفاده از تکنیک متن کاوی
        خجسته شعبانی عاصفه عاصمی
        هدف: هدف اصلی پژوهش حاضر بررسی روابط موضوعی در عناوین منابع مورد استفاده توسط کاربران رایسست با استفاده از تکنیک متن کاوی بود. بنابراین، به بازتاب چگونگی روابط موضوعی در منابع اطلاعاتی کاربران در مرکز رایسست مبادرت شده، تا از طریق شناخت به رفتار و احساس استفاده کنندگان أکثر
        هدف: هدف اصلی پژوهش حاضر بررسی روابط موضوعی در عناوین منابع مورد استفاده توسط کاربران رایسست با استفاده از تکنیک متن کاوی بود. بنابراین، به بازتاب چگونگی روابط موضوعی در منابع اطلاعاتی کاربران در مرکز رایسست مبادرت شده، تا از طریق شناخت به رفتار و احساس استفاده کنندگان دست یابند.روش پژوهش: روش پژوهش مبتنی بر متن کاوی بود، که به داده کاوی بر روی متن، تحلیل متن و به منظور فرایند استخراج اطلاعات با کیفیت از متن اشاره دارد. دسترسی اطلاعات به متن کامل مقالات مجلات علمی – پژوهشی، علمی – ترویجی، مجموعه مقالات کنفرانس‌ها و همایش‌های علمی، کتاب‌های لاتین و فارسی جامعه آماری پژوهش را تشکیل داده، که با استفاده از روش سرشماری، کلیه داده‌های حاصل از گزارش‌گیری توسط رایسست بررسی گردید. به منظور تجزیه و تحلیل داده‌ها و تحلیل متن از نرم افزار ویانت، و برای پاکسازی و نرمال سازی داده‌ها از نرم افزار پایتون بهره جویی گردید.یافته ها: براساس یافته‌ها از داده‌های حاصل شده، 21 کلمه و 160 کلمه موضوعی پرتکرار از منبع مورد استفاده در پایگاه اطلاعاتی رایسست مشخص گردید. دور نمای لوم از چگونگی توزیع کلمات موضوعی با تکرار بالا تهیه شده و ضریب همبستگی تکرار موضوعات پر استفاده در عنوان‌های منابع اطلاعاتی تدوین شد. به منظور تدوین نمایه درهم کرد کلمات موضوعی پر تکرار ترند (Trend) استفاده شد.نتیجه‌گیری: نتایج نشان داد که تدوین پژوهش در مجموعه سازی منابع الکترونیکی پایگاه‌های اطلاعاتی و پیش‌نگری در آینده این دسته از منابع به مدیران مراکز اطلاع رسانی و کاربران آنها مفید است. تفاصيل المقالة
      • حرية الوصول المقاله

        95 - تعیین مهم ترین ویژگی های کمی و کیفی متمایزکننده سرده Rubus L. در ایران با استفاده از الگوریتم های دسته بندی و انتخاب ویژگی
        محمد جواد شیخ زاده
        جنس سرده Rubus L. متعلق به تیره Rosaceae و زیرتیره Rosoideae شامل حدود 750 گونه در دنیا است. این جنس در اکثر نواحی جهان پراکنش دارد. در فلور ایران تعداد هشت گونه و پنج هیبرید (دو رگه) گزارش شده است. تمشک یکی از پر چالش‌ترین جنس‌ها در بین گیاهان گل‌دار می‌باشد. وجود عوام أکثر
        جنس سرده Rubus L. متعلق به تیره Rosaceae و زیرتیره Rosoideae شامل حدود 750 گونه در دنیا است. این جنس در اکثر نواحی جهان پراکنش دارد. در فلور ایران تعداد هشت گونه و پنج هیبرید (دو رگه) گزارش شده است. تمشک یکی از پر چالش‌ترین جنس‌ها در بین گیاهان گل‌دار می‌باشد. وجود عواملی از جمله پلی‌پلوئیدی، آپومیکسی و دورگه‌گیری زیاد در این جنس باعث مشکلاتی در تشخیص از نظر ریخت شناسی شده است. جمع آوری داده‌های کمی و کیفی جهت تشخیص گونه‌ها و روش‌های جمع‌آوری مولفه‌های ریخت‌ شناسی بسیار زمانبر و پر هزینه است. بنابراین، بکارگیری روش-های متفاوت در جهت کاهش زمان و هزینه‌ها همواره مطرح می‌باشد. در بسیاری از موارد، جهت آنالیز داده‌های زیستی روش‌های داده کاوی بکار گرفته می‌شود. در این مقاله، از ترکیب الگوریتم‌های مختلف انتخاب ویژگی و دسته‌بندی برای تشخیص ویژگی‌های متمایزکننده بین گونه‌های سرده Rubus L. استفاده شد. با بکارگیری روش‌ دسته‌بندی Random Forest و مدل انتخاب ویژگی InfoGainAttributeEval با تعداد 28 ویژگی به دقت 05/94 درصد در دسته‌بندی رسیدیم که بهترین الگوریتم از نظر دقت می‌باشد و با استفاده از روش MLP و مدل انتخاب ویژگی SymetricalAttributeEval، با تعداد 4 ویژگی دقت دسته‌بندی 32/84 درصد حاصل شد که بهترین الگوریتم از نظر تعداد اندک ویژگی‌های انتخاب شده است. چهار ویژگی فوق توسط اکثر الگوریتم‌های استفاده شده در این مقاله انتخاب شدند. تمامی این ویژگی‌ها کیفی هستند و جهت بدست آوردن آنها نیازی به هزینه‌ اندازه‌گیری آزمایشگاهی نمی‌باشد. بنابراین می-توانند معیار مناسبی جهت کلید شناسایی باشند. تفاصيل المقالة
      • حرية الوصول المقاله

        96 - Application of Satellite Data and Data Mining Algorithms in Estimating Coverage Percent (Case study: Nadoushan Rangelands, Ardakan Plain, Yazd, Iran)
        Zinab Mirshekari Majid Sadeghinia Saeideh Kalantari Maryam Asadi
        Assessing and monitoring rangelands in arid regions are important and essential tasks in order to manage the desired regions. Nowadays, satellite images are used as an approximately economical and fast way to study the vegetation in a variety of scales. This research ai أکثر
        Assessing and monitoring rangelands in arid regions are important and essential tasks in order to manage the desired regions. Nowadays, satellite images are used as an approximately economical and fast way to study the vegetation in a variety of scales. This research aims to estimate the coverage percent using the digital data given by ETM+ Landsat satellite. In late May and early June 2018, the vegetation was measured in Ardakan plain, Yazd province, Iran. Information was obtained by 320 plots in 40 transects and also, the satellite images in terms of sampling time were downloaded and processed in USGS website. 16 indices involving NDVI, NIR, MSI, SS, IR1, MIRV1, NVI, TVI, RAI, SAVI, LWC, PD322, PD321, PD312, PD311 and IR2 were estimated. Through estimating the indices and extracting the values in order to conduct index-based predictions, six data mining models of Artificial Neural Network (ANN), the K Nearest Neighbor (KNN), Gaussian Process (GP), Linear Regression (LR), Support Vector Machine (SVM) and Decision Tree (DT M5) have been applied. Model assessment results indicated high vegetation estimate efficiency based on the indices but the model KNN with Root Mean Square Error (RMSE= 2.520) and Coefficient of determination (R2= 0.94) and (RMSE= 2.872 and R2= 0.96) had the highest accuracy in the training and data sets, respectively. As well, to determine the weight and importance of parameters, and to estimate the coverage percent, the weighing process were conducted based on support vector machine. Weighing results indicated that the KNN model and the Simple Subtraction (SS) index had higher weight and importance in terms of vegetation percent. تفاصيل المقالة
      • حرية الوصول المقاله

        97 - ارایه الگوی دسته بندی مشتریان با رویکرد داده کاوی ترکیبی( مورد مطالعه صنعت محصولات بهداشتی و آرایشی)
        امید بشردوست عزت اله اصغری زاده محمدعلی افشار کاظمی
        با توجه به حجم انباشته شده اطلاعات خرید مشتریان و پیچیدگی رقابت در عصر حاضر اهمیت ایجاد بستری برای تحلیل داده‌های به روز ودقیق مشتریان، باهدف ایجاد ارتباط‌های مؤثر با مشتریان فعلی و وفادار، بیش از پیش برای سازمان‌ها به عنوان یک مزیت رقابتی جلوه‌گر شده است. هدف این پژوهش أکثر
        با توجه به حجم انباشته شده اطلاعات خرید مشتریان و پیچیدگی رقابت در عصر حاضر اهمیت ایجاد بستری برای تحلیل داده‌های به روز ودقیق مشتریان، باهدف ایجاد ارتباط‌های مؤثر با مشتریان فعلی و وفادار، بیش از پیش برای سازمان‌ها به عنوان یک مزیت رقابتی جلوه‌گر شده است. هدف این پژوهش بررسی الگوهای رفتاری خرید مشتریان محصول‌های بهداشتی به منظور دسته‌بندی آنها براساس مدل WRFMبا استفاده از روش‌های ترکیبی داده‌کاوی است. از میان مشتریان استان تهران که در بازه سالهای 1396- 1397 از شرکت خرید داشته اند از پایگاه داده های مشتریان 65534 نمونه، با روش نمونه گیری هدفمند در دسترس جمع آوری شده و به کمک SPSS مقدار RFM موزون با توجه به نظر خبرگان صنعت مشخص و سپس این فیلد به دیگر داده های پژوهش اضافه شده و توسط نرم افزار داده‌کاوی کلمنتاین بر اساس70 درصد داده ها، خوشه بندی مشتریان صورت گرفته است؛ همچنین به منظور بررسی کیفیت خوشه‌بندی از معیارهای امتیازجینی، درصد خطا، اطلاعات متقابل نرمال‌شده (NMI) استفاده شده است. نتایج پژوهش حکایت ازکارایی بالای روش خوشه‌بندی Kمیانگین با تعداد چهارخوشه با درصد خلوص (0/761)، برای بخش بندی مشتریان داشته است تفاصيل المقالة
      • حرية الوصول المقاله

        98 - A Machine Learning Approach to Detect Energy Fraud in Smart Distribution Network
        Mahdi Emadaleslami Mahmoud-Reza Haghifam
        Electricity utility have long sought to identify and reduce energy fraud as a significant part of non-technical losses (NTL). Generally, to determine customer’s honesty in consumption on-site inspection is vital. Since, inspecting all customers is expensive, utili أکثر
        Electricity utility have long sought to identify and reduce energy fraud as a significant part of non-technical losses (NTL). Generally, to determine customer’s honesty in consumption on-site inspection is vital. Since, inspecting all customers is expensive, utilities look for new ways to reduce inspection’s range to cases with a higher probability of fraud. One way to reduce the scope of inspection is to use machine learning (ML) algorithms to analysis consumption pattern. But, their performance is not satisfactory due to insufficiency of fraudulent customers. In this paper, a new two-stage ML-based model is presented to detect fraud in distribution network. . In the first stage, an Artificial Neural Network (ANN) is trained to model fraudulent customers, which is used to predict theft scenarios for normal consumers to handle data insufficiency. In the second stage, a Support Vector Machine (SVM) classifier is trained to distinguish normal and suspicious consumers. Assessment and comparison of the proposed algorithm to those of conventional models on a real data set with more than 5000 customers shows its high performance. تفاصيل المقالة
      • حرية الوصول المقاله

        99 - Comparing the speed and time of association extraction from database with cuckoo search and genetic algorithms
        Payam Abdolmohammadi Roham Farahani
        This paper aims to study the appropriate data mining method to extract the rules from a data set and examining the benefits of using the cuckoo algorithm to extract association rules and compare the execution time of the cuckoo algorithm and genetic algorithm (GA). Ther أکثر
        This paper aims to study the appropriate data mining method to extract the rules from a data set and examining the benefits of using the cuckoo algorithm to extract association rules and compare the execution time of the cuckoo algorithm and genetic algorithm (GA). Therefore, an algorithm is proposed that includes two parts: preprocessing and mining. The first part presents the procedures related to the calculation of cuckoo fit values and in the second part of the algorithm, which is the main achievement of this research. Support and confidence The best position can show the least confidence and support.These mining results can be used to continue mining the association rules. The proposed algorithm is based on the cuckoo search. It hides the sensitive relationship rules with a lower time cost and, at the same time, controls the peripheral effects of non-sensitive rules in a better way. This aim is achieved using recurring to the objective function. The GA is set to be the evaluation criterion to show the prominence of the proposed method. In this method, we compare the speed of the cuckoo algorithm with the genetic algorithm, which uses genetic evolution as a problem-solving model. In general, it is an algorithm based on repetition, most of its parts are selected as random processes, and these algorithms are part of the fitting function. It was chosen as a criterion and we paid .It is scientifically proven that the cuckoo algorithm outperforms the GA in the execution time. تفاصيل المقالة
      • حرية الوصول المقاله

        100 - Efficient Data Mining with Evolutionary Algorithms for Cloud Computing Application
        Hamid Malmir Fardad Farokhi Reza Sabbaghi-Nadooshan
        With the rapid development of the internet, the amount of information and data which are produced, are extremely massive. Hence, client will be confused with huge amount of data, and it is difficult to understand which ones are useful. Data mining can overcome this prob أکثر
        With the rapid development of the internet, the amount of information and data which are produced, are extremely massive. Hence, client will be confused with huge amount of data, and it is difficult to understand which ones are useful. Data mining can overcome this problem. While data mining is using on cloud computing, it is reducing time of processing, energy usage and costs. As the speed of data mining is very important, this paper proposes four faster classification algorithms in comparison with each other. In this paper, A Multi-Layer perceptron (MLP) Network is trained with Imperialist Competitive Algorithm (ICA), Particle Swarm Optimization (PSO), Differential Evolution (DE), and Invasive Weed Optimization (IWO) separately. The classifications are done on Wisconsin Breast Cancer (WBC) data base. At the end, to illustrate the speed and accuracy of these classifiers, they are compared with each other and two other types of Genetic algorithm classifiers (GA). تفاصيل المقالة
      • حرية الوصول المقاله

        101 - Predicting the Next State of Traffic by Data Mining Classification Techniques
        S.Mehdi Hashemi Mehrdad Almasi Roozbeh Ebrazi Mohsen Jahanshahi
        Traffic prediction systems can play an essential role in intelligent transportation systems (ITS). Prediction and patterns comprehensibility of traffic characteristic parameters such as average speed, flow, and travel time could be beneficiary both in advanced traveler أکثر
        Traffic prediction systems can play an essential role in intelligent transportation systems (ITS). Prediction and patterns comprehensibility of traffic characteristic parameters such as average speed, flow, and travel time could be beneficiary both in advanced traveler information systems (ATIS) and in ITS traffic control systems. However, due to their complex nonlinear patterns, these systems are burdensome. In this paper, we have applied some supervised data mining techniques (i.e. Classification Tree, Random Forest, Naïve Bayesian and CN2) to predict the next state of Traffic by a categorical traffic variable (level of service (LOS)) in different short-time intervals and also produce simple and easy handling if-then rules to reveal road facility characteristic. The analytical results show prediction accuracy of 80% on average by using methods تفاصيل المقالة
      • حرية الوصول المقاله

        102 - باز طراحی مدل فرآیند خدمات مددکاری و توانمندسازی با استفاده از تکنیک های داده کاوی و فرآیندکاوی (مطالعه موردی: کمیته امداد امام خمینی (ره) استان آذربایجان غربی)
        مهرداد محمدزاده علمداری منصور اسماعیل پور علیرضا اسلامبولچی کامران سرهنگی
        این پژوهش به بررسی میزان موفقیت مدل پیاده سازی شده فرایند خدمات مددکاری و توانمندسازی در بزرگترین نهاد حمایتی کشور پرداخته و با بهره گیری از تکنیک های نوین، نسبت به بازطراحی مدل اولیه اقدام نموده است. در این تحقیق داده های مربوط به منظور سنجش میزان تحقق اهداف کاربردی با أکثر
        این پژوهش به بررسی میزان موفقیت مدل پیاده سازی شده فرایند خدمات مددکاری و توانمندسازی در بزرگترین نهاد حمایتی کشور پرداخته و با بهره گیری از تکنیک های نوین، نسبت به بازطراحی مدل اولیه اقدام نموده است. در این تحقیق داده های مربوط به منظور سنجش میزان تحقق اهداف کاربردی با توزیع پرسش نامه در بین 100نفر از همکاران کمیته امداد در سطح 21 شهرستان استان آذربایجان غربی جمع آوری و با استفاده از متدولوژی CRISP-DM مراحل مختلف مبتنی بر داده کاوی انجام گردید. در ادامه به منظور پاسخگویی به سوال اصلی تحقیق، داده های مربوط به تعداد4687مددجویی که فرایند موجود را طی نموده بودند از طریق تکنیک های فرایندکاوی مورد بررسی قرار گرفت.نتایج حاصل نشان داد که مدل پیاده سازی شده، معیارهای 4 گانه کیفی را از جنبه سادگی محقق، ولی به منظور دستیابی کامل به مطابقت، عمومیت و دقت، نیاز به بازطراحی دارد. در این راستا با حذف حلقه تکرار در مسیر ۳، مدل اولیه بازطراحی گردید تا ضمن تحقق کامل اهداف کاربردی، با مد نظر قرار دادن مطالبات اقشار آسیب پذیر اجتماعی،ضمن تکریم و افزایش سطح رضایت مندی جامعه هدف، به عنوان الگویی موفق توسط سایر سازمانهای مردم نهاد غیردولتی در داخل و خارج کشور مورد بهره برداری قرار گیرد. تفاصيل المقالة
      • حرية الوصول المقاله

        103 - ارائه مدل ارزیابی عملکرد بانکهای بورسی کشور با رهیافت داده کاوی
        الهام آدخ عارفه فدوی اصغری محمد ابراهیم پورزرندی
        با رشد بانکهای خصوصی و مؤسسات مالی و اعتباری،رقابت بین آنها به منظور ارائه خدمات بهتر افزایش یافته است. با توجه به اهمیت موضوع،تدوین یک الگوی جامع و کامل برای ارزیابی بانکها ضروری به نظر می رسد. هر سازمان برای آگاهی از نقاط قوت و ضعف خود به ویژه در محیط های پویا نیازمند أکثر
        با رشد بانکهای خصوصی و مؤسسات مالی و اعتباری،رقابت بین آنها به منظور ارائه خدمات بهتر افزایش یافته است. با توجه به اهمیت موضوع،تدوین یک الگوی جامع و کامل برای ارزیابی بانکها ضروری به نظر می رسد. هر سازمان برای آگاهی از نقاط قوت و ضعف خود به ویژه در محیط های پویا نیازمند ارزیابی عملکرد می باشد. موضوع ارزیابی عملکرد آنقدر مورد توجه است که حتی در این باره صاحبنظران مدیریت معتقدند: "آنچه را که نتوان ارزیابی نمود، نمی توان مدیریت کرد".بنابراین بانک ها نیز همانند سایرسازمان ها در ایران برای ارائه خدمات متنوع تر و سریع ترو همچنین توسعه خود ، نیازمند ارزیابی عملکرد می باشند.[6]هدف اصلی این مقاله ارائه مدلی به منظور ارزیابی عملکرد بانکهای بورسی کشور با استفاده از روشهای داده کاوی می باشد. در این پژوهش، 4 مدل داده کاوی درخت تصمیم C5.0، درخت تصمیم C4.5، الگوریتم بیز و جنگل تصادفی، به منظور ارزیابی عملکرد بانک های پذیرفته شده در بورس اوراق بهادار تهران پیاده سازی و با یکدیگر مقایسه می گردند. بدین منظور نمونه ای مشتمل بر 28 نسبت مالی شامل نسبت های سودآوری، نقدینگی، حوزه کیفیت مدیریت ، حوزه کیفیت دارایی و کفایت سرمایه در 18 بانک بورس اوراق بهادار تهران درفاصله بین سالهای 1393 تا 1396 به عنوان متغیرهای مستقل و عملکرد بانکها درسه دسته قابل قبول، غیرقابل قبول ومتوسط به عنوان متغیر وابسته انتخاب گردیدند. نتایج حاکی از آن است که در بین کلیه مدلها درخت تصمیم C5.0 با صحت 94.4% بهترین مدل ارائه شده در این پژوهش می باشد. تفاصيل المقالة
      • حرية الوصول المقاله

        104 - ارزیابی عملکرد شعب بانک با رویکرد داده کاوی و سیستم خبره
        حمید اسلامی نصرت آبادی محمدجعفر تارخ علیرضا پورابراهیمی
        شعب بانک یکی از ارکان مهم بانکداری دیجیتال است و بررسی عملکرد آنها نقش مهمی در سودآوری و تحقق اهداف بانک در پی‌دارد. این پژوهش به ارزیابی عملکرد شعب بانک با استفاده از روشهای نوآورانه می‌پردازد. نخست به شناسایی شاخصهای مهم در خصوص ارزیابی عملکرد شعب پرداخته شده است. سپس أکثر
        شعب بانک یکی از ارکان مهم بانکداری دیجیتال است و بررسی عملکرد آنها نقش مهمی در سودآوری و تحقق اهداف بانک در پی‌دارد. این پژوهش به ارزیابی عملکرد شعب بانک با استفاده از روشهای نوآورانه می‌پردازد. نخست به شناسایی شاخصهای مهم در خصوص ارزیابی عملکرد شعب پرداخته شده است. سپس روش پیشنهاد‌ی برروی داده‌های شعب بانک در قالب مطالعه موردی پیاده‌سازی گردیده است. بدین منظور ابتدا خوشه بندی انجام گردید تا شعب کارا و نیمه کارا و ناکارا از یکدیگر تفکیک گردند. سپس بر اساس برچسب ایجاد شده بر روی دادهای شعب از الگوریتمهای طبقه بندی و درخت تصمیم استفاده گردید تا قوانین موجود در داده‌های شعب کارا و ناکارا و نیمه کارا استخراج گردد. در تحقیق حاضر از مدل ارائه شده از الگوریتم C5.0 بدلیل بدست آوردن بالاترین میزان صحت در مقایسه با سایر الگوریتمها مورد استفاده قرار گرفت. در انتها براساس قواعد استخراج شده به طراحی یک سیستم خبره برای ارزیابی عملکرد شعب بانکی پرداخته شد. برای طراحی سیستم خبره از نرم افزار کلیپس استفاده شد. در بانک مورد مطالعه شاخص درصد متوسط افزایش سپرده‌های ارزان قیمت طی دوره به افزایش مانده هدف دارای بیشترین تاثیر در عملکرد را دارا بود. تفاصيل المقالة
      • حرية الوصول المقاله

        105 - پیش ‏بینی ورشکستگی شرکت‏ها با استفاده از ترکیب مدل‏های داده‏ کاوی مبتنی بر جریمه دسته‏ بندی نادرست
        عطیه ترکمن امیرعباس نجفی
        یکی از ابزارهای قدرتمند در مسائل پیش بینی ورشکستگی که در دهه های اخیر مورد توجه بسیاری از سرمایه گذاران، مدیران و محققان قرارگرفته است؛ داده کاوی و به طور خاص ماشین بردار پشتیبان است. اما مطالعات نشان می دهد این روش نسبت به انتخاب پارامترها و متغیرهای ورودی از حساسیت ب أکثر
        یکی از ابزارهای قدرتمند در مسائل پیش بینی ورشکستگی که در دهه های اخیر مورد توجه بسیاری از سرمایه گذاران، مدیران و محققان قرارگرفته است؛ داده کاوی و به طور خاص ماشین بردار پشتیبان است. اما مطالعات نشان می دهد این روش نسبت به انتخاب پارامترها و متغیرهای ورودی از حساسیت بالایی برخوردار است. لذا هدف از تحقیق حاضر ترکیب مدل توسعه یافته ماشین بردار پشتیبان و k-نزدیکترین همسایه جهت حذف ورودی های دارای خطا و متعاقبا افزایش دقت پیش بینی ورشکستگی است. به این منظور ابتدا با استفاده از 5 نسبت مالی شامل نسبت جاری، حاشیه سود خالص، نسبت بدهی، بازده دارایی ها و بازده سرمایه مرتبط به 150 شرکت حاضر در بورس اوراق بهادار تهران در بازه 10 ساله 1389-1398و الگوریتم k-نزدیکترین همسایگی داده های آموزش پالایش شده و سپس با تکیه بر ماشین بردار پشتیبان مبتنی بر جریمه دسته بندی، جهت ساخت مدل پیش بینی به کار گرفته می شوند. پس از برآورد پارامترهای بهینه، اعتبارسنجی مدل با استفاده از داده های آزمایش صورت خواهد گرفت. در نهایت نتایج بدست آمده از مدل پیشنهادی و مدل های کلاسیک مورد مقایسه قرار خواهدگرفت. نتایج نشان می دهد با ترکیب مدل های k-نزدیکترین همسایه و ماشین بردار پشتیبان خطای کلی پیش بینی کاهش یافته و ضرایب جریمه ماشین بردار پشتیبان با سطح احتمال بالایی معنادار هستند. تفاصيل المقالة
      • حرية الوصول المقاله

        106 - کاوش قوانین پیوستگی کمی در بازار سهام با استفاده از الگوریتم های فراابتکاری چندهدفه مبتنی بر الگوریتم ژنتیک
        مصطفی زندیه سیما مردانلو
        پیش بینی بازده سهام موضوعی مهم در حوزه مالی است که توجه محققان را برای سالهای بسیاری به خود جلب کرده است. سرمایه گذاران همواره در تلاش برای پیدا کردن راهی برای پیش بینی قیمت سهام و پیدا کردن سهام و زمان مناسب برای خرید و یا فروش هستند. اخیرا، از تکنیک های داده کاوی و تک أکثر
        پیش بینی بازده سهام موضوعی مهم در حوزه مالی است که توجه محققان را برای سالهای بسیاری به خود جلب کرده است. سرمایه گذاران همواره در تلاش برای پیدا کردن راهی برای پیش بینی قیمت سهام و پیدا کردن سهام و زمان مناسب برای خرید و یا فروش هستند. اخیرا، از تکنیک های داده کاوی و تکنیک های هوش مصنوعی در این حوزه استفاده می شود. کشف قوانین پیوستگی یکی از رایج ترین روش های داده کاوی مورد استفاده جهت استخراج دانش از مجموعه داده های بزرگ است. برخی محققین کاوش قوانین پیوستگی را به عنوان یک مسئله چند هدفه بیان کرده اند، که به طور مشترک چند معیار را برای به دست آوردن یک مجموعه با قوانین جالب تر و دقیق تر بهینه سازی می کند. در این پژوهش، یک مدل تکاملی چند هدفه جدید ارائه می دهیم که قابلیت درک، جالب بودن و کارایی را به منظور کاوش مجموعه ای از قوانین پیوستگی کمی از داده های مالی، شامل 10 تا از رایج ترین نشانگرهای تحلیل تکنیکی، حداکثر می کند. برای این منظور، این مدل، دو الگوریتم تکاملی چندهدفه معروف الگوریتم ژنتیک مرتب سازی نامغلوب II و الگوریتم ژنتیک رتبه بندی شده نامغلوب را برای انجام فراگیری تکاملی فواصل ویژگی ها و انتخاب شرایط برای هر قانون گسترش می دهد. علاوه براین، مدل ارائه شده، یک جمعیت خارجی و یک فرایند شروع مجدد را برای مدل تکاملی به منظور ذخیره تمام قوانین نامغلوب یافته شده و بهبود تنوع مجموعه قوانین به دست آمده معرفی می کند. نتایج به دست آمده بر روی داده های سهام در دنیای واقعی، اثربخشی روش ارائه شده را نشان می دهد. تفاصيل المقالة
      • حرية الوصول المقاله

        107 - انتخاب آنلاین سبد سرمایه گذاری به روش تطابق با الگوی طیفی
        متین عبدی امیرعباس نجفی
        با توجه به افزایش حجم و سرعت معاملات در بازارهای مالی امروز، افزایش سرعت در تحلیل‌ها و تصمیم‌گیری‌ها اجتناب ناپذیر است. انجام تحلیل‌های سریع و عاری از خطاهای رفتاری توسط انسان غیر ممکن است. از این رو بازارهای مالی به سمت داد و ستدهای الگوریتمیدر حرکت هستند که در آن‎ أکثر
        با توجه به افزایش حجم و سرعت معاملات در بازارهای مالی امروز، افزایش سرعت در تحلیل‌ها و تصمیم‌گیری‌ها اجتناب ناپذیر است. انجام تحلیل‌های سریع و عاری از خطاهای رفتاری توسط انسان غیر ممکن است. از این رو بازارهای مالی به سمت داد و ستدهای الگوریتمیدر حرکت هستند که در آن‎ها از تکنیک‎هایی از قبیل یادگیری ماشینی و داده‌کاویاستفاده می‌شود. انتخاب آنلاین سبد سرمایه‌گذاری یکی از تکنیک‌های نوین در داد و ستد الگوریتمی است به این صورت که سرمایه را به تعداد مشخصی سهم تخصیص داده و در ابتدای هر دوره با استفاده از تکنیک‌هایی پرتفو را به روز رسانی می‌کند. در واقع در این تکنیک‌ها انسان در انتخاب پرتفو دخالتی نداشته و الگوریتم نحوه‌ی سرمایه‌گذاری را در هر دوره مشخص می‌کند. در این مقاله الگوریتمی توسعه داده شده است که از اصل تطابق با الگودر انتخاب آنلاین سبد سرمایه‌گذاری پیروی می‌کند. در این اصل، پرتفو بر اساس الگوهای تاریخی مشابه انتخاب می‌شود که در این مقاله برای یافتن الگوهای تاریخی مشابه از روش خوشه‌بندی طیفیدر داده کاوی استفاده شده است. در این خصوص یک مثال عددی با استفاده از ۲۰ سهم فعال‌تر در بورس نیویورک ارائه شده و نتایج آن با الگوریتم‌های دیگر در این حوزه مقایسه شده است. تفاصيل المقالة
      • حرية الوصول المقاله

        108 - ارائه رویکردی نوین مبتنی بر قوائد انجمنی جهت بررسی ارتباطات بازار نفت با بازارهای جهانی
        رضا خسروی احسان محمدیان امیری پوریا رضایی سیدبابک ابراهیمی
        در عصر کنونی بررسی ارتباطات میان بازار‌های مختلف و تاثیرگذاری آنان بر روی یکدیگر به یک امر ضروری برای سرمایه‌گذاران خرد و کلان تبدیل گشته است. با بررسی ارتباط بین بازارها علاوه بر آن‌که شخص سرمایه‌گذار می‌تواند در خصوص میزان تاثیرات بازارها، اطلاعات خود را بدست آورد، در أکثر
        در عصر کنونی بررسی ارتباطات میان بازار‌های مختلف و تاثیرگذاری آنان بر روی یکدیگر به یک امر ضروری برای سرمایه‌گذاران خرد و کلان تبدیل گشته است. با بررسی ارتباط بین بازارها علاوه بر آن‌که شخص سرمایه‌گذار می‌تواند در خصوص میزان تاثیرات بازارها، اطلاعات خود را بدست آورد، در زمینه شناسایی ریسک‌های مختلف نیز به او کمک شایانی می‌نماید. بر حسب اهمیت موضوع، در این مقاله سعی بر بررسی ارتباط میان بازار نفت با بازارهای طلا، دلار، شرکت‌ها و صندوق‌های فعال در حوزه انرژی با استفاده از رویکرد نوین قوائد انجمنی و الگوریتم آپریوری، شده است. استفاده از قوائد انجمنی سبب بررسی صریح ارتباطات بین فیلد‌های پایگاه‌های داده شده و روابط و وابستگی‌های متقابل بین مجموعه بزرگی از اقلام داده‌ای را مشخص می‌سازد. نتایج این تحقیق حاکی از رابطه مستقیم بازار نفت با شرکت‌ها و صندوق‌های فعال در حوزه انرژی و رابطه‌ای معکوس با شاخص دلار می‌باشد. همچنین رابطه محسوسی بین بازار نفت و طلا نیز یافت نشد. تفاصيل المقالة
      • حرية الوصول المقاله

        109 - Clustering with K-Means Hybridization Ant Colony Optimization (K-ACO)
        Dewi Ratnaningsih
        One of well-known techniques in data mining is clustering. Clustering method which is very popular is K-means cluster because its algorithm is very easy and simple. However, K-means cluster has some weaknesses, one of which is that the cluster result is sensitive toward أکثر
        One of well-known techniques in data mining is clustering. Clustering method which is very popular is K-means cluster because its algorithm is very easy and simple. However, K-means cluster has some weaknesses, one of which is that the cluster result is sensitive towards centroid initialization so that the cluster result tends to local optimal. This paper explains the modification of K-means cluster, that is, K-means hybridization with ant colony optimization (K-ACO). Ant Colony Optimization (ACO) is optimization algorithm based on ant colony behavior. Through K-ACO, the weaknesses of cluster result which tends to local optimal can be overcome well. The application of hybrid method of K-ACO with the use of R program gives better accuracy compared to K-means cluster. K-means cluster accuracy yielded by Minitab, Mathlab, and SAS at iris data is 89%. Meanwhile, K-ACO hybrid clustering with R program simulated on 38 treatments with 3-time repetitions gives accuracy result of 93,10%. تفاصيل المقالة
      • حرية الوصول المقاله

        110 - ارائه مدل پیش‏ بینی رضایت مشتریان از خدمات پشتیبانی نرم‏ افزار شرکت همکاران سیستم با رویکرد داده‏‌کاوی
        بابک سهرابی ایمان رئیسی وانانی سمانه کشاورزی
        کیفیت کار خود قلمداد می‌کنند. از آنجا که تقریباً کلیه سازمان‌های امروزی نیازمند رقابت در عرصه‌های مختلف از جمله خدمات هستند، ارائه خدمات با کیفیت در دستیابی به مزیت رقابتی پایدار از اهمیت قابل ملاحظه‌ای برخوردار است. سازمان‌ها و شرکت‌ها جهت بقاء و موفقیت در بازارهای رقا أکثر
        کیفیت کار خود قلمداد می‌کنند. از آنجا که تقریباً کلیه سازمان‌های امروزی نیازمند رقابت در عرصه‌های مختلف از جمله خدمات هستند، ارائه خدمات با کیفیت در دستیابی به مزیت رقابتی پایدار از اهمیت قابل ملاحظه‌ای برخوردار است. سازمان‌ها و شرکت‌ها جهت بقاء و موفقیت در بازارهای رقابتی، ناگزیرند خدماتی با کیفیت به مشتریان ارائه کنند. نتایج بسیاری از پژوهش ها نشان می‌دهد کیفیت خدمات مقدمه‌ای برای رضایت مشتری است. با این وجود، بسیاری از شرکت‌های مشتری‌مدار در فرآیند تشخیص و ارزیابی ترجیحات مشتریان با مشکل مواجه شده و اغلب درک اشتباهی از خواسته‌ها و انتظارات مشتریان دارند، زیرا ارائه خدمات با کیفیت بالاتر مستلزم شناخت روابط بین خواسته‌های مشتریان و کیفیت خدمات ارایه‌شده توسط شرکت است. سازمان ها و شرکت های ارائه دهنده خدمات نرم افزاری نیز از این قائده مستثنی نیستند. هدف از این پژوهش ارائه مدلی در جهت پیش بینی میزان رضایت مشتریان از خدمات پشتیبانی ارائه‌شده، تعیین میزان تأثیر هر یک از متغیرهای اثرگذار بر رضایت مشتریان و اطلاع از سطح رضایت مشتریان از خدمات پشتیبانی در شرکت مذکور است. که بدین منظور الگوریتم های پیش بینی در داده کاوی از جمله الگوریتم های طبقه بندی و رگرسیون و با استفاده از نرم افزار رپیدماینر بر روی داده ها اجرا شدند. از میان این روش ها آنهایی که بالاترین میزان دقت و کمترین میزان خطا را داشتند به‌عنوان روش های منتخب، برگزیده شدند. همچنین از روش وزن دهی برای مشخص کردن موثرترین متغیر ها در رضایت مشتری استفاده شد تا نتایج حاصل از اینها به‌منظور اتخاذ تصمیمات و پیاده‌سازی راهکارهای بهبود رضایت مشتری در اختیار مدیران شرکت قرار گیرد. تفاصيل المقالة
      • حرية الوصول المقاله

        111 - The Application of Combined Fuzzy Clustering Model and Neural Networks to Measure Valuably of Bank Customers
        Raheleh Nasiri Sharifi Maryam Rastgarpour
        Currently, acquisition of resources in banks is subject to attraction of the resources of banking customers. Meanwhile, the Bank’s valuable customers are one of the best resources to make profit for banks. Several different models are introduced for evaluation of أکثر
        Currently, acquisition of resources in banks is subject to attraction of the resources of banking customers. Meanwhile, the Bank’s valuable customers are one of the best resources to make profit for banks. Several different models are introduced for evaluation of profitability of the customers; but most of them are classical models and they are unable to evaluate the customers in complete and optimized manner. In this way, the conditions are ready to enter artificial intelligence to this scope. In this study, we tried to design an intellectual system for identification of valuable customers of Bank. Such a model is capable of reasoning and explaining the expert system together with adaptation and learning capability of neural network at the same time. Expertise is added to it through data mining. As a result, evaluating the proposed model is done through transaction data of the customer, and accuracy of 95.46 percent is gained. تفاصيل المقالة
      • حرية الوصول المقاله

        112 - Identification of Fraud in Banking Data and Financial Institutions Using Classification Algorithms
        Ardavan Rajaei
        In recent years, due to the expansion of financial institutions,as well as the popularity of the World Wide Weband e-commerce, a significant increase in the volume offinancial transactions observed. In addition to the increasein turnover, a huge increase in the number o أکثر
        In recent years, due to the expansion of financial institutions,as well as the popularity of the World Wide Weband e-commerce, a significant increase in the volume offinancial transactions observed. In addition to the increasein turnover, a huge increase in the number of fraud by user’sabnormality is resulting in billions of dollars in lossesover the world. Therefore, fraud detection techniques toidentify users motivated to do a lot of scientific research.To check the volume of such information data miningtechniques used. Data mining, knowledge discovery processthat finding patterns in large data sets by combiningtechniques from statistics, artificial intelligence, databasemanagement and etc. In data mining techniques we examineand analyze information to discover uncertaincommunication and hidden patterns of data. This studyaimed to detect fraud in banking data using classificationalgorithms. تفاصيل المقالة
      • حرية الوصول المقاله

        113 - تعیین مدلی جهت ارزیابی سیستم مدیریت دانش در جهت بهبود صنایع با محوریت فناوری آموزشی و بکارگیری مفاهیم داده کاوی
        کمیل اکبرنژادبائی محمود محمدی عبدالله کولوبندی محمد تقی پور
        مدیریت دانش مشتری تلفیقی از مدیریت دانش و مدیریت ارتباط با مشتریان می‌باشد که برای توسعه بخشیدن در راهبرد تجاری سازمان و درنتیجه بهسازی فعالیت‌های سازمانی و نائل شدن به مزیت رقابتی، اهمیت پیدا می‌کند. با توسعه و گسترش دانش و فناوری اطلاعات، محیط پروژه‌ها از پیچیدگی بیشت أکثر
        مدیریت دانش مشتری تلفیقی از مدیریت دانش و مدیریت ارتباط با مشتریان می‌باشد که برای توسعه بخشیدن در راهبرد تجاری سازمان و درنتیجه بهسازی فعالیت‌های سازمانی و نائل شدن به مزیت رقابتی، اهمیت پیدا می‌کند. با توسعه و گسترش دانش و فناوری اطلاعات، محیط پروژه‌ها از پیچیدگی بیشتری برخوردار شده‌اند. هدف تحقیق تعیین مدلی جهت ارزیابی سیستم مدیریت دانش در جهت بهبود صنایع با محوریت فناوری آموزشی و بکارگیری مفاهیم داده کاوی می باشد. روش تحقیق کمی و اطلاعات موردنیاز این تحقیق از پایگاه داده واحدهای صنعتی از جمله شرکت خودروسازی جمع‌آوری شد. جامعه آماری تحقیق شامل کلیه خریداران خودرو در طی سال‌های 1399 و 1400 می‌باشد که روش نمونه گیری به صورت تصادفی ساده بود. جهت جمع آوری داده ها از پرسش‌نامه‌ها و جهت تجزیه و تحلیل داده ها از روش داده‌کاوی و الگوریتم‌های kmens و روش شبکه عصبی و ماشین بردار پشتیبان استفاده گردید. نتایج به‌دست‌آمده نشان می‌دهد استفاده از مدیریت دانش و مفاهیم فناوری آموزشی به‌خوبی توانسته انواع مشتری‌ها و روند‌های فروش را در آینده پیش‌بینی نماید و انتظار می‌رود نتایج به‌دست‌آمده در بهبود صنایع و مدیریت ساخت و تولید در کشور، مفید واقع شود. تفاصيل المقالة
      • حرية الوصول المقاله

        114 - کاربرد تحلیل خوشه‌ای به منظور داده‌کاوی در پژوهش‌های روان‌شناسی
        زهرا نقش اعظم مقدم
        زمینه: داده‌کاوی فرایند مرتب‌سازی و طبقه‌بندی داده‌های حجیم است. هدف این مقاله معرفی تحلیل خوشه‌ای به عنوان یکی از تکنیک‌های داده‌کاوی و ارایه نمونه‌ای از کاربرد آن در خوشه‌بندی افراد تعلل‌ورز است. روش: بدین منظور ضمن معرفی تحلیل خوشه‌ای و انواع رویکردهای آن، نحوه انتخا أکثر
        زمینه: داده‌کاوی فرایند مرتب‌سازی و طبقه‌بندی داده‌های حجیم است. هدف این مقاله معرفی تحلیل خوشه‌ای به عنوان یکی از تکنیک‌های داده‌کاوی و ارایه نمونه‌ای از کاربرد آن در خوشه‌بندی افراد تعلل‌ورز است. روش: بدین منظور ضمن معرفی تحلیل خوشه‌ای و انواع رویکردهای آن، نحوه انتخاب هر یک و گام‌های اجرای آن در یک نمونه معرف ارایه می‌شود این نمونه متشکل از 200 دانشجوی دانشگاه تهران (100 پسر و 100 دختر) که در تعلل‌ورزی بر اساس مقیاس سولومون و روثبلوم (1984) نمرات بالایی به دست آورده بودند انتخاب و به مقیاس‌های پرسشنامه خودتنظیمی گرین و میلر (2004)، خودکارآمدی میدلتن و میگلی (1997)، مقیاس باورهای ناکامی هرینگتون (2005) و باورهای غیرمنطقی کوپمنز و همکاران (1994) پاسخ دادند. یافته‌ها: نتایج این پژوهش بیانگر وجود خوشه‌های مختلف از تعلل‌ورزان است که با شناسایی گروه‌های تعلل‌ورزان و ویژگی‌های هر یک از گروه‌ها می‌توان راهکارهای موثرتری برای کاهش تعلل‌ورزی هر گروه ارایه کرد. تفاصيل المقالة
      • حرية الوصول المقاله

        115 - مدل سازی و تاثیر کاربرد سیستم مدیریت دانش به منظور بهبود حاکمیت فناوری در صنعت خودروسازی کشور با استفاده از محیط داده‌کاوی
        کمیل اکبرنژاد بائی محمود محمدی عبداله کولوبندی محمد تقی پور
        زمینه و هدف: مدیریت دانش مشتری تلفیقی از مدیریت دانش و مدیریت ارتباط با مشتریان می‌باشد که برای توسعه بخشیدن در راهبرد تجاری سازمان و درنتیجه بهسازی فعالیت‌های سازمانی و نائل شدن به مزیت رقابتی، اهمیت پیدا می‌کند. با توسعه و گسترش دانش و فناوری اطلاعات، محیط پروژه‌ها از أکثر
        زمینه و هدف: مدیریت دانش مشتری تلفیقی از مدیریت دانش و مدیریت ارتباط با مشتریان می‌باشد که برای توسعه بخشیدن در راهبرد تجاری سازمان و درنتیجه بهسازی فعالیت‌های سازمانی و نائل شدن به مزیت رقابتی، اهمیت پیدا می‌کند. با توسعه و گسترش دانش و فناوری اطلاعات، محیط پروژه‌ها از پیچیدگی بیشتری برخوردار شده‌اند. روش شناسی: ازآنجاکه مدیریت دانش یکی از مهم‌ترین رویکردهایی است که در این راستا موردتوجه قرارگرفته است لذا مسئله تحقیق حاضر بررسی تأثیر مدیریت دانش و هر یک از فرایندهای تشکیل‌دهنده آن (خلق، کاربرد، تسهیم و ذخیره دانش) بر حاکمیت فناوری اطلاعات در صنعت خودروسازی است. یافته ها: با توجه به اینکه تأثیر فرایندهای دانش در محیط پروژه‌ای بررسی می‌گردد، روش این تحقیق کمی و اطلاعات موردنیاز این پژوهش از پایگاه داده شرکت‌های خودروسازی جمع‌آوری شد. سطح خرید خودرو به‌عنوان متغیر وابسته و اطلاعات مربوط به سن، جنسیت، سطح درآمد، شغل، سطح تحصیلات، سابقه داشتن خودرو، وضعیت تأهل به‌عنوان متغیر مستقل در نظر گرفته‌شده است. با استفاده از روش داده‌کاوی و الگوریتم‌های kmens و روش شبکه عصبی و ماشین بردار پشتیبان مورد تجزیه‌وتحلیل قرار گرفت. نتایج: نتایج به‌دست‌آمده نشان می‌دهد استفاده از مدیریت دانش به‌خوبی توانسته است انواع مشتری‌ها و روند‌های فروش را در آینده پیش‌بینی کند و انتظار می‌رود نتایج به‌دست‌آمده در مدیریت ساخت و تولید صنایع خودروسازی کشور مؤثر واقع شود. تفاصيل المقالة