• فهرست مقالات supervised Learning

      • دسترسی آزاد مقاله

        1 - کاربرد یادگیری بدون نظارت در کشف تقلبات بیمه اتومبیل (الگوریتم جنگل ایزوله)
        فربد خانی زاده فرزان خامسیان مریم اثنی عشری
        استراتژی شرکت‌های بیمه در مقابله با تخلفات و تقلبات، بسیار حائز اهمیت می‌باشد. نداشتن چنین برنامه‌ای برای جلوگیری از تقلبات بیمه‌ای و پرداخت سریع خسارت بیمه‌گذاران، ممکن است در کوتاه مدت موجب رضایت مشتریان و افزایش پورتفوی شرکت‌ها گردد؛ اما در بلندمدت عواقب ناگواری را ب چکیده کامل
        استراتژی شرکت‌های بیمه در مقابله با تخلفات و تقلبات، بسیار حائز اهمیت می‌باشد. نداشتن چنین برنامه‌ای برای جلوگیری از تقلبات بیمه‌ای و پرداخت سریع خسارت بیمه‌گذاران، ممکن است در کوتاه مدت موجب رضایت مشتریان و افزایش پورتفوی شرکت‌ها گردد؛ اما در بلندمدت عواقب ناگواری را برای صنعت بیمه به همراه دارد. به‌عبارت دیگر، هزینه پرونده‌های تقلب خسارت در طول زمان به‌صورت افزایش حق بیمه و غیرمستقیم به بیمه‌گذاران منتقل می‌گردد. هدف از این مطالعه، ارائه مکانیزمی به شرکت‌های بیمه جهت کشف تقلب است. دستیابی به این هدف از طریق الگوریتم بدون نظارت و جهت کشف ناهنجاری آشکار در مجموعه داده می‌باشد. استفاده از الگوریتم مزبور به علت تجمیعی بودن آن باعث افزایش دقت در تشخیص پرونده‌های مشکوک به تقلب و کاهش موارد مثبت کاذب می‌گردد. بر اساس نتایج مقاله خسارت وارده به راننده مقصر، نوع و کاربری خودرو، جنسیت زیان‌دیده از مهمترین شاخص‌ها در کشف پرونده‌های مشکوک به تقلب هستند. پرونده مقاله
      • دسترسی آزاد مقاله

        2 - Extracting Image Features Through Deep Learning
        Maliheh Ghasemzadeh
        The purpose of this study is to identify images with deep learning with the least error. In machine learning projects, the basis of the work is extracting features from raw data. Finally, we differentiate different features through classifiers. In the present project, i چکیده کامل
        The purpose of this study is to identify images with deep learning with the least error. In machine learning projects, the basis of the work is extracting features from raw data. Finally, we differentiate different features through classifiers. In the present project, images with dimensions of 224*224 are applied to the network. Most networks use color images, which have 3 channels, the final dimensions of which are 3*224*224. We used the vgg19 network to extract the feature from the image with the highest accuracy. To increase the speed of weight correction operations, batch_size = 30 is considered. 70% of the images were used for network training, 20% for validation and 10% of the data for network testing and evaluation. The speed and accuracy of this project is high. پرونده مقاله
      • دسترسی آزاد مقاله

        3 - یک راهکار نیمه‌نظارتی جدید برای انتخاب اسپرم مناسب در درمان ناباروری
        آصفه توکلی پله شاهی سیدابوالقاسم میرروشندل فاطمه قاسمیان
        : امروزه، رشد چشمگیر ناباروری در جوامع مختلف و نیاز به بررسی هر یک از عوامل ناشی از ناتوانی مردان و زنان در ایجاد و تشدید آن بر کسی پوشیده نیست. در این میان، آمارهای سازمان بهداشت جهانی از رشد سریع عوامل ناتوانی مردانه در باروری تا حدود 50 درصد حکایت دارد؛ که نشان‌دهنده چکیده کامل
        : امروزه، رشد چشمگیر ناباروری در جوامع مختلف و نیاز به بررسی هر یک از عوامل ناشی از ناتوانی مردان و زنان در ایجاد و تشدید آن بر کسی پوشیده نیست. در این میان، آمارهای سازمان بهداشت جهانی از رشد سریع عوامل ناتوانی مردانه در باروری تا حدود 50 درصد حکایت دارد؛ که نشان‌دهنده اهمیت بالای تجزیه و تحلیل مورفولوژیکی اسپرم، به عنوان یکی از مهم‌ترین و اساسی‌ترین گام‌ها در تجزیه و تحلیل مایع منی، به منظور اجرای لقاح مصنوعی است. در این مقاله، تلاش شده‌است تا به کمک یکی از روش‌های یادگیری نیمه‌نظارتی، موسوم به شبکه نردبانی، به استخراج ویژگی‌های بخش‌های مختلف اسپرم (مانند سر، واکوئل و آکروزوم) پرداخته و در ادامه با طبقه‌بندی آن‌ها در دو گروه اسپرم‌های طبیعی و غیرطبیعی، به انتخاب اسپرم مناسب، به منظور شرکت در فرآیند لقاح مصنوعی موفق شویم. پژوهش حاضر با اعمال تغییرات و بهبود عوامل مختلف به‌ویژه نویز ورودی، نتایج مناسبی را در آنالیز تصاویر با وضوح پایین و بدون رنگ‌آمیزی کسب کرده است. بررسی‌ مدل پیشنهادی برای هر سه بخش اسپرم (سر، واکوئل و آکروزوم) موفق شد با وجود تصاویری با کیفیت پایین، نتایج چشم‌گیر بیش از 70% را برای سر و آکروزوم و بیش از 80% را برای واکوئل به‌دست آورد. پرونده مقاله
      • دسترسی آزاد مقاله

        4 - ارایه یک رویکرد شبه نظارتی برای بهبود عملکرد آموزش الکترونیکی
        فرهاد قره باغی علی امیری
        در عصر اطلاعات جهت‌گیری بسیاری از سامانه‌ها به سمت شخصی‌سازی اطلاعات برای کاربر است. یادگیری الکترونیکی نیز از این قاعده مستثنی نبوده و یکی از ملزومات آن وجود مکانیزمی شخصی‌شده برای کمک به یادگیری مؤثر یادگیرنده است. در سال‌های اخیر از روش‌های داده‌کاوی به طور گسترده د چکیده کامل
        در عصر اطلاعات جهت‌گیری بسیاری از سامانه‌ها به سمت شخصی‌سازی اطلاعات برای کاربر است. یادگیری الکترونیکی نیز از این قاعده مستثنی نبوده و یکی از ملزومات آن وجود مکانیزمی شخصی‌شده برای کمک به یادگیری مؤثر یادگیرنده است. در سال‌های اخیر از روش‌های داده‌کاوی به طور گسترده در زمینه‌ یادگیری الکترونیکی استفاده شده است. در واقع محققین مختلف با استفاده از روش‌های داده‌کاوی سعی در شناخت هر چه بیشتر یادگیرندگان و در نتیجه ایجاد یادگیری تطبیقی داشته‌اند. در تحقیقات مختلف از یادگیری نظارت شده برای شناخت یادگیرندگان استفاده شده است. با توجه به معایب الگوریتم های یادگیری نظارت شده در این تحقیق جهت شناسایی سطح دانش یادگیرندگان یک مدل داده کاوی شبه نظارتی پیشنهادشده است تا بتواند با شخصی‌سازی و هوشمندسازی محیط یادگیری الکترونیکی، عملکرد یادگیری و رضایت مندی یادگیرندگان را بهبود بخشد. در این مقاله با استفاده از رویکرد داده‌کاوی شبه نظارتی به شناسایی سطح دانش یادگیرندگان پرداخته شده است. به این منظور برای ایجاد مدل پیشنهادی از الگوریتم شبه نظارتی LP-MLTSVM استفاده شده است. در ساخت مدل پیشنهادی از داده های واقعی استفاده شده است. به منظور ارزیابی، در یک دوره مجازی از مدل پیشنهاد شده استفاده شد. نتایج حاصل از دوره موفقیت و رضایت تحصیلی یادگیرندگان با مدل پیشنهادی را نشان می‌دهد. پرونده مقاله
      • دسترسی آزاد مقاله

        5 - عقیده‌کاوی نظرات دیجی‌کالا با استفاده از روش نیمه نظارتی مبتنی بر ماشین بردار پشتیبان
        زهره کریمی حدیث حقیری
        رشد فراوان نظرات دیجیتال کاربران در مورد خدمات و محصولات منجر به توسعه روش‌های عقیده‌کاوی شده است. مدل‌های یادگیری ماشین نظارتی در این زمینه به نتایج خوبی دست یافته‌اند. هرچند، این روش‌ها نیاز به تعداد کافی داده‌های آموزشی برچسب دار دارند که آماده سازی آن ها نیازمند چکیده کامل
        رشد فراوان نظرات دیجیتال کاربران در مورد خدمات و محصولات منجر به توسعه روش‌های عقیده‌کاوی شده است. مدل‌های یادگیری ماشین نظارتی در این زمینه به نتایج خوبی دست یافته‌اند. هرچند، این روش‌ها نیاز به تعداد کافی داده‌های آموزشی برچسب دار دارند که آماده سازی آن ها نیازمند صرف هزینه و زمان زیاد است. در این مقاله یک رویکرد نیمه‌نظارتی جهت تحلیل نظرات فارسی کاربران پیشنهادشده که از داده‌های بدون برچسب فراوان همراه با تعداد کمی دادۀ برچسب‌دار در مرحله‌ آموزش بهره می گیرد. با توجه به عملکرد مناسب روش ماشین بردار پشتیبان نظارتی جهت عقیده‌کاوی،‌ به کارگیری روش نیمه‌نظارتی ماشین بردار پشتیبان پیشنهاد شده است. این روش در مقایسه با روش‌های موجود با چالش تقویت خطا مواجه نبوده و قادر به تخمین قطبیت نظراتی که در مرحله‌ آموزش دیده نشده‌اند، نیز است. روش پیشنهادی روی مجموعه داده نظرات دیجی‌کالا مورد ارزیابی قرارگرفته و با الگوریتم ماشین بردار پشتیبان بر اساس ملاک‌های دقت، ‌صحت، بازخوانی و F1 مقایسه شده است. نتایج به دست آمده حاکی از عملکرد بهتر روش نیمه‌نظارتی در مقایسه با روش نظارتی و نیز روش نیمه نظارتی خودآموزی است. پرونده مقاله
      • دسترسی آزاد مقاله

        6 - Insurance Claim Classification: A new Genetic Programming Approach
        Alireza Bahiraie Farbod Khanizadeh Farzan Khamesian
        In this study we provide insurance companies with a tool to classify the risk level and predict the possibility of future claims. The support vector machine (SVM) and genetic programming (GP) are two approaches used for the analysis. Basically, in Iran insurance industr چکیده کامل
        In this study we provide insurance companies with a tool to classify the risk level and predict the possibility of future claims. The support vector machine (SVM) and genetic programming (GP) are two approaches used for the analysis. Basically, in Iran insurance industry there is no systematic strategy to evaluate the car body insurance policy. Companies refer mainly to the world experience and employ it to rate the premium. An insurance claim dataset provided by an Iranian insurance company with a sample size of 37904 is considered for programming and analysis. According to the structure of the dataset, a supervised learning algorithm was used to describe the underlying relationships between variables. پرونده مقاله
      • دسترسی آزاد مقاله

        7 - A Technical Review on Unsupervised Learning of Graph and Hypergraph Pattern Analysis
        Aref Safari
        Graph and hypergraph matching are fundamental problems in pattern analysis problems. They are applied to various tasks requiring 2D and 3D feature matching, such as image alignment, 3D reconstruction, and object or action recognition. Graph pattern analysis considers pa چکیده کامل
        Graph and hypergraph matching are fundamental problems in pattern analysis problems. They are applied to various tasks requiring 2D and 3D feature matching, such as image alignment, 3D reconstruction, and object or action recognition. Graph pattern analysis considers pairwise constraints that usually encode geometric and appearance associations between local features. On the other hand, hypergraph matching incorporates higher-order relations computed over sets of features, which could capture both geometric and appearance information. Therefore, using higher-order constraints enables matching that is more robust (or even invariant) to changes in scale, non-rigid deformations, and outliers. Many objects or other entities such as gesture recognition and human activities in the spatiotemporal domain can be signified by graphs with local information on nodes and more global information on edges or hyperedges. In this research, and essential review have been done on the unsupervised methods to explore and communicate meta-analytic data and results with a large number of novel graphs proposed quite recently. پرونده مقاله
      • دسترسی آزاد مقاله

        8 - A CAD System Framework for the Automatic Diagnosis and Annotation of Histological and Bone Marrow Images
        Sara Rezaei
        Due to ever increasing of medical images data in the world’s medical centers and recent developments in hardware and technology of medical imaging, necessity of medical data software analysis is needed. Equipping medical science with intelligent tools in diagnosis چکیده کامل
        Due to ever increasing of medical images data in the world’s medical centers and recent developments in hardware and technology of medical imaging, necessity of medical data software analysis is needed. Equipping medical science with intelligent tools in diagnosis and treatment of illnesses has resulted in reduction of physicians’ errors and physical and financial damages. In this article we propose a computer – aided diagnosis system framework in order to automatic classification and annotation of histological and bone marrow images. The proposed method has been tested on two data set including cytological and histological images. Images context features are used to train support vector machine classifier and the accuracy of classifier is 96%. Results show that the proposed framework can be a software model in order to classify and annotate microscopic images in clinical routine functions. Due to ever increasing of medical images data in the world’s medical centers and recent developments in hardware and technology of medical imaging, necessity of medical data software analysis is needed. Equipping medical science with intelligent tools in diagnosis and treatment of illnesses has resulted in reduction of physicians’ errors and physical and financial damages. In this article we propose a computer – aided diagnosis system framework in order to automatic classification and annotation of histological and bone marrow images. پرونده مقاله
      • دسترسی آزاد مقاله

        9 - Wised Semi-Supervised Cluster Ensemble Selection: A New Framework for Selecting and Combing Multiple Partitions Based on Prior knowledge
        Fozieh Asghari Paeenroodposhti Saber Nourian Muhammad Yousefnezhad
        The Wisdom of Crowds, an innovative theory described in social science, claims that the aggregate decisions made by a group will often be better than those of its individual members if the four fundamental criteria of this theory are satisfied. This theory used for in c چکیده کامل
        The Wisdom of Crowds, an innovative theory described in social science, claims that the aggregate decisions made by a group will often be better than those of its individual members if the four fundamental criteria of this theory are satisfied. This theory used for in clustering problems. Previous researches showed that this theory can significantly increase the stability and performance of learning problems. As a solution, this paper proposes a new methodology of using WOC theory for evaluating and selecting basic result partitions in semi-supervised clustering problems. This paper introduces new technique for reducing the data dimensions based on supervision information, a new semi-supervised clustering algorithm based on k-means for generating basic results, a new strategy for evaluating and selecting basic results based on feedback mechanism, a new metric for evaluating diversity of basic results. The results demonstrate the efficiency of proposed method's aggregate decision-making compared to other algorithms. پرونده مقاله
      • دسترسی آزاد مقاله

        10 - Combining Classifier Guided by Semi-Supervision
        Mohammad Mohammadi Hamid Parvin Eshagh Faraji Sajad Parvin
        The article suggests an algorithm for regular classifier ensemble methodology. The proposed methodology is based on possibilistic aggregation to classify samples. The argued method optimizes an objective function that combines environment recognition, multi-criteria agg چکیده کامل
        The article suggests an algorithm for regular classifier ensemble methodology. The proposed methodology is based on possibilistic aggregation to classify samples. The argued method optimizes an objective function that combines environment recognition, multi-criteria aggregation term and a learning term. The optimization aims at learning backgrounds as solid clusters in subspaces of the high-dimensional feature-space via an unsupervised learning including an attribute discrimination component. The unsupervised clustering component assigns degree of typicality to each data pattern in order to identify and reduce the effect of noisy or outlaid data patterns. Then, the suggested technique obtains the best combination parameters for each background. The experimentations on artificial datasets and standard SONAR dataset demonstrate that our classifier ensemble does better than individual classifiers in the ensemble. پرونده مقاله
      • دسترسی آزاد مقاله

        11 - Risk Classification of Imbalanced Data for Car Insurance Companies: Machine Learning Approaches
        Farzan Khamesian Maryam Esna-Ashari Eric Dei Ofosu-Hene Farbod Khanizadeh
        This paper presents a mechanism for insurance companies to assess the most effective features to classify the risk of their customers for third party liability (TPL) car insurance. Basically, the process of underwriting is carried out based on the expert experiences and چکیده کامل
        This paper presents a mechanism for insurance companies to assess the most effective features to classify the risk of their customers for third party liability (TPL) car insurance. Basically, the process of underwriting is carried out based on the expert experiences and the industry suffers from lack of a systematic method to categorize their policyholders with respect to the risk level. We analyzed 13,388 observations of an insurance claim dataset from body injury reports provided by an Iranian insurance company. The main challenge is the imbalanced dataset. Here we employ logistic regression and random forest with different resampling of the original data in order to increase the performance of models. Results indicate that the random forest with the hybrid resampling methods is the best classifier and furthermore, victim age, premium, car age and insured age are the most important factors for claims prediction. پرونده مقاله