-
دسترسی آزاد مقاله
1 - کاربرد یادگیری بدون نظارت در کشف تقلبات بیمه اتومبیل (الگوریتم جنگل ایزوله)
فربد خانی زاده فرزان خامسیان مریم اثنی عشریاستراتژی شرکتهای بیمه در مقابله با تخلفات و تقلبات، بسیار حائز اهمیت میباشد. نداشتن چنین برنامهای برای جلوگیری از تقلبات بیمهای و پرداخت سریع خسارت بیمهگذاران، ممکن است در کوتاه مدت موجب رضایت مشتریان و افزایش پورتفوی شرکتها گردد؛ اما در بلندمدت عواقب ناگواری را ب چکیده کاملاستراتژی شرکتهای بیمه در مقابله با تخلفات و تقلبات، بسیار حائز اهمیت میباشد. نداشتن چنین برنامهای برای جلوگیری از تقلبات بیمهای و پرداخت سریع خسارت بیمهگذاران، ممکن است در کوتاه مدت موجب رضایت مشتریان و افزایش پورتفوی شرکتها گردد؛ اما در بلندمدت عواقب ناگواری را برای صنعت بیمه به همراه دارد. بهعبارت دیگر، هزینه پروندههای تقلب خسارت در طول زمان بهصورت افزایش حق بیمه و غیرمستقیم به بیمهگذاران منتقل میگردد. هدف از این مطالعه، ارائه مکانیزمی به شرکتهای بیمه جهت کشف تقلب است. دستیابی به این هدف از طریق الگوریتم بدون نظارت و جهت کشف ناهنجاری آشکار در مجموعه داده میباشد. استفاده از الگوریتم مزبور به علت تجمیعی بودن آن باعث افزایش دقت در تشخیص پروندههای مشکوک به تقلب و کاهش موارد مثبت کاذب میگردد. بر اساس نتایج مقاله خسارت وارده به راننده مقصر، نوع و کاربری خودرو، جنسیت زیاندیده از مهمترین شاخصها در کشف پروندههای مشکوک به تقلب هستند. پرونده مقاله -
دسترسی آزاد مقاله
2 - Extracting Image Features Through Deep Learning
Maliheh GhasemzadehThe purpose of this study is to identify images with deep learning with the least error. In machine learning projects, the basis of the work is extracting features from raw data. Finally, we differentiate different features through classifiers. In the present project, i چکیده کاملThe purpose of this study is to identify images with deep learning with the least error. In machine learning projects, the basis of the work is extracting features from raw data. Finally, we differentiate different features through classifiers. In the present project, images with dimensions of 224*224 are applied to the network. Most networks use color images, which have 3 channels, the final dimensions of which are 3*224*224. We used the vgg19 network to extract the feature from the image with the highest accuracy. To increase the speed of weight correction operations, batch_size = 30 is considered. 70% of the images were used for network training, 20% for validation and 10% of the data for network testing and evaluation. The speed and accuracy of this project is high. پرونده مقاله -
دسترسی آزاد مقاله
3 - یک راهکار نیمهنظارتی جدید برای انتخاب اسپرم مناسب در درمان ناباروری
آصفه توکلی پله شاهی سیدابوالقاسم میرروشندل فاطمه قاسمیان: امروزه، رشد چشمگیر ناباروری در جوامع مختلف و نیاز به بررسی هر یک از عوامل ناشی از ناتوانی مردان و زنان در ایجاد و تشدید آن بر کسی پوشیده نیست. در این میان، آمارهای سازمان بهداشت جهانی از رشد سریع عوامل ناتوانی مردانه در باروری تا حدود 50 درصد حکایت دارد؛ که نشاندهنده چکیده کامل: امروزه، رشد چشمگیر ناباروری در جوامع مختلف و نیاز به بررسی هر یک از عوامل ناشی از ناتوانی مردان و زنان در ایجاد و تشدید آن بر کسی پوشیده نیست. در این میان، آمارهای سازمان بهداشت جهانی از رشد سریع عوامل ناتوانی مردانه در باروری تا حدود 50 درصد حکایت دارد؛ که نشاندهنده اهمیت بالای تجزیه و تحلیل مورفولوژیکی اسپرم، به عنوان یکی از مهمترین و اساسیترین گامها در تجزیه و تحلیل مایع منی، به منظور اجرای لقاح مصنوعی است. در این مقاله، تلاش شدهاست تا به کمک یکی از روشهای یادگیری نیمهنظارتی، موسوم به شبکه نردبانی، به استخراج ویژگیهای بخشهای مختلف اسپرم (مانند سر، واکوئل و آکروزوم) پرداخته و در ادامه با طبقهبندی آنها در دو گروه اسپرمهای طبیعی و غیرطبیعی، به انتخاب اسپرم مناسب، به منظور شرکت در فرآیند لقاح مصنوعی موفق شویم. پژوهش حاضر با اعمال تغییرات و بهبود عوامل مختلف بهویژه نویز ورودی، نتایج مناسبی را در آنالیز تصاویر با وضوح پایین و بدون رنگآمیزی کسب کرده است. بررسی مدل پیشنهادی برای هر سه بخش اسپرم (سر، واکوئل و آکروزوم) موفق شد با وجود تصاویری با کیفیت پایین، نتایج چشمگیر بیش از 70% را برای سر و آکروزوم و بیش از 80% را برای واکوئل بهدست آورد. پرونده مقاله -
دسترسی آزاد مقاله
4 - ارایه یک رویکرد شبه نظارتی برای بهبود عملکرد آموزش الکترونیکی
فرهاد قره باغی علی امیریدر عصر اطلاعات جهتگیری بسیاری از سامانهها به سمت شخصیسازی اطلاعات برای کاربر است. یادگیری الکترونیکی نیز از این قاعده مستثنی نبوده و یکی از ملزومات آن وجود مکانیزمی شخصیشده برای کمک به یادگیری مؤثر یادگیرنده است. در سالهای اخیر از روشهای دادهکاوی به طور گسترده د چکیده کاملدر عصر اطلاعات جهتگیری بسیاری از سامانهها به سمت شخصیسازی اطلاعات برای کاربر است. یادگیری الکترونیکی نیز از این قاعده مستثنی نبوده و یکی از ملزومات آن وجود مکانیزمی شخصیشده برای کمک به یادگیری مؤثر یادگیرنده است. در سالهای اخیر از روشهای دادهکاوی به طور گسترده در زمینه یادگیری الکترونیکی استفاده شده است. در واقع محققین مختلف با استفاده از روشهای دادهکاوی سعی در شناخت هر چه بیشتر یادگیرندگان و در نتیجه ایجاد یادگیری تطبیقی داشتهاند. در تحقیقات مختلف از یادگیری نظارت شده برای شناخت یادگیرندگان استفاده شده است. با توجه به معایب الگوریتم های یادگیری نظارت شده در این تحقیق جهت شناسایی سطح دانش یادگیرندگان یک مدل داده کاوی شبه نظارتی پیشنهادشده است تا بتواند با شخصیسازی و هوشمندسازی محیط یادگیری الکترونیکی، عملکرد یادگیری و رضایت مندی یادگیرندگان را بهبود بخشد. در این مقاله با استفاده از رویکرد دادهکاوی شبه نظارتی به شناسایی سطح دانش یادگیرندگان پرداخته شده است. به این منظور برای ایجاد مدل پیشنهادی از الگوریتم شبه نظارتی LP-MLTSVM استفاده شده است. در ساخت مدل پیشنهادی از داده های واقعی استفاده شده است. به منظور ارزیابی، در یک دوره مجازی از مدل پیشنهاد شده استفاده شد. نتایج حاصل از دوره موفقیت و رضایت تحصیلی یادگیرندگان با مدل پیشنهادی را نشان میدهد. پرونده مقاله -
دسترسی آزاد مقاله
5 - عقیدهکاوی نظرات دیجیکالا با استفاده از روش نیمه نظارتی مبتنی بر ماشین بردار پشتیبان
زهره کریمی حدیث حقیریرشد فراوان نظرات دیجیتال کاربران در مورد خدمات و محصولات منجر به توسعه روشهای عقیدهکاوی شده است. مدلهای یادگیری ماشین نظارتی در این زمینه به نتایج خوبی دست یافتهاند. هرچند، این روشها نیاز به تعداد کافی دادههای آموزشی برچسب دار دارند که آماده سازی آن ها نیازمند چکیده کاملرشد فراوان نظرات دیجیتال کاربران در مورد خدمات و محصولات منجر به توسعه روشهای عقیدهکاوی شده است. مدلهای یادگیری ماشین نظارتی در این زمینه به نتایج خوبی دست یافتهاند. هرچند، این روشها نیاز به تعداد کافی دادههای آموزشی برچسب دار دارند که آماده سازی آن ها نیازمند صرف هزینه و زمان زیاد است. در این مقاله یک رویکرد نیمهنظارتی جهت تحلیل نظرات فارسی کاربران پیشنهادشده که از دادههای بدون برچسب فراوان همراه با تعداد کمی دادۀ برچسبدار در مرحله آموزش بهره می گیرد. با توجه به عملکرد مناسب روش ماشین بردار پشتیبان نظارتی جهت عقیدهکاوی، به کارگیری روش نیمهنظارتی ماشین بردار پشتیبان پیشنهاد شده است. این روش در مقایسه با روشهای موجود با چالش تقویت خطا مواجه نبوده و قادر به تخمین قطبیت نظراتی که در مرحله آموزش دیده نشدهاند، نیز است. روش پیشنهادی روی مجموعه داده نظرات دیجیکالا مورد ارزیابی قرارگرفته و با الگوریتم ماشین بردار پشتیبان بر اساس ملاکهای دقت، صحت، بازخوانی و F1 مقایسه شده است. نتایج به دست آمده حاکی از عملکرد بهتر روش نیمهنظارتی در مقایسه با روش نظارتی و نیز روش نیمه نظارتی خودآموزی است. پرونده مقاله -
دسترسی آزاد مقاله
6 - Insurance Claim Classification: A new Genetic Programming Approach
Alireza Bahiraie Farbod Khanizadeh Farzan KhamesianIn this study we provide insurance companies with a tool to classify the risk level and predict the possibility of future claims. The support vector machine (SVM) and genetic programming (GP) are two approaches used for the analysis. Basically, in Iran insurance industr چکیده کاملIn this study we provide insurance companies with a tool to classify the risk level and predict the possibility of future claims. The support vector machine (SVM) and genetic programming (GP) are two approaches used for the analysis. Basically, in Iran insurance industry there is no systematic strategy to evaluate the car body insurance policy. Companies refer mainly to the world experience and employ it to rate the premium. An insurance claim dataset provided by an Iranian insurance company with a sample size of 37904 is considered for programming and analysis. According to the structure of the dataset, a supervised learning algorithm was used to describe the underlying relationships between variables. پرونده مقاله -
دسترسی آزاد مقاله
7 - A Technical Review on Unsupervised Learning of Graph and Hypergraph Pattern Analysis
Aref SafariGraph and hypergraph matching are fundamental problems in pattern analysis problems. They are applied to various tasks requiring 2D and 3D feature matching, such as image alignment, 3D reconstruction, and object or action recognition. Graph pattern analysis considers pa چکیده کاملGraph and hypergraph matching are fundamental problems in pattern analysis problems. They are applied to various tasks requiring 2D and 3D feature matching, such as image alignment, 3D reconstruction, and object or action recognition. Graph pattern analysis considers pairwise constraints that usually encode geometric and appearance associations between local features. On the other hand, hypergraph matching incorporates higher-order relations computed over sets of features, which could capture both geometric and appearance information. Therefore, using higher-order constraints enables matching that is more robust (or even invariant) to changes in scale, non-rigid deformations, and outliers. Many objects or other entities such as gesture recognition and human activities in the spatiotemporal domain can be signified by graphs with local information on nodes and more global information on edges or hyperedges. In this research, and essential review have been done on the unsupervised methods to explore and communicate meta-analytic data and results with a large number of novel graphs proposed quite recently. پرونده مقاله -
دسترسی آزاد مقاله
8 - A CAD System Framework for the Automatic Diagnosis and Annotation of Histological and Bone Marrow Images
Sara RezaeiDue to ever increasing of medical images data in the world’s medical centers and recent developments in hardware and technology of medical imaging, necessity of medical data software analysis is needed. Equipping medical science with intelligent tools in diagnosis چکیده کاملDue to ever increasing of medical images data in the world’s medical centers and recent developments in hardware and technology of medical imaging, necessity of medical data software analysis is needed. Equipping medical science with intelligent tools in diagnosis and treatment of illnesses has resulted in reduction of physicians’ errors and physical and financial damages. In this article we propose a computer – aided diagnosis system framework in order to automatic classification and annotation of histological and bone marrow images. The proposed method has been tested on two data set including cytological and histological images. Images context features are used to train support vector machine classifier and the accuracy of classifier is 96%. Results show that the proposed framework can be a software model in order to classify and annotate microscopic images in clinical routine functions. Due to ever increasing of medical images data in the world’s medical centers and recent developments in hardware and technology of medical imaging, necessity of medical data software analysis is needed. Equipping medical science with intelligent tools in diagnosis and treatment of illnesses has resulted in reduction of physicians’ errors and physical and financial damages. In this article we propose a computer – aided diagnosis system framework in order to automatic classification and annotation of histological and bone marrow images. پرونده مقاله -
دسترسی آزاد مقاله
9 - Wised Semi-Supervised Cluster Ensemble Selection: A New Framework for Selecting and Combing Multiple Partitions Based on Prior knowledge
Fozieh Asghari Paeenroodposhti Saber Nourian Muhammad YousefnezhadThe Wisdom of Crowds, an innovative theory described in social science, claims that the aggregate decisions made by a group will often be better than those of its individual members if the four fundamental criteria of this theory are satisfied. This theory used for in c چکیده کاملThe Wisdom of Crowds, an innovative theory described in social science, claims that the aggregate decisions made by a group will often be better than those of its individual members if the four fundamental criteria of this theory are satisfied. This theory used for in clustering problems. Previous researches showed that this theory can significantly increase the stability and performance of learning problems. As a solution, this paper proposes a new methodology of using WOC theory for evaluating and selecting basic result partitions in semi-supervised clustering problems. This paper introduces new technique for reducing the data dimensions based on supervision information, a new semi-supervised clustering algorithm based on k-means for generating basic results, a new strategy for evaluating and selecting basic results based on feedback mechanism, a new metric for evaluating diversity of basic results. The results demonstrate the efficiency of proposed method's aggregate decision-making compared to other algorithms. پرونده مقاله -
دسترسی آزاد مقاله
10 - Combining Classifier Guided by Semi-Supervision
Mohammad Mohammadi Hamid Parvin Eshagh Faraji Sajad ParvinThe article suggests an algorithm for regular classifier ensemble methodology. The proposed methodology is based on possibilistic aggregation to classify samples. The argued method optimizes an objective function that combines environment recognition, multi-criteria agg چکیده کاملThe article suggests an algorithm for regular classifier ensemble methodology. The proposed methodology is based on possibilistic aggregation to classify samples. The argued method optimizes an objective function that combines environment recognition, multi-criteria aggregation term and a learning term. The optimization aims at learning backgrounds as solid clusters in subspaces of the high-dimensional feature-space via an unsupervised learning including an attribute discrimination component. The unsupervised clustering component assigns degree of typicality to each data pattern in order to identify and reduce the effect of noisy or outlaid data patterns. Then, the suggested technique obtains the best combination parameters for each background. The experimentations on artificial datasets and standard SONAR dataset demonstrate that our classifier ensemble does better than individual classifiers in the ensemble. پرونده مقاله -
دسترسی آزاد مقاله
11 - Risk Classification of Imbalanced Data for Car Insurance Companies: Machine Learning Approaches
Farzan Khamesian Maryam Esna-Ashari Eric Dei Ofosu-Hene Farbod KhanizadehThis paper presents a mechanism for insurance companies to assess the most effective features to classify the risk of their customers for third party liability (TPL) car insurance. Basically, the process of underwriting is carried out based on the expert experiences and چکیده کاملThis paper presents a mechanism for insurance companies to assess the most effective features to classify the risk of their customers for third party liability (TPL) car insurance. Basically, the process of underwriting is carried out based on the expert experiences and the industry suffers from lack of a systematic method to categorize their policyholders with respect to the risk level. We analyzed 13,388 observations of an insurance claim dataset from body injury reports provided by an Iranian insurance company. The main challenge is the imbalanced dataset. Here we employ logistic regression and random forest with different resampling of the original data in order to increase the performance of models. Results indicate that the random forest with the hybrid resampling methods is the best classifier and furthermore, victim age, premium, car age and insured age are the most important factors for claims prediction. پرونده مقاله