ارائه یک الگوریتم برای گروه بندی انواع محصولات بیمه و کاربران در سیستم توصیه گر بیمه با خوشه بندی مبتنی بر فیلتر مشارکتی ارزیابی عملکرد آن براساس توصیه بیمه
محورهای موضوعی : پردازش چند رسانه ای، سیستمهای ارتباطی، سیستمهای هوشمندمرضیه امینی شیرکوهی 1 , محمدرضا یمقانی 2
1 - کارشناسی ارشد، کامپیوتر، واحد لاهیجان، دانشگاه آزاد اسلامی، لاهیجان، ایران
2 - استادیار، کامپیوتر، واحد لاهیجان، دانشگاه آزاد اسلامی، لاهیجان، ایران
کلید واژه: سیستم های توصیه گر, فیلترینگ مشارکتی, خوشه بندیk-means, بیمه,
چکیده مقاله :
با پیشرفتهایی که در صنعت بیمه صورت گرفته است، افراد زیادی برای دریافت خدمات بیمهای به شرکتهای دولتی و خصوصی بیمه مراجعه میکنند. پیش بینی اینکه مشتریان چه نوع بیمهای مناسب آن ها است و با توجه به شرایط فردی و اجتماعی به خصوص سطح درآمد کدام بیمه را ممکن است انتخاب کنند امری حیاتی است. در صنعت بیمه می توان با پیش بینی نوع بیمه ی انتخابی برای هر مشتری کار را برای افرادی که قصد خرید بیمه دارند و همچنین بیمه گزاران تا حد زیادی آسان کرد. خوشهبندی مشتریان، تحلیل ویژگیهای هر خوشه و دریافت اینکه در هر خوشه کدام بیمهها پرطرفدار هستند سپس استفاده از تکنیک فیلترینگ مشارکتی برای ارائه توصیه خرید بیمه به مشتریان، می تواند در روند تصمیم گیری و خرید خدمات بیمه ای موثر باشد. با استفاده از داده های موجود در مورد ویژگیهای فردی و اجتماعی افراد و نوع بیمههایی که انتخاب میکنند به همراه میزان رضایت آنها از خدمات بیمهای در صنعت بیمه میتوان به پیش بینی رفتار مشتری پرداخت و این امر با استفاده از الگوریتم خوشه بندی k-means و استفاده از تکنیک های سیستمهای توصیهگر مانند فیلترینگ مشارکتی تا حد زیادی میسر میشود.
Introduction: There are many improvements in insurance industries in these decades. So Many people refer to public and private insurance companies to get insurance services. They usually face to some challenges and issues for selecting the best and suitable insurance because of various type of insurance and lack of enough information of insurance service. Choosing the proper insurance service always related to people personal and social features.
Method: Prediction of customer’s insurance selection according to people personal and social property especially thier financial condition play vital role. On one hand Prediction of insurance type can help people who want to utilize insurance service. On the other hand this prediction can facilitate process of insurance for Insurers too. There are multiple important mechanisms and factors like customers clustring, analyze each class feature, detection of popular insurance in each class and using Collaborative filtering technique to offer best insurance that can influence on process of decision and selection the suitable insurance.
Results: The total precision value of the proposed method is 89.98% for joint insurances of similar users. Also, the total value of the F-measure of the proposed method for joint insurances between similar customers is 87.13%.
Discussion: Customer behavior can be predicted by available data of people’s personal and social features and type of insurance that they are chosen and rate of their satisfactions. K-means clustring algorithm and recommender systems Techniques like Collaborative filtering are two significant mechanisms to implement prediction of customer’s behaviors.
[1] J. Neidhardt, T. Kuflik and W. Wörndl, “Special section on recommender systems in tourism,” Information Technology & Tourism, vol. 19, no. 1, pp. 83-85, 2018
[2] T.N. Nguyen and F. Ricci, “A chat-based group recommender system for tourism,” Information Technology & Tourism, vol. 18, no. 1, pp. 5-28, 2018.
[3] Bazargani, Mehdi, & Homayunpour, Zainab. (2019). Presenting a new method to discover the nearest neighbor in recommender systems based on collaborative filtering. Intelligent Multimedia Communication and Processing Systems, 1(1), 55-64.
[4] Manteghipour, Mahnaz, & Rahimkhani, Parisa. (1401). Designing a hybrid model for classification of imbalanced data in the field of Casualty Insurance. Intelligent multimedia processing and communication systems, 3(2), 1-9.
[5] M. Jalili, S. Ahmadian, M. Izadi, P. Moradi and M. Salehi, “Evaluating collaborative filtering recommender algorithms: a survey,” IEEE access, vol. 6, pp. 74003-74024, 2018.
[6] W.S. Lin, N. Cassaigne and T.C. Huan, “A framework of online shopping support for information recommendations,” Expert Systems with Applications, vol. 37, no. 10, pp. 6874-6884, 2010.
[7] L. Zhang, J. Zhu and Q. Liu, “A meta-analysis of mobile commerce adoption and the moderating effect of culture”, Computers in human behavior, vol. 28, no. 5, pp. 1902-1911, 2012.
[8] A. Salah, N. Rogovschi and M. Nadif, “A dynamic collaborative filtering system via a weighted clustering approach”, Neurocomputing, vol. 175, pp. 206-215, 2016.
[9] M. Taghizadeh, “A review of filtering methods in recommender systems”, 6th National Conference on Computer Science and Engineering and Information Technology, 859097, 2018. [Persian].
[10] M. Khamisi, S. Samiri, “Review and comparison of collaborative filtering algorithm in recommender systems”, International Conference on Science, Engineering, Technology and Technological Businesses, 903155, 2018. [Persian].
[11] F. Pajuelo-Holguera, J.A. Gómez-Pulido, F. Ortega and J.M. Granado-Criado, “Recommender system implementations for embedded collaborative filtering applications”, Microprocessors and Microsystems, vol. 73, p. 102997, 2020.
[12] S.K. Panda, S. K. Bhoi and M. Singh, “A collaborative filtering recommendation algorithm based on normalization approach”, Journal of Ambient Intelligence and Humanized Computing, vol. 11, no. 11, pp. 4643-4665, 2020.
[13] Yao, S., Halpern, Y., Thain, N., Wang, X., Lee, K., Prost, F., ... & Beutel, A. (2021). Measuring recommender system effects with simulated users. arXiv preprint arXiv:2101.04526.
[14] Teixeira, B., Martinho, D., Novais, P., Corchado, J., & Marreiros, G. (2022, August). Diabetic-Friendly Multi-agent Recommendation System for Restaurants Based on Social Media Sentiment Analysis and Multi-criteria Decision Making. In EPIA Conference on Artificial Intelligence (pp. 361-373). Cham: Springer International Publishing.
[15] Cui, Y. (2021). Intelligent recommendation system based on mathematical modeling in personalized data mining. Mathematical Problems in Engineering, 2021, 1-11.
Accepted:
| 202?, ?? (?), ??-?? DOR:
|
An algorithm for clustering of insurance products and users in a collaborative filtering-based insurance recommender system and evaluating its performance based on the insurance recommendation
Abstract
Introduction
There are many improvements in insurance industries in these decades. So Many people refer to public and private insurance companies to get insurance services. They usually face to some challenges and issues for selecting the best and suitable insurance because of various type of insurance and lack of enough information of insurance service. Choosing the proper insurance service always related to people personal and social features
Method
Prediction of customer’s insurance selection according to people personal and social property especially thier financial condition play vital role. On one hand Prediction of insurance type can help people who want to utilize insurance service. On the other hand this prediction can facilitate process of insurance for Insurers too. There are multiple important mechanisms and factors like customers clustring, analyze each class feature, detection of popular insurance in each class and using Collaborative filtering technique to offer best insurance that can influence on process of decision and selection the suitable insurance.
Results
The total precision value of the proposed method is 89.98% for joint insurances of similar users. Also, the total value of the F-measure of the proposed method for joint insurances between similar customers is 87.13%.
Discussion
Customer behavior can be predicted by available data of people’s personal and social features and type of insurance that they are chosen and rate of their satisfactions. K-means clustring algorithm and recommender systems Techniques like Collaborative filtering are two significant mechanisms to implement prediction of customer’s behaviors.
Keywords: Recommender systems, collaborative filtering, k-means clustering, insurance
ارائه یک الگوریتم برای گروه بندی انواع محصولات بیمه و کاربران در سیستم توصیه گر بیمه با خوشه بندی مبتنی بر فیلتر مشارکتی ارزیابی عملکرد آن براساس توصیه بیمه
تاريخ پذيرش:
| دورۀ ، سال شمارۀ ، صص:
|
چکیده: با پیشرفتهایی که در صنعت بیمه صورت گرفته است، افراد زیادی برای دریافت خدمات بیمهای به شرکتهای دولتی و خصوصی بیمه مراجعه میکنند. پیش بینی اینکه مشتریان چه نوع بیمهای مناسب آن ها است و با توجه به شرایط فردی و اجتماعی به خصوص سطح درآمد کدام بیمه را ممکن است انتخاب کنند امری حیاتی است. در صنعت بیمه می توان با پیش بینی نوع بیمه ی انتخابی برای هر مشتری کار را برای افرادی که قصد خرید بیمه دارند و همچنین بیمه گزاران تا حد زیادی آسان کرد. خوشهبندی مشتریان، تحلیل ویژگیهای هر خوشه و دریافت اینکه در هر خوشه کدام بیمهها پرطرفدار هستند سپس استفاده از تکنیک فیلترینگ مشارکتی برای ارائه توصیه خرید بیمه به مشتریان، می تواند در روند تصمیم گیری و خرید خدمات بیمه ای موثر باشد. با استفاده از داده های موجود در مورد ویژگیهای فردی و اجتماعی افراد و نوع بیمههایی که انتخاب میکنند به همراه میزان رضایت آنها از خدمات بیمهای در صنعت بیمه میتوان به پیش بینی رفتار مشتری پرداخت و این امر با استفاده از الگوریتم خوشه بندی k-means و استفاده از تکنیک های سیستمهای توصیهگر مانند فیلترینگ مشارکتی تا حد زیادی میسر میشود.
واژههای کلیدی: سیستمهای توصیهگر، فیلترینگ مشارکتی، خوشهبندیk-means، بیمه
1. مقدمه
سیستم های توصیه گر به عنوان نمونه ای از سیستم های پشتیبانی تصمیم شناخته می شوند که در دهه 90 میلادی به عنوان یک شاخه مستقل پا به عرصه پژوهش و پژوهش گشودند. از این سیستم ها به عنوان یکی از راه حل های رویارویی با مسئله سربار اطلاعات در تجارت الکترونیک یاد می شود [1]. از یک سو کسب و کارهای فعال در زمینه تجارت الکترونیک به منظور جذب مشتری بیشتر در بازار پررقابت، نیازمند این سیستم ها هستند و از سوی دیگر مشتری نیازمند یاری رسانی در خیل عظیم و رو به رشد کالاها و اطلاعات مربوط به آن ها است تا بتواند از میان گزینه های پیش روی بیشمار مناسب ترین آن ها را برگزیند[2]. سیستم های توصیه گر با تحلیل و بررسی داده های متعلق به کاربران، یکسری آیتم های خاص را مبنی بر علایق به کاربران پیشنهاد می کنند. هدف از آنالیز داده های مربوط به کرابران، استخراج الگو های هر کاربر به منظور پیش بینی آیتم ها می باشد. یکی از مهمترین روش ها در سیستم های توصیه گر، روش فیلترینگ مشارکتی است [3].
امروزه وب سایت های تجاری و غیر تجاری زیادی در اینترنت وجود دارند که حجم فزاینده ای از محصولات متنوع را به ارائه می دهند. سیستم های توصیه کننده(RS1) به دلیل ظهور تجارت الکترونیک، گستره وسیع و سریع رو به رشد انتخاب ها برای مشتریان، تنوع ترجیحات بین، عدم آگاهی دقیق از نیازهایشان و فقدان اصطلاحات کلید واژه برای بیان و استفاده از موتورهای جستجو برای پاسخگویی به این خواسته ها به بخشی اجتناب ناپذیر از وب جهانی تبدیل شده اند. الگوریتم های توصیه گر سودمندی یک آیتم را برای کاربر هدف پیش بینی می کنند و با استفاده از رتبه بندی های گذشته خود برای موارد موجود در سیستم، بهترین موارد را در مورد ترجیحات کاربر پیشنهاد می کنند [4].
گسترش بسیار زیاد سامانه های الکترونیکی انواع بیمه و تنوع محصولات بیمه ای موجود در فروشگاه ها نیز موجب شده است و مشتریان فروشگاه های الکترونیکی بیمه با مشکل سربار اطلاعاتی رو به رو شوند. یافتن کالای مورد نظر به صورت برخط که با معیار های کاربر مطابقت داشته باشد نیاز به وقت و جستجوی زیادی دارد و در موراد زیادی هم ممکن است کاربر نتواند بیمه ی مورد نیازش را مطابق علایق خود پیدا کند. از این رو یک راهنمایی و در واقع پیشنهاد مفید مطابق با علایق و معیار های، آن ها را از سردرگمی و اتلاف وقت بیهوده باز می دارد.
اخیرا با استفاده از علم داده کاوی و به کار بستن قوانین موجود در این علم، می توان مدل هایی روی دادهها ایجاد کرد که این دانش ضمنی و اطلاعات نهفته در درون داده ها را برای ما آشکار سازد. کاربرد داده کاوی در علوم مختلف به صورت روز افزونی پیشرفت می کند، اخیرا شاهد گسترش کاربرد های داده کاوی در زمینه شبکه اینترنت و وب هستیم [6]. این کاربرد ها جنبه های مختلفی از وب را می توانند پوشش دهند و اظلاعات ضمنی موجود در وب ها را استخراج کنند. این اطلاعات می تواند به طریقه استفاده از وب ها را برای به منظور رسیدن به مقصود خودف آشکار سازند. سیستم توصیه گر محصول در تجارت الکترونیکی یکی از واسط هایی است که به منظور افزایش قابلیت کاربرپسندی فروشگاه های الکترونیکی مورد استفاده قرار گیرد. همچنین سیستم توصیه گر محصول می تواند با نظارت بر تاریخچه رفتار خرید مشتریان، الویتها و نیازهای مشتریان را پیشبینی کند و محصولاتی که با نیازهای مشتریان ارتباط نزدیکی دارد به عنوان توصیه خرید به مشتریان پیشنهاد کند. کاربر نیز می تواند با اتکا به این توصیه ها محصولاتی که با الویت های آنان در ارتباط هستند، شناخته و تصمیم به خرید بگیرد. از این رو سیستم توصیه گر می تواند به در شناسایی اقلام مناسب برای نیاز ها و الویت های خود در یک راه موثر کمک کند و در حل مشکل سربار بیش از حد اطلاعات و رشد فروش در تجارت الکترونیک کمک کند [7].
مشتریان فروشگاه های الکترونیکی بدون داشتن راهنما در دستیابی به اطلاعات و محصول مورد نظرشان به صورت برخط، دچار سردرگمی خواهند شد. در این زمان است که مشتاق هستند تا از یک کارشناس و یا فردی با تجربه راهنمایی بگیرند. در این حال استفاده از یک سیستم توصیه گر محصول، که با توجه به الویت محصولات مرتبط را به توصیه می کنند، ضروری است.
سیستم های توصیهگر محصول مبتنی بر فیلتر مشارکتی، بر اساس تاریخچه خرید و ارتباط کاربران و نظر سایر کاربران، کاربران هدف را پیش بینی کرده و محصولات مرتبط این علایق را به کاربران ارائه می دهد. از جمله مشکلات این دسته از سیستم های توصیه گر می توان به عدم اطلاعات کافی در مورد کاربران جدید، عدم توجه به تغییر نیاز کاربران با گذشت زمان، عدم دقت کافی در ارائه توصیه و غیره اشاره کرد. به منظور غلبه بر مشکلات موجود در سیستمهای توصیهگر مبتنی بر محتوا و فیلتر مشارکتی، سیستمهای توصیه گر ترکیبی ارائه شده است که مزایای روش های پیشین استفاده کرده و توصیه گر های انعطاف پذیری با سطح کاربر پسندی بالا ارائه نموده است [8]. در این پژوهش نیز یک سیستم توصیه گر ترکیبی ارائه شده است که از ترکیب خوشه بندی محصولات و روش فیلتر مشارکتی استفاده نموده است. نوآوری اصلی این پژوهش یافتن محصولات مورد علاقه کاربران، یافتن کاربران مشابه و ارائه محصولات و یا نمونه های مشابه به کاربران است. با توجه به این که محصولات مورد علاقه یک کاربر، محصولاتی با بیشترین نمره و رتبه بندی است، پس ارائه محصولات به کاربران مشابه می تواند مفید و با دقت بالایی باشد که سطح کاربر پسندی سیستم توصیه گر محصول پیشنهادی را افزایش می دهد.
2. سیستم توصیهگر محصول
سیستم توصیه گر محصول در تجارت الکترونیکی یکی از واسط هایی است که به منظور افزایش قابلیت کاربرپسندی فروشگاه های الکترونیکی مورد استفاده قرار گیرد. همچنین سیستم توصیه گر محصول می تواند با نظارت بر تاریخچه رفتار خرید مشتریان، الویت ها و نیاز های مشتریان را پیش بینی کند و محصولاتی که با نیاز های مشتریان ارتباط نزدیکی دارد به عنوان توصیه خرید به مشتریان پیشنهاد کند. کاربر نیز می تواند با اتکا به این توصیه ها محصولاتی که با الویت های آنان در ارتباط هستند، شناخته و تصمیم به خرید بگیرد. از این رو سیستم توصیه گر می تواند به در شناسایی اقلام مناسب برای نیاز ها و الویت های خود در یک راه موثر کمک کند و در حل مشکل سربار بیش از حد اطلاعات و رشد فروش در تجارت الکترونیک کمک کند [7].
سامانه های توصیه گر، الگوریتم های نسبتا ساده ای هستند که مناسب ترین و دقیق ترین پیشنهادات را با بررسی و کاوش اطلاعات مرتبط کاربران از بانک اطلاعاتی مربوطه، به کاربر ارائه می کنند. این سامانه ها، ببا بررسی انتخاب های کاربران در گذشته، الگوهایی را در داده ها پیدا می کنند که با توجه به آن الگوی رفتاری، برای هر کاربر توصیه مناسب را نمایش می دهند. وجه تمایز سیستم های توصیه گر و سیستم های جستجو این است که اولا در سیستم توصیه گر الزامی برای درخواست صریح از کاربر وجود ندارد و می توان در هر لحظه با رعایت ضوابط فنی و غیرفنی آیتم ها را به او پیشنهاد داد و ثانیا یک سیستم توصیه گر اصولا پیشنهادی بودن موارد را به کاربر گوشزد می کند کاربر بداند که این موارد نتیجه انتخاب صریح ( مثل انتخاب یک زیرشاخه از وب سایت) و جستجوی صریح (مثل درخواست برای جستجو) نیستند. تا کنون مطالعات متعددی در زمینه سیستم های توصیه گر و کاربردهای آنها توسط محققان داخلی و خارجی انجام گرفته است.
تقی زاده (1398) در پژوهشی انواع روش ای فیلترینگ در سیستمهای پیشنهاد دهنده را مورد بررسی قرار داده اند. حجم فراوان و رو به رشد اطلاعات بر روی اینترنت، فرایند تصمیم گیری و انتخاب اطلاعات، داده یا کالاهای مورد نیاز را، برای بسیاری از کاربران وب دشوار کرده است. سیستم های پیشناد دهنده، با هدف رفع این چالش به وجود آمده اند و تلاش می کنند تا از میان حجم عظیم اطلاعات، اطلاعات خاص و مفید را با توجه به علاقه و سلیقه کاربر و تجربیات کاربران گذشته به وی پیشنهاد دهند. برای طراحی سیستم های پیشنهاد دهنده اصول بسیاری وجود دارد، اما یکی از اصول مهم در طراحی این سیستم ها روش فیلترینگ مورد استفاده در آن است. بدین منظور روش های مختلفی تا به امروز ارائه شده اند. در این پژوهش ضمن دسته بندی این روش ها، کاربردها و مزایا و معایب هرکدام ارائه شده است [9]. خمیسی و همکاران (1398) در پژوهشی الگوریتم فیلتر گذاری مشارکتی در سیستم های توصیه گر را مورد بررسی قرار داده اند. سیستم های شخصی سازی وب متفاوتی جهت پیش بینی اقلام درخواستی آینده کاربر با بهره گیری از کاربرد وب کاوی پیشنهاد شده است. در این پژوهش به بررسی الگوریتم فیلتر گذاری مشارکتی در سیستم های توصیه گر پرداخته شده است [10].
F Pajuelo-Holguera و همکاران در سال 2020 پژوهشی با عنوان پیاده سازی سیستم های توصیه پر برای برنامه های فیلترینگ مشارکتی توسعه یافته انجام داده اند. در این پژوهش یک سیستم توصیه گر پیشنهاد شده است که روی یک سخت افزار با قابلیت برنامه ریزی مجدد برای تست روی تراشه برای برنامه های فیلترینگ مشارکتی توسعه یافته کم انرژی پیاده سازی می شود [9]. Panda و همکاران در سال 2020 پژوهشی با عنوان یک الگوریتم توصیه گر فیلترینگ مشارکتی بر اساس رویکرد نرمال سازی پیشنهاد داده اند. الگوریتم پیشنهادی از دو فاز ارزیابی و طراحی تشکیل شده است. در مرحله اول، الگوریتم پیشنهادی میانگین امتیاز کاربر را برای هر مورد پیدا می کند و تعداد کاربران خرید کننده در هر مورد شمارش می کند. سپس با استفاده از نرم افزار min-max تعداد نرمال کاربر در هر مورد و مقیاس میانگین رتبه بندی کاربران در یک محدوده معین را مشخص می کند. در مرحله دوم، الگوریتم پیشنهادی ماتریس رتبه بندی آموزش و آزمایش تقسیم می کند و رتبه بندی کاربران را پیش بینی می کند. کارایی الگوریتم پیشنهادی در این پژوهش با ده معیار عملکردی به اثبات رسیده است [11].
3. روششناسی پژوهش
داده های این پژوهش مربوط به داده های مشتریان شرکت بیمه ای ایران می باشد که برخی از این مشتریان قبلا از خدمات بیمه ای ارائه شده توسط بیمه ایران استفاده نموده اند و برخی تا به حال از خدمات بیمه ای استفاده نکرده اند.
روش گردآوری داده ها به صورت " پرسشنامه" بوده است. بدین صورت که برای دستیابی به یکسری از اطلاعات به مشتریان حاضر در شرکت بیمه ای پرسشنامه ای ارائه گردید و از مشتریان درخواست شد که به سوالات پرسشنامه صادقانه و با دقت پاسخ دهند. همچنین برای شناسایی متغیر های تاثیرگذار در رفتار پرداختی مشتریان از کمک های کارشناس بیمه استفاده شده است.
با توجه به فرمول آلفای کرونباخ و سوالات پرسشنامه این پژوهش ضریب آلفای کرونباخ 92/0 محاسبه شده است. همچنین پرسشنامه از روایی مطلوبی برخوردار است.
داده های این پژوهش شامل تعدادی رکورد از مشتریان حقیقی بیمه ایران می باشد که هر رکورد دارای چند فیلد به عنوان خصیصه2 های مشتریان می باشند. نوع داده های مورد استفاده در این پژوهش هم از نوع "عددی3" و هم از نوع " اسمی4" می باشند. جامعه آماری این پژوهش شامل 500 مورد از مشتریان حقیقی بیمه ایران در شهر رشت می باشند. داده ها مورد نظر در این پژوهش شامل داده های آماری مشتریان و داده های بانکی می باشند. داده های جمعیت آماری مشتریان شامل جنسیت، سن، وضعیت تاهل، تعداد فرزند، مدرک تحصیلی، شغل، میزان درآمد ماهیانه می باشد.
داده های بیمه ای مشتریان در این پژوهش شامل نوع بیمه درخواستی، مدت زمان استفاده از خدمات بیمه ای، میزان رضایت از خدمات بیمه می باشد. در نهایت نظر کارشناس بیمه در جهت نوع پرداخت و درصد حداقل پرداخت پرسیده شده است. پرسشنامه این پژوهش از سه بخش سوال تشکیل شده است که بخش اول مربوط به اطلاعات آماری متقاضی دریافت بیمه، بخش دوم اطلاعات بیمه ای دریافت کننده بیمه و بخش آخر نظر کارشناس بیمه به اطلاعات دریافتی در مورد متقاضی می باشد که به شرح زیر می باشد:
· اطلاعات آماری
1. جنسیت
2. سن
3. وضعیت تاهل
4. تعداد فرزند
5. مدرک تحصیلی
6. شغل
7. میزان درآمد ماهیانه
8. محل سکونت
· اطلاعات بیمه ای
1. نوع بیمه درخواستی
2. مدت زمان دریافت خدمات بیمه ای
3. روش پرداخت حق بیمه
4. میزان رضایتمندی از خدمات بیمه ای
· کارشناس بیمه
1. نوع پرداخت
2. درصد حداقل پرداخت
بعد از جمع آوری داده ها لازم است که آن ها در یک پایگاه جامع به صورت یکپارچه درآیند. بنابراین پایگاه داده یکپارچه در نرم افزار Excel تشکیل گردید آماده سازی داده ها و پیش پردازش داده ها شامل بخش های مقادیر گم شده5، کد بندی برچسب ها ( در یادگیری ماشین، ما معمولا با مجموعه داده هایی سر و کار داریم که حاوی چندین برچسب در یک یا چند ستون هستند. این برچسب ها می توانند به صورت کلمات یا اعداد باشند. برای اینکه داده ها قابل فهم یا قابل خواندن برای تحلیلگر باشند، داده ها اغلب با کلمات برچسب گذاری می شوند. کدبندی برچسب به تبدیل برچسب ها به شکل عددی به منظور تبدیل آن ها به فرم قابل خواندن توسط ماشین اشاره دارد. سپس الگوریتم های یادگیری ماشین می توانند به روشی بهتر تصمیم بگیرند که این برچسب ها چگونه باید کار کنند. این یک مرحله پیش پردازش مهم برای مجموعه داده ساختار یافته در یادگیری نظارت شده است. کدبندی برچسب داده ها را به شکل قابل خواندن توسط ماشین تبدیل می کند، اما یک عدد منحصر به فرد ( که از 0 شروع می شود) به هر کلاس داده اختصاص می دهد)، مقیاس بندی ویژگی6 و تفکیک مجموعه داده7 می باشد.
4. روش پیشنهادی
1. خوشه بندی با روش k-means مشتریان بر اساس میزان رضایت و تشکیل چهار خوشه و در نهایت جدا سازی و استفاده از خوشه ی مشتریان با میزان رضایت عالی(5).
2. خوشه بندی مجدد آن دسته از مشتریانی که در مرحله قبل جداسازی شده اند و میزان رضایت آنها از دریافت خدمات بیمه ای 5 بوده است، با روش k-means اینبار بر اساس درآمد ماهیانه که به 4 خوشه تقسیم می شوند.
3. تحلیل نظری خوشه ها و شناسایی ویژگی های شاخص هر خوشه و ارائه توضیحات
4. استفاده از تکنیک فیلترینگ مشارکتی برای هر خوشه بر اساس بیمه های پر فروش در هر خوشه و شناسایی مشتریان مشابه و ارائه توصیه
5. ارزیابی دقت و صحت و پوشش توصیه ها
6. ارائه یک الگوریتم برای پیشنهاد خرید بیمه با توجه به نتایج به دست آمده.
لازم به ذکر است که در این پژوهش داده ها به دو دسته آموزشی و آزمایشی تقسیم می شوند. نسبت داده های آموزشی 70 درصد کل داده ها می باشد و 30 درصد باقی مانده داده ها برای تست و آزمایش درستی پاسخگویی الگوریتم پیشنهادی مورد استفاده قرار میگیرند.
در یک سیستم مبتنی بر فیلتر مشارکتی(CF) فرض می شود که اگر دو کاربر منافع مشابهی داشته باشند، پش آن کاربران علاقه مشابهی نسبت به یکدیگر دارند. به طور کلی، یک لیست ازکاربران و یک لیست از اقلام را در نظر بگیرید.
برای هر کاربر U1 یک لیست m گزینه دارد که برای آن ها رتبه بندی نموده است. جدول 1 نمونه ای از ماتریس رتبه بندی کاربران را نشان می دهد. بنابراین، باشد ( ممکن است که m مجموعه ای تهی باشد)، یک کاربر قابل تشخیص ، به نام یک کاربر هدف، که برای آن کاربر، هدف فیلتر مشارکتی، پیدا کردن یک گزینه مورد علاقه در توصیه های جستجو خاص است. بنابراین، یک لیست از اقلام n، ، وجود خواهد داشت که کاربر هدف نیز به آن گزین ها بیشتر علاقه مند است. لیست توصیه شده باید از گزینه هایی باشد که توسط کاربر هدف به ترتیب کاهش ارزش نمرات پیش بینی شده و توسط فیلتر مشارکتی مورد بررسی قرار نگرفته باشند این رابط از الگوریتم های فیلتر مشارکتی به عنوان " Nـ توصیه برتر" شناخته شده است [12].
جدول 1: نمونه ای از ماتریس رتبه بندی | ||||
Item(I3) | Item(I2) | Item(I1) |
| |
2.5 | 3.0 | 5.0 | User(u1) | |
5.0 | 2.5 | 2.0 | User(u2) | |
- | - | 2.5 | User(u3) | |
3.0 | - | 5.0 | User(u4) | |
2.0 | 3.0 | 4.0 | User(u5) |
گام دوم از سیستم های مبتنی بر CF، انتخاب یک زیر مجموعه از کاربران با شباهت بالاتر است. پس از آن، گام بعدی محاسبه پیش بینی است. پیشبینی عمل استنتاج این است که مقدار ارزیابی کاربر از یک محصول است که تا کنون آن را ارزیابی نکرده است، چقدر است. با توجه به جدول 1، یک نمونه از این محاسبه را می توان در شکاف موجود برای کاربر U3 بر روی گزینه های I2 و I3 و کاربر U4 برای گزینه I2 پر کرد. بنابراین، پیش بینی مستقل از روش مورد استفاده ساخته می شود، به این دلیل که آن توسط یک میانگین وزنی رتبه بندی از همسایگان که ضریب قابل قبولی از شباهت دارد، تولید می شود. با توجه به گفته های فوق، پیش بینی را می توان با معادله زیر محاسبه کرد [11]:
(1) |
|
جدول 2: معیارهای ارزیابی دقت توصیه | |||||
شاخص | عملکرد شاخص | توضیحات | فرمول | ||
MAE | میانگین خطای مطلق | هر چه مقدار این معیار در ازای مشتریان کمتر باشد، دقت عملکرد روش فیلتر مشارکتی بیشتر خواهد بود. |
| ||
Accuracy | دقت | برابر است با تعداد مواردی که درست پیش بینی کردیم |
| ||
Recall | پوشش | نسبت موارد مناسب که در میان تمام موارد مربوطه واقعی پیدا شده است |
| ||
Precision | صحت | نسبت موارد یافت شده که مربوط به موارد واقعی هستند |
| ||
F-mesure | پوشش و صحت | برای کمک به ساده سازی دو معیار Recall و Precision در یک معیار واحد تعریف شده است. |
|
جدول 3: عناوین موجود در مجموعه داده | |||
وضعیت تاهل | سن | جنسیت | نام فیلد |
Marital status | Age | Gender | نام اختصاری |
گروه شغلی | تحصیلات | تعداد فرزندان | نام فیلد |
Job Category | Education | Dependents | نام اختصاری |
مدت زمان استفاده از خدمات بیمه ای | محل زندگی | حقوق ماهیانه | نام فیلد |
Period | Location | Mnth_Income | نام اختصاری |
نوع پرداخت مورد نظر کارشناس بیمه | میزان رضایت از خدمات بیمه ای | روش پرداخت مورد نظر مشتری | نام فیلد |
Payment type | Level of satisfaction | payment method | نام اختصاری |
بیمه بدنه | بیمه ثالث | درصد حداقل پرداخت طبق نظر کارشناس بیمه | نام فیلد |
Hull Insurance | Casualty Insurance | Minimum payment percentage | نام اختصاری |
بیمه درمان تکمیلی | بیمه آتش سوزی | بیمه عمر | نام فیلد |
Major Medical Insurance | Fire insurance | life Insurance | نام اختصاری |
بیمه زلزله | بیمه کارفرما در قبال کارکنان (ساختمانی) | بیمه کارفرما در قبال کارکنان (غیر ساختمانی) | نام فیلد |
Earthquake insurance | (construction) | (Non-construction) | نام اختصاری |
| بیمه سرقت | بیمه حوادث انفرادی | نام فیلد |
| Theft insurance | Individual accident insurance | نام اختصاری |
2.6. پیش پردازش داده ها
الگوریتم های یادگیری ماشین تنها اعداد را درک می کنند. در مجموعه داده پژوهش حاضر همان گونه که مشاهده شد تعدادی متغیر از نوع اسمی وجود دارد، پس لازم است این متغیر ها به متغیر عددی تبدیل شوند. برای این امر از روش کد بندی استفاده می کنیم. یعنی برای هر حالت یک خصیصه یک عدد در نظر می گیریم که از 0 شروع می شود
با رسم ماتریس همبستگی می توانیم نشان دهیم کدام متغیر نسبت به متغیر دیگر همبستگی زیاد یا کم دارد همانطور که دیده می شود وضعیت خرید بیمه ی ثالث با خرید بیمه ی بدنه ارتباط نزدیکی دارد. و عدد همبستگی آن ها 62/0 نیز است. .همچنین می توان به نزدیکی تقریبی ویژگی نوع پرداخت و درصد حداقل پرداخت که عدد همبستگی 53/0 را نشان می دهد نیز اشاره کرد. همچنین گروه شغلی و خرید بیمه کارفرما در قبال کارکنان (ساختمانی) و همینطور گروه شغلی و محل سکونت ضریب همبستگی آن ها 36/. می باشد و همبستگی جزیی دارند. در مقابل بیمه آتش سوزی و محل سکونت همبستگی 26/0- را نشان می دهد که بیانگر عدم همبستگی این دو ویژگی است.
7. پیاده سازی مدل پیشنهادی
این پژوهش بر روی 500 مشتری از مشتریان شرکت بیمه ایران به شماره نمایندگی3069 در شهر رشت انجام شده است. قابل ذکر است که به دلیل تنوع بالای بیمه های موجود در شرکت بیمه ای ایران تنها از 10 بیمه برتر و پرفروش استفاده شده است که در جدول (4) نمایش داده شده است.
ردیف | نام بیمه |
1 | بیمه ثالث |
2 | بیمه بدنه |
3 | بیمه عمر |
4 | بیمه آتش سوزی |
5 | بیمه درمان تکمیلی |
6 | بیمه کارفرما در قابل کارکنان (غیر ساختمانی) |
7 | بیمه کارفرما در قابل کارکنان (ساختمانی) |
8 | بیمه زلزله |
9 | بیمه حوادث انفرادی |
10 | بیمه سرقت |
در جدول (5) اسامی بیمه های مورد استفاده در دیتاست با شناسه های مشخص بیان شده است.
جدول 5: لیست شناسه های مورد استفاده در دیتاست | ||
ردیف | نام بیمه | شناسه بیمه ها |
1 | بیمه ثالث | Casualty Insurance |
2 | بیمه بدنه | Hull Insurance |
3 | بیمه عمر | Life Insurance |
4 | بیمه آتش سوزی | Fire insurance |
5 | بیمه درمان تکمیلی | Major Medical Insurance |
6 | بیمه کارفرما در قابل کارکنان (غیر ساختمانی) | (Non-construction) |
7 | بیمه کارفرما در قابل کارکنان (ساختمانی) | (construction) |
8 | بیمه زلزله | Earthquake insurance |
9 | بیمه حوادث انفرادی | Individual accident insurance |
10 | بیمه سرقت | Theft insurance |
خوشه بندی مشتریان بر اساس میزان رضایت عالی (5) به روش k-means و تعداد چهار خوشه در جدول (6) نمایش داده شده است.
جدول 6: نتیجه خوشهبندی بر اساس میزان رضایت از دریافت خدمات بیمهای | |||||
خوشه ها | خوشه 1 | خوشه 2 | خوشه 3 | خوشه 4 | |
عنوان خوشه | 5 | 4 | 3 | 2 | |
تعداد | 321 | 106 | 62 | 11 |
با توجه به اطلاعات جدول و خوشه بندی به روش k-means بر اساس میزان رضایت مشتریان به چهار خوشه تقسیم شده اند. خوشه اول با 321 مشتری که میزان رضایت 5 را از خدمات بیمه ای دارند، خوشه دوم با 106 مشتری که میزان رضایت 4 را از خدمات بیمه ای دارند، خوشه شماره 3 با 62 مشتری که میزان رضایت 3 را از دریافت خدمات بیمه ای دارند و خوشه آخر و چهارم با تعداد 11 مشتری که میزان رضایت از خدمات بیمه ای با امتیاز 2 را نمایش می دهد. برای خوشه بندی مجدد مشتریان بر اساس درآمد ماهیانه، مشتریان خوشه اول با میزان رضایت 5 و تعداد 321 نفر را در نظر می گیریم، مجدد این مشتریان را با روش خوشه بندی k-means، به چهار خوشه تقسیم می کنیم. نتیجه ی این خوشه بندی در جدول (7) آمده است.
جدول 7: خوشه بندی مشتریان بر اساس درآمد ماهیانه به روش k-means | ||||
خوشه ها | خوشه 1 | خوشه 2 | خوشه 3 | خوشه 4 |
عنوان خوشه | بیشتر از 12 میلیون | بین 12-10 میلیون | بین 10-6 میلیون | بین 6-4 میلیون |
تعداد | 183 | 70 | 47 | 21 |
طبق اطلاعات جدول (7) پس از خوشه بندی به روش k-means، تعداد 321 مشتری در چهار خوشه قرار گرفته اند. که از این تعداد 183 نفر با حقوق بالای 12 میلیون تومان در ماه در خوشه اول، 70 نفر با حقوق 10 الی 12 میلیون تومان در ماه در خوشه دوم، تعداد 47 نفر با حقوق 6 الی 10 میلیون تومان در ماه در خوشه سوم و در آخر تعداد 21 مشتری با حقوق ماهیانه 4 الی 6 میلیون تومان در خوشه چهارم قرار دارند.
8. تحلیل خوشه ها
1.8. تحلیل خوشه اول(مشتری با درآمد بالای 12 میلیون تومان)
در خوشه اول با 183 مشتری با درآمد بالای 12 میلیون تومان است. جدول (8) بیانگر ویژگی های شاخص مشتریان با تعداد و درصد آن ها است.
متغیر | عدد | درصد |
مرد | 143 | %78.1 |
40-30 | 68 | %37.2 |
متاهل | 140 | %76.5 |
یک فرزند | 57 | %31.1 |
لیسانس | 79 | %43.2 |
صنعت | 72 | %39.3 |
شهر | 159 | %86.9 |
ماهانه | 84 | %45.9 |
اقساط | 119 | %65 |
%50 درصد حداقل پرداخت | 82 | %44.8 |
ویژگی های شاخص در جدول (8) بیانگر این هستند که این ویژگی ها در این خوشه بیشترین تکرار را داشته اند و بخش زیادی از خوشه اول را افراد با این ویژگی ها تشکیل می دهند.
جدول 9: بیمه هایی که بیشترین خرید را توسط مشتریان خوشه اول داشته اند. | ||
اسامی بیمه ها | تعداد | درصد |
بیمه ثالث | 159 | %86.9 |
بیمه بدنه | 156 | %85.2 |
بیمه عمر | 92 | %50.3 |
همانطور که دیده می شود، بیمه ثالث، بیمه بدنه و بیمه عمر بیشترین خرید را در خوشه اول با مشتریان با درآمد بالای 12 میلیون تومان دارند.
2.8. تحلیل خوشه دوم (مشتری با درآمد 10 الی 12 میلیون تومان)
در خوشه دوم با 70 مشتری با درآمد 10 الی 12 میلیون تومان است. جدول (10) بیانگر ویژگی های شاخص مشتریان با تعداد و درصد آن ها است.
متغیر | عدد | درصد |
مرد | 39 | %55.7 |
40-30 | 32 | %47.7 |
یک فرزند | 25 | %37.7 |
لیسانس | 34 | %48.6 |
خدمات | 22 | %31.4 |
شهر | 49 | %70 |
بالای یک سال | 52 | %74.3 |
ماهانه | 31 | %44.3 |
اقساط | 65 | %92.9 |
%50 درصد حداقل پرداخت | 37 | %52.9 |
ویژگی های شاخص در جدول (10) بیانگر این هستند که این ویژگی ها در این خوشه بیشترین تکرار را داشته اند و بخش زیادی از خوشه دوم را افراد با این ویژگی ها تشکیل می دهند. جدول (11) بیانگر بیمه های شاخص خوشه دوم با تعداد و درصد آن ها می باشد.
جدول 11: بیمه هایی که بیشترین خرید را توسط مشتریان خوشه دوم داشته اند. | |||
اسامی بیمه ها | تعداد | درصد | |
بیمه ثالث | 45 | %64.3 | |
بیمه عمر | 35 | %50 | |
بیمه درمان تکمیلی | 40 | %57.1 |
همانطور که دیده می شود، بیمه ثالث، بیمه درمان تکمیلی و بیمه عمر بیشترین خرید را در خوشه دوم با مشتریان دارای درآمد 10 الی 12 میلیون تومان دارند.
3.8. تحلیل خوشه سوم (مشتری با درآمد 6 الی 10 میلیون تومان)
در خوشه سوم با 47 مشتری با درآمد 6 الی 10 میلیون تومان است. جدول (12) بیانگر ویژگی های شاخص مشتریان با تعداد و درصد آن ها است.
متغیر | تعداد | درصد | |
زن | 24 | %50 | |
30-20 | 16 | %33.3 | |
متاهل | 27 | %56.3 | |
بدون فرزند | 18 | %37.5 | |
لیسانس | 29 | %56.3 | |
خدمات | 26 | %54.2 | |
شهر | 42 | %87.5 | |
بالای یک سال | 29 | %60.4 | |
ماهانه | 22 | %45.8 | |
اقساط | 35 | %74.4 | |
%50 درصد حداقل پرداخت | 17 | %36.2 |
ویژگی های شاخص در جدول (13) بیانگر این هستند که این ویژگی ها در این خوشه بیشترین تکرار را داشته اند و بخش زیادی از خوشه سوم را افراد با این ویژگی ها تشکیل می دهند.
جدول 13: بیمه هایی که بیشترین خرید را توسط مشتریان خوشه سوم داشته اند. | |||
اسامی بیمه ها | تعداد | درصد | |
بیمه ثالث | 29 | %60.4 | |
بیمه درمان تکمیلی | 24 | %50 |
همانطور که دیده می شود، بیمه ثالث و بیمه درمان تکمیلی بیشترین خرید را در خوشه سوم با مشتریان دارای درآمد 6 الی 10 میلیون تومان دارند.
4.8. تحلیل خوشه چهارم(مشتری با درآمد 4 الی 6 میلیون تومان)
در خوشه چهارم با 21 مشتری با درآمد 4 الی 6 میلیون تومان است. جدول (14)بیانگر ویژگی های شاخص مشتریان با تعداد و درصد آن ها است.
ویژگی | تعداد | درصد |
زن | 17 | %81 |
30-20 | 9 | %42.9 |
متاهل | 12 | %57.1 |
بدون فرزند | 10 | %47.6 |
دیپلم | 10 | %47.6 |
خدمات | 11 | %52.4 |
شهر | 13 | %61.9 |
یک سال | 8 | %38.1 |
ماهانه | 11 | %52.4 |
اقساط | 21 | %100 |
%50 درصد حداقل پرداخت | 12 | %57.1 |
ویژگی های شاخص در جدول (14) بیانگر این هستند که این ویژگی ها در این خوشه بیشترین تکرار را داشته اند و بخش زیادی از خوشه چهارم را افراد با این ویژگی ها تشکیل می دهند.
5.8. الگوریتم فیلترینگ مشارکتی
در این پژوهش پس از خوشه بندی مشتریان ابتدا از نظر میزان رضایت از خدمات بیمه ای و سپس بر اساس درآمد ماهیانه و تحلیل ویژگی های هر خوشه، در ادامه به کمک الگوریتم فیلترینگ مشارکتی مشتریان مشابه در انتخاب بیمه را تشخیص می دهیم. برای این کار بیمه های ثالث، عمر و درمان تکمیلی که بیشترین خرید را در خوشه ها داشته اند را به عنوان بیمه های پر فروش انتخاب می کنیم. برای ادامه کار با فیلترینگ مشارکتی به: داده های اسامی بیمه ها و شناسه های آن ها و داده های، شناسه مشتریی مشتریان و میزان رتبه ای که به بیمه ها داده اند نیاز است. شکل (1) و (2) این دو نوع از اطلاعات را نمایش می دهد.
شکل 1: اسامی بیمهها و شناسههایشان
شکل2:اسامی مشتریان و نوع بیمه ها ی انتخابی و رتبه اعطا شده به هر بیمه آن ها
حالا با استفاده از قطعه کدی که در شکل (2) نمایش داده شده است، ویژگی های مشتری ورودی را به سیستم می دهیم که به ترتیب بیمه های ثالث با امتیاز 5، بیمه عمر با امتیاز 4 و بیمه درمان تکمیلی با امتیاز 3 را انتخاب کرده است.
شکل 3: بیمه های منتخب مشتری اصلی و امتیاز مشتری به هر بیمه
خروجی این قطعه کد بعلاوه دریافت اطلاعات نام بیمه، شناسه بیمه و رتبه ای مشتری به آن داده است در شکل (3) آمده است.
شکل 4: شناسه بیمه، نام بیمه و رتبه ی مشتری به هر بیمه
حالا مجموعه تمام مشتریانی که این سه بیمه را انتخاب کرده اند و امتیاز های متفاوتی به آن ها داده اند را می یابیم، چون در این قسمت از پژوهش هدف اصلی انتخاب های مشابه در زمینه بیمه است. در (4) و (5) خروجی این ویژگی ها را میبینیم.
شکل 5: مجموعه مشتریانی که این سه بیمه مشابه را انتخاب کردهاند
در مرحله بعد، همه مشتری با مشتری مشخص شده خود مقایسه شد و مشابه ترین مشتری پیدا شد. از طریق ضریب همبستگی پیرسون متوجه می شویم که هر مشتری چقدر به ورودی شباهت دارد. برای اندازه گیری قدرت ارتباط خطی بین دو متغیر استفاده می شود. شکل (6) شبیه ترین مشتریان به مشتری ورودی را با محاسبه میزان شباهت به روش ضریب همبستگی پیرسون نمایش می دهد.
شکل 6: محاسبه شباهت مشتریان به مشتری ورودی با ضریب همبستگی پیرسون
با توجه به اطلاعات شکل (6) برای مثال مشتری شماره 449 با میزان شباهت 1 بیشترین شباهت را به مشتری ورودی و مشتری شماره 133 بی شباهت ترین مشتری به مشتری ورودی از نظر انتخاب بیمه و رتبه دادن به بیمه ها است.
برای اینکه تشخیص دهیم مشتری ورودی چه امتیازی ممکن بود به بیمه های دیگری که مشتریان مشابه انتخاب کرده اند بدهند، وزن رتبه دهی توسط مشتری ورودی را با فرمول زیر محاسبه می کنیم.
(2) | weighted Rating = similarity Index * rating |
فرمول بالا توضیح می دهد که وزن رتبه ی احتمالی که مشتری اصلی به بیمه های مورد انتخاب مشتریان مشابه ممکن است بدهد برابر با میزان شباهت مشتری مشابه با مشتری ورودی در رتبه ای که مشتری مشابه به بیمه داده است. خروجی کار در شکل (7) آمده است.
شکل 7: محاسبه میزان رتبه احتمالی(وزن) مشتری ورودی به بیمه های مورد انتخاب مشتریان مشابه
در مرحله بعدی کار برای تشخیص و پیش بینی بهتر بیمه های منتخب دیگر توسط مشتری اصلی جمع میزان شباهت های کل بیمه ها و جمع میزان وزن های رتبه دهی احتمالی توسط مشتری اصلی و سپس میانگین بیشترین وزن رتبه دهی احتمالی توسط مشتری اصلی را محاسبه کرده و بیشترین آن ها را انتخاب می کنیم. شکل های (7) و (8) خروجی این کار را نشان می دهند.
شکل 8: محاسبه جمع شباهت ها و جمع وزن ها
شکل 9: محاسبه میانگین وزن ها برای پیدا کردن بهترین توصیه
با توجه به خروجی مرحله قبل و شکل های بالا همانطور که دیده می شود بیمه ها با شناسه 6 و 8 در بالاترین خانه های جدول با امتیاز 5 قرار دارند. پس دو بیمه ای که می توان به مشتری اصلی توصیه کرد بیمه های شماره 6 و 8 یعنی بیمه زلزله و بیمه کارفرما در قبال کارکنان (غیر ساختمانی) است. شکل (10) توصیه ها را با توجه به این توضیحات نشان می دهد.
شکل 10: ارائه توصیه بیمه به مشتری ورودی
در نهایت با به نتیجه رسیدن سیستم توصیه گر در این پژوهش برای کاربر ورودی هر خوشه نیز می توان بیمه هایی که کاربران مشابه دیگر انتخاب کرده اند را پیشنهاد داد. نتیجه کار در جدول (15) به چشم می خورد،هم چنین شکل (12) نیز فرایند الگوریتم پیشنهادی را به خوبی نشان میدهد که توضیحات آن به شرح زیر است :
1. خوشه بندی با روش k-means مشتریان بر اساس میزان رضایت و تشکیل چهار خوشه و در نهایت جدا سازی و استفاده از خوشه ی مشتریان با میزان رضایت عالی(5).
2. خوشه بندی مجدد آن دسته از مشتریانی که در مرحله قبل جداسازی شده اند و میزان رضایت آنها از دریافت خدمات بیمه ای 5 بوده است، با روش k-means اینبار بر اساس درآمد ماهیانه که به 4 خوشه تقسیم می شوند.
3. در صورتی که حقوق کاربر جدید بالای 12 میلیون تومان باشد، بیمه درمان و بیمه آتش سوزی را به کاربر پیشنهاد می دهیم.
4. در صورتی که حقوق کاربر جدید بین 10 الی 12 میلیون تومان باشد، بیمه بدنه را به کاربر پیشنهاد می دهیم.
5. در صورتی که حقوق کاربر جدید بین 6 الی 10 میلیون تومان باشد، بیمه بدنه و بیمه عمر را به کاربر پیشنهاد می دهیم.
6. در صورتی که حقوق کاربر جدید بین 4 الی 6 میلیون تومان باشد، بیمه آتش سوزی را به کاربر پیشنهاد می دهیم.
ردیف | ویژگی خوشه | بیمه های پر طرفدار | بیمه پیشنهادی |
1 | درآمد بالای 12 میلیون تومان | بیمه ثالث، بیمه بدنه، بیمه عمر | |
2 | درآمد 10 الی 12 میلیون تومان | بیمه ثالث، بیمه عمر، بیمه درمان تکمیلی | |
3 | درآمد 6 الی 10 میلیون تومان | بیمه ثالث، بیمه درمان تکمیلی | |
4 | درآمد 4 الی 6 میلیون تومان | بیمه عمر، بیمه درمان تکمیلی |
شکل12: الگوریتم
9.8. ارزیابی عملکرد روش پیشنهادی بر اساس توصیه بیمه
در ارزیابی عملکرد در روش پیشنهادی بر اساس توصیه بیمه، توصیه صحیح به صورت نسبت بیمه هایی است که به صورت مشترک بین مشتریان مشابه بررسی شده و بالاترین امتیاز را گرفته است. بیمه ها مشترک بین دو مشتری مشابه به منزله توصیه ای است که از سوی یک مشتری به مشتری مشابهش صورت گرفته و به صورت قطعی مورد قبول واقع شده و خریداری شده است. البته دیگر بیمه هایی که توسط یک مشتری به مشتری مشابه دیگر ارائه می شود ممکن است مورد قبول واقع شده و خریداری شود ولی به دلیل عدم دسترسی به نتایج واقعی از این موارد صرف نظر بع عمل می آید. جدول (16) معیار Recall برای 4 مشتری که بیشترین شباهت را به یکدیگر دارند که نشان دهنده نسبت توصیه های دقیق به کل توصیه های ارائه شده به مشتریان مشاه بررسی شده را نشان م دهد. دقت کل روش پیشنهادی بر اساس توصیه محصول از میانگین دقت کسب شده برای هر مشتری به دست آمده است.
Total Recall | 455 | 219 | 181 | 449 | # |
92.67 | 93.88 | 83.88 | 100 | 449 | |
90.5 | 89.37 | 100 | 89.31 | 181 | |
82.44 | 100 | 81.29 | 84.19 | 219 | |
100 | 92.18 | 90.6 | 82.72 | 455 | |
90.81 | 91.40 | 93.85 | 88.94 | 89.05 | avg |
Total Recall | 455 | 219 | 181 | 449 | # |
91.25 | 92.85 | 82.63 | 100 | 449 | |
89.6 | 88.36 | 100 | 88.22 | 181 | |
81.23 | 100 | 80.26 | 83.26 | 219 | |
100 | 91.20 | 89.3 | 81.69 | 455 | |
89.98 | 90.52 | 93.10 | 88.04 | 88.29 | avg |
Total Recall | 455 | 219 | 181 | 449 | # |
91.95 | 93.36 | 83.25 | # | 449 | |
90.04 | 88.86 | # | 88.76 | 181 | |
81.83 | # | 80.77 | 83.72 | 219 | |
| # | 91.68 | 89.94 | 82.20 | 455 |
87.13 | 87.70 | 91.3 | 84.65 | 84.89 | avg |
همانطور که در جدول (16) نشان داده شده است، مقدار کل Recall روش پیشنهادی به ازای بیمه های مشترک بین کابران مشابه 81/90% می باشد. مقدار کل Precision روش پیشنهادی به ازای بیمه های مشترک بینه کاربران مشابه 98/89% می باشد. همچنین مقدار کل معیار F-measure روش پیشنهادی به ازای بیمه های مشترک بین مشتریان مشابه 13/87% می باشد.
9.مقایسه روش پیشنهادی با الگوریتم ها و روش های دیگر
به منظور اعتبار سنجی روش پیشنهادی، در این بخش مقایسه روش پیشنهادی با دیگر الگوریتم ها را انجام خواهیم داد. از این رو با توجه به اینکه روش پیشنهادی از روش فیلتر مشارکتی توصیه بیمه بر اساس خوشه بندی است آن را از نظر معیار های دقت توصیه با دیگر الگوریتم ها مقایسه خواهیم کرد. در نمودار1 مقایسه روش پیشنهادی با دیگر الگوریتم ها در این حوزه از نظر دقت توصیه هایی که به درستی ارائه شده اند، نشان داده شده است. از آنجایی که در این پژوهش توصیه صحیح به صورت نسبت بیمه هایی است که به صورت مشترک بین کابران مشابه بررسی شده و بالاترین امتیاز را گرفته است، پس می توان این مقدار را به عنوان معیار مورد استفاده Recall معرفی کرد. چرا که بیمه های مشترک بین دو کاربر مشابه به منزله توصیه ی مفیدی است که از سوی یک مشتری به مشتری مشابهش صورت گرفته و به صورت قطعی مورد قبول واقع شده و خریداری شده است. نمودار 1 مقایسه روش پیشنهادی با روش های متفاوت دیگری [13-15] که در نمودار ذکر شده است را از نظر معیار Recall نشان می دهد.
نمودار1: مقایسه روش پیشنهادی با روش های دیگر از نظر معیار Recall
همانطور که در نمودار بالا نشان داده شده است. روش پیشنهادی در مقایسه با سایر روش های ذکر شده از نظر معیار Recall نتیجه بهتری را نشان می دهد. نتیجه بهتر در معیار Recall نشان دهنده دقت بالای سیستم توصیه گر پیشنهادی در ارائه توصیه به کاربران مشابه است. همچنین نمودار 2 مقایسه روش پیشنهادی با روش های دیگر را از نظر معیار Precision نشان می دهد.
نمودار2: مقایسه روش پیشنهادی با روش های دیگر از نظر معیار Precision
همچنینی با توجه به نمودار 2 روش پیشنهادی در مقایسه با سایر روش ها از نظر معیار Precision نتیجه بهتری را نشان می دهد. علاوه بر این نمودار 3 مقایسه روش پیشنهادی با تفاوت در روش نتیجه گیری را از نظر معیار F-measure نشان می دهد.
نمودار3: مقایسه روش پیشنهادی با الگوریتم های دیگر از نظر معیار F-mesure
10. نتیجهگیری
هدف از پژوهش حاضر ارائه یک الگوریتم برای گروه بندی انواع محصولات بیمه و کاربران در سیستم توصیه گر بیمه با خوشه بندی مبتنی بر فیلتر مشارکتی ارزیابی عملکرد آن بر اساس توصیه بیمه می باشد. فاز شناسایی مشتریان برای ارتقا و مدیریت تقاضای مشتری و همچنین کسب دانش سازمانی در خصوص مشتریان حال حاضر بیمه ایران با انجام داده کاوی در داده های مشتریان این بانک با اجرای خوشه بندی به روش K-means و فیلترینگ مشارکتی صورت گرفت و اهمیت متغیر پها به عنوان الگو در داده ها تلقی می شود. بیمه ها و موسساتی که خدمات بیمه ای ارائه می دهند، با استفاده از این الگوها و سرعت بالای پاسخگویی الگوریتم می توانند با سرعت بالاتر و دقت بیشتر در رابطه با شایستگی مشتریان خود برای ارائه خدمات بیمه ای تصمیم گیری کنند. بنابراین پاسخ سوال مثبت می باشد.
فیلترینگ مشارکتی یکی از تکنیک های سیستم های توصیه گر است که در دنیای اقتصاد به ویژه در بخش بازاریابی و ارائه خدمات و محصولات از آن استفاده می شود. با ساتفاده از این تکنیک توانستیممیزان شباهت مشتریان و خدمات بیمه ای که مشتریان خریداری می کنند را بررسی کنیم که منجر به بهبود شناخت مشتریان و نوع خدمات بیمه ای که استفاده می کنند با استفاده از داده های در دسترس شد. با دقت بالایی که این تکنیک در اختیار می گذارد، مشتریان مشابه به خوبی شناسایی شده وباعث ارائه خدمات بیمه ای بهتر از سوی شرکت بیمه ای شده و در نتیجه کاهش ضرر در صنعت بیه و افزایش سود می شود.
ویژگی های میزان رضایت، درآمد ماهانه مهمترین عناصر در بررسی شباهت مشتریان جهت دریافت خدمات بیمه ای می باشد. مدل حاصل شده می تواند ابزاری در بهبود ارائه خدمات بیمه ای به خصوص در فاز شناخت مشتریان در نظر گرفت.
در این پژوهش تنها فیلترینگ مشارکتی مورد بررسی و پیاده سازی قرار گرفت. با وجود این می توان از الگوریتم های دیگر سیستم های توصیه گر به شناسایی مشتریان مشابه پرداخت. همچنین استفاده از روش های ترکیبی هوش مصنوعی برای سنجش شباهت مشتریان و مقایسه آن ها پیشنهاد می شود.
[1] J. Neidhardt, T. Kuflik and W. Wörndl, “Special section on recommender systems in tourism,” Information Technology & Tourism, vol. 19, no. 1, pp. 83-85, 2018
[2] T.N. Nguyen and F. Ricci, “A chat-based group recommender system for tourism,” Information Technology & Tourism, vol. 18, no. 1, pp. 5-28, 2018.
[3] Bazargani, Mehdi, & Homayunpour, Zainab. (2019). Presenting a new method to discover the nearest neighbor in recommender systems based on collaborative filtering. Intelligent Multimedia Communication and Processing Systems, 1(1), 55-64.
[4] M. Jalili, S. Ahmadian, M. Izadi, P. Moradi and M. Salehi, “Evaluating collaborative filtering recommender algorithms: a survey,” IEEE access, vol. 6, pp. 74003-74024, 2018.
[5] Manteghipour, Mahnaz, & Rahimkhani, Parisa. (1401). Designing a hybrid model for classification of imbalanced data in the field of Casualty Insurance. Intelligent multimedia processing and communication systems, 3(2), 1-9.
[6] W.S. Lin, N. Cassaigne and T.C. Huan, “A framework of online shopping support for information recommendations,” Expert Systems with Applications, vol. 37, no. 10, pp. 6874-6884, 2010.
[8] A. Salah, N. Rogovschi and M. Nadif, “A dynamic collaborative filtering system via a weighted clustering approach”, Neurocomputing, vol. 175, pp. 206-215, 2016.
[9] M. Taghizadeh, “A review of filtering methods in recommender systems”, 6th National Conference on Computer Science and Engineering and Information Technology, 859097, 2018. [Persian].
[10] M. Khamisi, S. Samiri, “Review and comparison of collaborative filtering algorithm in recommender systems”, International Conference on Science, Engineering, Technology and Technological Businesses, 903155, 2018. [Persian].
[11] F. Pajuelo-Holguera, J.A. Gómez-Pulido, F. Ortega and J.M. Granado-Criado, “Recommender system implementations for embedded collaborative filtering applications”, Microprocessors and Microsystems, vol. 73, p. 102997, 2020.
[12] S.K. Panda, S. K. Bhoi and M. Singh, “A collaborative filtering recommendation algorithm based on normalization approach”, Journal of Ambient Intelligence and Humanized Computing, vol. 11, no. 11, pp. 4643-4665, 2020.
[13] Yao, S., Halpern, Y., Thain, N., Wang, X., Lee, K., Prost, F., ... & Beutel, A. (2021). Measuring recommender system effects with simulated users. arXiv preprint arXiv:2101.04526.
[14] Teixeira, B., Martinho, D., Novais, P., Corchado, J., & Marreiros, G. (2022, August). Diabetic-Friendly Multi-agent Recommendation System for Restaurants Based on Social Media Sentiment Analysis and Multi-criteria Decision Making. In EPIA Conference on Artificial Intelligence (pp. 361-373). Cham: Springer International Publishing.
[1] Recommendation System
[2] Feature
[3] Numeric
[4] Nominal
[5] Missing Values
[6] Feature Scaling
[7] Splitting the Dataset
مقالات مرتبط
حقوق این وبسایت متعلق به سامانه مدیریت نشریات دانشگاه آزاد اسلامی است.
حق نشر © 1403-1400