بخش عمده پورتفوی صنعت بیمه کشور ایران را رشته بیمه اجباری مسئولیت مدنی دارندگان وسایل نقلیه موتوری زمینی در مقابل اشخاص ثالث، تشکیل داده است. توانایی پیش بینی وقوع و یا عدم وقوع خسارت به ویژه خسارتهای جانی نه تنها برای شرکتهای بیمه بلکه برای تصمیم گیرندگان در حوزههای چکیده کامل
بخش عمده پورتفوی صنعت بیمه کشور ایران را رشته بیمه اجباری مسئولیت مدنی دارندگان وسایل نقلیه موتوری زمینی در مقابل اشخاص ثالث، تشکیل داده است. توانایی پیش بینی وقوع و یا عدم وقوع خسارت به ویژه خسارتهای جانی نه تنها برای شرکتهای بیمه بلکه برای تصمیم گیرندگان در حوزههای افزایش امنیت جادهها اهمیت بسیاری دارد. به منظور پیش بینی برچسب وقوع یا عدم وقوع خسارت از روشهای طبقه بندی استفاده میشود که در واقع یک مساله طبقه بندی نامتوازن است. این نامتوازن بودن شدید، ناشی از ماهیت کسب و کار بیمه است. نامتوازن بودن دادههای صنعت بیمه باعث ایجاد چالشهای بسیاری در تجزیه و تحلیل دادههای مربوطه میشود. در این پژوهش، ما به طبقهبندی دادههای نامتوازن بیمه شخص ثالث در یک شرکت بیمه معتبر میپردازیم. در این راستا دو روش ترکیبی برای رفع مشکل نامتوازن بودن دادهها براساس 5 مدل پایه گاوسین بیز، بردارهای پشتیبان، لجستیک رگرسیون، درخت تصمیم، نزدیکترین همسایگی به منظور طبقهبندی موثرتر دادههای مربوطه ارائه میشود. نتایج بدست آمده نشان میدهد که مدلهای ترکیبی ارائه شده بهتر از سایر الگوریتمهای دادهکاوی برای دادههای مربوطه جواب میدهند و استفاده از درخت تصمیم در تجمیع مدلهای پایه برای ساخت مدل ترکیبی نتایج بهتری نسبت به رای گیری ساده مدلها ارائه میکند. همچنین ابر پارامتر تعداد مدلهای لازم در رای گیری بر اساس استراتژی شرکت قابل تنظیم است. تعداد ویژگیهای ثبت شده از بیمه نامهها در شرکتهای بیمه محدود است با تکمیل این ویژگیها به ویژه اضافه شدن سوابق رانندگی و سایر ویژگیهای فردی میتوان به مدل بهتری دست یافت.
پرونده مقاله