بکارگیری تکنیکهای خوشهبندی و الگوریتم ژنتیک در بهینهسازی درختان تصمیم گیری برای اعتبارسنجی مشتریان بانک ها
الموضوعات :محمود البرزی 1 , محمد خان بابایی 2 , محمدابراهیم محمدپور زرندی 3
1 - استادیار و عضو هیئت علمی دانشگاه آزاد اسلامی واحد علوم و تحقیقات
2 - عضو باشگاه پژوهشگران جوان، دانشگاه آزاد اسلامی، واحد علوم و تحقیقات (مسئول مکاتبات)
3 - دانشیار دانشگاه آزاد اسلامی واحد تهران مرکز ی
الکلمات المفتاحية: اعتبارسنجی, طبقه بندی, الگوریتم ژنتیک, درختان تصمیم گیری, انتخاب ویژگی, خوشه بندی,
ملخص المقالة :
درختان تصمیم گیری به عنوان یکی از تکنیک های داده کاوی کاربرد زیادی در اعتبارسنجی مشتریان بانک و شناسایی آن ها برای اعطای تسهیلات اعتباری دارد. مسئله اصلی در پیچیدگی درختان تصمیم گیری، اندازه بیش از حد، عدم انعطاف پذیری و دقت کم در طبقه بندی است. هدف از این مقاله ارائه مدل ترکیبی در بهینه سازی درختان تصمیم گیری توسط تکنیک الگوریتم ژنتیک به منظور حل مسائل ذکر شده در فوق برای اعتبارسنجی مشتریان بانک است. به نظر می رسد بتوان با انتخاب ویژگی های مناسب و ساخت درختان تصمیم گیری توسط الگوریتم ژنتیک به کاهش پیچیدگی و افزایش انعطاف پذیری درختان تصمیم گیری پرداخت. در مدل ترکیبی پیشنهادی ابتدا داده های اعتباری توسط تکنیک خوشه بندی SimpleKmeans به دو خوشه تقسیم می شوند. سپس با استفاده از الگوریتم ژنتیک، پنج الگوریتم انتخاب ویژگی مبتنی بر سه رویکرد فیلتر، Wrapper و طرح جاسازی شده بر پایه درخت تصمیم گیری ژنتیکی، به انتخاب ویژگی های اعتبارسنجی مهم در مجموعه داده می پردازند. در ادامه پنج درخت تصمیم گیری مبتنی بر الگوریتم C4.5 در هر خوشه با مجموعه ویژگی های منتخب ساخته می شود. بهترین درختان تصمیم گیری در هر خوشه مبتنی بر معیارهای بهینگی مورد نظر در این مقاله انتخاب شده و با هم ترکیب می شوند تا درخت تصمیم گیری نهایی برای اعتبارسنجی مشتریان بانک ایجاد شود. ابزار یادگیری ماشین وکا و نرم افزار GATree برای رسیدن به نتایج بکار گرفته شده است. نتایج پژوهش نشان می دهد که استفاده از مدل ترکیبی پیشنهادی در ساخت درخت تصمیم گیری منجر به افزایش دقت طبقه بندی نسبت به بسیاری از الگوریتم های مقایسه شده در این مقاله می شود؛ ولی پیچیدگی الگوریتم مدل ترکیبی پیشنهادی از برخی الگوریتم های طبقه بندی مقایسه شده در این مقاله بیشتر است.