Identifying the Factors Affecting Marketing Success at One of the Branches of Tejarat Bank Using Data Mining Techniques
Subject Areas : Jounal of Marketing Managementmehdi ghazanfari 1 , aghdas badiee 2 , fatemeh moslehi 3
1 - Professor, Department of Industrial Engineering, Iran University of Science and Technology, Tehran, Iran
2 - Ph.D. Student, Economic and Social Systems Engineering, Iran University of Science and Technology, Tehran, Iran
3 - Master of Science (MSc) in Information Technology Engineering, Iran University of Science and Technology, Tehran, Iran
Keywords: Customer Relationship Management, Decision tree, Banking, Telephone Marketing, data mining,
Abstract :
Given the competitive market in the banking industry, the importance of customer relationship management in the industry is increasing day by day, one of the most important elements of which is active and effective marketing. Therefore, in this research it has been tried to identify and investigate the factors affecting the success of marketing activities, taking into account the application of data mining tools. Those factors that make bank customers more willing to take advantage of long-term deposits in the bank. In fact, the results of this study will help to increase the rate of return on direct marketing in the banking industry, which has been less considered in previous studies. To this end, the data set related to the telemarketing campaign conducted at one of the branches of Tejarat Bank in the period from May 2016 to September 2018. This paper is based on the type of applied research in sight of the objective of the research and from the perspective of the methodology of the research, is a mixed type, i.e., both qualitative and quantitative. The decision variable of this problem is the result of the success or failure of the telephone marketing activity. First, for identifying customers using the K-Means clustering algorithm, data are divided into six clusters. In the next step, C5 and CART decision tree algorithms were used to identify the factors affecting the success of the marketing campaign. As a general conclusion of the implementation of the three mentioned algorithms, it can be said that, in comparison with other variables, the time variable of the conversation with the client has the greatest effect on the decision of the person about the opening of the deposit. It should be noted that since the time period and place of data gathering in this research have been limited, the results of this study are not likely to be generalized to the other banks.
آقالاری، ص. و سجودی شیجانی، ا. (۱۳۹۵). "ارایه مدلی جدید برای پیشبینی وفاداری مشتری مبتنی بر وضعیت سازمان با روشهای دادهکاوی مطالعه موردی: بانکهای خصوصی و دولتی تبریز"، سومین کنفرانس بین المللی مدیریت و اقتصاد، دانشگاه تربیت حیدریه، ایران.
تارخ، م. و شریفیان، ک. (1389). "کاربرد دادهکاوی در بهبود مدیریت ارتباط با مشتری"، فصلنامه علمی پژوهشی مطالعات مدیریت صنعتی، دوره 6، شماره 17، صص. 153- 181.
خطیب سمنانی، م.، ایزدی، س. و خادمی، ر. (1396). "مزیت رقابتی داده کاوی در بانکداری الکترونیکی در برابر نااطمینانیهای اقتصادی"، اقتصاد مالی، دوره 11، شماره 39، صص. 146-125.
خواجوند، س.، تقویفرد، م. و نجفی، ا. (1391). "بخشبندی مشتریان بانک صادرات ایران با استفاده از داده کاوی"، مطالعات مدیریت (بهبود و تحول)، دوره 19، شماره 67، صص. 179-200.
رادفر، ر.، نظافتی، ن. و یوسفیاصل، س. (1393). "ﻃﺒﻘﻪﺑﻨﺪی ﻣﺸﺘﺮﻳﺎن اﻳﻨﺘﺮﻧﺖﺑﺎﻧﻚ ﺑﺎ ﻛﻤﻚ اﻟﮕﻮرﻳﺘﻢهای دادهﻛﺎوی"، مدیریت فناوری اطلاعات، دوره 6، شماره 1 ، صص. 90-71.
زینالعابدین، ف.، مهدوی، م. و خانبابایی، م. (1390). "بکارگیری تکنیکهای دادهکاوی و بازاریابی در بخشبندی و تحلیل رفتار مشتریان بانکداری الکترونیکی"، کنفرانس ملی فناوری اطلاعات و جهاد اقتصادی. دانشگاه سلمان فارسی کازرون، ایران.
عربمازار، ع.، نعمتی، م. و درویشی، ا. (1396). "بررسی اثر روابط اعطای تسهیلات بر هزینه مبادله تسهیلات بانکی: مطالعه موردی بانک کشاورزی"، اقتصاد مالی، دوره 11، شماره 38، صص21-46.
قدسالهی، ا.، شهریوری، ش. و ذوالنوری، م. (1390). "مقایسه تطبیقی تکنیکهای دادهکاوی به منظور ارزیابی اعتباری مشتریان"، پنجمین کنفرانس داده کاوی ایران، 23-22 آذر. 1390.
کابارانزاده قدیم، م. و کردنوری، ا. (1392). "شناسایی و بررسی رابطه بین عوامل حیاتی موفقیت در حوزه اعتباری بانک و اولویتبندی آنها با رویکرد فرآیند تحلیل سلسله مراتبی (موردکاوی بانک توسعه صادرات ایران – تهران"، اقتصاد مالی، دوره 7، شماره 24، صص. 213-242.
ناظمی، ج.، جعفری، پ. و هاشمی، ح. (1391). "کاوش خصوصیات مشتریان بانکداری خرد با استفاده از تکنیکهای دادهکاوی"، مجله مدیریت بازاریابی، دوره 7، شماره 14، صص 35-21.
ولایتی، م.، حسینزاده لطفی، ف.، شهریاری، م. و رهنمای رودپشتی، ف. (1396). "رویکرد دادهکاوی در بخشبندی بازار مشتریان به منظور اتخاذ استراتژیهای کارا (مطالعه موردی صنعت مخابرات)"، اقتصاد مالی، دوره 11، شماره 38، صص. 243-266.
Bilal Zoric, A. (2016). “Predicting customer churns in banking industry using neural networks”, Interdisciplinary Description of Complex Systems, 14 (2), PP. 116-124.
Chu, B.H, Tsai, M.S. Ho, C.S. (2007). “Toward a hybrid data mining model for customer retention”, Knowledge-Based Systems, 20)8(, PP. 703-718.
Elsalamony, H.A. (2014). “Bank direct marketing analysis of data mining techniques”, International Journal of Computer Applications, 85(7), PP. 12-22.
Glady, N., Baesens, B. & Croux, C. (2008). “Modeling churn using customer lifetime value”, European Journal of Operational Research, 197(1), PP. 402-411.
Han, J. & Kamber, M. (2006). “Data Mining: Concepts and Techniques”, United States of America: Morgan Kaufmann publishers.
Kotler, P. & Keller. K. (2008). “Marketing Management: Analysis, Planning, and Control”, Prentice-Hall, New Jersey.
Kotler, P. & Keller, K.L. (2013). “Framework for Marketing Management: Global Edition”, Pearson Higher Ed.
Li, W., Wu, X., Sun, Y. & Zhang, Q. (2010). “Credit card customer segmentation and target marketing based on data mining”, In Computational Intelligence and Security (CIS), 2010 International Conference on, PP. 73-76.
Mitik, M., Korkmaz, O., Karagoz, P., Toroslu, I.H. & Yucel, F. (2017). “Data Mining Approach for Direct Marketing of Banking Products with Profit/Cost Analysis”, the Review of Socionetwork Strategies, 11(1), PP. 17-31.
Nachev, A. & Hogan, M. (2014). “Application of multilayer perceptrons for response modeling”, In Proceedings on the International Conference on Artificial Intelligence (ICAI) (P. 1). The Steering Committee of the World Congress in Computer Science, Computer Engineering and Applied Computing (WorldComp).
Ngai, E.W., Xiu, L. & Chau, D.C. (2009). “Application of data mining techniques in customer relationship management: A literature review and classification”, Expert systems with applications,36(2), PP. 2592-2602.
Nueno, J.L. & Quelch, J.A. (1998). “The mass marketing of luxury” Business Horizons, 41(6), PP. 61-68.
Ogwueleka, F.N., Misra, S., Colomo‐Palacios, R. & Fernandez, L. (2015). “Neural network and classification approach in identifying customer behavior in the banking sector: A case study of an international bank”, Human factors and ergonomics in manufacturing & service industries, 25(1), PP. 28-42.
Oyeniyi, A.O. & Adeyemo, A.B. (2015). “Customer Churn Analysis in Banking Sector Using Data Mining Techniques”, African Journal of Computing & ICT, 8 (3).
Pavlović, D., Reljić, M. & Jaćimović, S. (2014). “Application of data mining in direct marketing in banking sector”, Industrija, 42(1), PP. 189-201.
Shih, J.Y., Chen, W.H. & Chang, Y.J. (2014). “Developing target marketing models for personal loans”, In Industrial Engineering and Engineering Management (IEEM), 2014 IEEE International Conference on. PP. 1347-1351.
Tan, P.N., Steinbach, M. & Kumar, V. (2005). “Introduction to Data Mining”, Pearson education.
Van den Poel, D. & Lariviere, B. (2004). “Customer attrition analysis for financial services using proportional hazard models”, European Journal of Operational Research, 157(1), PP. 196-217.
Xu, S. & Qiu, M. (2008). “A Privacy Preserved Data Mining Framework for Customer Relationship Management”, Journal of Relationship Marketing, 7 (3), PP. 309-321.
Yang, X., Chen, J., Hao, P. & Wang, Y.J. (2015). “Application of clustering for customer segmentation in private banking”, In Seventh International Conference on Digital Image Processing (ICDIP 2015) (Vol. 9631, P. 96311Z). International Society for Optics and Photonics.
_||_
آقالاری، ص. و سجودی شیجانی، ا. (۱۳۹۵). "ارایه مدلی جدید برای پیشبینی وفاداری مشتری مبتنی بر وضعیت سازمان با روشهای دادهکاوی مطالعه موردی: بانکهای خصوصی و دولتی تبریز"، سومین کنفرانس بین المللی مدیریت و اقتصاد، دانشگاه تربیت حیدریه، ایران.
تارخ، م. و شریفیان، ک. (1389). "کاربرد دادهکاوی در بهبود مدیریت ارتباط با مشتری"، فصلنامه علمی پژوهشی مطالعات مدیریت صنعتی، دوره 6، شماره 17، صص. 153- 181.
خطیب سمنانی، م.، ایزدی، س. و خادمی، ر. (1396). "مزیت رقابتی داده کاوی در بانکداری الکترونیکی در برابر نااطمینانیهای اقتصادی"، اقتصاد مالی، دوره 11، شماره 39، صص. 146-125.
خواجوند، س.، تقویفرد، م. و نجفی، ا. (1391). "بخشبندی مشتریان بانک صادرات ایران با استفاده از داده کاوی"، مطالعات مدیریت (بهبود و تحول)، دوره 19، شماره 67، صص. 179-200.
رادفر، ر.، نظافتی، ن. و یوسفیاصل، س. (1393). "ﻃﺒﻘﻪﺑﻨﺪی ﻣﺸﺘﺮﻳﺎن اﻳﻨﺘﺮﻧﺖﺑﺎﻧﻚ ﺑﺎ ﻛﻤﻚ اﻟﮕﻮرﻳﺘﻢهای دادهﻛﺎوی"، مدیریت فناوری اطلاعات، دوره 6، شماره 1 ، صص. 90-71.
زینالعابدین، ف.، مهدوی، م. و خانبابایی، م. (1390). "بکارگیری تکنیکهای دادهکاوی و بازاریابی در بخشبندی و تحلیل رفتار مشتریان بانکداری الکترونیکی"، کنفرانس ملی فناوری اطلاعات و جهاد اقتصادی. دانشگاه سلمان فارسی کازرون، ایران.
عربمازار، ع.، نعمتی، م. و درویشی، ا. (1396). "بررسی اثر روابط اعطای تسهیلات بر هزینه مبادله تسهیلات بانکی: مطالعه موردی بانک کشاورزی"، اقتصاد مالی، دوره 11، شماره 38، صص21-46.
قدسالهی، ا.، شهریوری، ش. و ذوالنوری، م. (1390). "مقایسه تطبیقی تکنیکهای دادهکاوی به منظور ارزیابی اعتباری مشتریان"، پنجمین کنفرانس داده کاوی ایران، 23-22 آذر. 1390.
کابارانزاده قدیم، م. و کردنوری، ا. (1392). "شناسایی و بررسی رابطه بین عوامل حیاتی موفقیت در حوزه اعتباری بانک و اولویتبندی آنها با رویکرد فرآیند تحلیل سلسله مراتبی (موردکاوی بانک توسعه صادرات ایران – تهران"، اقتصاد مالی، دوره 7، شماره 24، صص. 213-242.
ناظمی، ج.، جعفری، پ. و هاشمی، ح. (1391). "کاوش خصوصیات مشتریان بانکداری خرد با استفاده از تکنیکهای دادهکاوی"، مجله مدیریت بازاریابی، دوره 7، شماره 14، صص 35-21.
ولایتی، م.، حسینزاده لطفی، ف.، شهریاری، م. و رهنمای رودپشتی، ف. (1396). "رویکرد دادهکاوی در بخشبندی بازار مشتریان به منظور اتخاذ استراتژیهای کارا (مطالعه موردی صنعت مخابرات)"، اقتصاد مالی، دوره 11، شماره 38، صص. 243-266.
Bilal Zoric, A. (2016). “Predicting customer churns in banking industry using neural networks”, Interdisciplinary Description of Complex Systems, 14 (2), PP. 116-124.
Chu, B.H, Tsai, M.S. Ho, C.S. (2007). “Toward a hybrid data mining model for customer retention”, Knowledge-Based Systems, 20)8(, PP. 703-718.
Elsalamony, H.A. (2014). “Bank direct marketing analysis of data mining techniques”, International Journal of Computer Applications, 85(7), PP. 12-22.
Glady, N., Baesens, B. & Croux, C. (2008). “Modeling churn using customer lifetime value”, European Journal of Operational Research, 197(1), PP. 402-411.
Han, J. & Kamber, M. (2006). “Data Mining: Concepts and Techniques”, United States of America: Morgan Kaufmann publishers.
Kotler, P. & Keller. K. (2008). “Marketing Management: Analysis, Planning, and Control”, Prentice-Hall, New Jersey.
Kotler, P. & Keller, K.L. (2013). “Framework for Marketing Management: Global Edition”, Pearson Higher Ed.
Li, W., Wu, X., Sun, Y. & Zhang, Q. (2010). “Credit card customer segmentation and target marketing based on data mining”, In Computational Intelligence and Security (CIS), 2010 International Conference on, PP. 73-76.
Mitik, M., Korkmaz, O., Karagoz, P., Toroslu, I.H. & Yucel, F. (2017). “Data Mining Approach for Direct Marketing of Banking Products with Profit/Cost Analysis”, the Review of Socionetwork Strategies, 11(1), PP. 17-31.
Nachev, A. & Hogan, M. (2014). “Application of multilayer perceptrons for response modeling”, In Proceedings on the International Conference on Artificial Intelligence (ICAI) (P. 1). The Steering Committee of the World Congress in Computer Science, Computer Engineering and Applied Computing (WorldComp).
Ngai, E.W., Xiu, L. & Chau, D.C. (2009). “Application of data mining techniques in customer relationship management: A literature review and classification”, Expert systems with applications,36(2), PP. 2592-2602.
Nueno, J.L. & Quelch, J.A. (1998). “The mass marketing of luxury” Business Horizons, 41(6), PP. 61-68.
Ogwueleka, F.N., Misra, S., Colomo‐Palacios, R. & Fernandez, L. (2015). “Neural network and classification approach in identifying customer behavior in the banking sector: A case study of an international bank”, Human factors and ergonomics in manufacturing & service industries, 25(1), PP. 28-42.
Oyeniyi, A.O. & Adeyemo, A.B. (2015). “Customer Churn Analysis in Banking Sector Using Data Mining Techniques”, African Journal of Computing & ICT, 8 (3).
Pavlović, D., Reljić, M. & Jaćimović, S. (2014). “Application of data mining in direct marketing in banking sector”, Industrija, 42(1), PP. 189-201.
Shih, J.Y., Chen, W.H. & Chang, Y.J. (2014). “Developing target marketing models for personal loans”, In Industrial Engineering and Engineering Management (IEEM), 2014 IEEE International Conference on. PP. 1347-1351.
Tan, P.N., Steinbach, M. & Kumar, V. (2005). “Introduction to Data Mining”, Pearson education.
Van den Poel, D. & Lariviere, B. (2004). “Customer attrition analysis for financial services using proportional hazard models”, European Journal of Operational Research, 157(1), PP. 196-217.
Xu, S. & Qiu, M. (2008). “A Privacy Preserved Data Mining Framework for Customer Relationship Management”, Journal of Relationship Marketing, 7 (3), PP. 309-321.
Yang, X., Chen, J., Hao, P. & Wang, Y.J. (2015). “Application of clustering for customer segmentation in private banking”, In Seventh International Conference on Digital Image Processing (ICDIP 2015) (Vol. 9631, P. 96311Z). International Society for Optics and Photonics.
شناسایی عوامل مؤثر بر موفقیت بازاریابی در یکی از شعب بانک تجارت با استفاده از تکنیکهای دادهکاوی
چکیده
با توجه به بازار رقابتی موجود در صنعت بانکداری، اهمیت مدیریت ارتباط با مشتری روزبهروز افزایش مییابد که یکی از مهمترین ارکان آن، بازاریابی فعال و مؤثر است. از این رو، در این پژوهش تلاش شده است با توجه به کاربرد ابزارهای دادهکاوی، عوامل مؤثر بر موفقیت فعالیت بازاریابی در یکی از شعب بانک تجارت، شناسایی و بررسی شود. عواملی که باعث میشوند مشتریان بانک، تمایل بیشتری به بهرهمندی از سپردههای بلند مدت در بانک از خود نشان دهند. در حقیقت، نتایج این پژوهش به افزایش نرخ بازگشت در بازاریابی مستقیم در صنعت بانکداری کمک خواهد کرد که در مطالعات پیشین کمتر مورد توجه قرار گرفته بود. به این منظور، مجموعه دادهای مربوط به کمپین بازاریابی تلفنی صورت گرفته در یکی از شعب بانک تجارت در بازه زمانی اردیبهشت 1395 الی شهریور 1397 دریافت شده است. تحقيق حاضر از حيث طبقهبندي تحقيقات بر مبناي هدف از نوع كاربردي است و از دیدگاه روششناسی تحقيق، از نوع آميخته ميباشد. متغیر هدف این مسئله، نتیجه موفقیت یا شکست فعالیت بازاریابی تلفنی صورت گرفته است. ابتدا به جهت شناسایی مشتریان با استفاده از الگوریتم خوشهبندی K-Means دادهها به شش خوشه تقسیم شدهاند. در مرحله بعد، به منظور شناسایی عوامل مؤثر بر موفقیت کمپین بازاریابی، از الگوریتمهای درخت تصمیم C5 و CART استفاده شده است. بهعنوان نتیجهگیری کلی از اجرای سه الگوریتم ذکرشده میتوان عنوان کرد که در مقایسه با سایر متغیرها، متغیر مدتزمان مکالمه با مشتری، بیشترین تأثیر را در تصمیمگیری شخص در مورد افتتاح سپرده داشته است. لازم به ذکر است از آنجا که دوره زماني و مکان جمعآوری داده در اين پژوهش محدود بوده است، احتمالاً نتايج اين پژوهش قابل تعميم به ساير بانکها نيست.
واژههای كليدي: دادهکاوی، بانکداری، مدیریت ارتباط با مشتری، بازاریابی تلفنی، درخت تصمیم.
مقدمه
پر واضح است که در دنیای کنونی، رقابت بر سر ایجاد نوآوری و چگونگی استفاده از فناوری در کسبوکار به مرز اشباع رسیده و به نوعی میتوان گقت رونق خود را از دست داده است. حتی استفاده از سیستمهای پیشرفته و مدرن اطلاعاتی و تولید خدمات جدید و نوآورانه نیز نمیتواند موجب ایجاد مزیت رقابتی قابلتوجهی شده و بقای سازمان را تضمین کند. در نتیجه، سازمانها جهت فائق آمدن به مسائل و مشکلات اقتصادی ناچارند تلاش بیشتری در جهت جذب و نگهداری مشتریان صرف نمایند (Chu et al., 2007). جذب مشتریان جدید و حفظ مشتریان قدیمی از جمله فاکتورهای مهم برای حضور موفق بانکها و مؤسسات مالی در صنعت بانکداری است (تارخ و شریفیان، 1389). در این بازار رقابتی، راضی نگهداشتن مشتریان امری بسیار دشوار است؛ چرا که آنها هر روزه در معرض پیشنهادهایی برابر و یا حتی بهتر از خدمات شما از سوی رقبا میباشند و ازاینرو به مشتریانی بسیار باهوشتر، پرتوقعتر و حساستر از گذشته مبدل شدهاند (Kotler & Keller, 2008). پس، در شرایط کنونی که افراد با انتخابها و پیشنهادهای خدماتی فراوان و متنوعی روبرو هستند، فرآیند تصاحب مشتریان جدید، بسیار دشوار و هزینهبر است (Van den Poel & Lariviere, 2004). با در نظر گرفتن فشارهای موجود برای کاهش هزینهها و محیط رقابتی امروز، سازمانهای بیشتری شروع به تمرکز بر روی مدیریت ارتباط با مشتری کردهاند. رفتارهای ناشناخته مشتریان در مدیریت ارتباط با مشتری بسیار مهم هستند. از این رو مهم است که تصمیمات آینده مشتریان را شناسایی کنیم و سپس سازمان بتواند اقدامات متفاوتی انجام دهد (Glady et al., 2008).
همانطور که گفته شد از جمله کلیدهای موفقیت در کسب و کار و فائق آمدن به مسائل و مشکلات اقتصادی، وجود ارتباط خوب با مشتری است. به همین دلیل، سازمانها توجه بیشتری بر مدیریت ارتباط با مشتری معطوف کردهاند. یکی از استراتژیهای مدیریت ارتباط با مشتری، تحلیل و شناسایی رفتار و ویژگیهای مشتریان است که رسیدن به این هدف با بکارگیری بازاریابی صورت میپذیرد (Pavlović et al., 2014). بازاریابی، یک عامل کلیدی برای معرفی و ارائه محصولات به مشتریان است. در بازاریابی بانک، محصولاتی مانند کارت اعتباری و وام به مشتریان معرفی میشوند که استراتژی های متفاوتی برای معرفی این نوع محصولات بانکی وجود دارد (Shih et al., 2014). یکی از استراتژیهای مورد استفاده در بازاریابی، تبلیغات است که بانکها از دو روش کلی تبلیغ برای جذب مشتریان و ارائه محصولات جدید استفاده میکنند: بازاریابی انبوه و بازاریابی مستقیم (Nachev & Hogan et al., 2014) بازاریابی انبوه با هدف دسترسی به تعداد زیادی از مشتریان صورت میپذیرد، شامل تبلیغات از طریق روزنامه، رادیو و تلویزیون (Nueno & Quelch et al, 1998). برخلاف بازاریابی انبوه، مشتریان در بازاریابی مستقیم از طریق یک کانال خاص به طور اختصاصی در مورد محصولات اطلاع پیدا میکنند همچون ایمیل، پیامک و تلفن (Mitik et al., 2017). از طرفی، بازاریابی صورت گرفته از طریق یک مرکز تلفن، به سبب آنکه از راه دور و از طریق تلفن انجام میشود، بازاریابی تلفنی عنوان میشود (Kotler & Keller, 2013).
بانکهای اطلاعاتی، مقدار بسیار زیادی از اطلاعات مربوط به مشخصات مشتریان، تراکنشها و نتایج مربوط به کمپینهای بازاریابیِ محصولات قبلی را شامل میشوند. استخراج الگوها و قواعد موجود در این پایگاههای اطلاعاتی برای استفاده در بازاریابی محصولات جدید به صورت دستی امکانپذیر نمیباشد. روشهای متفاوت خودکار کردن این فرآیند به منظور حل این چالش وجود دارد. دادهکاوی، عنصر مهم هر چارچوب مدیریت ارتباط با مشتری است که تجزیه و تحلیل مشکلات کسبوکار را تسهیل نموده و برای چالشهای موجود در کسبوکار، دادهها را آمادهسازی و مدل پیشنهادی را ارزیابی میکند (Xu & Qiu, 2008). فرآیند و الگوریتمهای دادهکاوی با جستجو و کشف الگوهای پنهان میان دادهها، شناسایی روابط میان آنها و استخراج دانش، درک بهتری از کسبوکار به مدیران میدهد (Oyeniyi & Adeyemo, 2015)؛ که میتواند منجر به بهبود مدیریت ارتباط با مشتری شود.
تمرکز این پژوهش، بر استفاده از تکنیکهای دادهکاوی برای استخراج الگوهای با معنی و مفید از حجم عظیم دادههای مربوط به رفتار مشتریان است؛ تا عوامل اصلی تاثیرگذار بر تصمیم مشتریان از طریق کمپین بازاریابی شناسایی شوند. عواملی که باعث میشوند مشتریان بانک تمایل بیشتری به بهرهمندی از سپردههای بلند مدت در بانک از خود نشان دهند. در حقیقت نتایج این پژوهش به افزایش نرخ بازگشت در بازاریابی مستقیم در صنعت بانکداری کمک خواهد کرد که در مطالعات پیشین کمتر مورد توجه قرار گرفته است. به این منظور، در بخش 2 به مطالعات پیشین صورت گرفته در این حوزه اشارهای خواهیم داشت. در بخش 3 روششناسی پژوهش و در بخش 4 چارچوب پژوهش بررسی میشود. در انتها، بخش 5 نتایج این پژوهش را بیان مینماید.
پیشینه پژوهش
تحقیقات متنوعی در حوزه بانکداری بر روی بخشبندی مشتریان، شناسایی و تحلیل رفتار آنها صورت گرفته است. برخی از این موارد در ادامه بررسی میشود.
اگوولکا و همکاران (Ogwuelek et al, 2015) جهت شناسایی تغییر الگوی رفتار مشتریان بانک، یک مدل شبکه عصبی مصنوعی را ارائه دادند که در یک فرآیند مرحلهای توسعه داده شده است. هدف آنها، اعمال مدیریت مؤثر، ابقاء روابط مشتریان با بانک، افزایش کارایی، رشد و توسعه بود. مدل پیشنهادی آنها در یکی از بانکهای بین قارهای تحت نظارت بانک مرکزی نیجریه1، برای پشتیبانی از برنامهریزی و سیستم ارتباط با مشتری آنها بهکاررفته شد. نتایج نشان داد مدل بکار گرفته شده در زمینههای کارایی خدمات ارائهشده به مشتریان، ابقاء مشتری، رضایت مشتری، کاهش هزینه و جذب مشتریان جدید موجب پیشرفت قابلملاحظهای میشود.
ناظمی و همکاران در مقاله خود با استفاده از تكنيكهاي دادهكاوي، مدلي دومرحلهای معرفی کردهاند (ناظمی و همکاران، 1391). با استفاده از این مدل میتوان ويژگيهاي گروههاي مختلف در مشتريان سپرده كوتاهمدت بانك را شناسايي نمود. در مرحله نخست، از الگوریتم K-means، جهت شناسايي گروههای مشتريان بر مبناي ميزان سودآوري آنها بهره گرفته شده و در مرحله دوم، با استفاده از الگوریتم Apriori، قواعد وابستگي هر خوشه استنتاج نمودند. مشتریان بر اساس میزان سودآوری به سه خوشه برنزی و نقرهای و طلایی تقسیم شدند. نتايج تجربي حاكي از اين بود كه ويژگي تناوب تراكنش، بهتر ميتواند نمايانگر سودآوري آتي مشتري باشد. قدس الهی و همکاران با استفاده از روشهای دادهکاوی، مشتریان را به دو دسته معتبر و غیر معتبر تقسیمبندی کردند(قدس الهی و همکاران،1390). به همین منظور تکنیکهای تحلیل خطی، رگرسیون لجستیک، درخت تصمیم، شبکههای عصبی، ماشین بردار پشتیبان موردبررسی و مقایسه قرار گرفتند. نتایج این پژوهش نشان داد، تکنیک درخت تصمیم از نظر شاخصهای صحت کلی و هزینه پشتیبانی دارای عملکرد بهتری نسبت به سایر تکنیکهای ذکر شده است. لی و همکاران (Li et al., 2010) مشتریان کارت اعتباریِ یک بانک چینی را با استفاده از تکنیک K-means در چهار دسته بخشبندی کردند. سپس با استناد به اطلاعات کسانی که از پیش، کارت اعتباری داشتند، مدل پیشبینی کنندهای بر اساس الگوریتمهای متفاوت C5.0، CHAID2، CART3 و شبکه عصبی ارائه کردند. با توجه به نتایج دستهبندی، روش شبکه عصبی بالاترین دقت را در میان الگوریتمها دارا بود؛ اما از آنجا که خروجی روش شبکه عصبی بهسختی قابل توضیح بود، روش C5.0 بهعنوان مدل برتر برای تولید قواعد مربوط به رفتار مشتریان برگزیده شد.
زینالعابدینی و همکاران مدلی را با استفاده از تکنیک دادهکاویِ خوشهبندی برای بخشبندی مشتریان و تکنیک بازاریابی مدل تحلیل4 RFM برای شناسایی و تحلیل رفتار مشتریان بانکداری الکترونیکی و تعیین میزان ارزش آنها ارائه دادهاند (زینالعابدینی و همکاران،1390). نتایج این پژوهش مشخص کرد که بهکارگیری تکنیک دادهکاوی خوشهبندی و تحلیل RFM، میتواند مشتریان بانکی را بر اساس رفتار آنها شناسایی و تحلیل نموده و به بخشبندی آنها متناسب با ارزش هر گروه از مشتریان بپردازد. رادفر و همکاران ﻳﻚ ﻣﺪل ﻣﻨﺎﺳﺐ ﺑﺮاي طبقهبندی ﻣﺸﺘﺮﻳﺎن ﺑﺮ ﻣﺒﻨﺎي بهرهگیری از خدمات اینترنت بانک ارائه دادند (رادفر و همکاران، 1393). این ﭘﮋوﻫﺶ، جهت طبقهبندی ﻣﺸﺘﺮﻳﺎن ﺑﺎﻧﻚ در ﺳﻄﻮح اﺳﺘﻔﺎده ﻣﺨﺘﻠﻒ از ﺧﺪﻣﺎت اینترنت بانک ﺑﻪ کمک ﻣﺪل فرایندی CRISP-DM و روش دستهبندی درخت تصمیمC5، ﺑﻪ اراﺋﺔ ﻳﻚ ﭼﺎرﭼﻮب ﻧﻮﻳﻦ پرداخت. در این راستا، ﺷﺶ ﺧﺼﻴصه ﻣﺸﺘﺮﻳﺎن شامل سن، سطح تحصیلات، جنسیت، تأهل، شغل و محل سکونت، به عنوان ﻣﺘﻐﻴﺮﻫﺎي ﻣﺴﺘﻘﻞ ﭘﮋوﻫﺶ و طبقۀ ﻣﺸﺘﺮي به عنوان ﻣﺘﻐﻴﺮ وابسته در نظر گرفته شد. نهایتاً مهمترین شاخصها در اﻳﻦ اﻟﮕﻮرﻳﺘﻢ، ﺗﺤﺼﻴﻼت و ﺷﻐﻞ تشخیص داده شد و شاخصهای ﺷﻬﺮ، ﺟﻨﺴﻴﺖ، ﺳﻦ و ﺗﺄﻫﻞ به ﺗﺮﺗﻴﺐ از اهمیت کمتری ﺑﺮﺧﻮردار بودند. آقالاری و سجودی شیجانی جهت پیشبینی وفاداری مشتریان بانکی، مدلی را با در نظر گرفتن وضعیت سازمان ارائه دادند (آقالاری و سجودی شیجانی، 1395). در این مدل، از شبکه عصبی جهت کمی کردن وضعیت سازمان و مدل کردن وفاداری مشتریان به همراه پارامترهای دیگر استفاده شد. با توجه به نتایج پژوهش صورت گرفته از جمله عوامل مؤثر بر میزان وفاداری، میتوان به تعداد دفعات تراکنش حساب مشتری، تعداد دفعات رجوع مشتری و انتخاب خدمات بانک برای پرداخت قبوض اشاره کرد. همچنین به این نتیجه رسیدند که افزودن وضعیت سازمان بهعنوان ورودی به مدل غیرخطی، بر میزان وفاداری مشتری تأثیر مثبت دارد.
بیلال زوریک (Bilal Zoric, 2016) از روش شبکه عصبی جهت شناسایی ويژگیهای مشتریان و بهبود سیستم مدیریت ارتباط با مشتریان در صنعت بانکداری بهره گرفت. نتایج تحقیق مشخص کرد مشتریانی که از خدمات بانکی بیشتر استفاده میکنند وفادارتر هستند؛ بنابراین بانکها باید بر روی مشتریانی که کمتر از خدمات بانکی استفاده میکنند تمرکز کنند و با توجه به نیازها و انتظاراتشان خدماتی برای آنها تعریف و ارائه کنند. ارائه سبد متنوعی از محصولات و خدمات بانکی یکی از مهمترین راههای افزایش سودآوری مشتریان میباشد؛ درحالیکه میزان وفاداری آنها را نیز میافزاید. به عنوانمثال بانکها میتوانند بیمه خودرو همراه با وام خودرو به مشتریان ارائه دهند. مشتریان وفادارتر افرادی هستند که از بیش از دو محصول یا خدمت بانکی استفاده میکنند.
اُینِیی و آدیمو (Oyeniyi & Adeyemo, 2015) بر اساس تکنیکهای دادهکاوی، مدلی جهت شناسایی الگوهای رفتار تراکنشی مشتریان و پیشبینی و تشخیص مشتریانی که با احتمال بالا بانک را ترک و یا تعویض خواهند کرد، توسعه دادهاند. مدل ارائهشده در گام نخست از الگوریتم خوشهبندی k-Meansجهت تقسیم مشتریان در پنج خوشه استفاده کرده است و در گام بعد، الگوریتم JRip بهمنظور شناسایی قواعد به کار گرفته شده است. مدل بر روی مجموعه داده یکی از بانکهای کشور نیجریه پیادهسازی شده است. یانگ و همکاران (Yang et al, 2015)، بهمنظور شناسایی مشتریان باارزش یک بانک چینی، از تکنیک خوشهبندی آنها با استفاده از الگوریتم k-Means بهره گرفتهاند. مشتریان بر اساس ویژگیهای دموگرافیک، اطلاعات تراکنشی و رفتارهای اقتصادی در سه خوشه تقسیمبندی شدهاند. خوشه اول، مشتریان باارزش بالا هستند که هم از محصولات اقتصادی استفاده میکنند و هم حسابهای سپرده بلندمدت با مبالغ بالا دارند. خوشه دوم، مشتریان مبتنی بر محصولات مالی هستند که بیشترین درخواست آنها، خرید محصولات مالی بوده است. خوشه سوم، مشتریان سپردهگرا هستند که تمایلی به خرید محصولات مالی ندارند و سپردهگذاری روش مطلوب آنها برای مدیریت سرمایهشان میباشد. از سوی دیگر، السالامونی (Elsalamony, 2014) کارایی الگوریتمهای دستهبندی را در بازاریابی مستقیم بانکداری بررسی کرده است.
همانطور که گفته شد برای رقابت مؤثرتر در بازارهای رقابتی دنیا بانکها بایستی درک بهتری از مشتریان و بازار داشته باشند. صنعت بانکداری در دنیا تغییرات زیادی را در نحوه انجام فعالیتهای خود متحمل شده است. بانکهای پیشرو از ابزارهای دادهکاوی برای تقسیمبندی مشتریان، اعتبارسنجی مشتریان جهت اعطای تسهیلات و تأیید آنها، پیشبینی عدم پرداخت بدهیها، بازاریابی و شناسایی الگوهای کلاهبرداری استفاده میکنند. در مقاله خطیب سمنانی و همکاران ضمن اشارهای به بحث نااطمینانی و تأثیر آن بر مشتریان، تکینیکهای دادهکاوی به عنوان مزیت رقابتی در رضایت مشتریان از بانکداری الکترونیکی و خدمات بانکی بیان میگردد (خطیب سمنانی و همکاران، 1396).
در مقاله ولایتی و همکاران یک رویکرد مبتنی بر پردازش داده ارائه میشود تا با واکاوی رفتار مشتریان سیاستهای بازاریابی مربوط به هر مشتری به صورت سفارشی تعیین شود (ولایتی و همکاران، 1396). متدولوژی ارائه شده از خوشه بندی دادههای استخراج شده از پایگاه داده مربوط به رفتار مشتری استفاده میکند. سپس با توجه به کلاس مالی، که مشتری به آن تعلق دارد دو نوع سیاست بازاریابی را پشتیبانی میکند. سیاست اول، سیاست بقا یا تثبیت مشتری و سیاست دوم سیاست انگیزشی یا ارتقا نام دارد. مقاله کاباران زاده قدیم و کرد نوری، با هدف شناسایی و بررسی عوامل حیاتی موفقیت در حوزه اعتباری بانک توسعه صادرات ایران و اولویتبندی آنها با رویکرد فرآیند تحلیل سلسله مراتبی انجام شده است (کاباران زاده قدیم و کرد نوری، 1392). آنها با مرور مطالعاتی عوامل حیاتی موفقیت در حوزههای اعتباری بانکها، نسبت به استخراج عوامل مربوطه اقدام و سپس با اخذ نظرات خبرگان و مشتریان اعتباری، عوامل حیاتی موفقیت مربوط به حوزه اعتباری این بانک شناسایی و انتخاب شدند. عرب مازار و همکاران در مقاله خود، اثر متغیر روابط اعطای تسهیلات بر هزینه مبادله (هماهنگی) اعطای تسهیلات بانکی در بانک کشاورزی و بررسی توالی اهمیت متغیرهای تاثیرگذار بر هزینه مبادله را اندازهگیری نمودند (عرب مازار و همکاران، 1396). دادههای مورد استفاده در این مطالعه از طریق پرسشنامه که حاصل دادههای ذهنی و تجربی افراد تکمیل کننده پرسشنامهها می باشد به دست آمده است. در این مطالعه به منظور بررسی فرضیههای مطرح شده و مشخص کردن اهمیت متغیرهای تاثیرگذار بر هزینه مبادله، از روش شبکه عصبی مصنوعی استفاده شده است.
در این پژوهش عملکرد الگوریتمهای MLPNN5، TAN6، LR7 و C5.0 بهمنظور دستهبندی مشتریان برای افتتاح حساب سپرده، ارزیابی و مقایسه شده است. هدف از اجرای این الگوریتمها، افزایش اثربخشی بازاریابی با تشخیص متغیرهای مؤثر در موفقیت کمپین بازاریابی است. عملکرد الگوریتمهای ذکرشده با سه شاخص آماری دقت، حساسیت و شفافیت مقایسه شده است که یکی از مهمترین متغیرها در تأثیرگذاری بازاریابی متغیر سن تشخیص داده شد. میتیک و همکاران (Mitik et al., 2017) نیز، روشی ترکیبی برای افزایش کارایی کمپین بازاریابی ارائه دادند. در این روش ابتدا بر مبنای اینکه مشتری به استفاده از محصول ارائ هشده تمایل دارد یا نه دستهبندی شدهاند؛ در مرحله بعد، مشتریان برای محصولات و کانالهای ارتباطی پیشنهادی خوشهبندی میشوند. مدل پیشنهادی بر روی یک مجموعه داده بانکی به کار گرفته شد و در پیشبینی محصول و کانال مناسب برای مشتری دقت بالایی داشت. همچنین تحلیل هزینه-سود نیز صورت گرفته است. طبق نتایج، بهکارگیری این روش سود کلی را اندکی کاهش میدهد اما کاهش چشمگیری در هزینههای بازاریابی صورت گرفته نیز دارد.
روششناسی پژوهش
تحقيق حاضر از حيث طبقهبندي تحقيقات بر مبناي هدف از نوع كاربردي است و از اين منظر كه نتايج اين تحقيق بلافاصله ميتواند مورد استفاده قرار گيرد جزء تحقيقات تصميمگرا است. تحقيق حاضر از اين منظر كه دلايل و عوامل مؤثر بر موفقیت کمپین بازاریابی بانک را در سالهاي 95 الی 97 مورد مطالعه قرار ميدهد، به لحاظ بازه زماني در شمار تحقيقات معطوف به گذشته ميباشد. از دیدگاه روششناس تحقيق، روش مورد استفاده از نوع روش تحقيق آميخته ميباشد. به اين معنا كه در بخش كيفي روش موردنظر، براي رسيدن به عوامل تاثيرگذار بر موفقیت کمپین بازاریابی بانک، از همان پاسخهاي كوتاه و خام پاسخدهندگان به پرسشهایِ حاصل از مذاکره تلفنی بهره گرفته شده است. در بخش كمي نیز، اجرای مدل پیشنهای در بستر فرآیندیِ الگوریتم 8CRISP-DM صورت پذیرفته است. همچنین، تکنیکهای دادهکاوی مورداستفاده شامل خوشهبندی و دستهبندی است که در ادامه به تفصیل بیان میگردد.
جامعه آماري تحقيق، متشكل از مشتریان یکی از شعب بانک تجارت است که بر اساس روش نمونهگيري هدفمند، بخشی از آنها استخراج شدند و در قالب يك مذاکره تلفنی ساختارمند از آنها اطلاعاتي اخذ گرديد. همچنین از لحاظ ماهيت و روش، تحقیق حاضر در زمره تحقيقات علي قرار ميگيرد، زيرا به كشف علت يا عوامل مؤثر بر موفقیت کمپین بازاریابی یکی از شعب بانک تجارت ميپردازد.
- الگوریتم CRISP-DM
روشهای گوناگوني براي پیادهسازی و اجراي پروژههای دادهکاوی موجود است. استفاده از اين روشها باعث میشود، دادهکاو مديريت بهتري بر پروژه موردبررسی خود داشته باشد. يکي از روشهای بسيار قوي و رايج در ادبيات دادهکاوی روش CRISP-DM است. اين روش، يك مدل فرايندي براي دادهکاوی ارائه میدهد كه مروري بر چرخه عمر هر پروژه دادهکاوی است. چرخه عمر يك پروژه دادهكاوي، شامل شش مرحله است: شناخت محیط کسبوکار، شناخت دادهها، آمادهسازی دادهها، مدلسازی، ارزيابي نتايج و بهکارگیری مدل.
فاز اول) شناخت محیط کسبوکار
در این فاز، آشنایی با محیط کسبوکار صورت میگیرد. در ابتدا، مسئلهای با توجه به نیازهای سازمان بهگونهای که تکنیکهای دادهکاوی پاسخگوی آن باشد، تعریف میشود.
فاز دوم) شناخت دادهها
اقدام اولیه در این فاز، جمعآوری دادهها است. بعد از گردآوری دادهها، پردازشهای اولیه بر روی مجموعه دادهها صورت میگیرد تا شناخت دادهها تکمیل گردد.
فاز سوم) آمادهسازی دادهها
پاکسازی و آمادهکردن داده بهمنظور اعمال الگوریتمهای دادهکاوی در این مرحله صورت میپذیرد. این مرحله طولانیترین و مهمترین فاز فرآیند دادهکاوی میباشد. ايجاد جدول، انتخاب ويژگي و رکوردها با توجه به هدف تعیینشده و همچنین تبديل و تميز کردن دادهها براي استفاده در مدل از جمله اعمالی است که در اين فاز انجام میشود.
فاز چهارم) مدلسازی
هدف اصلی فرآیند دادهکاوی در این مرحله صورت میپذیرد. مسائل و چالشهای مختلفی مطرح میشود و با توجه به مسئله مطرحشده، تکنیک مناسب جهت آناليز دادهها و استخراج دانش از آنها به كار گرفته میشود.
فاز پنجم) ارزیابی
در این فاز، پس از کسب نتایج از مرحله قبل، نتایج بهدستآمده ارزیابی میشود تا به اطمینان برسیم که این نتایج، متناسب با اهداف تعریف شده برای پروژه است و به نوعی، میزان کارایی آن سنجیده شود.
فاز ششم) توسعه
در اين فاز، ثمره حاصل از فعالیتهای صورت گرفته در مراحل قبل به دست ميآيد. تمركز اين فاز بر بهکارگیریِ دانش بهدستآمده، در فرآيندهاي کسبوکار است؛ بهگونهای كه نیاز مطرحشدهِ کسبوکار حل شود.
- تکنیکهای دادهکاوی
Ø خوشهبندی
تکنیک خوشهبندی، فرآیندی است که سبب تقسیمبندی مجموعهای از دادههای ناهمگن به تعدادی خوشه همگن میشود (Ngai et al., 2009). در آغازِ فرآیند خوشهبندی، تعداد، شکل و ویژگیهای خوشهها مشخص نیست؛ و به سبب آنکه هیچ دانش قبلی از خوشهها وجود ندارد، تکنیک خوشهبندی روشی بدون ناظر9 نامیده میشود (خواجهوند و همکاران، 1391). در این بین، الگوریتم k-means یک نوع از الگوریتمهای خوشهبندی است که یک مجموعه داده را به تعداد خوشه مشخصشده توسط کاربر، تقسیم میکند. این الگوریتم برای پیادهسازی و اجرا، نسبتا سریع و ساده است؛ و یکی از مهمترین الگوریتمهای دادهکاوی است.
Ø دستهبندی
دستهبندی از مدلهای پیشبینی در دادهکاوی است و به زبان ساده، به معنای اختصاص یک شیء داده به یکی از چند دسته یا کلاس از پیش تعریف شده است (Tan et al., 2005). دستهبندی، فرایندی است برای یافتن مدل یا تابعی که دستههای مجزایی را با هدف پیشبینی دسته شیئی تعریف کند که برچسب دسته یا کلاس آن مشخص نیست (Han & Kamber, 2006). از اینرو، دستهبندی از روشهای با ناظر10 11 در دادهکاوی است.
از مدلهای دستهبندی، میتوان درخت تصمیم را نام برد. هر درخت تصمیم، از تعدادی گره و یال تشکیل شده است (Tan et al., 2005). درختهای تصمیم، بر اساس دادههای گذشته ساخته میشوند و هرگاه داده جدیدی با تمام ویژگیهایش (تمام ویژگیها بهجز دسته مربوطهاش) وارد شود، گرههای داخلی بر روی ویژگیهای ورودی جدید، آزمون انجام داده و نتیجه آزمون بر روی یالها میرود و گرههای برگ نیز دسته پیشبینیشده، برای داده جدید را ارائه خواهند کرد (Han & Kamber, 2006).
مدلسازی پیشنهادی و بیان یافتهها
روشهاي مختلفي براي اجراي پروژههاي دادهكاوي وجود دارد كه يكي از اين روشهاي بسيار قوي، روش CRISP-DM است. با توجه به اينكه، براي انجام فرايند پژوهش و دستيابي به اهداف آن، استاندارد جهاني CRISP-DM مورداستفاده قرارگرفته است؛ در ادامه، ساختار اجرايي پژوهش جهت مدلسازی پیشنهادی بر اساس مراحل اين استاندارد تشريح میشود:
- شناخت محیط کسبوکار
اين مرحله ابتدا بر درك اهداف و ملزومات پروژه از ديدگاه کسبوکار متمركز میشود كه یکی از اهداف کسبوکار بانك، مدیریت ارتباط با مشتری، جذب مشتریان جدید و حفظ مشتریان فعلی است. ازاینرو، فعالیتهای بازاریابی در نیل به این هدف بسیار ضروری به نظر میرسد. در این راستا، شناخت مشتریان و بررسی عوامل تأثیرگذار بر فعالیتهای بازاریابی، بانکها را در مدیریت هر چهبهتر ارتباط با مشتری مساعدت خواهند نمود.
- شناخت دادهها
در این فاز، از دادههای موجود در یکی از بانکهای تجارت استفاده شده است؛ منتهی به دلیل حفظ امنیت اطلاعات از ذکر شماره شعبه بانک خودداری میشود. دادههای مرتبط با کمپین بازاریابی تلفنی صورت گرفته در بازه زمانی اردیبهشت 1395 الی شهریور 1397، شامل 20 متغیر و 41188 رکورد که در جدول 1 متغیرهای این مجموعه داده توضیح داده شده است. متغیر هدف این مسئله، نتیجه تشکیل کمپین بازاریابی تلفنی صورت گرفته است که آیا بر اثر آن، مشتری اقدام به افتتاح حساب میکند یا خیر؟
جدول 1: تعریف متغیرها
ردیف | نام متغیر | توضیح متغیر |
---|---|---|
1 | شغل | مقادیر طبقهای: مدیر، کارگر، مؤسس شرکت، بازنشسته، خانهدار، تکنسین فنی، بیکار، دانشجو، شغل آزاد، نیروهای خدماتی و نامشخص. |
2 | وضعیت تأهل | مقادیر طبقهای: مطلقه، متأهل، مجرد و نامشخص. |
3 | تحصیلات | مقادیر طبقهای: بیسواد، چهارم ابتدایی، ششم ابتدایی، نهم ابتدایی، دبیرستان، دورههای حرفهای، مدرک دانشگاهی و نامشخص. |
4 | وضعیت حساب قبلی | آیا مشتری قبلا در این بانک حساب سپرده داشته است؟ شامل دو مقدار Yes و No |
5 | وام مسکن | آیا مشتری وام مسکن دارد؟ شامل دو مقدار Yes و No |
6 | وام | آیا مشتری وام دارد؟ شامل دو مقدار Yes و No |
7 | کانال ارتباطی | مقادیر طبقهای: تلفن همراه، تلفن |
8 | ماه | آخرین ارتباط با مشتری در چه ماهی صورت پذیرفته است؟ مقادیر طبقهای: ('فروردین' , 'اردیبهشت' ... 'بهمن’ ,'اسفند’) |
9 | روز | آخرین ارتباط با مشتری در چه روزی از هفته صورت پذیرفته است؟ مقادیر طبقهای: ('سه شنبه','چهارشنبه ,' ‘پنج شنبه’,'دوشنبه’, 'یکشنبه’ ,'شنبه' ) |
10 | مدتزمان مکالمه | متغیر عددی مدت مکالمه آخرین ارتباط با مشتری چند دقیقه بوده است؟ |
11 | تعداد دفعات ارتباط | متغیر عددی شامل تعداد دفعات ارتباط صورت گرفته با مشتری طی مدتزمان جمعآوری این اطلاعات. |
12 | مدتزمان سپریشده از ارتباط پیشین | متغیر عددی شامل تعداد روز گذشته از آخرین مکالمه. |
13 | تعداد ارتباطات پیشین | متغیر عددی شامل تعداد دفعات ارتباط صورت گرفته با مشتری قبل از آغاز زمان جمعآوری این اطلاعات. |
14 | نتیجه بازاریابی پیشین | مقادیر طبقهای شامل موفقیت، شکست، ناموجود |
15 | نرخ تغییرات اشتغال | متغیر عددی مربوط به تغییرات اشتغال که در هر فصل سال منتشر میشود. |
16 | شاخص قیمت مصرفکننده | متغیر عددی مربوط به نتایج آمارگیری این شاخص که بهصورت ماهانه منتشر میشود. |
17 | شاخص اعتماد مشتریان | متغیر عددی مربوط به نتایج آمارگیری این شاخص که بهصورت ماهانه منتشر میشود. |
18 | euribor3m | متغیر عددی مربوط به این شاخص روزانه. |
19 | آمار شاغلین | متغیر عددی مربوط به آمار شاغلین که در هر فصل منتشر میشود. |
20 | نتیجه تماس (متغیر هدف) | متغیر دودویی که شکست یا موفقیت بازاریابی صورت گرفته را مشخص میکند. شامل دو مقدار Yes و No |
- آمادهسازی دادهها
اين مرحله از روش CRISP-DM شامل انتخاب دادهها، پاکسازی دادهها و آماده كردن داده براي انجام فرآیند دادهکاوی است. پاکسازی داده، در واقع مرحله كنترل كيفي قبل از تحليل داده است و يكي از وظايف آن، پر کردن يا حذف دادههاي مفقوده است. لذا، در این مرحله مقادیر پرت و مفقود اصلاح شدند. همچنین 25% از کل دادهها بهصورت تصادفی از مجموعه داده موردنظر، بهمنظور اجرای الگوریتمها انتخاب شدند.
در مرحله بعد، انواع روشهای مدلسازی انتخابشده به كار گرفته میشوند. در كل، براي يك نوع مسئله دادهكاوي چندين روش وجود دارد. برخي از روشها نيازمند فرمت ويژهای از دادهها هستند. بنابراين اغلب لازم است كه به مرحله آمادهسازي دادهها، بازگردیم. براي اعمال روشها در پژوهش حاضر، از نرمافزار IBM SPSS modeler 18 استفاده شده است.
- اجرای مدل
Ø خوشه بندی
ابتدا الگوریتم خوشهبندی K-Means، اجرا و از معیار سیلوئت12 برای انتخاب تعداد خوشه بهینه استفاده شد. از این رو، خوشهبندی با تعداد متفاوت خوشهها مورد بررسی قرار گرفت. با توجه به اینکه تمایز قابلملاحظهای میان نرخ معیار سیلوئت حاصل از خوشههای مختلفِ ایجاد شده، وجود نداشت؛ تعداد 6=k با بالاترین نرخ معیار برای خوشهبندی دادهها برگزیده شد. در جدول 2، نرخ معیار سیلوئت برای تعداد خوشههای متفاوت مشخص شده است. در جدول 3، نتایج این خوشهبندی آمده است.
جدول 2: محاسبه معیار سیلوئت برای تعداد مختلف خوشهها
تعداد خوشه | نرخ معیار سیلوئت |
---|---|
2 خوشه | 0.173 |
3 خوشه | 0.236 |
4 خوشه | 0.158 |
5 خوشه | 0.179 |
6 خوشه | 0.244 |
7 خوشه | 0.221 |
8 خوشه | 0.218 |
9 خوشه | 0.191 |
10 خوشه | 0.229 |
جدول 3: نتایج حاصل از خوشهبندی
نام متغیر | خوشه 1 | خوشه 2 | خوشه 3 | خوشه 4 | خوشه 5 | خوشه 6 |
---|---|---|---|---|---|---|
شغل | کارگر (31.79%) | مدیر (32.09%) | مدیر (26.56%) | کارگر (31.79%) | مدیر (30.5%) | مدیر (31.28%) |
وضعیت تأهل | متأهل (65.24%) | متأهل (51.03%) | متأهل (56.49%) | متأهل (57.03%) | متأهل (60.01%) | متأهل (57.49%) |
تحصیلات | دبیرستان (25.61%) | مدرک دانشگاهی (44.15%) | مدرک دانشگاهی (29.53%) | دبیرستان (25.61%) | مدرک دانشگاهی (36.22%) | مدرک دانشگاهی (39.57%) |
وضعیت حساب قبلی | NO (70.35%) | NO (97.71%) | NO (87.51%) | NO (83.96%) | NO (77.36%) | NO (96.26%) |
وام مسکن | NO (51.14%) | YES (56.33%) | YES (57.09%) | YES (56.66%) | YES (54.1%) | YES (52.67%) |
وام | NO (82.47%) | NO (83.11%) | NO (81.17%) | NO (81.53%) | NO (81.66%) | NO (79.68%) |
کانال ارتباطی | تلفن (100%) | تلفن همراه (87.33%) | تلفن همراه (91.97%) | تلفن همراه (91.54%) | تلفن همراه (100%) | تلفن همراه (91.98%) |
ماه | May (56.62%) | Jun (18.09%) | May (46.48%) | May (69.68%) | Jul (16.48%) | May (16.48%) |
روز | Fri (21.1%) | Tue (23.4%) | Fri (23.29%) | Mon (23.77%) | Thu (22.05%) | Tue (24.6%) |
مدتزمان مکالمه | 251.96 | 332.28 | 236.25 | 232.15 | 253.412 | 342.56 |
تعداد دفعات ارتباط | 2.82 | 1.79 | 2.098 | 2.26 | 2.792 | 1.87 |
مدت سپریشده از ارتباط پیشین | 999 | 999 | 996 | 999 | 999 | 5.60 |
تعداد ارتباطات پیشین | 0.001 | 0.109 | 1.102 | 0 | 0 | 1.70 |
نتیجه بازاریابی پیشین | Nonexistent (99.88%) | Nonexistent (91.19%) | Failure (100%) | Nonexistent (100%) | Nonexistent (100%) | Success (92.25%) |
نرخ تغییرات اشتغال | 1.19 | 2.46- | 1.62- | 1.80- | 1.119 | 2.07- |
شاخص قیمت مصرفکننده | 94.11 | 92.96 | 93.04 | 92.97 | 93.60 | 93.36 |
شاخص اعتماد مشتریان | 38.74- | 37.388- | 43.62- | 46.27- | 40.02- | 38.45- |
euribor3m | 4.87 | 1.007 | 1.72 | 1.31 | 4.80 | 1.004 |
آمار شاغلین | 5206 | 5047.96 | 5100.53 | 5095.67 | 5222.05 | 5027.88 |
نتیجه تماس (متغیر هدف) | NO (96.08%) | YES (59.59%) | NO (94.25%) | NO (97.28%) | NO (94.37%) | YES (65.51%) |
تعداد رکورد | 3389 | 829 | 1009 | 1359 | 3266 | 374 |
در ادامه به توصیف هر یک از خوشهها میپردازیم:
خوشه 1: این خوشه شامل مشتریان کارگر با تحصیلات دبیرستانی و بدون وام مسکن است که کانال ارتباطی آنها تلفن بوده است و نتیجه فعالیت بازاریابی قبلی در ارتباط با این مشتری موجود نبوده است. اکثر مشتریان این خوشه بعد از این فعالیت بازاریابی اقدام به افتتاح حساب نکردهاند.
خوشه 2: این خوشه شامل مشتریان مدیر با تحصیلات دانشگاهی و با وام مسکن است که کانال ارتباطی آنها تلفن همراه بوده است و نتیجه فعالیت بازاریابی قبلی در ارتباط با این مشتری موجود نبوده است. اکثر مشتریان این خوشه بعد از این فعالیت بازاریابی اقدام به افتتاح حساب کردهاند.
خوشه 3: این خوشه شامل مشتریان مدیر با تحصیلات دانشگاهی و با وام مسکن است که کانال ارتباطی آنها تلفن همراه بوده است و نتیجه فعالیت بازاریابی قبلی در ارتباط با این مشتری با عدم موفقیت همراه بوده است. اکثر مشتریان این خوشه بعد از این فعالیت بازاریابی اقدام به افتتاح حساب نکردهاند.
خوشه 4: این خوشه شامل مشتریان کارگر با تحصیلات دبیرستانی و با وام مسکن است که کانال ارتباطی آنها تلفن همراه بوده است و نتیجه فعالیت بازاریابی قبلی در ارتباط با این مشتری موجود نبوده است. اکثر مشتریان این خوشه بعد از این فعالیت بازاریابی اقدام به افتتاح حساب نکردهاند.
خوشه 5: این خوشه شامل مشتریان مدیر با تحصیلات دانشگاهی و با وام مسکن است که کانال ارتباطی آنها تلفن همراه بوده است و نتیجه فعالیت بازاریابی قبلی در ارتباط با این مشتری موجود نبوده است. اکثر مشتریان این خوشه بعد از این فعالیت بازاریابی اقدام به افتتاح حساب نکردهاند.
خوشه 6: این خوشه شامل مشتریان مدیر با تحصیلات دانشگاهی و با وام مسکن است که کانال ارتباطی آنها تلفن همراه بوده است و نتیجه فعالیت بازاریابی قبلی در ارتباط با این مشتری با موفقیت همراه بوده است. اکثر مشتریان این خوشه بعد از این فعالیت بازاریابی اقدام به افتتاح حساب کردهاند.
از مقایسه خوشههای ایجادشده میتوان نتیجه گرفت تأثیرگذارترین متغیر در نتیجه بازاریابی، مدتزمان مکالمه میباشد و بعد از این متغیر، متغیرهای مربوط به سابقه مشتری نظیر نتیجه بازاریابی پیشین، مدتزمان سپریشده از ارتباط پیشین و تعداد ارتباط پیشین نیز در نتیجه بازاریابی مؤثر است.
Ø درخت تصمیم
در این مرحله بهمنظور کشف عوامل مؤثر بر موفقیت بازاریابی تلفنی در بانک، الگوریتمهای دستهبندی C5 و CART استفاده شد. در اجرای درخت تصمیم C5، متغیرهایی به عنوان متغیرهای شغل، وضعیت تأهل، تحصیلات، وضعیت حساب قبلی، وام مسکن، وام، کانال ارتباطی، ماه، روز، مدتزمان مکالمه، تعداد دفعات ارتباط، مدتزمان سپریشده از ارتباط پیشین، تعداد ارتباطات پیشین، نتیجه بازاریابی پیشین، نرخ تغییرات اشتغال، شاخص قیمت مصرفکننده، شاخص اعتماد مشتریان، شاخص euribor3m و آمار شاغلین، متغیرهای مستقل مسئله و متغیر نتیجه تماس به عنوان متغیر هدف تعیین شدند. با توجه به نتایج حاصل از اجرای این الگوریتم، متغیرهای مدتزمان مکالمه، مدتزمان سپریشده از ارتباط پیشین، شاخص قیمت مصرفکننده، آمار شاغلین و شغل به ترتیب به عنوان مهمترین متغیرها در تأثیرگذاری بازاریابی تلفنی شناخته شدند. دقت دستهبندی الگوریتم C5 در جدول 4 نمایش دادهشده است. همچنین، قواعد استخراجشده از الگوریتم C5 در جدول 5 آمده است.
جدول 4: دقت درخت تصمیم C5
پارتیشن | آموزش | آزمایش | ||
---|---|---|---|---|
نمونههای طبقهبندیشده صحیح | 7479 | 91.13% | 1862 | 91.19% |
نمونههای طبقهبندیشده نادرست | 728 | 8.87% | 180 | 8.81% |
کل نمونهها | 8207 |
| 2042 |
|
جدول 5: قواعد استخراجشده درخت تصمیم C5
ردیف | قاعده | کلاس No | کلاس Yes | ||
---|---|---|---|---|---|
فروانی مطلق | فراوانی نسبی | فروانی مطلق | فراوانی نسبی | ||
R1 | مدتزمان سپریشده از ارتباط پیشین 22 مدتزمان مکالمه 212 وضعیت حساب قبلی = No آمار شاغلین 5076.2 وام = No وضعیت تأهل = متأهل وام مسکن = No | 4 | 22.22% | 14 | 77.77% |
R2 | مدتزمان سپریشده از ارتباط پیشین 22 مدتزمان مکالمه 212 وضعیت حساب قبلی = No آمار شاغلین 5076.2 وام = No وضعیت تأهل = متأهل وام مسکن = Yes | 11 | 61.11% | 7 | 38.88% |
R3 | مدتزمان سپریشده از ارتباط پیشین 22 مدتزمان مکالمه 612 آمار شاغلین 5076.2 | 40 | 38.83% | 63 | 61.16% |
R4 | مدتزمان سپریشده از ارتباط پیشین 22 مدتزمان مکالمه 612 آمار شاغلین 5076.2 | 581 | 85.69% | 97 | 14.30% |
R5 | مدتزمان سپریشده از ارتباط پیشین 22 مدتزمان مکالمه 612 شغل = بیکار شاخص اعتماد مشتریان 42.7- | 6 | 100% | 0 | 0% |
R6 | مدتزمان سپریشده از ارتباط پیشین 22 مدتزمان مکالمه 612 شغل = بیکار شاخص اعتماد مشتریان 42.7- | 3 | 27.27% | 8 | 72.72% |
R7 | مدتزمان سپریشده از ارتباط پیشین 22 مدتزمان مکالمه 612 شغل= مدیر ماه = aug وضعیت حساب قبلی = No وام مسکن = No | 1 | 20% | 4 | 80% |
R8 | مدتزمان سپریشده از ارتباط پیشین 22 مدتزمان مکالمه 612 شغل= مدیر ماه = aug وضعیت حساب قبلی = No وام مسکن = Yes | 8 | 72.72% | 3 | 27.27% |
R9 | مدتزمان سپریشده از ارتباط پیشین22 مدتزمان مکالمه 393 کانال ارتباطی = تلفن همراه وام= No تحصیلات = دبیرستان شاخص قیمت مصرفکننده 92.201 | 4 | 100% | 0 | 0% |
R10 | مدتزمان سپریشده از ارتباط پیشین22 مدتزمان مکالمه 393 کانال ارتباطی = تلفن همراه وام= No تحصیلات = دبیرستان شاخص قیمت مصرفکننده 92.201 | 8 | 36.36% | 14 | 63.63% |
R11 | مدتزمان سپریشده از ارتباط پیشین 22 مدتزمان مکالمه 612 شغل= مدیر ماه = jul تعداد دفعات ارتباط 5 | 15 | 62.5% | 9 | 37.5% |
R12 | مدتزمان سپریشده از ارتباط پیشین 22 مدتزمان مکالمه 612 شغل= مدیر ماه = jul تعداد دفعات ارتباط 5 | 0 | 0% | 5 | 100% |
R13 | مدتزمان سپریشده از ارتباط پیشین 22 مدتزمان مکالمه 612 شغل= مدیر ماه = jun euribor3m 4.864 | 1 | 14.28% | 6 | 85.71% |
R14 | مدتزمان سپریشده از ارتباط پیشین 22 مدتزمان مکالمه 612 شغل= مدیر ماه = jun euribor3m 4.864 | 8 | 88.88% | 1 | 11.11% |
R15 | مدتزمان سپریشده از ارتباط پیشین 22 مدتزمان مکالمه 612 شغل= مدیر ماه = apr euribor3m 1.384 وضعیت تأهل = جداشده، مجرد | 1 | 25% | 3 | 75% |
R16 | مدتزمان سپریشده از ارتباط پیشین 22 مدتزمان مکالمه 612 شغل= مدیر ماه = apr euribor3m 1.384 وضعیت تأهل = متأهل | 3 | 100% | 0 | 0% |
R17 | مدتزمان سپریشده از ارتباط پیشین 22 شغل = شغل آزاد مدتزمان مکالمه 847 | 1 | 12.5% | 7 | 87.5% |
R18 | مدتزمان سپریشده از ارتباط پیشین 22 612 < مدتزمان مکالمه 847 شغل = شغل آزاد | 9 | 90% | 1 | 10% |
R19 | مدتزمان سپریشده از ارتباط پیشین 22 شغل = خدماتی ماه = may euribor3m 1.286 مدتزمان مکالمه 933 | 4 | 40% | 6 | 60% |
R20 | مدتزمان سپریشده از ارتباط پیشین 22 612 < مدتزمان مکالمه 933 شغل = خدماتی ماه = may euribor3m 1.286 | 12 | 92.30% | 1 | 7.69% |
R21 | مدتزمان سپریشده از ارتباط پیشین 22 مدتزمان مکالمه 612 شغل = خدماتی ماه = Jul وام= No,Unkown | 11 | 68.75% | 5 | 31.25% |
R22 | مدتزمان سپریشده از ارتباط پیشین 22 مدتزمان مکالمه 612 شغل = خدماتی ماه = Jul وام= Yes | 1 | 12.5% | 7 | 87.5% |
پارتیشن | آموزش | آزمایش | ||
---|---|---|---|---|
نمونههای طبقهبندیشده صحیح | 7582 | 91.15% | 1892 | 91.14% |
نمونههای طبقهبندیشده نادرست | 736 | 8.85% | 184 | 8.64% |
کل نمونهها | 8318 |
| 2076 |
|
جدول 7: قواعد استخراجشده از الگوریتم CART
ردیف | قاعده | کلاس No | کلاس Yes | ||
---|---|---|---|---|---|
فروانی مطلق | فراوانی نسبی | فروانی مطلق | فراوانی نسبی | ||
R23 | 318.5 < مدتزمان مکالمه 522.5 آمار شاغلین 5087.65 مدتزمان سپریشده از ارتباط پیشین > 510 | 51 | 38.93% | 80 | 61.06% |
R24 | 162.5 < مدتزمان مکالمه 318.5 آمار شاغلین 5087.65 مدتزمان سپریشده از ارتباط پیشین > 510 | 119 | 57.76% | 87 | 42.23% |
R25 | 522.5 < مدتزمان مکالمه 830 euribor3m 1.408 ماه = "apr", "aug", "jul", "jun", "mar", "nov","oct", "sep" | 26 | 30.23% | 60 | 69.76% |
R26 | 522.5 < مدتزمان مکالمه 830 euribor3m 1.408 ماه = "dec", "may" | 57 | 57.57% | 42 | 42.42% |
R27 | 522.5 < مدتزمان مکالمه 830 شغل = کارگر، شغل آزاد، دانشجو | 55 | 52.88% | 49 | 47.11% |
R28 | 522.5 < مدتزمان مکالمه 830 شغل = مدیر، بازنشسته، خانهدار، خدماتی، تکنسین فنی، بیکار، مؤسس شرکت | 88 | 35.91% | 157 | 64.08% |