کد مقاله : FEJ-2303-3434 (R2) بازدید : 481 صفحه: 21 - 40

نوع مقاله: پژوهشی

پیش ‏بینی ورشکستگی شرکت‏ها با استفاده از ترکیب مدل‏های داده‏ کاوی مبتنی بر جریمه دسته‏ بندی نادرست

محورهای موضوعی : مهندسی مالی

1 - گروه مهندسی مالی، دانشکده مهندسی صنایع، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران
2 - گروه مهندسی مالی، دانشکده مهندسی صنایع، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران

تاریخ دریافت : 1401/12/21 تاریخ پذیرش : 1402/04/31 تاریخ انتشار : 1403/05/25

کلید واژه: ماشین بردار پشتیبان, پیش‏بینی ورشکستگی, داده‏کاوی, k-نزدیکترین همسایه, ضرایب جریمه,

چکیده مقاله :

یکی از ابزارهای قدرتمند در مسائل پیش بینی ورشکستگی که در دهه های اخیر مورد توجه بسیاری از سرمایه گذاران، مدیران و محققان قرارگرفته است؛ داده کاوی و به طور خاص ماشین بردار پشتیبان است. اما مطالعات نشان می دهد این روش نسبت به انتخاب پارامترها و متغیرهای ورودی از حساسیت بالایی برخوردار است. لذا هدف از تحقیق حاضر ترکیب مدل توسعه یافته ماشین بردار پشتیبان و k-نزدیکترین همسایه جهت حذف ورودی های دارای خطا و متعاقبا افزایش دقت پیش بینی ورشکستگی است. به این منظور ابتدا با استفاده از 5 نسبت مالی شامل نسبت جاری، حاشیه سود خالص، نسبت بدهی، بازده دارایی ها و بازده سرمایه مرتبط به 150 شرکت حاضر در بورس اوراق بهادار تهران در بازه 10 ساله 1389-1398و الگوریتم k-نزدیکترین همسایگی داده های آموزش پالایش شده و سپس با تکیه بر ماشین بردار پشتیبان مبتنی بر جریمه دسته بندی، جهت ساخت مدل پیش بینی به کار گرفته می شوند. پس از برآورد پارامترهای بهینه، اعتبارسنجی مدل با استفاده از داده های آزمایش صورت خواهد گرفت. در نهایت نتایج بدست آمده از مدل پیشنهادی و مدل های کلاسیک مورد مقایسه قرار خواهدگرفت. نتایج نشان می دهد با ترکیب مدل های k-نزدیکترین همسایه و ماشین بردار پشتیبان خطای کلی پیش بینی کاهش یافته و ضرایب جریمه ماشین بردار پشتیبان با سطح احتمال بالایی معنادار هستند.

چکیده انگلیسی:

In recent years, data mining, particularly the support vector machine, has gained considerable interest among investors, managers, and researchers as an effective means of bankruptcy prediction. However, studies indicate that it is highly sensitive to the selection of parameters and input variables. Hence, the aim of this research is to improve bankruptcy prediction accuracy by combining an advanced support vector machine model with the k-nearest neighbor approach to eliminate erroneous entries. To achieve this, first, by using five financial ratios: current ratio, net profit margin, debt ratio, return on assets, and return of investment from 150 companies listed on the Tehran Stock Exchange during the 10-year period (2010-2019), and k-nearest neighbor algorithm, the training data will be refined. Then, relying on a support vector machine based on classification penalty, a prediction model will be constructed. The parameters will be estimated, and its validity will be assessed using test data. Finally, a comparison will be made between the outcomes of the proposed model and traditional models.The findings demonstrate that the combination of the k-nearest neighbor models and support vector machine reduces the overall prediction error, and the penalty coefficients of the support vector machine exhibit a high level of statistical significance.

منابع و مأخذ:

_|Asghari, Zahra & Esfahanipour (2019) Introducing a model for forecasting corporate bankruptcy by integrating the particle swarm optimization algorithm with support vector machine. The fourth national conference in management, Tehran.
Altman, Edward (1968) Financial ratios, discriminant analysis and the prediction of corporate bankruptcy. The journal of finance, 23,4, 589-609.
Barboza, Kimura, & Altman (2017) Machine learning models and bankruptcy prediction. Expert Systems with Applications, 83, 405-417.
Beaver, William H (1966) Financial ratios as predictors of failure. Journal of accounting research, 71- 111.
Burges, Christopher (1998) A tutorial on support vector machines for pattern recognition. Data Mining and Knowledge Discovery, 2, 955–974.
Chen, Ning, & Vieira (2009) Bankruptcy Prediction based on Independent Component Analysis. In ICAART (pp. 150-155).
Deakin, Edward (1976) A discriminant analysis of predictors of business failure. Journal of Accounting Research, 167–179.
Ghazanfari, Mahdi, Rahimikia, Askari (2018) bankruptcy prediction of companies based on hybrid intelligent systems. Financial accounting and audit researches, 10, 37, 159-194.
Kim, Kang (2012) classifiers selection in ensembles using genetic algorithms for bankruptcy prediction. Expert systems with Applications,39,9308-9314.
Li, Xiaohui, Yang, Fan, Yu & Chen (2018) Discrimination of soft tissues using laser-induced breakdown spectroscopy in combination with k nearest neighbors (KNN) and support vector machine (SVM) classifiers. Optics & Laser Technology, 102, 233-239.
Liang, Ting-peng, Chandler, & Han (1990) Integrating statistical and inductive learning methods for knowledge acquisition. Expert Systems with Applications, 1, 4, 391-401.
Naserzade, Houshang (1995) Business Law. Didar publication, Tehran.
Ohlson, James A (1980) Financial ratios and the probabilistic prediction of bankruptcy. Journal of accounting research, 109-131.
Qu, Yi, Quan, Lei & Shi (2019) Review of bankruptcy prediction using machine learning and deep learning techniques. Procedia Computer Science, 162, 895-899.
Tian, Yingjie, Qi (2014) Review on: twin support vector machines. Annals of Data Science, 1, 2, 253-277.
Tomar, Divya, Agarwal (2015) Twin support vector machine: a review from 2007 to 2014. Egyptian Informatics Journal, 16, 1, 55-69
Van Gestel, Tony et al (2003) Bankruptcy prediction with least squares support vector machine classifiers, IEEE International Conference on Computational Intelligence for Financial Engineering, 1-8.
Vapnik, Vladimir N (1995) The nature of statistical learning theory. Springer science & business media, New York.

|_

متن کامل:

پیش‏بینی ورشکستگی شرکت‏ها با استفاده از ترکیب مدل‏های داده‏کاوی مبتنی بر جریمه دسته‏بندی نادرست

چکیده

یکی از ابزارهای قدرتمند در مسائل پیش‏بینی ورشکستگی که در دهه‏های اخیر مورد توجه بسیاری از سرمایه‏گذاران، مدیران و محققان قرارگرفته ‏است؛ داده‏کاوی و به طور خاص ماشین بردار پشتیبان است. اما مطالعات نشان می‏دهد این روش نسبت به انتخاب پارامترها و متغیرهای ورودی از حساسیت بالایی برخوردار است. لذا هدف از تحقیق حاضر ترکیب مدل توسعه یافته ماشین بردار پشتیبان و k-نزدیکترین همسایه جهت حذف ورودی‏های دارای خطا و متعاقبا افزایش دقت پیش‏بینی ورشکستگی است. به‏ این منظور ابتدا با استفاده از 5 نسبت مالی شامل نسبت جاری، حاشیه سود خالص، نسبت بدهی، بازده دارایی‏ها و بازده سرمایه مرتبط به 150 شرکت‏ حاضر در بورس اوراق بهادار تهران در بازه 10 ساله 1389-1398و الگوریتم k-نزدیکترین همسایگی داده‏های آموزش پالایش شده و سپس با تکیه بر ماشین بردار پشتیبان مبتنی بر جریمه دسته‏بندی، جهت ساخت مدل پیش‏بینی به کار گرفته می‏شوند. پس از برآورد پارامترهای بهینه، اعتبارسنجی مدل با استفاده از داده‏های آزمایش صورت خواهد گرفت. در نهایت نتایج بدست آمده از مدل‏ پیشنهادی و مدل‏های کلاسیک مورد مقایسه قرار خواهدگرفت. نتایج نشان می‏دهد با ترکیب مدل‏های k-نزدیکترین همسایه و ماشین بردار پشتیبان خطای کلی پیش‏بینی کاهش یافته و ضرایب جریمه ماشین بردار پشتیبان با سطح احتمال بالایی معنادار هستند.

واژه‏های کلیدی: پیش‏بینی ورشکستگی، داده‏کاوی، ماشین بردار پشتیبان، k-نزدیکترین همسایه، ضرایب جریمه

1- مقدمه

ورشکستگی مفاهیم و معانی متعددی دارد. طبق تعریف آلتمن ورشکستگی زمانی رخ می‏دهد که شرکت قادر به پرداخت بدهی‏های خود نیست بنابراین از ادامه فعالیت‏های تجاری باز می‏ماند. ویتاکر (1999) بحران مالی را وضعیتی در نظر می‏گیرد که در آن جریان‏های نقدی ورودی شرکت از مجموع هزینه‏های بهره مربوط به بدهی‏های بلندمدت کمتر است. از نقطه نظر اقتصادی، بحران مالی را می‏توان به زیان‏ده بودن شرکت تعبیر کرد که در این حالت شرکت دچار زیان‏های سنگین و متوالی شده است. در واقع، در این حالت نرخ بازده داخلی شرکت کمتر از نرخ هزینه سرمایه است. حالت دیگری از بحران مالی زمانی رخ می‏دهد که شرکت موفق به رعایت یک یا تعداد بیشتری از بندهای مربوط به قراردادهای تسهیلات مالی دریافتی خود نمی‏شود که بـه این حالت نکول تکنیکی گفته می‏شود.

اگرچه ورشکستگی همواره بعنوان یک پدیده نامطلوب مالی مهم بوده است. از اواسط قرن بیستم، همزمان با رشد سریع تکنولوژی، تغییرات محیطی و افزایش رقابت، احتمال ورشکستگی شرکت‏ها نیز افزایش یافت. از سوی دیگر با ظهور شرکت‏های سهامی و افزایش تقاضا برای تامین مالی از منابع خارجی، نیاز به ارزیابی شرکت‏ها و کسب اطمینان از وضعیت مالی آن‏ها توسط سرمایه‏گذاران و وام‏ دهندگان بیشتر احساس شد. بنابراین در دهه‏های اخیر پیش‏بینی ورشکستگی و توسعه مدل‏‏های آن بعنوان موضوعی مهم و به‏طور گسترده مورد توجه جامعه دانشگاهی و سرمایه‏گذاران قرار گرفته است.

مطالعات اولیه در حوزه پیش‏بینی ورشکستگی با استفاده از تکنیک‏های آماری مانند تحلیل ممیزی چندگانه¹ ( آلتمن، 1968)، لاجیت² (اولسن، 1980) و پروبیت³ (زمیجسکی، 1984) انجام گرفت. سال‏ها بعد تعداد زیادی از مطالعات نشان دادند که روش‏های هوش مصنوعی و به طور خاص شبکه عصبی مصنوعی⁴، می‏توانند در حل مسائل طبقه‏بندی جایگزین مناسبی برای روش‏های آماری و سنتی باشند. با این‏حال این تحقیقات محدودیت‏هایی را برای استفاده از شبکه عصبی از جمله انتخاب مدل مناسب، همگرایی مدل به بهینه محلی و عدم تعمیم‏دهی کارآمد گزارش کردند. به مرور ماشین بردار پشتیبان⁵ که یکی دیگر از مدل‏های قدرتمند داده‏کاوی⁶ است و عملکرد قابل قبولی را در حل مسائل طبقه‏بندی از جمله تشخیص چهره و پیش‏بینی ورشکستگی ارائه داده بود، جایگزین روش‏های سابق از جمله شبکه عصبی شد.SVM روشی است که با پیدا کردن ابرصفحه‏ای⁷ میان نمونه‏ها سعی در حداکثر کردن فاصله میان ابرصفحه و نمونه‏ها و درنهایت نمونه‏ها از یکدیگر دارد. درواقع روش کار SVM معادل حل کردن مساله‏ای کوادراتیک است. این روش از قوانین حداقل‏سازی ریسک ساختاری⁸ بهره می‏گیرد و افزایش قدرت تعمیم‏دهی را به ‏همراه دارد. به همین دلیل جواب حاصل از آن برای مسائل محدب، یکتا و کلی می‏باشد (برگس، 1998). از آن‏جاییکه روش ماشین بردار پشتیبان به کیفیت داده‏ها و نمونه‏های ورودی حساسیت نشان داده و نمونه‏های دارای خطا اثر ملموسی بر دقت مدل می‏گذارند، به ذهن می‏رسد می‏توان با استفاده از روشی دیگر مانند روش ساده و در عین حال قدرتمند k-نزدیکترین همسایه⁹ و ترکیب آن‏ها با یکدیگر به کارایی بیشتری دست یافت. KNN نیز مانند SVM الگوریتمی تحت نظارت است که هدف از آن دسته‏بندی یک عضو جدید براساس ویژگی نمونه‏های آموزشی می‏باشد. بدین صورت که نمونه جدید بر اساس اکثریت Kنمونه که نزدیکترین همسایگی‏ را با آن داشته باشند، تقسیم‏بندی می‏شود. بنابراین در تحقیق حاضر سعی بر این بوده که علاوه بر توسعه رویکرد ماشین بردار پشتیبان در تشخیص الگوی پنهان داده‏ها جهت پیش‏بینی ورشکستگی شرکت‏ها‏، مدل توسعه یافته با استفاده از مدل k-نزدیکترین همسایه بهبود داده شود. بخش‏های پژوهش بدین صورت است که ابتدا پیشینه تحقیق مورد بررسی قرار می‏گیرد. سپس مبانی نظری و معرفی مدل‏های طبقه‏بندی مورد استفاده و الگوریتم‏ پیشنهادی بیان می‏شود. در بخش بعد نتایج تحقیق و مقایسه مدل پیشنهادی و مدل‏های کلاسیک ارائه شده و در نهایت، بخش پایانی و نتیجه‏گیری ذکر خواهد شد.

2 - پیشینه تحقیق

1-2 پیشینه نظری

در 50 سال اخير موضوع " پيش‏بيني ورشكستگي شركت‏ها" به يكي از موضوعات عمده پژوهش در ادبيات مالي تبديل شده است. به‏طور كلي، مدل‏هاي پيشنهاد شده براي پيش‏بيني ورشكستگي را مي‏توان به دو دسته رويكردهاي آماري و روش‏هاي هوش مصنوعي طبقه‏بندي كرد. روش‏های آماری از اولین روش‏های پرکاربرد در مسائل طبقه‏بندی بودند که غالبا فرضیات محدودکننده‏ای از جمله خطی و نرمال بودن و استقلال متغیرهای وروردی را به مدل تحمیل می‏کردند. به‏همین دلیل اثربخشی روش را کاهش می‏دادند (دیکن، 1976). روش‏های آماری که براي پيش‏بيني ورشكستگي استفاده مي‏شوند، تجزيه و تحليل تك‏متغيره ساده (بيوِر ، 1966)، تجزيه‏وتحليل چندمتغيره (آلتمن ، 1968)، رگرسيون لجستيك (السون ،1980) و تحليل عاملي (وِست ، 1985) را شامل می‏شوند. اما پس از سال‏ها مطالعات بعدی نشان داد که روش‏های هوش مصنوعی نسبت به این فرضیات آسیب پذیری کمتری دارند. به عبارت دیگر روش‏های هوش مصنوعی بر استخراج اطلاعات از نمونه‏های آموزشی تکیه می‏کنند، درحالیکه روش‏های آماری بر بهینه‏سازی احتمال طبقه‏بندی صحیح تمرکز دارند (لیانگ و همکاران، 1990). شبکه عصبی، درخت تصمیم¹⁰، ماشین بردار پشتیبان و k-نزدیکترین همسایه از مهمترین روش‏های یادگیری ماشین بودند که در طبقه‏بندی جایگزین مدل‏های آماری شدند. و در مسائل مالی از جمله پیش‏بینی ورشکستگی به صورت گسترده مورد مطالعه و مقایسه با روش‏های آماری قرار گرفتند (کارالامبوس و همکاران، 2000؛ آتیا، 2001؛ شی و همکاران، 2009؛ باربزا، 2017؛ مای و همکاران، 2018، پتاک، 2021). بنابراین همزمان با نوآوری ایجاد شده در مدل‏های پیش‏بینی ورشکستگی و از زمانی که وپینگ ماشین بردار پشتیبان را ارائه داد، این روش مورد توجه و پایه بسیاری از تحقیقات قرار گرفت. اساس کار ماشین بردار پشتیبان نظریه یادگیری آماری¹¹ و حداقل کردن ریسک ساختاری است، و برخلاف سایر روش‏های هوش مصنوعی سعی در حداقل کردن خطای تعمیم‏پذیری دارد. طی تحقیقات انجام شده برخی مزایای SVM نسبت به سایر روش‏های یادگیری ماشین بدین ترتیب ذکر شده است: (الف) با مجموعه داده‏های بزرگ سازگار است. (ب) برخلاف روش‏های سنتی یادگیری ماشین، SVM به دنبال حداقل کردن ریسک ساختاری است. (ج) مبنای این روش مساله بهینه سازی کوادراتیک و محدبی است که بر خلاف سایر روش‏ها به بهینه کلی دست‏ می‏یابد. (د) SVM برای حل مسائل غیرخطی از توابع کرنل استفاده می‏کند، از این رو تعمیم‏پذیری و حل داده‏ها با ابعاد بزرگ مانند عکس و متن را تضمین می‏نماید. (ه) مدل یادگیرنده آن تنها با بردارهای پشتیبان ساخته می‏شود نه تمام نمونه‏ها. به همین دلیل مدلی ساده، سازگار و در عین حال قوی می‏باشد (تیان و کی، 2014؛ تومار و آگاروال، 2015).

2-2 پیشینه تجربی

همانگونه که پیش‏تر ذکر شد، تاكنون مطالعات بسیاری در خصوص پيش‏بيني درماندگي مالي صورت گرفته است. اگرچه شاید بتوان ادعا کرد قديمي‏ترين پژوهش در این حوزه مربوط به استفاده از نسبت‏ جاری جهت ارزيابي وضعيت اعتباري در سال 1870 بوده است. اما تحقیق بیور (1966) که همراه با یک نمونه از 158 شرکت انجام شد و نشان داد نسبت‏های مالی می‏توانند بهترین معیار سلامت مالی شرکت باشند، پایه‏گذار مطالعه در مسائل پیش‏بینی ورشکستگی محسوب می‏شود. درواقع تحقیق او نشان می‏داد نسبت‏های مالی در شرکت‏های سالم و ورشکسته متفاوت است. در اين تحقيق، بيور 30 نسبت مالي كه تصور مي‏كرد بهترين معیار براي سنجش سلامت مالي يك شركت هستند را انتخاب كرد. سپس اين نسبت‏ها را به شش گروه تقسيم كرد. اين شش گروه عبارت بودند از : نسبت‏هاي مربوط به جريان نقدي، بدهي به كل دارايي‏ها، دارايي‏هاي نقدشونده به كل دارايي‏ها، دارايي‏هاي نقدشونده به بدهي‏هاي جاري، فعاليت (گردش) و سود خالص. آلتمن (1968) با استفاده از 5 نسبت مالی در حالی‏که نمونه‏های ورودی را بر اساس اندازه و صنعت به چند دسته تقسیم کرده بود، مدلی را بر مبنای MDA ارائه داد که به مدل z-score معروف است. و ادعا کرد این مدل می‏تواند در تخصیص وام‏های بانکی و ارزیابی مشخصات سرمایه‏گذاری استفاده شود. مدل او می‏توانست یک سال قبل از ورشکستگی این رویداد را با دقت 96 درصد پیش‏بینی کند. اهلسون (1980) نیز مدلي را با استفاده از تكنيك لاجيت توسعه داد. وي در اين پژوهش از 105 شركت ورشكسته و 205 شركت غير ورشكسته بين سال‏هاي 1970 تا 1976 استفاده كرد و نه نسبت مالي را بعنوان متغير مستقل بكار برد؛ از اين نه نسبت مالي، پنج تاي آن‏ها در مطالعات قبلي نيز استفاده شده بودند (چن، 2009) .شاه و مرتزا (2000) مدلي را با استفاده از شبکه عصبی مصنوعی برای پیش بینی ورشکستگی ارائه دادند. در اين مطالعه از اطلاعات 60 شركت ورشكسته و 54 شركت غير ورشكسته بين سال‏های ۱۹۹۲ تا ۱۹۹۴ استفاده شده و دقت پيش بيني مدل مورد استفاده 73 درصد ثبت شده است. سال‏ها بعد نیز به‏دلیل عملکرد قابل قبول شبکه عصبی بسیاری از مطالعات و تحقیقات بر اساس این روش انجام می‏گرفت. اما در سال 2003 زمانی که ماشین بردار پشتیبان برای نخستین بار توسط هاردل و همکارانش در پیش‏بینی ورشکستگی مورد استفاده قرار گرفت و با روش‏های سابق از جمله ANN و MDA مقایسه شد، با کسب 70درصد دقت و برتری نسبت به سایر روش‏ها توجه محققان را جلب کرده و بعنوان روشی پیشرو در حوزه‏های مختلف از جمله تشخیص چهره، شناسایی دستخط و متن‏کاوی بطور گسترده مورد مطالعه قرار گرفت؛ آن‏ها مجددا ثابت کردند SVM در مقایسه با مدل‏های آماری نیز کارایی بهتری دارد (ون و همکاران، 2003) . چن در سال 2011 طی تحقیقی تجربی شامل33 نسبت مالی و 8 نسبت غیرمالی و یکی از شاخص‏های کلان اقتصادی نشان داد نسبت‏های مالی در تشخیص شرکت‏های ورشکسته از کارایی بالاتری برخوردارند. پس از آن کیم و کانگ با انتخاب 1200 شرکت و به‏کارگیری 7 نسبت مالی ( درآمد به کل دارایی، سود ناخالص به هزینه بهره، سود انباشته به کل دارایی، بازده نقدی، کل بدهی به کل دارایی، موجودی کالا به فروش و موجودی کالا به کل دارایی) نشان دادند ماشین بردار پشتیبان با کسب دقت 45/72 درصد در مقایسه با سایر الگوریتم‏ها از جمله الگوریتم ژنتیک قوی‏تر ظاهر شده و خطای پیش‏بینی را به میزان قابل توجهی کاهش می‏دهد (کیم و کانگ، 2012). ژو (2013) در تحقیق خود با بکارگیری 7 روش نمونه‏برداری و 5 مدل پیش‏بینی و با استفاده از دو دیتابیس واقعی و نامتوازن، تاثیر روش‏های نمونه‏برداری بر عملکرد مدل‏های استفاده شده را بررسی کرد. او ثابت کرد علاوه بر اینکه تاثیر روش‏های نمونه‏برداری به تعداد شرکت‏های ورشکسته وابسته است، به عنوان مثال برای مسائل با تعداد نمونه کم روش بیش‏نمونه‏برداری مصنوعی کلاس اقلیت بهینه است. از میان 5 روش متفاوت پیش‏بینی، ماشین بردار پشتیبان بهترین کارایی را دارد. در تحقیق دیگری نیز اثر عدم توازن داده‏های مورد مطالعه بررسی شد. طبق یافته‏های تحقیق، اگر نمونه‏های ورشکسته کمتر از 20 درصد داده‏های آموزش را تشکیل دهند، توانایی پیش‏بینی به میزان قابل توجهی کاهش می‏یابد. بنابراین برای حل این مشکل روشی ترکیبی مبتنی بر کم‏نمونه‏گیری¹² و بیش‏نمونه‏گیری¹³ پیشنهاد گردید. نتایج نشان می‏داد SVM تنها روشی است که کمترین میزان حساسیت را نسبت به داده‏های نامتوزان داراست (سورین، 2018). کیو نیز در مقایسه‏ای میان ماشین بردار پشتیبان و شبکه عصبی بیان کرد که استفاده از فضای ویژگی، SVM را قادر می‏سازد تا با استفاده از نمونه‏های آموزشی‏های کمتر و به طور کاراتری به جواب بهینه دست یابد (کیو و همکاران، 2019). در برخی مطالعات دیگر نیز ماشین بردار پشتیبان با سایر روش‏ها مقایسه شده و نتایج تمامی آن‏ها حاکی از برتری SVM نسبت به سایر روش‏ها بوده است (مین و همکارانش، 2006؛ دینگ و همکاران، 2008؛ چادهوری و همکاران، 2011؛ وانگ و ما ، 2012؛ لی و همکاران، 2018؛ آلاکا و همکاران، 2018).

در ایران نیز از سال‏ها قبل پیش‏بینی ورشکستگی با استفاده از روش‏های گوناگون از جمله ماشین بردار پشتیبان مورد بررسی قرار گرفته است. راعی و فلاح‏پور در سال 1387 از این روش به همراه یکی از پرکاربردترین مدل‏های آماری، یعنی رگرسیون لجستیک¹⁴، جهت پیش‏بینی درماندگی مالی شرکت‏های پذیرفته شده در بورس و اوراق بهادار تهران بهره گرفتند. یافته‏های تحقیق حاکی از آن بود که نه تنها SVM نسبت به رگرسیون خطی¹⁵ از دقت كلي بهتري برخوردار است، بلكه توانايي بالاتري نيز در تعميم‏پذيري دارد. قدرتی و معنوی مقدم نیز به مقایسه مجموعه روش‏های آماری و دو روش هوشمند ژنتیک فرج زاده و ژنتیک مک کی در بورس اوراق بهادار تهران طی سال‏های 1382 تا 1389 پرداختند. در تحقیق آن‏ها برای تفکیک شرکت‏های سالم و دارای بحران مالی از ماده 141 قانون تجارت بهره گرفته شده بود. نتایج نشان می‏داد الگوی پیش‏بینی بحران مالی زمیسکی¹⁶، اسپرینگیت¹⁷، سی ای اسکور، ژنتیک فرج زاده و ژنتیک مک‏کی¹⁸ توانایی پیش‏بینی تداوم فعالیت شرکت‏های پذیرفته شده در بورس اوراق بهادار تهران را دارند. همچنین مدل‏هایی که بر پایه الگوریتم ژنتیک طراحی شده‏اند نسبت به روش آماری دارای دقت بیشتری می‏باشند. در این تحقیق دقت کلی 91.7 درصد برای الگوریتم ژنتیک فرج زاده و 91.65 درصدی برای الگوریتم ژنتیک مک‏کی گزارش شده است. مدل‏های آماری زمیسکی، اسپرینگیت و سی ای اسکور نیز همگی دارای توان پیش‏بینی 90 درصد بودند (غضنفری و همکاران، 1397). مرادی و همکارانش (1391) دو روش ماشین‏ بردار پشتیبان و تحلیل ممیزی چندگانه را در شرکت‏های بورس اوراق بهادار تهران و با در نظر گرفتن ۸8 متغیر ورودی مورد مقایسه قرار دادند. و نتایج نشان از عدم برتری آماری مدل‏ها نسبت به یکدیگر داشت. اصغری و اصفهانی‏پور در مطالعه‏ای که اخیرا صورت گرفته است، مدل ترکیبی الگوریتم بهینه‏سازی ازدحام ذرات و ماشین بردار پشتیبان جهت پیش‏بینی ورشکستگی شرکت‏ها را ارائه داده‏اند. هدف اصلی آنها ارائه یک مدل پیش‏بینی کننده با عملکرد بالا و مقایسه نتایج آن با سایر مدل‏های رایج بوده، و به همین منظور از الگوریتم بهینه‏سازی ذرات به عنوان روش انتخاب ویژگی در ترکیب با ماشین بردار پشتیبان به عنوان الگوریتم طبقه‏بندی کننده استفاده کرده‏اند. نتایج نشان می‏دهد مدل پیشنهادی پژوهش در پیش‏بینی ورشکستگی نسبت به روش پرسپترون چند لایه از عملکرد بهتری برخوردار است (اصغری و اصفهانی‏پور، 1398). همانطور که مشاهده می‏شود، تمامی مطالعات داخلی مبتنی بر استفاده از داده‏کاوی در پیش‏بینی ورشکستگی بر داده‏های حاصل از بورس اوراق بهادار متمرکز بوده‏اند. بررسی مطالعات خارجی در این حوزه نیز نشان‏دهنده استفاده از نسبت‏های مالی شرکت‏ها و داده‏های بورس و اوراق بهادار کشورهای مختلف به عنوان ورودی مدل‏های پیش‏بینی می‏باشد. که دلیل آن را می‏توان عدم امکان دسترسی به پایگاه داده‏های غنیتر دانست. لذا باتوجه به عدم تغییر داده‏های ورودی جهت پیش‏بینی ورشکستگی، سوالاتی مطرح می‏گردد از جمله اینکه آیا می‏توان با توسعه روش کارایی مثل ماشین بردار پشتیبان و لحاظ جریمه برای نتایج اشتباه به دقت بیشتری در امر پیش‏بینی دست یافت؟ آیا استفاده از یک روش داده‏کاوی دیگر در نقش پالایش‏کننده ویژگی‏ها به عنوان متغیرهای ورودی اثری در دقت مدل دارد؟

3- روش ‎شناسی پژوهش

ماشین بردار پشتیبان که در حالت کلی برای دسته‏بندی داده‏ها استفاده می‏شود نسبت به داده‏های آموزشی حساسیت قابل توجهی دارد. از این رو در این تحقیق به منظور حذف اثر داده‏های دارای خطا و افزایش دقت پیش‏بینی از مدلی پیشنهادی حاصل از ترکیب روش نزدیکترین همسایگی و ماشین بردار پشتیبان استفاده شده است. بدین صورت که ابتدا بوسیله‏ی داده‏های آموزشی و با بهره‏گیری از روش نزدیکترین همسایگی مدلی جهت پیش‏بینی ورشکستگی شرکت‏ها ساخته شده و نتیجه با داده‏های واقعی مقایسه می‏گردد. داده‏هایی که توسط مدل به اشتباه برچسب‏گذاری شده‏اند حذف شده و سایر داده‏ها به‏عنوان ورودی مدل ماشین بردار پشتیبان در نظر گرفته می‏شوند. در ادامه و با در نظر گرفتن ضریب جریمه‏ برای دسته بندی نادرست کلاس‏های مختلف، کارایی ماشین بردار پشتیبان در پیش‏بینی وضعیت شرکت‏ها با استفاده از داده‏های آزمایش مورد سنجش قرار گرفته و با مدل‏های کلاسیک مقایسه می‏گردد.

1-3 الگوریتم‏های هر مرحله

1-1-3 روش k-نزدیکترین همسایه

روش k-نزدیکترین همسایه، به ‏عنوان یک رویکرد طبقه‏بندی ناپارامتریک، عليرغم سادگي توانسته است نتایج قابل قبولی را در حل مسائل دسته‏بندی نشان دهد. در این روش اگر نقطه‏ی فرضی x0 و n نقطه آموزشی وجود داشته باشد، الگوریتم تمامی xn هایی که در نزدیک‏ترین فاصله به x0 باشند را پیدا کرده و براساس رای‏گیری اکثریت درمیان k همسایه، x0 را دسته‏بندی می‏کند. درواقع در اين روش به هر نمونه دسته‏بندي نشده كلاسي اختصاص داده مي شود كه مشتمل بر k عدد از نزديكترين همسايه‏هاي آن ‏باشد. به همين دلیل است كه اين روش داده‏کاوی، k-نزدیکترین همسایه نامیده می‏شود. شکل 1 روند تصمیم‏گیری روش مذکور با مقدار3k= برای مجموعه‏ای از نمونه‏ها که در دو دسته تقسیم‏بندی شده‏اند را نشان می‏دهد.

شکل1 ¹⁹- روش نزدیکترین همسایگی برای k=3

مهم‏ترین فاکتور در این الگوریتم که نقش مهمی در میزان دقت و موفقیت آن دارد، تابع فاصله است. در پژوهش پیش ‏رو معیار فاصله ( D) براساس فاصله اقلیدسی در نظر گرفته شده ‏است.

(1)

فاکتور مهم دیگر انتخاب k یعنی تعداد نمونه‏های همسایه معیار جهت دسته‏بندی نمونه جدید است. اگر k خیلی بزرگ باشد، کلاس‏هایی که تعداد نمونه‏های آن‏ها زیاد است کلاس‏ها با تعداد نمونه‏های کم را در خود جای داده و نتایج را دچار انحراف می‏نمایند. و اگر خیلی کوچک باشد، فرآیند آموزش با مشکل مواجه خواهد شد. اما در حالت کلی مقادیر بزرگتر k نسبت به داده‏های دارای خطا ایمن‏ترند.

2-1-3 روش ماشین بردار پشتیبان

ماشین بردار پشتیبان یکی از روش‏های یادگیری ماشینی با نظارت است که در سال 1995 توسط وپنیک²⁰ و همکارانش ارائه گردید. این روش در واقع یک طبقه بندی‏کننده دودویی²¹ است که سعی دارد میان داده‏های دو کلاس‏ ابرصفحه‏ای ایجاد نماید؛ به‏طوریکه حاشیه میان داده‏های هر کلاس و ابرصفحه حداکثر گردد. داده‏هایی که در نزدیکترین فاصله نسبت به ابر صفحه قرار دارند و بردار پشتیبان نامیده می‏شوند، برای محاسبه این فاصله بکار می‏روند (وپینک 1995). مهم‏ترین ویژگی ماشین بردار پشتیبان که آن را از سایر روش‏های داده‏کاوی متمایز می‏کند قدرت تعمیم‏دهی و رسیدن به نقطه بهینه کلی در مقابل نقطه بهینه محلی است. به منظور درک بهتر مطلب، در شکل 2 تصویری از یک مجموعه داده متعلق به دو کلاس نشان داده شده که ماشین بردار پشتیبان بهترین ابرصفحه را برای جداسازی آن ها انتخاب کرده است.

شکل2- ساختار مدل طبقه‏بندی ماشین بردار پشتیبان

مدل کلاسیک ماشین بردار پشتیبان به‏صورت زیر می‏باشد :

(2)

و به‏ترتیب تعداد نمونه‏ها و ویژگی‏های مساله هستند. بردار نرمال و انحراف از ابر صفحه جداکننده است. نیز برچسب امین نمونه را نشان می‏دهد. هم‏چنین و به‏ترتیب معرف پارامتر جریمه و متغیر کمبود مدل هستند. طبق برخی تحقیقات انجام شده، در بسیاری از مجموعه داده‏ها خروجی ماشین بردار پشتیبان نسبت به سایر روش‏ها بهینه‏تر است. با این‏حال ممکن است داده‏ها و مسائلی وجود داشته باشند که ماشین بردار کلاسیک برای آن‏ها مناسب نیست. از این رو به‏منظور افزایش دقت مدل از تابع کرنل استفاده می‏شود. اضافه کردن تابع کرنل به مدل اصلی f داده‏ها را از فضای به فضای c که فضای ویژگی²² نامیده می‏شود منتقل می‏کند. ترکیب تابع کرنل و مدل کلاسیک، مدل غیرخطی نامیده می‏شود و به صورت زیر تعریف می‏گردد :

(3)

تابع کرنل استفاده شده در پژوهش حاضر نیز تابع پایه شعاعی²³ و به صورت زیر است :

(4)

در بسیاری از مسائل حساسیت پیش‏بینی و برچسب‏گذاری اشتباه برای کلاس‏های متفاوت یکسان نیست. به‏طور مثال دسته‏بندی شرکتی که ورشکسته است به‏عنوان شرکت سالم به مراتب تبعات بیشتر و سنگین‏تری در مقایسه با دسته‏بندی نادرست شرکتی سالم دارد. بنابراین در پژوهش حاضر سعی شده است با توسعه مدل کلاسیک ماشین بردار پشتیبان، جریمه‏های متفاوتی برای دسته‏بندی غلط مدل در نظر گرفته شود. مدل پیشنهادی بدین صورت می‏باشد :

(5)

و به‏ترتیب جریمه‏ دسته‏بندی غلط کلاس اول ( شرکت‏های سالم) و جریمه‏ دسته‏بندی غلط کلاس دوم (شرکت‏های ورشکسته) می‏باشند. سایر پارامترهای تاثیرگذار بر عملکرد ماشین بردار پشتیبان، پارامتر تعیین کننده بردارهای پشتیبان و پارامتر تابع کرنل می‏باشند که مشابه با پارامترهای مدل کلاسیک بوده و با نمادهای C و نمایش داده می‏شوند.

2-3 داده‏ها

1-2-3 معیار تعیین وضعیت ورشکستگی شرکت‏ها

معیار مورد استفاده به منظور تعیین وضعیت ورشکستگی یک شرکت مشخص، ماده 141 قانون تجارت می‏باشد. بر اساس این ماده قانون تجارت ایران شرکتی به عنوان ورشکسته در نظرگرفته می‏شود که بر اساس زیان‏های وارده، حداقل نیمی از سرمایه خود را از دست داده باشد. در شرایط فوق طبق قانون ذکر شده هیئت مدیره مکلف است بلافاصله طی مجمع عمومی فوق‏العاده، صاحبان سهام کسب و کار را دعوت کرده تا موضوع انحلال یا بقای شرکت به رأی گذاشته شود. در صورتیکه مجموع شرکت به انحلال رأی مثبت ندهد در همان جلسه و با رعایت مقررات ماده 6 این قانون، درمورد افزایش و یا کاهش سرمایه تصمیم گرفته می‏شود (ناصرزاده، 1374، 19).

2-2-3 پیش‏پردازش

با توجه به برابر نبودن تعداد شرکت‏های سالم و ورشکسته (به طور معمول تعداد شرکت‏های ورشکسته به صورت معناداری از تعداد شرکت های سالم کمتر می‏باشد)، نیاز است به تعداد شرکت‏های ورشکسته از میان شرکت‏های سالم، نمونه‏هایی انتخاب شوند. در صورت ورود داده‏ها بدون بهره‏گیری از فرآیند بالانس داده‏ها، سیستم طراحی شده گروهی را با دقت بالا و گروه مقابل را به دلیل پایین بودن تعداد نمونه‏های ورودی با دقت پایین‏تری مورد تشخیص قرار خواهد داد. از طرفی الگوریتم‏هایی مانند شبکه عصبی، ماشین بردار پشتیبان و بسیاری از الگوریتم‏های طبقه‏بندی جهت عملکرد مطلوب به داده‏های ورودی نرمال شده نیاز دارند؛ بنابراین تمامی داده‏های ورودی همگن و نرمال شده و سپس مورد استفاده قرار گرفتند.

3-2-3 جامعه مورد بررسی و متغیرهای ورودی

به منظور حذف اثر همه‏گیری ویروس کرونا بر کسب و کارها، جامعه مورد مطالعه در این پژوهش، شامل شرکت‏های پذیرفته شده در بورس اوراق بهادار تهران²⁴ است که تا پیش از سال 1399 صورت مالی خود را به بورس ارائه داده‏اند، به‏طوریکه دارای شرایط زیر باشند :

1. صورت مالی شرکت در دسترس باشد.

2. سال مالی شرکت منتهی به پایان اسفند ماه هر سال باشد.

از میان شرکت‏های دارای شرایط، 75 شرکت ورشکسته و 75 شرکت سالم به‏صورت تصادفی انتخاب شدند. همچنین نمونه‏های موجود به دودسته داده‏های آموزشی برای برآورد پارامترهای بهینه و ساخت مدل و آزمایشی به منظور اعتبار سنجی تقسیم می‏شوند. متغیرهای پژوهش نیز در دو دسته‏ی مستقل و وابسته تعریف می‏گردند. پس از مطالعه و بررسي پژوهش‏هاي مشابه كه در محيط اقتصادي ايران انجام شده‏اند، 5 نسبت مالی شامل نسبت جاری، حاشیه سود خالص، نسبت بدهی، بازده دارایی‏ها و بازه سرمایه به‏عنوان متغیرهای مستقل و پیش‏بینی‏کننده شناسایی و انتخاب شدند. متغیر وابسته نیز شرکت‏های سالم و ورشکسته هستند که به‏صورت (1-) برای شرکت‏های ورشکسته و (1) برای شرکت‏های سالم برچسب‏گذاری شده‏اند. تمامی اطلاعات مالی شرکت‏ها از صورت‏های مالی آن‏ها و با استفاده از نرم افزار ره‏آورد نوین گردآوری شده‏اند. ابزار مورد استفاده جهت پالایش داده‏ها و پیش‏بینی نیز نرم‏افزار متلب می‏باشد.

4- نتایج

همانطور که پیش‏تر ذکر شد، مقدار پارامتر k برای نزدیکترین همسایگی و پارامترهای C و برای SVM در دقت و عملکرد این روش‏ها تاثیر بسزایی دارند؛ از این رو الگوریتم‏های به کار رفته با مقادیر مختلف پارامترها و به دفعات مورد تست قرار گرفته و مدل با کمترین مقدار خطای اعتبار سنجی متقاطع²⁵ به عنوان مدل بهینه انتخاب شده است، نتایج بدین صورت است :

Chart, line chart

Description automatically generated

شکل 3- میانگین خطای مدل KNN به ازای مقادیر مختلف k

شکل4- نمای شماتیک میزان خطای مدل KNN به ازای k ها و تکرارهای متفاوت

طبق شکل‏های 3 و 4 بالا با اجرای مدل KNN و در نظر گرفتن مقادیر 2 تا 25 برای پارامتر k در 10 تکرار، بهترین مدل دارای 15k= می‏باشد. جدول 1 نیز نشان‏دهنده میزان خطا به ازای 6 مقدار مختلف و 9 مقدار متفاوت C است که با استفاده از روش خطای اعتبار سنجی متقاطع (30k-fold =) بدست آمده است.

جدول1- خطای اعتبار سنجی به ازای مقادیر مختلف C و

بنابراین مقادیر بهینه C و نیز به ترتیب ۱۰۰۰۰ و ۱ می‏باشد. هچنین طبق فرضیات این پژوهش جریمه طبقه‏بندی نادرست برای کلاس‏ مربوط به شرکت‏های ورشکسته در بازه یک تا 10 برابر جریمه کلاس مقابل در نظر گرفته شده است. واضح است که جریمه‏های مربوط به مدل با کمترین خطا به عنوان جریمه‏های بهینه انتخاب می‏گردد. جریمه‏های انتخابی بدین صورت بوده است:

جدول2- مقادیر بهینه ضرایب جریمه دسته‏بندی نادرست

	C =0.001	C =0.01	C =0.1	C =1	C =10	C =100	C =1000	C =10000	C =100000
=0.1	0.0012	0.0012	0.0012	0.0012	0.0012	0.0012	0.82	0.82	0.82
=1	0.0012	0.0012	0.0012	0.0012	0.0012	0.000142	0.000107	0.0000356	0.0713
=10	0.0012	0.0012	0.0012	0.0012	0.0012	0.0012	0.000535	0.000107	0.000107
=100	0.0012	0.0012	0.0012	0.0012	0.0012	0.0012	0.0012	0.00107	0.000535
=1000	0.0012	0.0012	0.0012	0.0012	0.0012	0.0012	0.0012	0.0012	0.0012
=10000	0.0012	0.0012	0.0012	0.0012	0.0012	0.0012	0.0012	0.0012	0.0012

با توجه به نتایج جدول 2 بنظر می‎‏رسد که مدل پیشنهادی نه تنها تفاوت میان جریمه‏ها را مثبت تلقی کرده بلکه سعی در حداکثر کردن اختلاف میان جریمه دو کلاس دارد. پس از تعیین مقادیر بهینه پارامترهای هر مدل و ساخت مدل پیشنهادی، نتایج بدست آمده بر اساس مدل‏های گوناگون مورد مقایسه و بررسی قرار گرفت. در جدول 3 نتایج حاصل از پیش‏بینی با استفاده از KNN، SVM و مدل‏های ترکیبی و پیشنهادی آورده شده است:

جدول 3- نتایج آزمون مدل‏های مورد استفاده در پیش‏بینی وضعیت شرکت‏ها

پارامتر	مقدار
	1
	9.35

نام مدل	دقت کلی	میزان خطای جانشینی مجدد²⁶	میزان خطای اعتبار سنجی متقاطع²⁷
KNN	%63	%38	%۴۱
SVM	%91	%11	%۴۰
KNN-SVM	%94.2	%10	%۲۰
KNN-CSSVM	%98.6	%0	%7

اعداد ذکر شده در ستون اول درصد پیش‎بینی صحیح را نشان می‏دهند. مجددا یادآوری می‏گردد تعداد شرکت‏های هر گروه 75 شرکت است. بنابراین با توجه به کوچک بودن جامعه مورد بررسی دقت پایین در مدل نزدیکترین k-همسایه قابل تامل است. همانطور که جدول 3 نشان می‏دهد، اگرچه مدل کلاسیک SVM و مدل ترکیبی KNN-SVM نیز از دقت خوبی جهت پیش‎بینی برخوردارند اما مدل پیشنهادی بالاترین دقت را در پیش بینی ورشکستگی با استفاده از نسبت‏های مالی در نظر گرفته شده داشته است. جهت تایید قدرت و اعتبار مدل بدست آمده خطای هر مدل به دوروش مجزا محاسبه شد و مطابق با انتظارات، KNN-CSSVM با خطایی نزدیک به صفر در هر دو روش کمترین میزان خطا را ثبت نمود.

برای بررسی فرضیه پژوهشی، مبنی بر عملکرد بهتر مدل پیشنهادی KNN-CSSVM در مقایسه با مدل SVM کلاسیک، از آزمون t مستقل استفاده شده است. با استفاده از این آزمون، عملکرد بهتر مدل پیشنهادی از نظر آماری بررسی می‏شود. نتایج نشان می‏دهد میانگین دقت در مدل SVM ساده 92 درصد و انحراف معیار آن برابر با 6.4 است، در حالیکه این مقادیر برای مدل پیشنهادی به ترتیب 97.3 درصد و 5.3 می‏باشد. و می‏توان ادعا کرد دقت کلی مدل KNN-CSSVM، با سطح اطمینان 95 درصد از مدل SVM کلاسیک بیشتر است. نتایج آزمون بدین صورت است:

جدول 4- نتایج آزمون t در مساله مورد بررسی

الگوریتم	KNN-CSSVM	SVM
میانگین دقت کلی	97.3	92
انحراف معیار	5.3	6.4
آماره t	2.36
p-value	0.7

5- نتیجه‏گیری

پيش‏بيني درماندگي مالي و ورشكستگي شركت‏ها يكي از پژوهش‏هاي با اهميت در حوزه مالي است. معمولاً بانك‏ها و موسسات رتبه‏بندي اعتباري از اين مدل‏ها براي اتخاذ تصميمات اعتباري و اختصاص رتبه استفاده مي‏نمايند. از طرفی با پيش‏بيني وضعیت شرکت درآینده و پس از آن ريشه‏يابي و حل مسأله، مي‏توان به نتايج بسيار رضايت‏بخشي در حوزه مدیریتی دست يافت. در این پژوهش، پيش‏بيني ورشکستگی شركت‏ها با استفاده از مدل‏هاي KNN، SVM و مدل‏های توسعه یافته انجام گرفت. و نتايج نشان داد مدل پیشنهادی KNN-CSSVM می‏تواند در امر پیش‏بینی جانشین مناسبی برای مدل ساده SVM باشد. درواقع، یافته‏های تحقیق حاکی از این است که دقت کلی و قدرت تعمیم‏پذیری KNN-CSSVM از مد‏ل‏های SVM و KNN-SVM به طور معناداری بیشتر است. و با اطمینان بیشتری می‏توان از آن برای پیش‏بینی یا رتبه‏بندی اعتباری شرکت‏ها در بازه زمانی یک سال قبل از ورشکستگی استفاده نمود. همچنين، نتايج حاصل از اين پژوهش بار دیگر ثابت می‏کند كه نسبت‏هاي مالي مي‏توانند پيش‏بيني‏كننده مناسبی براي ورشکستگی شركت‏ها باشند. در مجموع می‏توان ادعا نمود كه با استفاده از نتايج اين پژوهش بعنوان اولين گام، مي توان از مبتلا شدن شركت‏ها به درماندگي مالي و ورشكستگي و پيامدهاي آن بطورمطلوبي جلوگيري كرد. البته در صورتيكه پس از پيش‏بيني به ريشه‏يابي مساله و رديابي علل پرداخته شود. همچنین قابل ذکر است صنعت بانكداري ايران به دلیل عملكرد سال‏های اخير، تحريم‏هاي بانكي و بي‏توجهي‏هاي مديريتي، فاصله قابل توجهي با بانكداري جهانی دارد و اين موضوع اخيرا مورد توجه مسوولان بانك مركزي و سيستم بانكي جهان قرار گرفته است؛ از این رو، بانك‏ها و ساير موسسات مالي مي‏توانند براي اتخاذ تصميمات اعتباري دقيق‏تر و علمي‏تر از اين مدل‏ها استفاده نمايند؛ بويژه بانك‏هايي كه قصد دارند رويكرد رتبه‏بندي داخلي از دستورالعمل بال 2 ²⁸را پياده‏سازي نمايند.

[1] Multiple Discriminant Analysis )MDA)

[2] Logit

[3] Probit

[4] Artificial Neural Network (ANN)

[5] Support Vector Machine (SVM)

[6] Data Mining

[7] Hyperplane

[8] Structural risk minimization principle (Srm)

[9] K-Nearest Neighbors (KNN)

[10] Decision Tree

[11] Statistical learning theory (slt)

[12] Under Sampling

[13] Over Sampling

[14] Logistic Regression

[15] Linear regression (LR)

[16] Zemijewski

[17] Springate

[18] Mackay

[19] www. towardsdatascience.com

[20] Vladimir N. Vapnik

[21] Binary classifier

[22] Feature space

[23] Radial basis function (RBF)

[24] Tehran Stock Exchange (TSE)

[25] Cross-validation

[26] Resubstitution error

[27] Cross-Validation error

[28] پيشنويس توافقنامه بال دو، نخستين بار در ژوئن سال ۱۹۹۹ ميلادي تنظيم و پس از چند مرحله انتشار مقدماتي و اخذ نظرات اصلاحي و اجراي آزمايشي، سرانجام از ابتداي سال ۲۰۰۸ مـيلادي بـه مرحلـه اجـرا درآمد و داراي سه بخش (رکن) اصلي شامل: حداقل سرمايه لازم بانکها براي پوشش ريسک‏هاي مترتب، فرآيند بررسي نظارتي و انضباط بازارمي‏باشد که البته اين عوامل به صورت متقابل بر يکديگر تاثيرگذار هستند.

مقالات مرتبط

طراحی پرتفوی هوشمند با استفاده از مدلهای سرمایه گذاری کمی
تاریخ چاپ : 1399/07/01
گونه شناسی شبکه های مالی بر اساس ویژگی های مکان شناختی آن ها (مطالعه ای در بورس اوراق ‏بهادار تهران)‏
تاریخ چاپ : 1399/10/01
بررسی تأثیر عدم تقارن اطلاعات و اثر مقیاس بر ساختار بازار در بورس اوراق بهادار تهران
تاریخ چاپ : 1399/10/01
به کارگیری مدل‌های یادگیری ماشین در تشکیل پرتفوی بهینه سهام و مقایسه کارایی آنها
تاریخ چاپ : 1399/10/01
تبیین رابطه ترکیب ریسک نامطلوب و ریسک مطلوب در پیش بینی نوسانات بازده بازار
تاریخ چاپ : 1399/10/01
پیش بینی گرایش احساسی سرمایه گذاران با استفاده ازتکنیک‏های ماشین بردار پشتیبان(SVM) و درخت تصمیم(DT)
تاریخ چاپ : 1399/10/01

اشتراک گذاری

آدرس مقاله

پیش ‏بینی ورشکستگی شرکت‏ها با استفاده از ترکیب مدل‏های داده‏ کاوی مبتنی بر جریمه دسته‏ بندی نادرست

پیش ‏بینی ورشکستگی شرکت‏ها با استفاده از ترکیب مدل‏های داده‏ کاوی مبتنی بر جریمه دسته‏ بندی نادرست