حل مساله توزیع دادههای نامتوازن در پیشبینی ورشکستگی به روش یادگیری حساس به هزینه
محورهای موضوعی : مهندسی مالیسید بهروز رضوی 1 , ابراهیم عباسی 2
1 - گروه حسابداری، دانشکده حسابداری، موسسه آموزش عالی سناباد گلبهار، گلبهار، ایران.
2 - گروه مدیریت، دانشکده علوم اجتماعی و اقتصادی، دانشگاه الزهراء، تهران، ایران
کلید واژه: پیش بینی ورشکستگی, نسبت های مالی, داده های نامتوازن, یادگیری حساس به هزینه, بهینه سازی جستجو شبکه ای,
چکیده مقاله :
هدف از پژوهش حاضر افزودن تکنیک یادگیری حساس به هزینه به مدلهای پیشبینی ورشکستگی مبتنی بر دادههای نامتوازن به منظورکاهش خطای نوع اول و افزایش معیار میانگین هندسی دقت است تا بتوان هزینههای طبقهبندی اشتباه شرکتهای ورشکسته را بر ذینفعان کاهش داد. بدین منظور خطای نوع اول، خطای نوع دوم و معیار میانگین هندسی دقت مدلهای پیشبینی ورشکستگی مبتنی بر یادگیری حساس به هزینه با مدلهای پیشبینی ورشکستگی با داده به شدت نامتوازن مقایسه شدند، نمونه آماری شامل 1200 سال-شرکت در بازه زمانی سال 1380 الی سال 1399 شامل %90 شرکتهای سالم و %10 شرکتهای ورشکسته است، نتایج آزمون فرضیهها بیانگر آن است که افزودن تکنیک یادگیری حساس به هزینه به مدلهای پیشبینی ورشکستگی منجر به کاهش معنادار خطای نوع اول، افزایش معنادار خطای نوع دوم و افزایش معنادار معیار میانگین هندسی دقت مدلهای مبتنی بر دادههای نامتوازن در سطح اطمینان %95 شد، همچنین با افزایش مقدار هزینه طبقهبندی اشتباه شرکتهای ورشکسته، خطای نوع اول روند نزولی و خطای نوع دوم روند صعودی و میانگین هندسی دقت روند صعودی دارند
This study aimed to add cost-sensitive learning technique to imbalanced data-based bankruptcy prediction models in order to reduce type I error and increase the geometric mean criterion of overall accuracy to reduce the misclassification costs of bankrupt companies for stakeholders. For this purpose, type I error, type II error, and the geometric mean of overall accuracy of bankruptcy models based on cost-sensitive learning were compared with bankruptcy prediction models with highly imbalanced datasets. The statistical sample included 1200 year-companies since 2001- 2020, consisting of 90% healthy companies and 10% bankrupt companies. Hypotheses test results showed that adding a cost-sensitive learning technique to the bankruptcy prediction models led to a significant decrease in the type I error, a significant increase in the type II error, and a significant increase in geometric mean of accuracy of imbalanced data-based models at 95% confidence level. Also, with the increase in the misclassification cost of bankrupt companies, type I error had a downward trend and the II type error had an upward trend, and the geometric mean of accuracy had an upward trend.
_||_