پیشبینی نگهداشت وجه نقد با استفاده از الگوریتمهای یادگیری ماشین نظارتشده در شرکتهای پذیرفتهشده در بورس اوراق بهادار تهران
سعید فلاح پور
1
(
دانشیار گروه مالی و بیمه دانشکده مدیریت دانشگاه تهران
)
رضا راعی
2
(
استاد، دانشگاه تهران
)
نگار توکلی
3
(
دانشگاه تهران
)
کلید واژه: یادگیری ماشین, رگرسیون بردار پشتیبان, الگوریتم تقویت گرادیان شدید, نگهداشت پول نقد, شاخص عدم قطعیت جهانی,
چکیده مقاله :
این مطالعه با توجه به 22 ویژگی انتخاب شده (که در حین پژوهش بررسی میشوند) با روشهای یادگیری ماشین، نگهداری وجه نقد شرکتهای پذیرفتهشده در بورس اوراق بهادار تهران را پیشبینی میکند. 201 شرکت از سال 1396 تا سال 1400 بررسی شد. رگرسیون خطی چندگانه ، کی-نزدیکترین همسایه، رگرسیون بردار پشتیبان، درخت تصمیم، جنگل تصادفی، الگوریتم تقویت گرادیان شدید و شبکههای عصبی چندلایه برای پیشبینی استفاده میشود. نتایج نشان میدهد که روشهای رگرسیون خطی چندگانه ، کی-نزدیکترین همسایه خطای جذر میانگین مربعات و میانگین قدرمطلق خطا بالا را ارائه میدهند. در همین حال، الگوریتمهای پیچیدهتر، به خصوص رگرسیون بردار پشتیبان ، دقت بالاتری را به دست میآورند؛ یافتهها حاکی از آن بوده است که با کاهش به 15 متغیر، روشهای یادگیری ماشین به خصوص کی-نزدیکترین همسایه نتایج بهتری را ارائه دادند. بر مبنای آزمون مقایسه زوجی نیز رگرسیون بردار پشتیبان عملکرد بهتری از سایر الگوریتمهای یادگیری ماشین نظارت شده به جز درخت تصمیم دارد. همچنین مهمترین متغیرها نیز اندازه شرکت و مخارج سرمایهای به دست آمد. شاخص عدم قطعیت جهانی و تورم نیز از متغیرهایی با اهمیت نسبتاً بالایی بودند؛ بنابراین، با استفاده از الگوریتم رگرسیون بردار پشتیبان ، ممکن است میزان وجه نقد را به میزان قابلتوجهی پیشبینی کنیم.
چکیده انگلیسی :
According to the 22 selected features (which are checked during the research) with machine learning methods, this study predicts the cash holding of companies admitted to the Tehran Stock Exchange. 201 companies were investigated from 1396 to 1400. Multiple linear regression, K-nearest neighbor, support vector regression, decision tree, random forest, extreme gradient boosting algorithm and multilayer neural networks are used for prediction. The results show that the multiple linear regression methods provide the k-nearest neighbor of the root mean square error (RMSE) and the mean absolute error (MAE) of the high error. Meanwhile, more complex algorithms, especially support vector regression, achieve higher accuracy; The findings indicated that by reducing to 15 variables, machine learning methods, especially K-nearest neighbor, provided better results. Based on the paired sample t-test, support vector regression has a better performance than other supervised machine learning algorithms except decision tree. Also, the most important variables were company size and capital expenditures (CapEx). The World Uncertainty Index and inflation were also relatively important variables; Therefore, by using the support vector regression algorithm, we may predict the amount of cash to a significant extent.
_||_