Detection of Fraudulent Financial Statements based on Long Short-Term Memory (LSTM) Deep Learning Technique
Subject Areas : Financial Economicsjavad sharafkhani 1 , Muhammad ali bidari 2
1 -
2 - accouanting faculty
Keywords: Fraudulent Financial Statements, Deep Learning, Long Short-Term Memory (LSTM) Technique,
Abstract :
The present study aims to detect fraudulent financial statements using the Long Short-Term Memory (LSTM) deep learning technique in companies listed on the Tehran Stock Exchange and compare its results with other deep learning algorithms. . In this study, four deep learning algorithms, including Long Short-Term Memory (LSTM), Support Vector Machine (SVM), Convolutional Neural Network (CNN), and Recurrent Neural Network (RNN), were employed. Additionally, a two-sample mean comparison test was used to select the final variables for building the model.
The results of deep learning algorithms show that the overall accuracy of the LSTM, SVM, CNN, and RNN algorithms is 98.6%, 88.4%, 81.3%, and 94.4%, respectively, indicating that the LSTM algorithm performs the best, while the CNN algorithm shows the weakest performance in detecting fraudulent financial statements. . Therefore, the LSTM algorithm provides the most effective model for detecting fraudulent financial statements in companies listed on the Tehran Stock Exchange.
The findings of this study can provide useful information for shareholders, creditors, analysts, and other participants in the capital market, helping improve the prediction of fraudulent financial statements, reduce errors in decision-making based on financial statement information, better evaluate company performance based on data, adopt optimal trading strategies, and identify suitable stock trading opportunities based on financial statement information.
منابع و مآخذ
الف- منابع فارسی:
1. ابراهیمی، سید بابک، جهانگیرزاده، جواد، کتابیان، حمید. (1395). شناسایی پارامترهای تاثیرگذار بر تقلب در حوزه مالی. فصلنامه مجلس و راهبرد، 12(86). 174-149.
2. احمدی، سید جلال، فغانی ماکرانی، خسرو، فاضلی، نقی. (1399). ارائه مدلی برای پیشبینی صورتهایمالی متقلبانه و مقایسه صورتها و نسبتهای مالی با قانون بنفورد. دانش حسابداری و حسابرسی مدیریت، 9(35)، 221-237.
3. اعتمادی، حسین، عبدلی، لیلا. (1396). کیفیت حسابرسی و تقلب در صورتهای مالی. دانش حسابداری مالی، 4(4)، 23-43.
4. برنا، محمدرضا، برادران حسن زاده، رسول، فضل زاده، علیرضا، بادآورنهندی، یونس. (1401). الگوی عوامل موثر بر وقوع تقلب در صورت های مالی با رویکرد حسابداری دادگاهی: بر اساس روش تحلیل مضمون(تم). پژوهش های کاربردی در گزارشگری مالی، 11(21)، 320-281.
5. پسندیده فرد، فایزه، وادی زاده، کاظم، سپاسی سحر. (۱۳۹۹). شناسایی عوامل مؤثر بر گزارشگری مالی متقلبانه و نادرست با استفاده از روش فراترکیب. عنوان نشریه. ۵ (۹)، ۳۰۱-۳۳۴.
6. پور حیدری، امید، بذر افشان، سعید. (1390). اهمیت بسترهای خطر تقلب از دیدگاه حسابرسان مستقل. پژوهش های حسابداری مالی و حسابرسی، 3(10)، 1-26.
7. خواجوی، شکرالله، ابراهیمی، مهرداد. (1396). ارائة یک رویکرد محاسباتی نوین برای پیشبینی تقلب در صورتهای مالی، با استفاده از شیوههای خوشهبندی و طبقهبندی (شواهدی از شرکتهای پذیرفتهشده در بورس اوراق بهادار تهران). پیشرفتهای حسابداری، 9(2)، 1-34.
8. خواجوی، شکراله. (1396). مدل سازی متغیرهای اثرگذار برای کشف تقلب در صورت های مالی با استفاده از تکنیک های داده کاوی. حسابداری مالی، 9(33)، 23-50.
9. رحیمیان، نظام الدین، حاجی حیدری، راضیه. (1398). کشف تقلب با استفاده از مدل تعدیل شده بنیش و نسبتهای مالی. پژوهش های تجربی حسابداری، 9(1)، 47-70.
10. رضائی، مهدی، ناظمی اردکانی، مهدی، ناصر صدرآبادی، علیرضا. (1399). کشف تقلب صورتهای مالی با توجه به گزارش حسابرسی صورتهای مالی. حسابداری مدیریت، 13(45)، 141-153.
11. رضائی، مهدی، ناظمی اردکانی، مهدی، ناصر صدرآبادی، علیرضا. (1400). پیش بینی تقلب صورت های مالی با استفاده از رویکرد کریسپ (CRISP). دانش حسابداري و حسابرسي مديريت، 10(40)، 150-135.
12. سجادی، سید حسین، کاظمی، توحید. (1395). الگوی جامع گزارشگری مالی متقلبانه در ایران به روش نظریه پردازی زمینه بنیان. پژوهش های تجربی حسابداری، 6(3)، 185-204.
13. شکوری، محمدمهدی، طاهرآبادی، علی اصغر، قنبری، مهرداد، جمشیدی، نوید بابک. (1401). تبیین مدل پنتاگون تقلب و ارائه مدل جامع گزارشگری مالی متقلبانه. دانش حسابرسی. ۲۲ (۸۷)،۱۲۰-۱۵۹.
14. شمس، زهرا، ملانظری، مهناز. (1398). مدل عوامل مؤثر بر قضاوت و تصمیمگیری در خصوص تقلب مرتبط با داراییها. پژوهش های تجربی حسابداری، 9(3)، 277-300.
15. صفرزاده، محمدحسین. (1391). توانایی نسبتهای مالی در کشف تقلب در گزارشگری مالی: تحلیل لاجیت. مجله دانش حسابداری، 1(1)، 137-163.
16. صفی خانی، فرهاد، یعقوب نژاد، احمد، جهانشاد، آزیتا. (1402). پیشایندهای گزارشگری مالی متقلبانه در شرکت های دارای بحران مالی. دانش حسابداری و حسابرسی مدیریت، 12(45)، 251-270.
17. فرج زاده دهکردی، حسن، آقایی، لیلا. (1394). سیاست تقسیم سود و گزارشگری مالی متقلبانه. مطالعات تجربی حسابداری مالی، 12(45)، 114-97.
18. فرقان دوست حقیقی، کامبیز، و برواری، فرید. (1388). بررسی کاربرد روش های تحلیلی در ارزیابی ریسک تحریف صورت های مالی (تقلب مدیریت). دانش و پژوهش حسابداری، -(16)، 1-15.
19. کاظمی، توحید، پیری، پرویز. (1401). پیش بینی طرح تقلب در گزارشگري مالی با استفاده از رویکرد یادگیري ماشین در فضاي چند کلاسه. پژوهش های تجربی حسابداری، 12(46)، 276-255.
20. مرادی، جواد، رستمی، راحله، زارع، رضا. (1393). شناسایی عوامل خطر مؤثر بر احتمال وقوع تقلب در گزارشگری مالی از دید حسابرسان و بررسی تأثیر آنها بر عملکرد مالی شرکت. پیشرفتهای حسابداری، 6(1)، 141-173.
21. ملکی کاکلر، حسن، بحری ثالث، جمال، جبارزاده کنگرلویی، سعید، آشتاب، علی. (1400). کارایی مدلهای آماری والگوهای یادگیری ماشین در پیش بینی گزارشگری مالی متقلبانه. اقتصاد مالی، 15(54)، 267-292.
22. ملکی کاکلر، حسن، بحری ثالث، جمال، جبارزاده کنگرلویی، سعید، آشتاب، علی، کاظمی، توحید. (1400). ارائه مدل توسعه یافته ی پنج ضلعی تقلب در گزارشگری مالی با تاکید بر ساختار کنترلهای داخلی. دانش حسابرسی. ۲۱ (۸۴)، ۵۶-۷۹.
23. مهدوی، غلامحسین، قهرمانی، علیرضا. (1396). ارائه الگویی برای کشف تقلب به وسیله حسابرسان با استفاده از شبکه عصبی مصنوعی. دانش حسابرسی، ۱۷ (۶۷)، ۴۵-۷۰.
24. میرفندرسکی، سید محمدتقی، قادری، بهمن، آخوندی، مجید. (1397). رابطه ی بین دوره ی تصدی حسابرس و خطر تقلب در گزارشگری مالی با کنترل اثر شرایط نااطمینانی محیطی. فصلنامه حسابدار رسمی، 21(43)، 65-56.
25. یوخنه القیانی، ماریام، بحری ثالث، جمال، جبارزاده کنگرلوئی، سعید، زواری رضایی، اکبر. (1400). تبیین گزارشگری مالی- مالیاتی متقلبانه شرکتها: رویکرد ترکیبی دادهکاوی کلاسیک، ANFIS و الگوریتمهای فراابتکاری. مطالعات تجربی حسابداری مالی، 18(71)، 87-112.
26. یوخنه القیانی، ماریام، جبارزاده کنگرلوئی، سعید، بحری ثالث، جمال، و زواری رضایی، اکبر. (1399). تبیین الگوی تقلب مالیاتی در ایران مبتنی بر رویکرد آمیخته (واکاوی کنش مالیاتی متقلبانه اشخاص حقوقی). دانش حسابرسی، 20(80 )، 241-280.
27. بهشتی مسئله گو، سیده مژگان، افشار کاظمی، محمد علی، حقیقت منفرد، جلال، رضاییان، علی. (1401). یادگیری عمیق برای پیشبینی بازار سهام با استفاده از اطلاعات عددی و متنی (رویکرد الگوریتم حافظه کوتاه مدت ماندگار LSTM). مهندسی مالی و مدیریت اوراق بهادار، پذیرفته شده، انتشار آنلاین از تاریخ 25 مرداد 1401.
28. سیاهکارزاده، علی محمد. (1400). پیشبینی بازارهای مالی با استفاده از یادگیری عمیق. پایان نامه کارشناسی ارشد، مهندسی کامپیوتر، دانشگاه صنعتی شاهرود.
ب- منابع لاتین:
29. Albashrawi, M. Detecting financial fraud using data mining techniques: A decade review from 2004 to 2015. J. Data Sci. 2016, 14, 553–569.
30. Alfaiz, N.S.; Fati, S.M. Enhanced Credit Card Fraud Detection Model Using Machine Learning. Electronics 2022, 11, 662.
31. Alsinglawi, M.M.A.S.M.A.O.; Almari, M.O.S. Predicting Fraudulent Financial Statements Using Fraud Detection Models. Acad. Strateg. Manag. 2021, 20, 1–17.
32. Amar, I.A.A.B.; Jarboui, A. Detection of Fraud in Financial Statements: French Companies as a Case Study. Int. J. Acad. Res. Bus. Soc. Sci. 2013, 3, 456–472.
33. Andrew, C.; Robin. Detecting Fraudulent of Financial Statements Using Fraud S.C.O.R.E Model and Financial Distress. Int. J. Econ. Bus. Account. Res. (IJEBAR) 2022, 6, 211–222.
34. Asimit, A.V.; Kyriakou, I.; Santoni, S.; Scognamiglio, S.; Zhu, R. Robust Classification via Support Vector Machines. Risks 2022, 10, 154.
35. Bao, Y.; Ke, B.; Li, B.; Yu, Y.J.; Zhang, J. Detecting accounting fraud in publicly traded US firms using a machine learning approach. J. Account. Res. 2020, 58, 199–235.
36. Beneish, M.D. The detection of earnings manipulation. Financ. Anal. J. 1999, 55, 24–36.
37. Cecchini, M.; Aytug, H.; Koehler, G.J.; Pathak, P. Detecting management fraud in public companies. Manag. Sci. 2010, 56, 1146–1160.
38. Chen, S. Detection of fraudulent financial statements using the hybrid data mining approach. SpringerPlus 2016, 5, 1–16.
39. Craja, P.; Kim, A.; Lessmann, S. Deep learning for detecting financial statement fraud. Decis. Support Syst. 2020, 139, 113421.
40. Deebak, B.; Memon, F.H.; Dev, K.; Khowaja, S.A.; Wang, W.; Qureshi, N.M.F. TAB-SAPP: A trust-aware blockchain-based seamless authentication for massive IoT-enabled industrial applications. IEEE Trans. Ind. Inform. 2022, 19, 243–250.
41. El-Bannany, M.; Sreedharan, M.; Khedr, A.M. A robust deep learning model for financial distress prediction. Int. J. Adv. Comput. Sci. Appl. 2020, 11, 170–175.
42. Fernández-Delgado, M.; Cernadas, E.; Barro, S.; Amorim, D. Do we need hundreds of classifiers to solve real world classification problems? J. Mach. Learn. Res. 2014, 15, 3133–3181.
43. Gorenc, M. Empirical evidence of financial statement manipulation during economic recessions. Management 2019, 14, 19–31.
44. Grove, H.; Basilico, E. Fraudulent Financial Reporting Detection Key Ratios Plus Corporate Governance Factors. Int. Stud. Mgt. Org. 2008, 38, 10–42.
45. Gu, Q.; Zhu, L.; Cai, Z. Evaluation measures of the classification performance of imbalanced data sets. In Proceedings of the Computational Intelligence and Intelligent Systems: 4th International Symposium, ISICA 2009, Huangshi, China, 23–25 October 2009; Proceedings 4. Springer: Cham, Switzerland, 2009; pp. 461–471.
46. Gupta, R.; Gill, N.S. Prevention and detection of financial statement fraud–An implementation of data mining framework. Editor. Pref. 2012, 3, 150–160
47. Gupta, S.; Mehta, S.K. Data mining-based financial statement fraud detection: Systematic literature review and meta-analysis to estimate data sample mapping of fraudulent companies against non-fraudulent companies. Glob. Bus. Rev. 2021, 1–26.
48. Hajek, P.; Henriques, R. Mining corporate annual reports for intelligent detection of financial statement fraud—A comparative study of machine learning methods. Knowl.-Based Syst. 2017, 128, 139–152.
49. Hamal, S.; Senvar, Ö. Comparing performances and effectiveness of machine learning classifiers in detecting financial accounting fraud for Turkish SMEs. Int. J. Comput. Intell. Syst. 2021, 14, 769–782.
50. Han, D. Researches of Detection of Fraudulent Financial Statements Based on Data Mining. J. Comput. Theor. Nanosci. 2017, 14, 32–36.
51. Humpherys, S.L.; Moffitt, K.C.; Burns, M.B.; Burgoon, J.K.; Felix, W.F. Identification of fraudulent financial statements using linguistic credibility analysis. Decis. Support Syst. 2011, 50, 585–594.
52. Kanapickiene, R.; Grundiene, Z. The Model of Fraud Detection in Financial Statements by Means of Financial Ratios. Procedia Soc. Behav. Sci. 2015, 213, 321–327
53. Kulikova, L.; Satdarova, D. Internal control and compliance-control as effective methods of management, detection and prevention of financial statement fraud. Acad. Strateg. Manag. J. 2016, 15, 92.
54. Kumar, R.; Tripathi, R. Secure healthcare framework using blockchain and public key cryptography. In Blockchain Cybersecurity, Trust and Privacy; Springer: Cham, Switzerland, 2020; pp. 185–202.
55. Kumar, S.; Ahmed, R.; Bharany, S.; Shuaib, M.; Ahmad, T.; Tag Eldin, E.; Rehman, A.U.; Shafiq, M. Exploitation of Machine Learning Algorithms for Detecting Financial Crimes Based on Customers’ Behavior. Sustainability 2022, 14, 13875.
56. Li, H.; Wong, M.L. Financial fraud detection by using Grammar-based multi-objective genetic programming with ensemble learning. In Proceedings of the 2015 IEEE Congress on Evolutionary Computation (CEC), Sendai, Japan, 25–28 May 2015; IEEE: New York, NY, USA, 2015; pp. 1113–1120.
57. Lin, C.C.; Chiu, A.A.; Huang, S.Y.; Yen, D.C. Detecting the financial statement fraud: The analysis of the differences between data mining techniques and experts’ judgments. Knowl.-Based Syst. 2015, 89, 459–470.
58. Misstatements; Bertomeu, J.; Cheynel, E.; Floyd, E.; Pan, W. Ghost in the Machine: Using Machine Learning to Uncover Hidden; Springer: Cham, Switzrland, 2018; Volume 4, pp. 233–241.
59. Moepya, S.O.; Akhoury, S.S.; Nelwamondo, F.V. Cost-sensitive classification for financial fraud detection under high classimbalance. In Proceedings of the 2014 IEEE international conference on data mining workshop, Shenzhen, China, 14–17 December 2014; IEEE: New York, NY, USA, 2014; pp. 183–192.
60. Mohammadi, M.; Yazdani, S.; Khanmohammadi, M.H.; Maham, K. Financial reporting fraud detection: An analysis of data mining algorithms. Int. J. Financ. Manag. Account. 2020, 4, 1–12.
61. Murorunkwere, B.F.; Tuyishimire, O.; Haughton, D.; Nzabanita, J. Fraud Detection Using Neural Networks: A Case Study of Income Tax. Future Internet 2022, 14, 168.
62. Pai, P.F.; Hsu, M.F.; Wang, M.C. A support vector machine-based model for detecting top management fraud. Knowl.-Based Syst. 2011, 24, 314–321.
63. Paulo Sérgio Gomes Macedo, H.C.I.; Vieira, E.S. A model to detect financial statement fraud in Portuguese companies by the auditor. Contaduría Adm. 2022, 67, 185–209.
64. Pérez López, C.; Delgado Rodríguez, M.; de Lucas Santos, S. Tax Fraud Detection through Neural Networks: An Application Using a Sample of Personal Income Taxpayers. Future Internet 2019, 11, 86.
65. Perols, J. Financial statement fraud detection: An analysis of statistical and machine learning algorithms. Audit. J. Pract. Theory 2011, 30, 19–50.
66. Pintelas, P.; Livieris, I. Ensemble learning and their applications. Algorithms 2020, 1–184.
67. Ragab, Y. Financial Ratios and Fraudulent Financial Statements Detection: Evidence from Egypt. Int. J. Acad. Res. 2017, 4, 1–6.
68. Ravisankar, P.; Ravi, V.; Rao, G.R.; Bose, I. Detection of financial statement fraud and feature selection using data mining techniques. Decis. Support Syst. 2011, 50, 491–500.
69. Rizki, A.A.; Surjandari, I.; Wayasti, R.A. Data mining application to detect financial fraud in Indonesia’s public companies. In Proceedings of the 2017 3rd International Conference on Science in Information Technology (ICSITech), Bandung, Indonesia, 25–26 October 2017; IEEE: New York, NY, USA, 2017; pp. 206–211
70. Saville, A. Using Benford’s Law to Detect Data Error and Fraud: An Examination Of Companies Listed on the Johannesburg Stock Exchange. SAJEMS 2006, 9, 341–354
71. Schreiber-Gregory, D.; Bader, K. Logistic and Linear Regression Assumptions: Violation Recognition and Control. In Proceedings of the SESUG Conference, St. Pete Beach, FL, USA, 14–17 October 2018; pp. 1–6.
72. Song, X.P.; Hu, Z.H.; Du, J.G.; Sheng, Z.H. Application of machine learning methods to risk assessment of financial statement fraud: Evidence from China. J. Forecast. 2014, 33, 611–626.
73. Sreedharan, M.; Khedr, A.M.; El Bannany, M. A Multi-Layer Perceptron Approach to Financial Distress Prediction with Genetic Algorithm. Autom. Control. Comput. Sci. 2020, 54, 475–482.
74. Strelcenia, E.; Prakoonwit, S. Improving Classification Performance in Credit Card Fraud Detection by Using New Data Augmentation. AI 2023, 4, 172–198.
75. Tilden, C.; Janes, T. Benford’s Law as a Useful Tool to Determine Fraud in Financial Statements. J. Financ. Account. 2012, 14, 1–15.
76. Wadhwa, A.V.K.; Kumar, S. Financial Fraud Prediction Models: A Review of Research Evidence. Int. J. Sci. Technol. Res. 2020, 9, 677–680.
77. West, J.; Bhattacharya, M.; Islam, R. Intelligent financial fraud detection practices: An investigation. In Proceedings of the International Conference on Security and Privacy in Communication Networks, Beijing, China, 24–26 September 2014; Springer: Cham, Switzrland, 2014; pp. 186–203.
78. Whiting, D.G.; Hansen, J.V.; McDonald, J.B.; Albrecht, C.; Albrecht, W.S. Machine learning methods for detecting patterns of management fraud. Comput. Intell. 2012, 28, 505–527.
79. Yao, J.; Pan, Y.; Yang, S.; Chen, Y.; Li, Y. Detecting fraudulent financial statements for the sustainable development of the socio-economy in China: A multi-analytic approach. Sustainability 2019, 11, 1579.
80. Yao, J.; Zhang, J.; Wang, L. A financial statement fraud detection model based on hybrid data mining methods. In Proceedings of the 2018 International Conference on Artificial Intelligence and Big Data (ICAIBD), Chengdu, China, 26–28 May 2018; IEEE: New York, NY, USA, 2018; pp. 57–61.
81. Zaheer, S.; Anjum, N.; Hussain, S.; Algarni, A.D.; Iqbal, J.; Bourouis, S.; Ullah, S.S. A Multi-Parameter Forecasting for Stock Time Series Data Using LSTM and Deep Learning Model. Mathematics 2023, 11, 590. https://doi.org/10.3390/ math11030590.