A Model for Identification Tax Fraud Based on Improved ID3 Decision Tree Algorithm and Multilayer Perceptron Neural Network
Subject Areas : Management AccountingAkbar Javadian Kootanaee 1 , Abbas Ali Poor aghajan Sarhamami 2 , Mirsaeid Hosseini Shirvani 3
1 - PhD student of Accounting, Department of Accounting, Qaemshahr Branch, Islamic Azad University, Qaemshahr, Iran
2 - Assistant Professor, Department of Accounting, Qaemshahr Branch, Islamic Azad University, Qaemshahr, Iran.
3 - Assistant Professor, Department of Camputer Engineering, Sari Branch, Islamic Azad University, Sari, Iran.
Keywords: Tax fraud, declared tax, Improved Decision tree, Genetic algorithm, Adaboost Algorithm,
Abstract :
Tax revenues are one of the most important sources of governments and cover a large portion of government spending. In recent years, fraud in financial statements and tax returns has increasingly become a serious problem for businesses, governments and investors. Most taxpayers are looking for a way to manipulate their financial statements and reduce their taxable profits. Therefore, identifying tax fraudsters and companies that cheat on financial statements has become a vital issue for the government.The purpose of this study is to present a model that uses the improved ID 3decision tree algorithm. Also, to improve its performance and accuracy, it was combined with multilayer perceptron neural networks optimized by genetic algorithm to select financial ratios associated with tax fraud and reduce computational overhead. The tree in the proposed model has the lowest depth possible, so it has high velocity and low computational overhead. For this purpose, the financial statements of 06companies listed in Tehran Stock Exchange during - 4330 4331were studied and 41financial ratios were extracted. By ANOVA test, 33ratios and finally by neural networks 7ratios related to tax fraud was selected as the model input data. The proposed model, with %4411accuracy, has been successful in identifying fraudulent companies with the highest accuracy and predictive power over the adaboost algorithms.
* اعتمادی، حسین و حسن زلقی، (1392)، کاربرد رگرسیون لجستیک در شناسایی گزارشگری مالی متقلبانه، مجله دانش حسابرسی، سال 13، شماره 51، 145-163.
* پور حیدری، امید و مجتبی گل محمدی شورکی (1394)، تأثیر ریسک وضعیت مالیاتی شرکت بر حقالزحمه حسابرسی، بررسی های حسابداری و حسابرسی، شماره 22، صص 318-301.
* تشدیدی الهه، سحر سپاسی، حسین اعتمادی و عادل آذر (1398)، ارائه رویکردی نوین در پیشبینی و کشف تقلب صورتهای مالی با استفاده از الگوریتم زنبور عسل، مجله دانش حسابداری، دوره دهم، شماره 3، پاییز 1398، 139-167
* تقوی فرد، سید محمدتقی، ایمان رئیسی وانانی و ریحانه پناهی (1396)، تحلیل آینده نگر تشخیص فرار مالیاتی مؤدیان مالیات بر ارزش افزوده با استفاده از الگوریتمهای طبقهبندی و خوشه بندی، پژوهشنامه مالیات، شماره 35، 11-35
* داغمه چی فیروزجایی، علی (1393)، پاسخگویی در گزارشگری مالی: کشف شرکتهای متقلب، پایان نامه کارشناسی ارشد، رشته حسابداری، دانشگاه مازندران.
* زارع بهنمیری، محمد جواد (1395)، پیش بینی تقلب در صورتهای مالی با استفاده از نسبت های مالی، پایان نامه دکتری، رشته حسابداری، دانشگاه مازندران.
* صدر موسوی، میرستار و اکبر رحیمی (1388)، مقایسه نتایج شبکههای عصبی پرسپترون چندلایه با رگرسیون چندگانه در پیشبینی غلظت ازن در شهر تبریز، پژوهشهای جغرافیای طبیعی، شماره 71، 65-72
* عرب صالحی، مهدی و مجید هاشمی (1394)، تأثیر اطمینان بیش از حد مدیریتی بر اجتناب مالیاتی، بررسی های حسابداری و حسابرسی، شماره 22، 104-85
* عرب مازار، علی اکبر و علی دهقانی (1388)، برآورد کارایی مالیات بر درآمد مشاغل و اشخاص حقوقی در استانهای کشور، مجله پژوهشهای مالیاتی، فصلنامه پژوهشنامه مالیات، سال 17، شماره 7، صص 64-45
* فرقاندوست حقیقی، کامبیز و فرید برواری (1388)، بررسی کاربرد روش های تحلیل در ارزیابی ریسک تحریف صورتهای مالی(تقلب مدیریت)، مجله دانش و پژوهش حسابداری، شماره 16، 18-70.
* قانون مالیاتهای مستقیم، مصوب 31/4/1394.
* محمدموسایی جابر، بابک جمشیدی نوید، مهرداد قنبری و فرشید خیراللهی (1398)، تدوین مدل کشف تقلب با استفاده از رویکرد ترکیبی برپایه مدل تحلیل عاملی و روش شبکه عصبی مصنوعی در شرکت های پذیرفته شده در بورس اوراق بهادار تهران، مجله حسابداری مدیریت، دوره 12، شماره 42، پاییز 1398، 75-87.
* مهام، کیهان و ابوالفضل ترابی (1391)، ارائه مدل رتبه بندی ریسک در تقلب گزارشگری مالی، همایش جهاد اقتصادی (با تاکید بر تولید ملی، حمایت از کار و سرمایه ایرانی)، دانشگاه مازندران.
* مهرانی، ساسان و سیدجلال سیدی، (1393)، بررسی تأثیر مالیات بر درآمد و حسابداری محافظه کارانه بر اجتناب مالیاتی شرکتها، فصلنامه علمی پژوهشی دانش حسابداری و حسابرسی مدیریت، شماره دهم، 33-13.
* نمازی، محمد و محمدصادق زاده مهارلوئی (1396)، پیش بینی فرار مالیاتی با استفاده از الگوریتم های دادهکاوی درخت تصمیم، فصلنامه حسابداری مالی، سال نهم، شماره 36، زمستان 96، 76-100
* همتی، هدی و محمدعلی جابری و کریم ایمانی و محمدعلی شامحمدی، (1398)، بررسی رابطه نوع اظهارنظر و اندازه موسسه حسابرسی با اجتناب از مالیاتی با استفاده از روش دو مرحله ای همکن، نشریه تحقیقات حسابداری و حسابرسی، پاییز 1398، شماره 43، 171-186.
* همراز، سعید (1385)، ماشین یادگیری همه منظوره، پایان نامه کارشناسی، رشته مهندسی کامپیوتر- نرم افزار، دانشگاه علم و صنعت ایران
* A.V Senthil Kumar et. al. 2013, “Diagnosis of heart disease using Advanced Fuzzy Resolution Mechanism” International Journal of Science and Applied Information Technology (IJSAIT), Vol. 2, No.2, Pages: 22-30 (2013).
* Didimo, W., L. Giamminonni, G. Liotta, F. Montecchiani, and Pagliuca, D. (2018). A Visual Analytics System to support Tax Evasion Discovery. Decision Support Systems.
* Hanlon, M, Heitzman, Sh. (2010). “A review of tax research”. Journal of Accounting and Economics 50. Pp. 127-178.
* Hao Wang, Chengzhi Mao, Hao He, Mingmin Zhao, Tommi S. Jaakkola, Dina Katabi, “Bidirectional Inference Networks: A Class of Deep Bayesian Networks for Health Profiling”, Machine Learning (stat.ML); Artificial Intelligence (cs.AI); Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs. LG),2019.
* Kantesh Kumar Oad, Xu DeZhi & Pinial Khan Butt et. al, “A Fuzzy Rule based Approach to Predict Risk Level of Heart Disease”. Global Journal of Computer Science and Technology: C Software & Data Engineering, Volume14
* Kim, Yeonkook J., Baik, Bok. Cho, Sungzoon. (2016). Detecting financial misstatements with fraud intention using multi-class cost-sensitive learning, Expert Systems with Applications, No. 62, pp. 32-43.
* Kirkos, E., Spathis, C., & Manolopoulos, Y. (2007). Data Mining techniques for the detection of fraudulent. Expert Systems with Applications, 32(4), 995–1003
* Lari. Dashtbayaz, Mahmoud. (2015). Data search and discovery process for financial statement fraud, Research Journal of Finance and Accounting, Vol.6, No.3.
* Sergio Ledesma, Gustavo Cerda, Gabriel Avina, Donato Hernandez and Miguel Torres, Feature Selection using Artificial Neural Networks, A. Gelbukh and E.F. Morales (Eds.): MICIAI 2008, LNAI 5317, pp. 351-359.
* Ojeme Blessing Onuwa et. all, “Fuzzy Expert System for Malaria Diagnosis”., An International Open Free Access, Peer Reviewed Research Journal, Published by: Oriental Scientific Publishing Co., India. June2014, Vol.7, No. (2): Pgs. 273-284 [ISSN: 0974-6471].
* Ravisankar, P., Ravi, V., Rao, R., & Bose, I. (2011). Detection of financial statement fraud and feature selection using data miningtechniques. Decision Support Systems,50(2), 491–500.
* Rasa Kanapickiene, Zivile Grundiene, (2015), The Model of Fraud Detection in Financial Statements by Means of Financial Ratios, 20th International Scientific Conference Economics and Management, 2015
* Sergio Ledesma, Gustavo Cerda, Gabriel Avina, Donato Hernandez, and Miguel Torres, “Feature Selection Using Artificial Neural Networks”, A. Gelbukh and E.F. Morales (Eds.): MICAI 2008, LNAI 5317, pp. 351–359, 2008.
* Seyedhossein Naslmosavi, Arezoo Aghaei Chadegani and Mohammadghorban Mehri. (2011), Comparing the Ability of Bayesian networks and Adaboost for Predicting Financial Distress of Firms listed on Tehran Stock Rxchange (TSE), Australian Journal of Basic and Applied Sciences, 5(10): 629-634, 2011
* Shin, K & Lee, Y. (2002). A Genetic Algorithm Application in Bankruptcy Prediction Modeling. Expert Systems with Applications, Vol. 23, Issue. 3, pp.321-328.
* Sudan Chen. (2016). Detection of fraudulent financial statements using the hybrid data mining approach, Springer Plus, No. 5:89.
* Vanhoeyveld Jellis, David Martens, Bruno Peeters. (2020), Value-added tax fraud detection with scalable anomaly detection techniques. Applied Soft Computing Volume 86, January 2020.
* Watts, R. (2003a). Conservatism in Accounting Part I: Explanations and Implications.AccountingHorizons 17 (3): 207-222.
* Xin-Ping Song, Zhi-Hua Hu, Jian-Guo Du, Zhao-Han Sheng, 2014, Application of Machine Learning Methods to Risk Assessment of Financial Statement Fraud: Evidence from China, Journal of Forecasting, J. Forecast. 33, 611–626 (2014)
* Ziming Yin, Yinhong Zhao, Xudong Lu, and Huilong Duan, 2014, Screening of Alzheimer’s Disease Based on Multiple Neuropsychological Rating Scales, Hindawi Publishing Corporation Computational and Mathematical Methods in Medicine, Volume 2015.
* Zhou, W., & Kapoor, G. (2011). Detecting evolutionaryfinancialstatement fraud. Decision Support Systems, 50(3), 570-575.
_||_