Modelling and Predicting Earnings Quality Using Decision Tree and Support Vector Machine
Subject Areas : مدیریتLoghman Hatami Shirkouhi 1 , Soghra Barari Nokashti 2 , Maryam Ooshaksarae 3
1 - PhD student, Accounting Department, Rasht Branch, Islamic Azad University, Rasht, Iran
2 - Assistant Professor, Department of Accounting, Rasht Branch, Islamic Azad University, Rasht, Iran
3 - Assistant Professor, Department of Industrial Management, Rasht Branch, Islamic Azad University, Rasht, Iran
Keywords: Support vector machine, Conservatism, Accruals, earnings quality, Decision tree,
Abstract :
Earnings and its quality are one of the most important decision-making com-ponents for users. Therefore, earnings quality prediction is very important for investors and other stakeholders. To this aim, decision tree and support vec-tor machine (SVM) were used to predict earnings quality. The statistical population of the study included companies listed in Tehran Stock Exchange from 2011 to 2021 for 10 years. After screening, 113 companies and 1130 observations were selected as statistical samples. In order to identify and predict earnings quality, indicators related to corporate governance (board independence, audit committee independence, organizational ownership), dividend policy, debt financing, and conservatism were considered as inde-pendent variables and discretionary accruals quality representing profit quali-ty index was considered as a dependent variable. Data analysis was done according to CRISP-DM data mining standards and implementation of four decision tree algorithms including CHAID, C5.0, C&R, QUEST, and SVM. As the results showed, board independence had the greatest effect on earn-ings profit quality. Considering the accuracy value for the created SVM, which is equal to 98.5%, it indicates the high capability of this method to predict earnings quality.
_||_
مجله مدیریت توسعه و تحول 54 (1402) 152-141
مدلسازی پیشبینی کیفیت سود با استفاده از درخت تصمیم و ماشینبردار پشتیبان
لقمان حاتمی شیرکوهی1، صغری براری نوکاشتی2،*، مریم اوشک سرایی۳
۱دانشجوی دکتری، گروه حسابداری، واحد رشت، دانشگاه آزاد اسلامی، رشت، ایران.
۲استادیار، گروه حسابداری، واحد رشت، دانشگاه آزاد اسلامی، رشت، ایران(عهدهدار مکاتبات)
۳استادیار، گروه مدیریت صنعتی، واحد رشت، دانشگاه آزاد اسلامی، رشت، ایران.
تاریخ دریافت: شهریور 1402، اصلاحيه: مهر 1402، پذیرش: آبان 1402
چكيده
سود و کیفیت آن از مهمترین مولفههای تصمیمگیری برای استفادهکنندگان است. از اینرو پیشبینی کیفیت سود برای سرمایهگذاران و سایر گروهای ذینغع از اهمیت بسزایی برخوردار است، بدین منظور از روش درخت تصمیم و ماشینبردار پشتیبان برای پیشبینی کیفیت سود که هدف اصلی تحقیق میباشد استفاده شده است. جامعه آماری پژوهش شامل شرکتهای پذیرفته شده در بورس اوراق بهادار تهران از سال 1390 سال 1400 به مدت 10 سال میباشد، بعد از غربالگری تعداد 113 شرکت و 1130 مشاهده به عنوان نمونه آماری انتخاب شدند. در این مطالعه به منظور شناسایی و پیشبینی کیفیت سود شاخصهای مرتبط با حاکمیت شرکتی (استقلال هیئت مدیره، استقلال کمیته حسابرسی، مالکیت سازمانی)، سیاست تقسیم سود، تامین مالی بدهی و محافظه کاری به عنوان متغیر مستقل وکیفیت اقلام تعهدی اختیاری نماینده شاخص کیفیت سود به عنوان متغیر وابسته مورد بررسی قرار گرفته است. این پژوهش ازنظر هدف کاربردی و به لحاظ روش پژوهشی، توصیفی از نوع همبستگی. تجزیه تحلیل دادهها مطابق با استاندارد دادهکاوی CRISP-DM و اجرای چهار الگوریتم درخت تصمیم شامل (CHAID, C5.0 , C&R, QUEST) و ماشینبردار پشتیبان انجام شده است. نتایج پژوهش نشان میدهد که در هر دو روش درخت تصمیم و ماشینبردار پشتیبان، استقلال هیئت مدیره بیشترین تاثیر را در پیشبینی کیفیت سود دارد. مقایسه نتایج عملکرد دو روش نشان میدهد که، تکنیک ماشینبردار پشتیبان به جهت دارا بودن صحت و حساسیت بیشتر و خطای کمتر نسبت به تکنیک درخت تصمیم عملکرد بهتری دارد.
واژههای اصلی: کیفیت سود، درخت تصمیم، ماشینبردار پشتیبان، اقلام تعهدی، محافظهکاری.
1- مقدمه
گزارشگری مالی اطلاعات حسابداری مفیدی را در اختیار بازار سرمایه برای تصمیمگیری تجاری قرار میدهد]27[، گزارشهای مالی بطور گسترده توسط مدیران، سرمایهگذاران، تحلیلگران، تنظیم کنندهها و استانداردگذاران مالی بطورگسترده مورد استفاده قرارمیگیرد. شکل سود در صورت مالی اطلاعات حسابداری را خلاصه میکند، در حالی که کیفیت سود برای تصمیمگیری اقتصادی استفاده میشود]21[. سود با کیفیت بالا با ارایه یک معیار دقیق از عملیات یک شرکت مشخص میشود. در وافع چنین سودی (سود با کیفیت) پایدار است؛ درآمدهای آتی را بطور قابل اعتماد پیشبینی میکند، مدیریت نشده است و اطلاعات ارزشمندی را در اختیار کاربران قرار میدهد]25[.
کیفیت سود معیاری مهم برای سلامت مالی واحد تجاری به شمار میرود و مفهومی چند بعدی است و معنای واحدی ندارد. ارزش سهام یك شرکت، تنها به سود هر سهم سال جاری آن بستگی ندارد، بلکه به انتظارات ما از آیندة شرکت و توان سود آوری آتی بستگی دارد. کیفیت سود جنبة بسیار مهمی از سود حسابداری را نشان میدهد، زیرا آگاهی سهامداران از کیفیت سود میتواند بر قیمت سهام، میزان سود تقسیمی و در نتیجه بازده سهام، تأثیرگذار باشد. به عنوان مثال در مورد تاثیرات کیفیت سود بر بازده سهام تحقیقات مختلفی انجام شده است. دومینگوس]13[ نشان دادند افزایش نوسانات خاص با بدتر شدن کیفیت سود مرتبط است؛ اما تحقیقات موگوتو و موزینداتسی1]25[ نشان داد معیارهای مختلفی برای کیفیت سود وجود دارد و هریک از معیارهای کیفیت سود منحصر به فرد است و جنبه خاصی از سود گزارش شده یک شرکت را نشان میدهد؛ بنابراین هریک از معیارهای کیفیت سود میتواند به طور متفاوتی بر نوسانات بازده بازده سهام تاثیر بگذارد و مطابق با این نگرش میتوان گفت که کیفیت سود یک مفهوم چند بعدی است. معیارهای متعدی از جمله کیفیت اقلام تعهدی، محافظه کاری، به موقع بودن، ارتباط ارزشی، تداوم سود، قابلیت پیشبینی و یکنواختی سود برای اندازه گیری آن استفاده شده است]16[. اگرچه در مجموع هیچ دستورالعمل خاصی در مورد انتخاب معیارهای سود وجود ندارد، اما توصیه میشود از معیارهای مختلفی استفاده شود زیرا هر معیار کیفیت سود جنبه خاصی از سود گزارش شده یک شرکت را نشان میدهد]11،19[.
از آنجایی که واکنشهای متفاوت سرمایهگذاران نسبت به اطلاعات سود، موجب واکنشهای متفاوت بازار میگردد، لذا درک عوامل تأثیرگذار بر کیفیت سود حائز اهمیت به نظر می رسد. فعالان بازار همواره خواهان کیفیت بالای گزارشگری مالی میباشند. زیرا کیفیت بالای گزارشگری مالی باعث کاهش عدم تقارن اطلاعاتی و همچنین افزایش شفافیت و بهبود قراردادها میگردد. کیفیت بالای صورتهای مالی به وسیلة کیفیت سود تخمین زده میشود. چون سود پایه و اساس تصمیمات سرمایهگذاران است]26[. البته همین سود حسابداری به دلایل متنوعی ممکن است کیفیت لازم را نداشته باشد و به جای اینکه به استفادهکنندگان از صورتهای مالی کمک کند زمینه گمراهی آنها را فراهم کند. هدف اصلی این تحقیق بررسی عوامل موثر بر کیفیت سود و کمک به تصمیمگیرندگان از جمله سرمایهگذاران در شناسایی این موضوع که آیا سود گزارش شده از طرف مدیریت در صورتهای مالی از کیفیت لازم برخوردار هست یا خیر؟ هدف دیگر تحقیق بیان این موضوع است که تمامی تحقیقات قبلی انجام شده فقط ارتباط یک متغیر مستقل با متغیر کیفیت سود (متغیر وابسته) را مورد مطالعه قرار دادند ولی این تحقیق به طور همزمان تاثیر چندین متغیر موثر بر کیفیت سود را مورد مطالعه قرار میدهد تا نتایج آن مورد استفاده تمامی تصمیمگیرندگان و استفادهکنندگان از صورتهای مالی قرار گیرد. هدف دیگر این پژوهش این است که با بررسی جامع دادههای حسابداری شرکتهای پذیرفته شده در بورس اوراق بهادار برای اولین بار در ایران با استفاده از رویکرد ماشینبردار پشتیبان و الگوریتمهای درخت تصمیم به شناسایی و پیش بینی کیفیت سود اقدام کند و با توجه به کاستیهای الگوهای طبقبندی شده و پیشبینی مرسوم در این پژوهش به منظور شناسایی و پیشبینی کیفیت سود از ماشین بردار پشتیبان و چهار الگوریتم درخت تصمیم استفاده نماید.
2- مبانی نظری و ادبیات پژوهش
در حال حاضر تعریف کیفیت سود و نحوه اندازهگیری آن چالش بزرگی در دنیای تئوری حسابداری و تحقیقات تجربی حسابداری محسوب میشود. در بعد تئوریک، عدهای کیفیت سود را حاصل بیان صادقانه سود معرفی نموده و عدهای نیز نزدیکی سود حسابداری به مفهوم سود اقتصادی را ضابطه کیفیت سود قلمداد میکنند. ضمنا در تئوری حسابداری مفاهیم ساختاری، تفسیری و رفتاری (عملگرایانه) سود تبیین شده که هر کدام معنای خاص خود را دارد که در صورتی که بتوان این مفاهیم را به تعاریف کیفیت سود مرتبط نمود، شاید قدری ابهام را برطرف نموده و زمینه ساز فراهم شدن اجماع درباره ماهیت کیفیت سود گردد]9[. تعاریف متعددی برای کیفیت سود مطرح شده است. دیچو و دیچف2]10[ سود را بر اساس ارتباط اقلام تعهدی با جریانات نقدی عملیاتی دوره گذشته، حال و آینده تعریف میکنند. در این صورت، کیفیت سود ناشی ازکیفیت اقلام تعهدی خواهد بود. آنها کیفیت سود را برای شرکتهایی که واریانس مجموع خطاهای آنها با هم برابر است را یکسان میدانند. بال و شیوا کومار3]4[ مفهوم کیفیت را سودمندی صورتهای مالی برای سرمایهگذاران، اعتباردهندگان، مدیران و تمامی بخشهای مرتبط با شرکت تعریف میکنند.
عوامل متعددی بر کیفیت سود تاثیر دارند در این پژوهش ویژگیهای حاکمیت شرکتی (استقلال هیت مدیره، استقلال کمیته حسابرسی، مالکیت سازمانی)، محافظهکاری، سیاست تقسیم سود و تامین مالی از طریق بدهی مورد بررسی قرار گرفتهاند. تئوری نمایندگی رابطه بین مالکان و مدیران شرکت را توصیف میکند و در این حالت ممکن است مدیران در جهت افزایش منافع مالکان عمل نکنند و یک نوع تضاد منافع بین آنها ایجاد شود. تئوری نمایندگی یعنی تضاد بالقوهای بین منافع نماینده و کارفرما وجود دارد، که ممکن است منجربه بروز یک درگیری بالقوه شود که بر کیفیت سود گزارش شده تأثیر بگذارد. مدیریت با سود بهره خاص تمایل به تهیه گزارش متناسب با هدف و نه در جهت منافع اصلی دارد. در چنین شرایط، یک سازوکار کنترلی برای همسویی منافع دو طرف لازم است]7[. حاکمیت شرکتی مفهومی است که برای بهبود عملکرد مدیریت از طریق نظارت به منظور اطمینان از پاسخگویی به سهامداران طراحی شده است. حاکمیت شرکتی علاوه بر اینکه میتواند تضاد نمایندگی را کاهش دهد، توانایی ایجاد ارزش افزوده برای سهامداران به صورت حمایت موثرتر، به ویژه برای سرمایهگذاران برای بازیابی سرمایههای خود به روشی طبیعی و با ارزش بالا را دارد]28[. مکانیزمهای حاکمیت شرکتی می تواند فرصتهای مدیریت سود را کاهش و در نتیجه کیفیت سود را افزایش دهد. محافظهکاری یکی از عوامل مهم بر کیفیت سود است. حسابداران بطور سنتی محافظهکاری را از طریق قاعده"هیچ سودی را پیشبینی نکن اما همه زیانها را پیشبینی کم بیان نموده اند"]6[. باسو این قاعده را به معنی تمایل حسابداران به الزام درجه بالاتری از تاییدپذیری در شناسایی اخبار خوب و سودها نسبت به اخبار بد و زیانها تفسیر مینماید. گیولی و هاین4]18[ محافظه کاری از طریق اقلام تعهدی اختیاری (غیر عملیاتی) اندازهگیری می کنند، زیرا به نظر آنها حسابداری تعهدی محلی برای اجرای محافظهکاری است. براساس مفهوم محافظهکاری واحدهای تجاری در شرایط مختلف روشهای را انتخاب میکنند که حداکث اثر فزاینده بر سود و جمع داراییها داشته باشد و این نحوه عمل میتواند تاثیر زیادی بر محتوای اطلاعاتی تهیه شده توسط سیستم داشته باشد و هر چقدر میزان محافظهکاری بیشتر باشد کیفیت سود بالاتر است. تحقیقات مختلف نشان میدهد که بین کیفیت اقلام تعهدی در شرکت و سیاست تقسیم سود ارتباط وجود دارد. کیفیت اقلام تعهدی به عنوان شاخصی ازکیفیت گزارشهای مالی رابطه مستقیمی با سیاست تقسیم سود شرکت دارد. شرکتهایی که میزان سود خود را در گزارشهای مالی اظهار میکنند، سیاستهایی متناظر با سود اعلام شده، در تقسیم سود شرکت لحاظ میکنند]23[. فاما و فرنج5]15[ نشان دادند نسبت شرکتهای آمریکایی که بطور مستمر سود تقسیمی پرداخت میکنند در سال 1999 نسبت به سال 1978 روند نزولی داشته است. شواهد حاکی از این است که سود تقسیمی فراهم کننده اطلاعاتی درباره کیفیت سود گزارش شده است]31[. تامین مالی از طریق بدهی بر کیفیت سود تاثیر دارد و در این مورد سه دیدگاه مطرح است. دیدگاه اول تامین مالی از طریق بدهی تاثیر مثبت بر کیفیت سو دارد. در این دیدگاه اعتباردهندگان نسبت به کیفیت اطلاعات حسابداری وامگیرندگان واکنش نشان میدهند. بدین معنی هرچه کیفیت اطلاعات حسابداری وامگیرندگان بیشتر باشد شرایط محدود کننده کمتر و نرخ بهره پایینتری را در قراردادهای وام آنها در نظر میگیرند و بالعکس. در نتیجه اعتبارگیرندگان سعی میکنند با گزارش اطلاعات با کیفیت بالا، هزینه بهره و سایر شروط محدود کننده را کاهش دهند]2[. دیدگاه دوم تامین مالی از طریق بدهی بر کیفیت سود اثر منفی دارد، بدین معنی که مدیران شرکتها ممکن است برای جلب نظر مثبت اعتباردهندگان، سود را دستکاری کرده تا بتوانند تصویر مطلوبی از توان سودآوری شرکت را به نمایش گذاشته تا سرمایه مورد نیاز را جذب نمایند]12[. در نتیجه میتوان گفت که بدهی اثر منفی بر کیفیت سود دارد. دیدگاه سوم رابطه بین نامین مالی بدهی و کیفیت سود یک رابطه مستقیم یا معکوس نیست بلکه نوعی رابطه سهمی گون است که در نهایت بوسیله کنش و واکنش بین اثرهای مثبت و منفی تامین مالی از طریق بدهی برکیفیت سود تعیین میشود]17[.
3- پیشینه تجربی پژوهش
موگوتو و موزینداتسی]25[ در پژوهشی با عنوان معیارهای کیفیت سود و نوسانات بازده سهام در آفریقای نشان دادند که کیفیت اقلام تعهدی و تداوم سود رابطه منفی با نوسانات خاص دارند. علاوه بر این مشخص شد که یکنواختی سود بطور مثبت بر نوسانات خاص تاثیر میگذارد و شرکتهایی با سود کمتر یکنواخت، نوسانات بازده سهام بیشتری دارند.
وانگ و توماس6]30[ به بررسی ارتباط بین مسئولیت اجتماعی شرکت و کیفیت سود در میان شرکت های استخراجی موزامبیك طی سالهای 2017-2010 پرداختهاند. نتایج حاصل از آزمون فرضیههای پژوهش با استفاده از مدل رگرسیون داده های تابلویی نشان داد که بین مسئولیت اجتماعی شرکت و کیفیت سود رابطة منفی و معناداری وجود دارد. این یافتهها با این ایده سازگار هستند که مدیران فرصت طلب از مسئولیت اجتماعی برای رسیدن به منافع خاص خود استفاده می کنند. چن و کومال7]8[ در پژوهشی رابطة بین تخصص مالی کمیتة حسابرسی و کیفیت سود شرکتها را با استفاده از تکنیك فراتحلیل نتایج 90 مطالعة صورت گرفته در سالهای 2016-2003 مورد بررسی قرار دادهاند. نتایج این پژوهش شان داد که تخصص مالی کمیتة حسابرسی رابطة مثبت و معناداری با کیفیت سود دارد و متخصصان مالی حسابداری رابطة قویتری با کیفیت سود نسبت به متخصصان مالی غیر حسابداری دارند. از طرفی سیستمهای حاکمیت شرکتی و استانداردهای گزارشگری مالی بینالمللی رابطة بین تخصص مالی کمیتة حسابرسی و کیفیت سود را تعدیل میکنند.
ستین و مروانیگساری8]29[ تأثیر توانایی مدیریت در افزایش کیفیت سود با در نظر گرفتن اثر تعدیلی کمیتة حسابرسی در 12 شرکت تولیدی دولتی اندونزی در بین سالهای 2018-2016 را مورد بررسی قرار دادهاند. نتایج حاصل از برآورد مدل رگرسیون چند متغیرة پژوهش نشان داد که بین تواناییهای مدیریت و کیفیت سود رابطة مثبت و معناداری وجود دارد. همچنین کمیتة حسابرسی تأثیر توانایی مدیریتی را در قبال کیفیت سود تقویت میکند.
استبان و گارسیا9]26[ در پژوهش خود به بررسی تأثیر ویژگیهای شرکت بر کیفیت سود پرداختند. جامعة آماری این پژوهش هتلهای کشور اسپانیا بین سالهای 2000 تا 2011 میباشد. ایشان در پژوهش خود برای اندازهگیری کیفیت سود از یك اندازهگیری چند بعدی که شامل پایداری سود و قابلیت پیشبینی و هموارسازی سود میباشد استفاده کرده و متغیرهایی مانند متغیرهای بازار و استراتژیهای بازار و ساختار مالکیت و شاخصهای حسابرسی به عنوان ویژگیهای شرکت مورد استفاده قرار گرفت. نتایج تحقیق نشان داد که متغیرهای بازار و ساختار مالکیت و شاخصهای حسابرسی بر کیفیت سود تأثیرگذار بوده ولی سایر متغیرهای ویژگیهای شرکت تأثیری بر کیفیت سود ندارند.
ایورت و واگن هوفر10]14[ به بررسی روابط میان استانداردهای حسابداری، مدیریت سود و کیفیت سود پرداختند تنایج نشان میدهد که کیفیت سود با افزایش دقت حسابداری افزایش مییابد. با ملاحظه پژوهشهای بالا میتوان گفت که اکثر آنها اثر یک متغیر مستقل وابسته بر یک متغیر وابسته را مورد بررسی قرار دادهاند و از روشهای ساده رگرسیون و غیر هوشمند برای تجزیه تحلیل دادهها و آزمون فرضیهها استفاده نمودهاند. از آنجایی که همیشه بین متغیر مستقل و متغیر وابسته رابطه خطی وجود ندارد، از اینرو در چنین مواقعی باید از روشهای دیگری مانند درخت تصمیم و ماشین بردار پشتیبان که جز روشهای دادهکاوی هستند و از قدرت پیشبینی کنندگی بالایی برخوردار هستند و میزان صحت و قدرت دقت آن بیشتر از روشهای خطی هست استفاده نمود. علاوه بر استفاده از روشهای الگوریتم درخت تصمیم و ماشینبردار پشتیبان استفاده شده در این تحقیق برای پیشبینی کیفیت سود به طور همزمان اثر چندین متغیر بر کیفیت سود مورد بررسی قرار گرفته است تا در یک نگاه همه جانبه اطلاعات جامعی را در اختیار سرمایهگذاران و سایر گروههای ذینفع قرار دهد.
این پژوهش یک پژوهش توصیفی، و در حوزه پژوهشهای همبستگی است که مبتنی بر اطلاعات واقعی شرکتهای پذیرفته شده در بورس اوراق بهادار تهران است. دادههای لازم برای اجرای پژوهش از صورتهای مالی و گزارشات هیأت مدیره شرکتهای پذیرفته شده در بورس اوراق بهادار تهران در شرکتهای صنایع تولیدی از سال 1390 تا سال 1400 و همچنین از سایت کدال جمعآوری شده است. تجزیه و تحلیل دادهها با استفاده از نرم افزار اکسل و ایویوز انجام شده برای استخراج مدل از روش الگوریتم درخت تصمیم و ماشین بردار پشتیبان استفاده شده است.
4-1- فرضیه پژوهش
فرضیه اصلی پژوهش در این نحقیق در قالب سوال مطرح میشود به دلیل اینکه روشهای روشهای دادهکاوی مانند روشهای آماری از آمار استنباطی برای تحلیل فرضیهها استفاده نمیکنند و صرفا روشی هوشمند برای پیشبینی متغیر وابسته هستند، بنابراین فرضیه پژوهش را میتوان به بصورت زیر بیان کرد. "آیا استفاده از الگوریتمهای درخت تصمیم و ماشین بردار پشتیبان بر پیشبینی دقت کیفیت سود موثر است یا خیر"
4-2- جامعه و نمونه آماری پژوهش
جامعه آماری مورد بررسی در این پژوهش شامل شرکتهای پذیرفته شده در بورس اوراق بهادار تهران از سالهای 1390 سال 1400 به مدت 10 سال میباشد. به علت گستردگی حجم جامعه آماری و وجود برخی ناهماهنگیها میان اعضای جامعه، شرایط زیر برای انتخاب نمونه آماری قرار داده شده و نمونه آماری به روش غربالگری (حذف سیستماتیک) انتخاب شده است. شرکتهایی به عنوان نمونه انتخاب میشوند که دارای شرایط زیر باشند:
- سال مالی آنها منتهی به پایان اسفند باشد.
- جز شرکتهای سرمایهگذاری و واسطهگری مالی نباشد.
- طی دوره مورد پژوهش سال مالی خود را تغییر نداده باشد.
در نهایت با توجه به موارد اشاره شده در بالا، از مجموع شرکتهای پذیرفته شده در بورس اوراق بهادار تهران، دادههای مربوط به بازه زمانی 10 ساله از سال 1390 تا 1400 شامل 113 شرکت جمعا 1130 سال شرکت به عنوان نمونه در این پژوهش استفاده شده است.
[1] Muguto & Muzindutsi
*Brari@iaurasht.ac.ir
[2] Dechow & Dichev
[3] Ball & Shivakumar
[4] Givoly & Hayn
[5] Fama & French
[6] Siueia & Wang
[7] Chen & Komal
[8] SeTin & Murwaningsari
[9] Parte-Esteban & García
[10] Ewert & Wagenhofer
جدول (1): صنايع و شركتهاي مورد مطالعه
تعداد شرکت در نمونه | نوع صنعت | تعداد شرکت در نمونه | نوع صنعت |
10 | کانه فلزی | 18 | خودرو و قطعات |
2 | قند شکر | 20 | دارو |
3 | لاستیک پلاستیک | 8 | صنایع شیمایی |
7 | ماشین الات و تجهیزات | 7 | صنایع غذایی |
|
|
|
|
|
|
|
|
1 | محصولات فلزی | 3 | صنعت کاشی و سرامیک |
5 | دستگاههای برقی | 12 | صنعت سیمان |
2 | قند و شکر | 9 | فلزات اساسی |
1 | حمل نقل | 5 | کانه غیر فلزی |
113 | جمع كل |
4-3- نحوه محاسبه متغیرها
این پژوهش یک پژوهش توصیفی و در حوزه پژوهشهای همبستگی است که مبتنی بر اطلاعات واقعی شرکتهای پذیرفته شده در بورس اوراق بهادار تهران است. در این پژوهش متغیر وابسته کیفیت سود و متغیرهای مستقل عبارتند: تامین مالی بدهی، استقلال هیئت مدیره، استقلال کمیته حسابرسی، مالکیت سازمانی، تقسیم سود، محافظهکاری.
متغیر وابسته: جهت اندازهگیری کیفیت سود معیارهای مختلفی وجود
دارد. در این پژوهش برای اندازهگیری آن از مدل تعدیل شده جونز1]20[ استفاده شده است. در این پژوهش متغیر وابسته، کیفیت سود میباشد که از طریق کیفیت اقلام تعهدی اختیاری2 (DA) اندازهگیری شد. کیفیت اقلام تعهدی نیز از طریق رابطه زیر محاسبه گردید.
| اقلام تعهدی کل |
| اقلام تعهدی غیراختیاری |
| اقلام تعهدی اختیاری |
| تغییرات در |
| تغییرات حسابها و اسناد دریافتنی سال جاری به سال قبل |
| جمع کل داراییهای ابتدای دوره |
| پسماند مدل رگرسیونی |
| داراییهای ثابت (اموال، ماشین آلات و تجهیزات) |
| تغییرات بدهیهای جاری |
| تغییرات داراییهای جاری |
به طور کلی جهت پیشبینی کیفیت سود، میانه توزیع این متغیر در میان سال شرکتهای مختلف استخراج شد و با توجه به منطق زیربنایی آنها به شرکتهای بالا یا پایین میانه امتیاز (یک و صفر) داده شد. از آنجا که هرچه اقلام تعهدی اختیاری بیشتر باشد، کیفیت سود کمتر است، پس به شرکتهای بالای میانه عدد صفر و به شرکتهای زیر میانه عدد یک تعلق گرفت که در جدول 2 مشاهده میشوند.
جدول (2): چگونگی امتیازدهی و تعیین سطح کیفیت سود
سطوح کیفیت سود | کیفیت اقلام تعهدی | امتیاز |
با کیفیت | 1 | 1 |
کیفیت کمتر | 0 | 0 |
متغیرهای مستقل. در این پژوهش با توجه به تحقیقات قبلی متغیرهای مستقل انتخاب شدند که در جدول 3، علامت اختصاری و نحوه محاسبه هریک از آنها نشان داده شده است.
جدول (3): نحوه محاسبه متغیرهای مستقل پژوهش
علامت اختصاری | متغیر | نحوه محاسبه |
| سیاست تقسیم سود | میزان سود تقسیمی توسط شرکتها معیار اندازه گیری سیاست تقسیم سود است که از نسبت سود تقسیمی به سود خالص شرکت بدست میآید. |
| تامین مالی از طریق بدهی | از نسبت مجموع بدهیها (بدهیهای جاری و غیر جاری) به مجموع داراییها بدست میآید. |
| محافظه کاری | در این پژوهش با توجه به ارتباط بین کیفیت اقلام تعهدی و کیفیت سود محافظهکاری غیرشرطی مد نظر بوده و مطابق مدل گیولی و هاین (2000) از نسبت جمع کل اقلام تعهدی به جمع کل داراییهای شرکت بدست میآید. |
| استقلال هئیت مدیره | استقلال هیت مدیره برابر است با نسبت اعضای هیت مدیره غیر موظف یه کل اعضای هیت مدیره |
| استقلال کمیته حسابرسی | استقلال کمیته حسابرسی برابر است نسبت مدیران غیر اجرایی کمیته حسابرسی به کل مدیران
|
| مالکیت سازمانی | مالکیت سازمانی برابر است نسبت سهم نگه داری شده توسط مالکان نهادی به کل سهام |
4-4- روش درخت تصمیم
الگوریتمهاي درخت تصمیم یکی از رهیافتهاي ممکن براي تصمیمگیري چندمرحلهاي میباشند. ایده اصلی در تصمیمگیري چند مرحلهاي این است که تصمیمیات پیچیده به چند تصمیم ساده تقسیم شوند و در نهایت با ترکیب این تصمیمات ساده، به تصمیم مورد انتظار دست پیدا کنیم. درخت تصمیم زیرمجموعهاي از تصمیمگیريهاي سلسله مراتبی میباشد (پریجایی مقدم و موسوی، 2012). الگوریتمهاي زیادي در طول سالهاي گذشته براي ساخت درخت تصمیم ایجاد شدهاند، همانند: (1993) C4.5،(1984) C&RT ، SPRINT (1996)، (1996) SLIQ. یکی از آخرین مطالعاتی که درخت تصمیم و دیگر الگوریتمهاي یادگیري را مقایسه کرد، به وسیله Tjen-Sien و همکارانش در سال 2000 انجام شد. این مطالعه نشان داد که C. 4.5 یک ترکیب بسیار خوب از خطا و سرعت میباشد. در C4.5 فرض بر این است که کل دادههاي آموزشی در داخل حافظه باشند، بنابراین گرک و همکارانش، چارچوبی براي رشد سریع درخت تصمیم پیشنهاد کردند که به خوبی با اندازه حافظه در دسترس قابل انطباق میباشد]22[. درخت تصمیم و شبکه عصبی متدهاي ترتیبی براي دستهبندي نمونهها میباشند..
4-5- ماشین بردار پشتیبان
ماشین بردار پشتیبان تکنیک های یادگیری آماری است که ابتدا توسط کورتز و واپنیک در سال 1995معرفی شدند و در بسیاری از مسائل طبقه بندی بسیار موفق بودهاند. ماشین بردار پشتیبان بر اساس مفهوم تصمیمگیری است و مرزهای تصمیمگیری را تعریف میکند. یک سطح تصمیمگیری آن است که بین مجموعهای از کلاسهای مختلف جداشده است. این الگوریتمها یک سطح بالاتر را به عنوان یک سطح تصمیمگیری که نمونهها را به دو کلاس مثبت و منفی طبقهبندی میکند، در نظر میگیرند. این مدل در مقایسه با مدلهای دیگر دقت و کارایی بالاتری دارد. به منظور دستیابی به حداکثر دقت پیشبینی، این الگوریتم نیازمند دادههای با اندازه بزرگ برای آموزش است]5[.
4-6- روش اجرایی درخت تصمیم
در این پژوهش از روش درخت تصمیم3 بر اساس قوانین "اگر-آنگاه" با استفاده از مخزن دادههای تمام شرکتهای پذیرفته شده در بورس اوراق بهادار تهران که قابل دسترس است، ایجاد شد. مخزن داده پژوهش حاضر شامل 1130 رکورد و 7 ویژگی است، که مورد تجزیه و تحلیل قرار گرفتند. هدف از انجام این پژوهش پیشبینی کیفیت سود با استفاده از معیارهای استقلال هیئت مدیره، استقلال کمیته حسابرسی، مالکیت سازمانی، سیاست تقسیم سود، تامین مالی بدهی، و محافظه کاری است. لذا ویژگی کیفیت سود به عنوان برچسب داده ها تعیین شد و مساله از نوع مسائل با ناظر میباشد که برای حل آن باید از روشهای دستهبندی4 استفاده نمود. برای انجام دستهبندی از الگوریتم درخت تصمیم با استفاده از نرمافزار Rapid minerاستفاده شده است.
جدول (4): اطلاعات مختصر پایگاه داده پژوهش
ویژگی پایگاهداده | تعداد ویژگیها | تعداد رکوردها | روش دادهکاوی | دادههای گم شده |
چندمتغیره | 7 | 1130 | دستهبندی | ندارد |
بر اساس مطالب گفته شده، فرایند انجام درخت تصمیم به شرح زیر میباشد:
- تهیه اطلاعات در سطح کل بورس
- انجام محاسبات نسبتهای مالی و شاخصهای پیشبینی کننده کیفیت سود
- اجرای مدلهای درخت تصمیم
- ترکیب نتایج مدلهای الگوریتم درخت تصمیم با کمک تحلیل حساسیت
5- نتایج
5-1- آمادهسازی و پیش پردازش دادهها
این مرحله یکی از مهمترین و اثرگذارترین مراحل داده کاوی است و 80 درصد زمان فرایند دادهکاوی را به خود اختصاص میدهد. در این پژوهش از متدولوژی CRISP DMبه عنوان فرایند استاندادسازی دادهکاوی استفاده شد. این روش اولین بار در سال 1996 ارائه شد. این متدولوژی یک چرخه شش مرحلهای دارد و از گام های شناخت کسب وکار، شناخت دادهها، آمادهسازی دادهها، مدلسازی، ارزیابی مدل و استقرار تشکیل شده است. دادههای مورد استفاده در این پژوهش، دادههای شرکتهای پذیرفته شده در بورس اوراق بهادار تهران است.
پس از نرمال سازی دادهها در مرحله پیش پردازش دادهها، کل دادهها به دو بخش 70 درصد دادههای آموزشی برای ساخت مدل و 30 درصد دادههای آزمایشی برای اعتبارسنجی مدل تقسیم گردید. کلیه مراحل در نرمافزار Rapid miner انجام شده است. جدول 5 اطلاعات آماری پژوهش حاضر را نشان میدهد.
جدول (5): اطلاعات آماری پژوهش
نام | مقدار |
حداقل | 1- |
حداکثر | 1+ |
انحراف معیار | 0.125 |
میانگین | 0.051 |
در مرحله بعدی، با کمک درختهای (CHAID, C5.0 , C&RT , QUEST)، قدرت برازندگی شاخصهای مورد بررسی بر کیفیت سود تعیین شده و با استفاده از ماتریس انطباق، عملکرد هر یک از درختهای تصمیم مورد بررسی قرار گرفته است.
5-2- مدلهای درخت تصمیم با کمک تحلیل حساسیت
در نهایت نتایج چهار درخت تصمیم با استفاده از تحلیل حساسیت ترکیب میشود و مدل نهایی شکل میگیرد تا اعتباردهی هر یک از نسبت ها با دقت بیشتری انجام شود. تحلیل حساسیت تکنیکی مبتنی بر ترکیب اطلاعات است که با اجرای آن میتوان نتایج چهار درخت تصمیم را ترکیب کرد تا مدل توانمند و صحیحتری ارائه کرد. شش متغیر به عنوان متغیرهای ورودی الگوریتم تعریف شده است. برای تعریف متغیر خروجی از کیفیت سود استفاده شده است. برای پیشبینی کیفیت سود، چهار نوع درخت تصمیم به کار برده شد: CHAID,C&RT, C5.0 , QUEST. ابتدا 70% دادهها برای آموزش و 30% آن ها برای تست در نظر گرفته شدند. همان طور که در جدول 6 مشخص است شاخص استقلال هیئت مدیره در چهار الگوریتم CHAID و C5.0 و C&RT و QUEST بالاترین اهمیت را به خود اختصاص داده است. با توجه به تشریح معیارهای عملکرد درخت تصمیم، ابتدا با پیادهسازی ماتریس انطباق چهار درخت تصمیم (جدول 7) به ارزیابی عملکرد هر یک از مدل های درخت تصمیم در جدول 8 پرداخته شد.
[1] Jones
[2] Discretionary Accruals (DA)
[3] Decision tree
[4] Classification
جدول (6): میزان اهمیت هریک از متغیرهای مستقل
مدل | CHAID | C5.0 | C&RT | QUEST |
| 0.636 | 0.487 | 0.539 | 0.474 |
| 0.215 | 0.142 | 0.087 | 0.96 |
| 0.178 | 0.189 | 0.214 | 0.188 |
| 0.187 | 0.263 | 0.218 | 0.269 |
| 0.166 | 0.229 | 0.019 | 0.248 |
| 0.041 | 0.049 | 0.132 | 0.049 |
جدول (7): ماتریس اختلال (انطباق) مدلهای درخت تصمیم
نوع مدل |
| ناموفق (0) | موفق (1) |
|
| صحت کلی (%) | صحت هر گروه (%) |
CHAID | ناموفق (0) | 609 | 35 | صحیح | 1027 | 93.75 | 94.45 |
موفق (1) | 38 | 448 | غلط | 73 | 6.25 | 92.75 | |
جمع | 647 | 483 |
| 1130 |
|
| |
C&RT | ناموفق (0) | 636 | 23 | صحیح | 1096 | 97.09 | 98.39 |
موفق (1) | 11 | 460 | غلط | 34 | 2.91 | 95.24 | |
جمع | 647 | 483 |
| 1130 |
|
| |
C5.0 | ناموفق (0) | 610 | 25 | صحیح | 1068 | 94.69 | 94.60 |
موفق (1) | 37 | 458 | غلط | 62 | 5.31 | 94.82 | |
جمع | 647 | 483 |
| 1130 |
|
| |
QUEST | ناموفق (0) | 593 | 102 | صحیح | 974 | 86.64 | 92.12 |
موفق (1) | 54 | 381 | غلط | 156 | 13.36 | 78.88 | |
جمع | 647 | 483 |
| 1130 |
|
|
جدول (8): ارزیابی عملکرد مدلهای درخت تصمیم
نوع مدل | صحت کلی | دقت | حساسیت | ویژگی | نسبت مثبت کاذب | نسبت منفی کاذب | معیار f | منطقه زیر منحنی |
CHAID | 0.934 | 0.925 | 0.929 | 0.942 | 0.052 | 0.074 | 0.921 | 0.984 |
C&RT | 0.971 | 0.958 | 0.973 | 0.968 | 0.039 | 0.029 | 0.968 | 0.974 |
C5.0 | 0.948 | 0.949 | 0.927 | 0.969 | 0.038 | 0.078 | 0.933 | 0.973 |
QUEST | 0.863 | 0.784 | 0.872 | 0.861 | 0.136 | 0.126 | 0.838 | 0.939 |
درخت CHAID با صحت کلی 75/93 درصد و درخت QUEST با صحت کلی 64/86 درصد عملکرد خوبی را داشته اند. با توجه به جدول 5 می توان دید که صحت گروه ناموفق در سه درخت C&RT CHAID, و QUEST بالاتر از صحت گروه موفق بوده است ولی در درخت C5.0 با تفاوت کمی، صحت گروه موفق بالاتر از صحت گروه ناموفق بوده است.
نمایش نموداری معیارهای عملکرد با استفاده از نمودار کیفیت در شکل 1 به تصویر کشیده شده است. کیفیت به صورت نسبتی از کل موفقیتها است که در هر چارک اتفاق میافتد و به صورت (تعداد موفقیتها در چارک/کل تعداد موفقیتها) * 100% تعریف میشود. مدل C&RT عملکرد بسیار خوبی را در بسیاری از چارکها نشان میدهد. منحنیها از نقطه 0% شروع میشود و به به سمت 100% از چپ به راست حرکت میکنند.
تحلیل حساسیت مدلهاي درخت تصمیم :تحلیل حساسیت تکنیکی مبتنی بر ترکیب اطلاعات است که با اجرای آن میتوان نتایج چهار درخت تصمیم را ترکیب کرد تا مدل توانمند و صحیحتری ارائه کرد. همانطور که اشاره شد، درجدول 9 میزان اهمیت هر یک از شاخصها در مدلهای درخت تصمیم بیان شده است.
همانطور که در جدول ۹ مشخص شده است سه متغیر استقلال هیئت مدیره، تقسیم سود و استقلال کمیته حسابرسی به ترتیب با میزان 6/35% ، 4/20 % و2 /14% درصد مهمترین شاخصها در معادله مدل تحلیل حساسیت هستند. با توجه به اینکه الگوریتم C&RT کاراترین درخت تصمیم شناخته شده مجدد جهت افزایش اعتبار نتیجه، این الگوریتم با نرم افزار رپید مایندر نیز مورد بررسی قرار گرفت که در ادامه نتایج آن آورده شده است. در این قسمت ابتدا دادههای آموزشی در اختیار درخت تصمیم قرار داده شد تا دانش حاکم بر دادههای مدلسازی کند و در ادامه برای پیشبینی کلاس از دادههای آزمایشی استفاده شد. جدول 10 نمایانگر متغیرهای مورد استفاده در پژوهش حاضر میباشد. شکل 2 درخت تصمیم حاصل از دادههای پژوهش را نشان میدهد.
شکل (1): نمودار سود مبتنی بر الگوریتمهای درخت تصمیم
جدول (9): میزان اهمیت هریک از متغیرهای مستقل در تحلیل حساسیت
نسبت های مالی | تحلیل حساسیت |
0.356 | |
استقلال کمیته حسابرسی | 0.142 |
مالکیت سازمانی | 0.098 |
تقسیم سود | 0.204 |
تامین مالی از طریق بدهی | 0.102 |
محافظه کاری | 0.098 |
جدول (10): متغیرهای پژوهش در الگوریتم C&RT
علامت اختصاری | متغیر | وزن با همبستگی |
| استقلال هئیت مدیره | 0.356 |
| استقلال کمیته حسابرسی | 0.142 |
| مالکیت سازمانی | 0.098 |
| تقسیم سود | 0.204 |
| تامین مالی از طریق بدهی | 0.102 |
| محافظه کاری | 0.098 |
| کیفیت سود |
|
شکل (2): درخت تصمیم با الگوریتم C&RT
با توجه به درخت ایجاد شده معیاراستقلال هیئت مدیره (BOD) به عنوان ریشه درخت انتخاب شد که نشان دهنده بالابودن اهمیت و تاثیرگذار بودن آن است. اگر مقدار ترکیب هیئت مدیره بالاتر از 0.007 باشد پیشبینی به درستی صورت نمیگیرد.
الف) ماتریس در هم ریختگی
ماتریس در هم ریختگی به ماتریسی گفته میشود که در آن عملکرد الگوریتمهای مربوطه را نشان میدهد. این ماتریس دو قطر دارد؛ قطر اصلی نمایانگر دادههایی است که به درستی دستهبندی شدهاند و قطر فرعی نمایانگر دادههایی است که به اشتباه دستهبندی شدهاند. عناصر این ماتریس به شرح زیر است]3[:
TP تعداد نمونههای مثبت که به درستی مثبت طبقهبندی شدهاند.
FP تعداد نمونههای منفی که به اشتباه مثبت طبقهبندی شدهاند.
TN تعداد نمونههای منفی که به درستی منفی طبقهبندی شدهاند.
FN تعداد نمونه های مثبت که به اشتباه منفی طبقهبندی شدهاند.
حال با استفاده از اپراتورهای این الگوریتم دقت مدل اندازهگیری شد (جدول 11 و 12):
جدول (11): ماتریس درهم ریختگی مدل درخت تصمیم
دقت | درست: 1 | درست: 0 |
|
%97.09 | 636 | 23 | پیش بینی:0 |
%100 | 11 | 460 | پیش بینی:1 |
| %2.91 | %100 | حساسیت |
جدول (12): ارزیابی عملکرد مدل درخت تصمیم
معیار | مقدار(%) | انحراف معیار(%) |
صحت | 79 |
|
خطا | 21 | 2.8 |
AUC | 82.9 | 3.2 |
دقت | 100 | 0 |
حساسیت | 55.7 | 4 |
میانگین هارمونیک | 73.4 | 3.2 |
وضوح | 100 | 0 |
ب) ماتریس همبستگی
این ماتریس مشخص میکند در یک پژوهش دو ویژگی باهم ارتباط معنادار دارند یا خیر. میزان همبستگی عددی بین 1- و 1+ است. مقدار 1+ نشان دهنده رابطه مثبت و کامل بین دو ویژگی است و معیار 1- نشان دهنده ارتباط منفی و صفر نشان دهنده عدم ارتباط است]24[.
جدول (13): ماتریس همبستگی مدل درخت تصمیم
PS | EQ=1 | Dept | Coser |
|
|
| attributes |
0.041- | 0.026- | 0.023 | 0.016- | 0.028 | 0.036 | 1 |
|
0.036 | 0.026- | 0.0024- | 0.003- | 0.026 | 1 | 0.036 |
|
0.048 | 0.039 | 0.047 | 0.214 | 1 | 0.026 | 0.028 |
|
0.055- | 0.116- | 0.043- | 1 | 0.214 | 0.003- | 0.016- | Conser |
0.037 | 0.066 | 1 | 0.043- | 0.047 | 0.0024- | 0.023 | Dept |
0.045 | 1 | 0.466 | 0.116- | 0.039 | 0.026- | 0.026- | EQ=1 |
1 | 0.045 | 0.037 | 0.055- | 0.048 | 0.036 | 0.041- | PS |
ج) نمودارهای ROC و AUC
ROC یک ابزار مدلسازی قوی برای تصمیمگیریها در زمانی که ارزشهای آستانهای مدنظر است میباشد. این منحنی نمودار پراکندگی از حساسیت برای یک سیستم طیقهبندی کننده دوبه دویی است.
با استفاده از این نمودار میتوان سه معیار اساسی در بررسی صحت یک مدل شامل دقت، ویژگی و حساسیت را استخراج کرد. AUC سطح زیر نمودار ROC است که یک معیار استاندارد از میزان تشخیص مربوط به روش شناسایی است. این مقدار نشان دهنده کارایی مدل مورد استفاده است و هرچه این مقدار بیشتر باشد کارایی آن مدل بیشتر است.
5-3- روش اجرایی ماشین بردار پشتیبان
بر اساس توضیحات گفته شده، در این قسمت نتایج روش ماشین بردار پشتیبان آورده شده است. جدول 14 مدل Kernel تکنیک ماشین بردار پشتیبان را نشان میدهد.
در ادامه به بررسی معیارهای ارزیابی و اعتبارسنجی ماشین بردار پشتیبان طراحی شده پرداخته شد. نتیجه حاصل از اجرای عملگر performance classification در جدول 15 و 16 نمایش داده شده است. با توجه به مقدار صحت برای ماشین بردار پشتیبان ایجاد شده که برابر با 98.5 درصد می باشد عملکرد خوب مدل را نشان میدهد.
دقت در این مدل 100% ، میزان حساسیت 56.6% است. در ادامه به مقایسه نتایج دو روش مورد استفاده در پیش بینی کیفیت سود پرداخته شد.
جدول (14): نتایج تکنیک ماشین بردار پشتیبان
عنوان | مقدار | |
مجموع بردارهای پشتیبان | 109 | |
Bias (Offset) | 12.854- | |
درجه معیارها | استقلال هئیت مدیره | 241586.3- |
استقلال کمیته حسابرسی | 9654-32- | |
مالکیت سازمانی | 9141.141- | |
تقسیم سود | 36497.785- | |
تامین مالی از طریق بدهی | 225760.677- | |
محافظه کاری | 3079.977- | |
تعداد کلاس | 2 | |
تعداد بردار پشتیبان برای کلاس صفر | 53 | |
تعداد بردار پشتیبان برای کلاس یک | 56 |
با توجه به مقایسه نتایج عملکرد دو تکنیک (جدول 17)، تکنیک ماشین بردار پشتیبان به جهت دارا بودن صحت و حساسیت بیشتر و خطای کمتر نسبت به تکنیک درخت تصمیم عملکرد بهتری دارد. همچنین در هر دو روش متغیر استقلال هیئت مدیره (BOD) بالاترین وزن و اهمیت را نسبت به سایر متغیر ها دارد و با توجه منحنی ROC، مدل ماشین بردار پشتیبان از کارایی بالاتری نسبت به مدل درخت تصمیم برخوردار است. با توجه به اینکه سطح زیر منحنی مدل ماشین بردار پشتیبان از مدل درخت تصمیم بیشتر است (شکل 3) کارایی آن نیز بیشتر از مدل درخت تصمیم است.
جدول (15): ماتریس درهم ریختگی مدل ماشین بردار پشتیبان
درست: 1 | درست: 0 |
| |
%98.51 | 37 | 458 | پیش بینی:0 |
%100 | 647 | 483 | پیش بینی:1 |
| %1.49 | %100 | حساسیت |
جدول (16): ارزیابی عملکرد مدل ماشین بردار پشتیبان
معیار | مقدار(%) | انحراف معیار(%) |
صحت | 78.3 | 3.8 ± |
خطا | 21.2 | 3.8 ± |
AUC | 99.9 | 0.2 ± |
دقت | 100 | 0 ± |
حساسیت | 56.6 | 4.6 ± |
میانگین هارمونیک | 72.2 | 3.8 ± |
وضوح | 100 | 0 ± |
جدول (17): مقایسه نتایج دو روش درخت تصمیم و ماشین بردار پشتیبان
عنوان | دقت(%) | صحت(%) | حساسیت(%) | خطا(%) | انحراف معیار(%) | میانگین هارمونیک(%) |
درخت تصمیم | 100 | 78 | 55.7 | 22 | 3.2 | 71.2 |
ماشین بردار پشتیبان | 100 | 78.6 | 56.6 | 21.4 | 3.8 | 72.4 |
شکل (3): منحنی ROC دو روش درخت تصمیم و ماشین بردار پشتیبان
6- بحث
نتیجه تحقیق نشان میدهد که در هر دو روش الگوریتم درخت تصمیم و ماشین بردار پشتیبان استقلال هیت مدیره و سیاست تقسیم سود به ترتیب به ترتیب با 6/35%و 04/20% بیشترین تاثیر را جهت پیشبینی کیفیت سود نسبت به سایر متغیرها داشتهاند .و ماشین بردار پشتیبان با دقت 5/98% نسبت به روش درخت تصمیم عملکرد بهتری جهت پیشبینی کیفیت سود داشته و کارایی آن بالاتر است. نتیجه این تحقیق تایید کننده نتایج تحقیق حبیبزاده و همکاران در سال 97 میباشد که تاثیر شبکه عصبی و مقایسه آن با درخت تصمیم و ماشین یردار پشتیبان، بر سودآوری شرکتها را مورد مطالعه قرار دادند. نتایج تحقیق آنها نشان داد که درخت تصمیم با دقت 5/93درصد بیشترین در پیش بینی روند سودآوری شرکتهای پذیرفته شده در بورس اوراق بهادار تهران دارد.یافتههای این پزوهش بیان میکند که ماشین بردار پشتیبان نسبت به درخت تصمیم دقت، صحت بیشترو خطای کمتری در پیشبینی کیفیت سود دارد با نتایج پزوهش گنگ و همکاران (2015) و کیم و همکاران (2013) تطابق دارد. با توجه به نتیجه این تحقیق استفاده از روشهای داده کاوی جهت افزایش دقت پیشبینیهای مبتنی بر دادههای مالی برای افراد مشارکت کننده در بازار سرمایه سودمند است، تا ازتحمیل زیانهای عمده مرتبط با خطای دادههای مالی به سرمایهگذاران جلوگیری شود. باتوجه به یافتههای این تحقیق به
سرمایهگذاران بایستی هنگام تصمیمگیری درباره خرید یا فروش سهام خود به ویژگیهای حاکمیتت شرکتی و مالکیت شرکتها توجه کنند زیرا بر اساس نتایج این تحقیق ویژگیهای حاکمیت شرکتی بر کیفیت سود آنها تاثیر دارد و توصیه میشود در شرکتهایی سرمایهگذاری کنند که دارای حاکمیت شرکتی قویتر و ساختار مالکیت متمرکزتری هستند زیرا هر چه تمرکز مالکیت شرکت متمرکزتر باشد موجب بهبود عملکرد و سودآوری شرکت میشود.
از طرفی سهامداران بایستی از مزایای وجود مدیران غیرموظف و مستقل در هیئت مدیره و مالکیت سازمانی که از معیارهای حاکمیت شرکتی هستند، آگاه شوند. چون در صورتی که اکثریت اعضای هیت مدیره را مدیران غیرموظف تشکیل دهند هیت مدیره از کارایی بیشتری برخوردار خواهد بود.
7- نتیجهگیری
هدف این پژوهش، پیشبینی کیفیت سود با شاخصهای مرتبط با تامین مالی بدهی، استقلال هیئت مدیره، استقلال کمیته حسابرسی، مالکیت سازمانی، محافظه کاری و سیاست تقسیم سود میباشد. برای این منظور دادههای لازم جهت محاسبه متغیرهای مستقل از صورتهای مالی شرکتهای پذیرفته شده در بورس اوراق بهادار برای دوره زمانی 1390 تا 1400 به تعداد 113 شرکت و 1130 مشاهده استخراج شد. بعد از شناسایی عوامل موثر، پیشبینی کیفیت سود با استفاده از الگوریتمهای درخت تصمصم شامل شامل (CHAID, C5.0, C&RT, QUEST) و ماشین بردار پشتیبان انجام شد. نتایج الگوریتم درخت تصمیم و ماشین بردار پشتیبان نشان میدهد در هر دو مورد استقلال هیئت مدیره بیشترین تاثیر را درپیش بینی کیفیت سود دارد. مقایسه نتایج تکنیک درخت تصمیم و ماشین بردار نشان میدهد که ماشین بردار پشتیبان با دقت 5/98% ، حساسیت 6/56% و خطای 4/21% نسبت به روش درخت تصمیم عملکرد بهتری جهت پیشبینی کیفیت سود داشته و در هر دو روش استقلال هیئت مدیره بالاترین وزن و اهمیت نسبت به سایر متغیرهای مربوط به پیشبینی کیفیت سود دارد. باتوجه به اینکه پژوهش حاضر تأثیر تعدادی از متغیرها را برکیفیت سود بررسی کرده و به پیش بینی کیفیت سود به وسیله تکنیک درخت تصمیم و ماشین بردار پشتیبان پرداخته است، انجام پژوهش مشابه برای تک تک شرکتها بااستفاده از گزارشهای مالی میان دورهای و یا استفاده از مدلهای دیگر و ترکیب الگوریتمهای مختلف، انجام پژوهش درخصوص اثرات روانی پیشبینی و همچنین استفاده از سایر متغیرهای موثر بر کیفیت سود موضوعی است که میتواند در پژوهشهای آتی مد نظر قرار گیرد.
منابع و مأخذ
[1] پریجایی مقدم، احمد. موسوی، سجاد. (2012). یادگیري درخت تصمیم بااستفاده ازشبکه عصبی براي افزایش پایداري وانعطافپذیري،مجله ایرانی انفورماتیک پزشکی، ش 3.
[2] Armstrong, C.S., Guay, W. R., Weber, J.P. (2010). The Role of Information and Financial Reporting in Corporate Governance and Debt Contracting. Journal of accounting and economics, 50(2-3), 179-234.
[3] Azizi, Z., Abdolvand, N., Ghalibaf Asl, H., Rajaee Harandi, S. (2021). The Impact of Persian News on Stock Returns through Text Mining Techniques. Iranian Journal of Management Studies, 14(4), 799-816.
[4] Ball, R., Shivakumar, L. (2005). Earnings Quality in UK Private Firms: Comparative Loss Recognition Timeliness. Journal of Accounting and Economics, 39(1), 83-128.
[5] Bhatia, S., Bajaj, R., Hazari, S. (2016). Analysis of Credit Card Fraud Detection Techniques. International Journal of Science and Research, 5(3), 1302-1307.
[6] Bliss, J. (1924). Management Through Accounts. The Ronald Press Co., New York .
[7] Boediono, G.S.B. (2005). Kualitas Laba: Studi Pengaruh Mekanisme Corporate Governance dan Dampak Manajemen Laba dengan Menggunakan Analisis Jalur. Simposium Nasional Akuntansi 8. Solo.
[8] Chen, S., Komal, B. (2018). Audit Committee Financial Expertise and Earnings Quality: A Meta-Analysis. Journal of Business Research, 84, 253-270.
[9] Clyde, P.S. (2007). Financial Accounting an Introduction to Concepts, Methods, and Uses. Canada: South Cangage Learning.
[10] Dechow, P. M., Dichev, I. D. (2002). The Quality of Accruals and Earnings: The Role of Accrual Estimation Errors. The accounting review, 77(s-1), 35-59.
[11] Dechow, P., Ge, W., Schrand, C. (2010). Understanding Earnings Quality: A Review of the Proxies, their Determinants and their Consequences. Journal of accounting and economics, 50(2-3), 344-401.
[12] DeFond, M.L., Jiambalvo, J. (1994). Debt Covenant Violation and Manipulation of Accruals. Journal of accounting and economics, 17(1-2), 145-176.
[13] Domingues, A. (2016). Idiosyncratic Volatility and Earnings Quality: Evidence from United Kingdom. FEP Working Papers, 579: 3–42.
[14] Ewert, R., Wagenhofer, A. (2013). Accounting Standards, Earnings Management, and Earnings Quality. Earnings Management, and Earnings Quality (April 30, 2013). papers.ssrn.com.
[15] Fama, E.F., French, K.R. (2001). Disappearing Dividends: Changing firm Characteristics or Lower Propensity to Pay?. Journal of Financial economics, 60(1), 3-43.
[16] Francis, J., LaFond, R., Olsson, P.M., Schipper, K. (2004). Costs of Equity and Earnings Attributes. The accounting review, 79(4), 967-1010.
[17] Ghosh, A., Moon, D. (2010). Corporate Debt Financing and Earnings Quality. Journal of Business Finance & Accounting, 37(5‐6), 538-559.
[18] Givoly, D., Hayn, C. (2000). The Changing Time-Series Properties of Earnings, Cash Flows and Accruals: Has Financial Reporting Become More Conservative?. Journal of accounting and economics, 29(3), 287-320.
[19] Gutierez A.L., Rodriguez, M.C. (2020). Measuring Earnings Quality: a Proposal for a Theoretical Framework and an Empirical Method. https://aeca.es method. https://aeca.es/ wp-content/uploads/2014/05/10a.pdf. Accessed 5 June 2020.
[20] Jones, J. J. (1991). Earnings Management During Import Relief Investigations. Journal of accounting research, 29(2), 193-228.
[21] Khuong, N. V., Abdul Rahman, A. A., Thuan, P. Q., Liem, N. T., Anh, L. H. T., Thuy, C. T. M., & Ly, H. T. N. (2022). Earnings Management, Board Composition and Earnings Persistence in Emerging Market. Sustainability, 14(3), 1-15.
[22] Kotsiantis, S.B. (2013). Decision Trees: a Recent Overview. Artificial Intelligence Review, 39(4), 261-283.
[23] Lennox, C., Lisowsky, P., Pittman, J. (2013). Tax Aggressiveness and Accounting Fraud. Journal of accounting research, 51(4), 739-778.
[24] Mathew, R.J., Largen, J., Claghorn, J.L. (1979). Biological Symptoms of Depression. Psychosomatic Medicine, 41(6), 439-443.
[25] Muguto, L., Muzindutsi, P.F. (2022). A Comparative Analysis of the Nature of Stock Return Volatility in BRICS and G7 Markets. Journal of Risk and Financial Management, 15(2), 1-27.
[26] Parte-Esteban, L., García, C.F. (2014). The Influence of Firm Characteristics on Earnings Quality. International Journal of Hospitality Management, 42, 50-60.
[27] Perotti, P., Wagenhofer, A. (2014). Earnings Quality Measures and Excess Returns. Journal of business finance & accounting, 41(5-6), 545-571.
[28] Pratiwi, W., Pralita, T. (2021). The Influence of Corporate Governance Mechanism, Accounting Conservatism, And Company Size on Earnings Quality. Journal of Economics, Finance and Management Studies, 4(01), 26-34.
[29] SeTin, S., Murwaningsari, E. (2018). The Effect of Managerial Ability towards Earning Quality with Audit Committee as Moderating Variable. Journal of Business and Retail Management Research, 12(3), 178-189.
[30] Siueia, T.T., Wang, J. (2019). The Association between Corporate Social Responsibility and Earnings Quality: Evidence from Extractive Industry: La Asociación Entre Las Actividades de Responsabilidad Social Corporativa y la Calidad de Los ingresos: Evidencia de la Industria Extractiva. Revista de Contabilidad-Spanish Accounting Review, 22(1), 112-121.
[31] Skinner, D. J., Soltes, E. (2011). What Do Dividends Tell us about Earnings Quality?. Review of Accounting Studies, 16(1), 1-28.