مدل سازی پیش بینی کیفیت سود با استفاده از درخت تصمیم و ماشین بردار پشتیبان
محورهای موضوعی :لقمان حاتمی شیرکوهی 1 , صغری براری نوکاشتی 2 , مریم اوشک سرایی 3
1 - دانشجوی دکتری، گروه حسابداری، واحد رشت، دانشگاه آزاد اسلامی، رشت، ایران
2 - استادیار، گروه حسابداری، واحد رشت، دانشگاه آزاد اسلامی، رشت، ایران
3 - استادیار، گروه مدیریت صنعتی، واحد رشت، دانشگاه آزاد اسلامی، رشت، ایران
کلید واژه: اقلام تعهدی, کیفیت سود, محافظه کاری, ماشین بردار پشتیبان, درخت تصمیم,
چکیده مقاله :
سود و کیفیت آن از مهم ترین مولفه های تصمیم گیری برای استفاده کنندگان است. از اینرو پیش بینی کیفیت سود برای سرمایه گذاران و سایر گروهای ذینغع از اهمیت بسزایی برخوردار است، بدین منظور از روش درخت تصمیم و ماشین بردار پشتیبان برای پیش بینی کیفیت سود که هدف اصلی تحقیق می باشد استفاده شده است. جامعه آماری پژوهش شامل شرکتهای پذیرفته شده در بورس اوراق بهادار تهران از سال 1390سال 1400به مدت 10 سال می باشد، بعد از غربالگری تعداد 113 شرکت و 1130 مشاهده بعنوان نمونه آماری انتخاب شدند. در این مطالعه به منظور شناسایی و پیش بینی کیفیت سود شاخصهای مرتبط با حاکمیت شرکتی (استقلال هیئت مدیره، استقلال کمیته حسابرسی، مالکیت سازمانی)، سیاست تقسیم سود، تامین مالی بدهی و محافظه کاری بعنوان متغیر مستقل وکیفیت اقلام تعهدی اختیاری نماینده شاخص کیفیت سود بعنوان متغیر وابسته مورد بررسی قرار گرفته است. این پژوهش ازنظر هدف کاربردی و به لحاظ روش پژوهشی، توصیفی از نوع همبستگی. تجزیه تحلیل داده ها مطابق با استاندارد داده کاوی CRISP-DM و اجرای چهار الگوریتم درخت تصمیم شامل(CHAID, C5.0 , C&R, QUEST) و ماشین بردار پشتیبان انجام شده است . نتایج پژوهش نشان می دهد که در هر دو روش درخت تصمیم و ماشین بردار پشتیبان، استقلال هیئت مدیره بیشترین تاثیر را در پیش بینی کیفیت سود دارد. مقایسه نتایج عملکرد دو روش نشان می دهد که، تکنیک ماشین بردار پشتیبان به جهت دارا بودن صحت و حساسیت بیشتر و خطای کمتر نسبت به تکنیک درخت تصمیم عملکرد بهتری دارد.
Earnings and its quality are one of the most important decision-making com-ponents for users. Therefore, earnings quality prediction is very important for investors and other stakeholders. To this aim, decision tree and support vec-tor machine (SVM) were used to predict earnings quality. The statistical population of the study included companies listed in Tehran Stock Exchange from 2011 to 2021 for 10 years. After screening, 113 companies and 1130 observations were selected as statistical samples. In order to identify and predict earnings quality, indicators related to corporate governance (board independence, audit committee independence, organizational ownership), dividend policy, debt financing, and conservatism were considered as inde-pendent variables and discretionary accruals quality representing profit quali-ty index was considered as a dependent variable. Data analysis was done according to CRISP-DM data mining standards and implementation of four decision tree algorithms including CHAID, C5.0, C&R, QUEST, and SVM. As the results showed, board independence had the greatest effect on earn-ings profit quality. Considering the accuracy value for the created SVM, which is equal to 98.5%, it indicates the high capability of this method to predict earnings quality.
_||_
مجله مدیریت توسعه و تحول 54 (1402)
مدلسازی پیشبینی کیفیت سود با استفاده از درخت تصمیم و ماشین بردار پشتیبان
لقمان حاتمی شیرکوهی1، صغری براری نوکاشتی2،*، مریم اوشک سرایی۳
۱دانشجوی دکتری، گروه حسابداری، واحد رشت، دانشگاه آزاد اسلامی، رشت، ایران.
۲استادیار، گروه حسابداری، واحد رشت، دانشگاه آزاد اسلامی، رشت، ایران
۳استادیار، گروه مدیریت صنعتی، واحد رشت، دانشگاه آزاد اسلامی، رشت، ایران.
تاریخ دریافت: شهریور 1402، اصلاحيه: مهر 1402، پذیرش: آذر 1402
چكيده
سود و کیفیت آن از مهم ترین مولفه های تصمیم گیری برای استفاده کنندگان است. از اینرو پیش بینی کیفیت سود برای سرمایه گذاران و سایر گروهای ذینغع از اهمیت بسزایی برخوردار است، بدین منظور از روش درخت تصمیم و ماشین بردار پشتیبان برای پیش بینی کیفیت سود که هدف اصلی تحقیق می باشد استفاده شده است. جامعه آماری پژوهش شامل شرکتهای پذیرفته شده در بورس اوراق بهادار تهران از سال 1390 سال 1400 به مدت 10 سال می باشد، بعد از غربالگری تعداد 113 شرکت و 1130 مشاهده بعنوان نمونه آماری انتخاب شدند. در این مطالعه به منظور شناسایی و پیش بینی کیفیت سود شاخصهای مرتبط با حاکمیت شرکتی (استقلال هیئت مدیره، استقلال کمیته حسابرسی، مالکیت سازمانی)، سیاست تقسیم سود، تامین مالی بدهی و محافظه کاری بعنوان متغیر مستقل وکیفیت اقلام تعهدی اختیاری نماینده شاخص کیفیت سود بعنوان متغیر وابسته مورد بررسی قرار گرفته است. این پژوهش ازنظر هدف کاربردی و به لحاظ روش پژوهشی، توصیفی از نوع همبستگی. تجزیه تحلیل داده ها مطابق با استاندارد داده کاوی CRISP-DM و اجرای چهار الگوریتم درخت تصمیم شامل(CHAID, C5.0 , C&R, QUEST) و ماشین بردار پشتیبان انجام شده است . نتایج پژوهش نشان می دهد که در هر دو روش درخت تصمیم و ماشین بردار پشتیبان، استقلال هیئت مدیره بیشترین تاثیر را در پیش بینی کیفیت سود دارد. مقایسه نتایج عملکرد دو روش نشان می دهد که، تکنیک ماشین بردار پشتیبان به جهت دارا بودن صحت و حساسیت بیشتر و خطای کمتر نسبت به تکنیک درخت تصمیم عملکرد بهتری دارد.
واژههای اصلی: کیفیت سود، درخت تصمیم، ماشین بردار پشتیبان، اقلام تعهدی، محافظه کاری.
1- مقدمه
گزارشگری مالی اطلاعات حسابداری مفیدی را در اختیار بازار سرمایه برای تصمیمگیری تجاری قرار میدهد ]27[، گزارشهای مالی بطور گسترده توسط مدیران، سرمایهگذاران، تحلیلگران، تنظیم کنندهها و استانداردگذاران مالی بطورگسترده مورد استفاده قرارمی گیرد. شکل سود در صورت مالی اطلاعات حسابداری را خلاصه می کند، در حالیکه کیفیت سود برای تصمیمگیری اقتصادی استفاده می شود ]21[. سود با کیفیت بالا با ارایه یک معیار دقیق از عملیات یک شرکت مشخص می شود. در وافع چنین سودی (سود با کیفیت) پایدار است؛ درآمدهای آتی را بطور قابل اعتماد پیشبینی میکند، مدیریت نشده است و اطلاعات ارزشمندی را در اختیار کاربران قرار می دهد ]25[.
کیفیت سود معیاری مهم برای سلامت مالی واحد تجاری به شمار میرود و مفهومی چند بعدی است و معنای واحدی ندارد. ارزش سهام یك شرکت، تنها به سود هر سهم سال جاری آن بستگی ندارد، بلکه به انتظارات ما از آیندة شرکت و توان سود آوری آتی بستگی دارد. کیفیت سود جنبة بسیار مهمی از سود حسابداری را نشان میدهد، زیرا آگاهی سهامداران از کیفیت سود می تواند بر قیمت سهام، میزان سود تقسیمی و در نتیجه بازده سهام، تأثیرگذار باشد. بعنوان مثال در مورد تاثیرات کیفیت سود بر بازده سهام تحقیقات مختلفی انجام شده است. دومینگوس ]13[ نشان دادند افزایش نوسانات خاص با بدتر شدن کیفیت سود مرتبط است؛ اما تحقیقات موگوتو و موزینداتسی1 ]25[ نشان داد معیارهای مختلفی برای کیفیت سود وجود دارد و هریک از معیارهای کیفیت سود منحصر بفرد است و جنبه خاصی از سود گزارش شده یک شرکت را نشان می دهد؛ بنابراین هریک از معیار های کیفیت سود می تواند به طور متفاوتی بر نوسانات بازده بازده سهام تاثیر بگذارد و مطابق با این نگرش می توان گفت که کیفیت سود یک مفهوم چند بعدی است. معیارهای متعدی از جمله کیفیت اقلام تعهدی، محافظه کاری، به موقع بودن، ارتباط ارزشی، تداوم سود، قابلیت پیش بینی و یکنواختی سود برای اندازه گیری آن استفاده شده است ]16[. اگرچه در مجموع هیچ دستور العمل خاصی در مورد انتخاب معیارهای سود وجود ندارد، اما توصیه می شود از معیارهای مختلفی استفاده شود زیرا هر معیار کیفیت سود جنبه خاصی از سود گزارش شده یک شرکت را نشان می دهد ]11،19[.
از آنجایی که واکنش های متفاوت سرمایه گذاران نسبت به اطلاعات سود، موجب واکنش های متفاوت بازار می گردد، لذا درک عوامل تأثیرگذار بر کیفیت سود حائز اهمیت به نظر می رسد. فعالان بازار همواره خواهان کیفیت بالای گزارشگری مالی می باشند. زیرا کیفیت بالای گزارشگری مالی باعث کاهش عدم تقارن اطلاعاتی و همچنین افزایش شفافیت و بهبود قراردادها می گردد. کیفیت بالای صورت های مالی بوسیلة کیفیت سود تخمین زده می شود.چون سود پایه و اساس تصمیمات سرمایه گذاران است ]26[. البته همین سود حسابداری به دلایل متنوعی ممکن است کیفیت لازم را نداشته باشد و بجای اینکه به استفادهکنندگان از صورتهای مالی کمک کند زمینه گمراهی آنها را فراهم کند. هدف اصلی این تحقیق بررسی عوامل موثر بر کیفیت سود و کمک به تصمیم گیرندگان از جمله سرمایه گذاران در شناسایی این موضوع که آیا سود گزارش شده از طرف مدیریت در صورتهای مالی از کیفیت لازم برخوردار هست یا خیر؟ هدف دیگر تحقیق بیان این موضوع است که تمامی تحقیقات قبلی انجام شده فقط ارتباط یک متغیر مستقل با متغیر کیفیت سود (متغیر وابسته) را مورد مطالعه قرار دادند ولی این تحقیق به طور همزمان تاثیر چندین متغیر موثر بر کیفیت سود را مورد مطالعه قرار می دهد تا نتایج آن مورد استفاده تمامی تصمیم گیرندگان و استفاده کنندگان از صورتهای مالی قرار گیرد. هدف دیگر این پژوهش این است که با بررسی جامع داده های حسابداری شرکتهای پذیرفته شده در بورس اوراق بهادار برای اولین بار در ایران با استفاده از رویکرد ماشین بردار پشتیبان و الگوریتم های درخت تصمیم به شناسایی و پیش بینی کیفیت سود اقدام کند و با توجه به کاستیهای الگوهای طبق بندی شده و پیشبینی مرسوم در این پژوهش به منظور شناسایی و پیش بینی کیفیت سود از ماشین بردار پشتیبان و چهار الگوریتم درخت تصمیم استفاده نماید.
1-1-مبانی نظری و ادبیات پژوهش
در حال حاضر تعریف کیفیت سود و نحوه اندازه گیری آن چالش بزرگی در دنیای تئوری حسابداری و تحقیقات تجربی حسابداری محسوب میشود. در بعد تئوریک، عده ای کیفیت سود را حاصل بیان صادقانه سود معرفی نموده و عده ای نیز نزدیکی سود حسابداری به مفهوم سود اقتصادی را ضابطه کیفیت سود قلمداد میکنند. ضمنا در تئوری حسابداری مفاهیم ساختاری، تفسیری و رفتاری( عملگرایانه) سود تبیین شده که هر کدام معنای خاص خود را دارد که در صورتی که بتوان این مفاهیم را به تعاریف کیفیت سود مرتبط نمود، شاید قدری ابهام را برطرف نموده و زمینه ساز فراهم شدن اجماع درباره ماهیت کیفیت سود گردد ]9[. تعاریف متعددی برای کیفیت سود مطرح شده است. دیچو و دیچف2 ]10[ سود را بر اساس ارتباط اقلام تعهدی با جریانات نقدی عملیاتی دوره گذشته، حال و آینده تعریف می کنند. در این صورت، کیفیت سود ناشی ازکیفیت اقلام تعهدی خواهد بود. آنها کیفیت سود را برای شرکت هایی که واریانس مجموع خطا های آنها با هم برابر است را یکسان می دانند. بال و شیوا کومار3 ]4[ مفهوم کیفیت را سودمندی صورت های مالی برای سرمایه گذاران، اعتباردهندگان، مدیران و تمامی بخش های مرتبط با شرکت تعریف می کنند.
عوامل متعددی بر کیفیت سود تاثیر دارند در این پژوهش ویژگیهای حاکمیت شرکتی (استقلال هیت مدیره، استقلال کمیته حسابرسی، مالکیت سازمانی)، محافظه کاری، سیاست تقسیم سود و تامین مالی از طریق بدهی مورد بررسی قرار گرفته اند. تئوری نمایندگی رابطه بین مالکان و مدیران شرکت را توصیف می کند و در این حالت ممکن است مدیران در جهت افزایش منافع مالکان عمل نکنند و یک نوع تضاد منافع بین آنها ایجاد شود. تئوری نمایندگی یعنی تضاد بالقوهای بین منافع نماینده و کارفرما وجود دارد، که ممکن است منجربه بروز یک درگیری بالقوه شود که بر کیفیت سود گزارش شده تأثیر بگذارد. مدیریت با سود بهره خاص تمایل به تهیه گزارش متناسب با هدف و نه در جهت منافع اصلی دارد. در چنین شرایط، یک سازوکار کنترلی برای همسویی منافع دو طرف لازم است ]7[. حاکمیت شرکتی مفهومی است که برای بهبود عملکرد مدیریت از طریق نظارت به منظور اطمینان از پاسخگویی به سهامداران طراحی شده است. حاکمیت شرکتی علاوه بر اینکه می تواند تضاد نمایندگی را کاهش دهد، توانایی ایجاد ارزش افزوده برای سهامداران به صورت حمایت موثرتر، به ویژه برای سرمایه گذاران برای بازیابی سرمایه های خود به روشی طبیعی و با ارزش بالا را دارد ]28[. مکانیزمهای حاکمیت شرکتی می تواند فرصتهای مدیریت سود را کاهش ودر نتیجه کیفیت سود را افزایش دهد. محافظه کاری یکی از عوامل مهم بر کیفیت سود است. حسابداران بطور سنتی محافظه کاری را از طریق قاعده"هیچ سودی را پیش بینی نکن اما همه زیانها را پیش بینی کم بیان نموده اند"]6[. باسو این قاعده را به معنی تمایل حسابداران به الزام درجه بالاتری از تاییدذیری در شناسایی اخبار خوب و سودها نسبت به اخبار بد و زیانها تفسیر می نماید. گیولی و هاین4 ]18[ محافظه کاری از طریق اقلام تعهدی اختیاری (غیر عملیاتی) اندازه گیری می کنند، زیرا به نظر آنها حسابداری تعهدی محای برای اجرای محافظه کاری است. براساس مفهوم محافظه کاری واحدهای تجاری در شرایط مختلف روشهای را انتخاب می کنند که حداکث اثر فزاینده بر سود و جمع داراییها داشته باشد و این نحوه عمل می تواند تاثیر زیادی بر محتوای اطلاعاتی تهیه شده توسط سیستم داشته باشد و هر چقدر میزان محافظه کاری بیشتر باشد کیفیت سود بالاتر است. تحقیقات مختلف نشان میدهد که بین کیفیت اقلام تعهدی در شرکت و سیاست تقسیم سود ارتباط وجود دارد. کیفیت اقلام تعهدی بعنوان شاخصی ازکیفیت گزارشهای مالی رابطه مستقیمی با سیاست تقسیم سود شرکت دارد. شرکتهایی که میزان سود خود را در گزارشهای مالی اظهار می کنند، سیاست هایی متناظربا سود اعلام شده، در تقسیم سود شرکت لحاظ می کنند]23[. فاما و فرنج5 ]15[ نشان دادند نسبت شرکتهای آمریکایی که بطور مستمر سود تقسیمی پرداخت میکنند در سال 1999 نسبت به سال 1978 روند نزولی داشته است. شواهد حاکی از این است که سود تقسیمی فراهم کننده اطلاعاتی درباره کیفیت سود گزارش شده است ]31[. تامین مالی از طریق بدهی بر کیفیت سود تاثیر دارد و در این مورد سه دیدگاه مطرح است. دیدگاه اول تامین مالی از طریق بدهی تاثیر مثبت بر کیفیت سو دارد. در این دیدگاه اعتبار دهندگان نسبت به کیفیت اطلاعات حسابداری وام گیرندگان واکنش نشان می دهند. بدین معنی هرچه کیفیت اطلاعات حسابداری وام گیرندگان بیشتر باشد شرایط محدود کننده کمتر و نرخ بهره پایین تری را در قراردادهای وام آنها در نظر می گیرند و بالعکس. در نتیجه اعتبارگیرندگان سعی می کنند با گزارش اطلاعات با کیفیت بالا، هزینه بهره و سایر شروط محدود کننده را کاهش دهند ]2[. دیدگاه دوم تامین مالی از طریق بدهی بر کیفیت سود اثر منفی دارد، بدین معنی که مدیران شرکتها ممکن است برای جلب نظر مثبت اعتبار دهندگان، سود را دستکاری کرده تا بتوانند تصویر مطلوبی از توان سودآوری شرکت را به نمایش گذاشته تا سرمایه مورد نیاز را جذب نمایند ]12[. در نتیجه می توان گفت که بدهی اثر منفی بر کیفیت سود دارد. دیدگاه سوم رابطه بین نامین مالی بدهی و کیفیت سود یک رابطه مستقیم یا معکوس نیست بلکه نوعی رابطه سهمی گون است که در نهایت بوسیله کنش و واکنش بین اثرهای مثبت و منفی تامین مالی از طریق بدهی برکیفیت سود تعیین می شود ]17[.
2-2- پیشینه تجربی پژوهش
موگوتو و موزینداتسی ]25[ در پژوهشی با عنوان معیار های کیفیت سود و نوسانات بازده سهام در آفریقای نشان دادند که کیفیت اقلام تعهدی و تداوم سود رابطه منفی با نوسانات خاص دارند. علاوه بر این مشخص شد که یکنواختی سود بطور مثبت بر نوسانات خاص تاثیر می گذارد و شرکتهایی با سود کمتر یکنواخت ، نوسانات بازده سهام بیشتری دارند.
وانگ و توماس6 ]30[ به بررسی ارتباط بین مسئولیت اجتماعی شرکت و کیفیت سود در میان شرکت های استخراجی موزامبیك طی سال های2017-2010 پرداخته اند. نتایج حاصل از آزمون فرضیه های پژوهش با استفاده از مدل رگرسیون داده های تابلویی نشان داد که بین مسئولیت اجتماعی شرکت و کیفیت سود رابطة منفی و معناداری وجود دارد. این یافته ها با این ایده سازگار هستند که مدیران فرصت طلب از مسئولیت اجتماعی برای رسیدن به منافع خاص خود استفاده می کنند. چن و کومال7 ]8[ در پژوهشی رابطة بین تخصص مالی کمیتة حسابرسی و کیفیت سود شرکت ها را با استفاده از تکنیك فراتحلیل نتایج 90 مطالعة صورت گرفته در سال های 2016-2003 مورد بررسی قرار داده اند. نتایج این پژوهش شان داد که تخصص مالی کمیتة حسابرسی رابطة مثبت و معناداری با کیفیت سود دارد و متخصصان مالی حسابداری رابطة قویتری با کیفیت سود نسبت به متخصصان مالی غیر حسابداری دارند. از طرفی سیستم های حاکمیت شرکتی و استانداردهای گزارشگری مالی بین المللی رابطة بین تخصص مالی کمیتة حسابرسی و کیفیت سود را تعدیل می کنند.
ستین و مروانیگساری8 ]29[ تأثیر توانایی مدیریت در افزایش کیفیت سود با در نظر گرفتن اثر تعدیلی کمیتة حسابرسی در 12 شرکت تولیدی دولتی اندونزی در بین سال های 2018-2016 را مورد بررسی قرار داده اند. نتایج حاصل از برآورد مدل رگرسیون چند متغیرة پژوهش نشان داد که بین توانایی های مدیریت و کیفیت سود رابطة مثبت و معناداری وجود دارد. همچنین کمیتة حسابرسی تأثیر توانایی مدیریتی را در قبال کیفیت سود تقویت می کند.
استبان و گارسیا9 ]26[ در پژوهش خود به بررسی تأثیر ویژگی های شرکت بر کیفیت سود پرداختند. جامعة آماری این پژوهش هتل های کشور اسپانیا بین سال های 2000 تا 2011 می باشد. ایشان در پژوهش خود برای اندازه گیری کیفیت سود از یك اندازه گیری چند بعدی که شامل پایداری سود و قابلیت پیش بینی و هموارسازی سود می باشد استفاده کرده و متغیر هایی مانند متغیر های بازار و استراتژی های بازار و ساختار مالکیت و شاخص های حسابرسی به عنوان ویژگی های شرکت مورد استفاده قرار گرفت. نتایج تحقیق نشان داد که متغیر های بازار و ساختار مالکیت و شاخص های حسابرسی بر کیفیت سود تأثیر گذار بوده ولی سایر متغیر های ویژگیهای شرکت تأثیری بر کیفیت سود ندارند.
ایورت و واگن هوفر10 ]14[ به بررسی روابط میان استانداردهای حسابداری، مدیریت سود و کیفیت سود پرداختند تنایج نشان می دهد که کیفیت سود با افزایش دقت حسابداری افزایش می یابد.
با ملاحظه پژوهشهای بالا میتوان گفت که اکثر آنها اثر یک متغیر مستقل وابسته بر یک متغیر وابسته را مورد بررسی قرار دادهاند و از روشهای ساده رگرسیون و غیر هوشمند برای تجزیه تحلیل دادهها و آزمون فرضیهها استفاده نمودهاند. از آنجایی که همیشه بین متغیر مستقل و متغیروابسته رابطه خطی وجود ندارد، از اینرو در چنین مواقعی باید از روشهای دیگری مانند درخت تصمیم و ماشین بردار پشتیبان که جز روشهای داده کاوی هستند و از قدرت پیش بینی کنندگی بالایی برخوردار هستند و میزان صحت و قدرت دقت آن بیشتر از روشهای خطی هست استفاده نمود. علاوه بر استفاده از روشهای الگوریتم درخت تصمیم و ماشین بردار پشتیبان استفاده شده در این تحقیق برای پیش بینی کیفیت سود بطور همزمان اثر چندین متغیر بر کیفیت سود مورد بررسی قرار گرفته است تا در یک نگاه همه جانبه اطلاعات جامعی را در اختیار سرمایه گذاران و سایر گروههای ذینفع قرار دهد.
این پژوهش یک پژوهش توصیفی، و در حوزه پژوهشهای همبستگی است که مبتنی بر اطلاعات واقعی شرکتهای پذیرفته شده در بورس اوراق بهادار تهران است. دادههای لازم برای اجرای پژوهش از صورتهای مالی و گزارشات هیأت مدیره شرکتهای پذیرفته شده در بورس اوراق بهادار تهران در شرکتهای صنایع تولیدی از سال 1390 تا سال 1400 و همچنین از سایت کدال جمعآوری شده است. تجزیه و تحلیل دادهها با استفاده از نرم افزار اکسل و ایویوز انجام شده برای استخراج مدل از روش الگوریتم درخت تصمیم و ماشین بردار پشتیبان استفاده شده است.
2-1- فرضیه پژوهش
فرضیه اصلی پژوهش در این نحقیق در قالب سوال مطرح می شود به دلیل اینکه روشهای روشهای داده کاوی مانند روشهای آماری از آمار استنباطی برای تحلیل فرضیه ها استفاده نمی کنند و صرفا روشی هوشمند برای پیش بینی متغیروابسته هستند ، بنابراین فرضیه پژوهش را می توان به بصورت زیر بیان کرد. "آیا استفاده از الگوریتم های درخت تصمیم و ماشین بردار پشتیبان بر پیش بینی دقت کیفیت سود موثر است یا خیر"
2-2- جامعه و نمونه آماری پژوهش
جامعه آماری مورد بررسی در این پژوهش شامل شرکتهای پذیرفته شده در بورس اوراق بهادار تهران از سالهای 1390 سال 1400 به مدت 10 سال می باشد. بعلت گستردگی حجم جامعه آماری و وجود برخی ناهماهنگی ها میان اعضای جامعه، شرایط زیر برای انتخاب نمونه آماری قرار داده شده و نمونه آماری به روش غربالگری (حذف سیستماتیک) انتخاب شده است. شرکتهایی بعنوان نمونه انتخاب می شوند که دارای شرایط زیرباشند:
1- سال مالی آنها منتهی به پایان اسفند باشد.
2- جز شرکتهای سرمایه گذاری و واسطه گری مالی نباشد.
3- طی دوره مورد پژوهش سال مالی خود را تغییر نداده باشد.
در نهایت با توجه به موارد اشاره شده در بالا، از مجموع شرکتهای پذیرفته شده در بورس اوراق بهادار تهران، داده های مربوط به بازه زمانی 10 ساله از سال 1390 تا 1400 شامل 113 شرکت جمعا 1130 سال- شرکت بعنوان نمونه در این پژوهش استفاده شده است.
[1] Muguto & Muzindutsi
*Brari@iaurasht.ac.ir
[2] Dechow & Dichev
[3] Ball & Shivakumar
[4] Givoly & Hayn
[5] Fama & French
[6] Siueia & Wang
[7] Chen & Komal
[8] SeTin & Murwaningsari
[9] Parte-Esteban & García
[10] Ewert & Wagenhofer
جدول (1): صنايع و شركت هاي مورد مطالعه
تعداد شرکت در نمونه | نوع صنعت | تعداد شرکت در نمونه | نوع صنعت |
10 | کانه فلزی | 18 | خودرو و قطعات |
2 | قند شکر | 20 | دارو |
3 | لاستیک پلاستیک | 8 | صنایع شیمایی |
7 | ماشین الات و تجهیزات | 7 | صنایع غذایی |
|
|
|
|
|
|
|
|
1 | محصولات فلزی | 3 | صنعت کاشی و سرامیک |
5 | دستگاههای برقی | 12 | صنعت سیمان |
2 | قند و شکر | 9 | فلزات اساسی |
1 | حمل نقل | 5 | کانه غیر فلزی |
113 | جمع كل |
2-3- نحوه محاسبه متغیرها
این پژوهش یک پژوهش توصیفی و در حوزه پژوهشهای همبستگی است که مبتنی بر اطلاعات واقعی شرکتهای پذیرفته شده در بورس اوراق بهادار تهران است. در این پژوهش متغیر وابسته کیفیت سود و متغیرهای مستقل عبارتند: تامین مالی بدهی، استقلال هیئت مدیره، استقلال کمیته حسابرسی، مالکیت سازمانی، تقسیم سود، محافظهکاری.
متغیر وابسته: جهت اندازهگیری کیفیت سود معیارهای مختلفی وجود دارد. در این پژوهش برای اندازهگیری آن از مدل تعدیل شده جونز1 ]20[ استفاده شده است. در این پژوهش متغیر وابسته، کیفیت سود میباشد که از طریق کیفیت اقلام تعهدی اختیاری2 (DA) اندازهگیری شد. کیفیت اقلام تعهدی نیز از طریق رابطه زیر محاسبه گردید.
| اقلام تعهدی کل |
| اقلام تعهدی غیراختیاری |
| اقلام تعهدی اختیاری |
| تغییرات درامد سال جاری به سال قبل |
| تغییرات حسابها و اسناد دریافتنی سال جاری به سال قبل |
| جمع کل داراییهای ابتدای دوره |
| پسماند مدل رگرسیونی |
| داراییهای ثابت (اموال، ماشین آلات و تجهیزات) |
| تغییرات بدهیهای جاری |
| تغییرات داراییهای جاری |
به طور کلی جهت پیش بینی کیفیت سود، میانه توزیع این متغیر در میان سال شرکتهای مختلف استخراج شد و با توجه به منطق زیربنایی آنها به شرکت های بالا یا پایین میانه امتیاز (یک و صفر) داده شد. از آنجا که هرچه اقلام تعهدی اختیاری بیشتر باشد، کیفیت سود کمتر است، پس به شرکت های بالای میانه عدد صفر و به شرکت های زیر میانه عدد یک تعلق گرفت که در جدول 2 مشاهده میشوند.
جدول (2): چگونگی امتیازدهی و تعیین سطح کیفیت سود
سطوح کیفیت سود | کیفیت اقلام تعهدی | امتیاز |
با کیفیت | 1 | 1 |
کیفیت کمتر | 0 | 0 |
متغیرهای مستقل. در این پژوهش با توجه به تحقیقات قبلی متغیرهای مستقل انتخاب شدند که در جدول 3، علامت اختصاری و نحوه محاسبه هریک از آنها نشان داده شده است.
جدول (3): نحوه محاسبه متغیرهای مستقل پژوهش
علامت اختصاری | متغیر | نحوه محاسبه |
| سیاست تقسیم سود | میزان سود تقسیمی توسط شرکتها معیار اندازه گیری سیاست تقسیم سود است که از نسبت سود تقسیمی به سود خالص شرکت بدست میآید. |
| تامین مالی از طریق بدهی | از نسبت مجموع بدهیها (بدهیهای جاری و غیر جاری) به مجموع داراییها بدست میآید. |
| محافظه کاری | در این پژوهش با توجه به ارتباط بین کیفیت اقلام تعهدی و کیفیت سود محافظهکاری غیرشرطی مد نظر بوده و مطابق مدل گیولی و هاین (2000) از نسبت جمع کل اقلام تعهدی به جمع کل داراییهای شرکت بدست میآید. |
| استقلال هئیت مدیره | استقلال هیت مدیره برابر است با نسبت اعضای هیت مدیره غیر موظف یه کل اعضای هیت مدیره |
| استقلال کمیته حسابرسی | استقلال کمیته حسابرسی برابر است نسبت مدیران غیر اجرایی کمیته حسابرسی به کل مدیران
|
| مالکیت سازمانی | مالکیت سازمانی برابر است نسبت سهم نگه داری شده توسط مالکان نهادی به کل سهام |
2-4- روش درخت تصمیم
الگوریتم هاي درخت تصمیم یکی از رهیافت هاي ممکن براي تصمیم گیري چندمرحله اي می باشند. ایده اصلی در تصمیم گیري چند مرحله اي این است که تصمیمیات پیچیده به چند تصمیم ساده تقسیم شوند و در نهایت با ترکیب این تصمیمات ساده، به تصمیم مورد انتظار دست پیدا کنیم. درخت تصمیم زیرمجموعه اي از تصمیمگیريهاي سلسله مراتبی می باشد (پریجایی مقدم و موسوی، 2012). الگوریتم هاي زیادي در طول سالهاي گذشته براي ساخت درخت تصمیم ایجاد شده اند، همانند: (1993) C4.5،(1984) C&RT ، SPRINT (1996)، (1996) SLIQ. یکی از آخرین مطالعاتی که درخت تصمیم و دیگر الگوریتمهاي یادگیري را مقایسه کرد، به وسیله Tjen-Sien و همکارانش در سال 2000 انجام شد. این مطالعه نشان داد که C. 4.5 یک ترکیب بسیار خوب از خطا و سرعت می باشد. در C4.5 فرض بر این است که کل دادههاي آموزشی در داخل حافظه باشند، بنابراین گرک و همکارانش، چارچوبی براي رشد سریع درخت تصمیم پیشنهاد کردند که به خوبی با اندازه حافظه در دسترس قابل انطباق می باشد ]22[. درخت تصمیم و شبکه عصبی متدهاي ترتیبی براي دسته بندي نمونه ها میباشند..
2-5- ماشین بردار پشتیبان
ماشین بردار پشتیبان تکنیک های یادگیری آماری است که ابتدا توسط کورتز و واپنیک در سال 1995معرفی شدند و در بسیاری از مسائل طبقه بندی بسیار موفق بوده اند. ماشین بردار پشتیبان بر اساس مفهوم تصمیم گیری است و مرزهای تصمیم گیری را تعریف می کند. یک سطح تصمیم گیری آن است که بین مجموعه ای از کلاس های مختلف جداشده است. این الگوریتم ها یک سطح بالاتر را به عنوان یک سطح تصمیم گیری که نمونه ها را به دو کلاس مثبت و منفی طبقه بندی می کند، در نظر می گیرند. این مدل در مقایسه با مدل های دیگر دقت و کارایی بالاتری دارد. به منظور دستیابی به حداکثر دقت پیش بینی، این الگوریتم نیازمند داده های با اندازه بزرگ برای آموزش است ]5[.
2-6- روش اجرایی درخت تصمیم
در این پژوهش از روش درخت تصمیم3 بر اساس قوانین "اگر-آنگاه" با استفاده از مخزن داده های تمام شرکت های پذیرفته شده در بورس اوراق بهادار تهران که قابل دسترس است، ایجاد شد. مخزن داده پژوهش حاضر شامل 1130 رکورد و 7 ویژگی است، که مورد تجزیه و تحلیل قرار گرفتند. هدف از انجام این پژوهش پیش بینی کیفیت سود با استفاده از معیارهای استقلال هیئت مدیره، استقلال کمیته حسابرسی، مالکیت سازمانی، سیاست تقسیم سود، تامین مالی بدهی، و محافظه کاری است. لذا ویژگی کیفیت سود به عنوان برچسب داده ها تعیین شد و مساله از نوع مسائل با ناظر می باشد که برای حل آن باید از روش های دسته بندی4 استفاده نمود. برای انجام دسته بندی از الگوریتم درخت تصمیم با استفاده از نرم افزار Rapid minerاستفاده شده است.
جدول (4): اطلاعات مختصر پایگاه داده پژوهش
ویژگی پایگاه داده | تعداد ویژگی ها | تعداد رکوردها | روش داده کاوی | داده های گم شده |
چندمتغیره | 7 | 1130 | دسته بندی | ندارد |
بر اساس مطالب گفته شده، فرایند انجام درخت تصمیم به شرح زیر میباشد:
1) تهیه اطلاعات در سطح کل بورس
2) انجام محاسبات نسبتهای مالی و شاخصهای پیش بینی کننده کیفیت سود
3) اجرای مدل های درخت تصمیم
4) ترکیب نتایج مدل های الگوریتم درخت تصمیم با کمک تحلیل حساسیت
3- نتایج
3-1- آماده سازی و پیش پردازش دادهها
این مرحله یکی از مهم ترین و اثرگذارترین مراحل داده کاوی است و 80 درصد زمان فرایند داده کاوی را به خود اختصاص می دهد. در این پژوهش از متدولوژی CRISP DMبه عنوان فرایند استاندادسازی داده کاوی استفاده شد. این روش اولین بار در سال 1996 ارائه شد. این متدولوژی یک چرخه شش مرحله ای دارد و از گام های شناخت کسب و کار، شناخت داده ها، آماده سازی داده ها، مدلسازی، ارزیابی مدل و استقرار تشکیل شده است . داده های مورد استفاده در این پژوهش، داده های شرکت های پذیرفته شده در بورس اوراق بهادار تهران است.
پس از نرمال سازی داده ها در مرحله پیش پردازش داده ها، کل داده ها به دو بخش 70 درصد داده های آموزشی برای ساخت مدل و 30 درصد داده های آزمایشی برای اعتبارسنجی مدل تقسیم گردید. کلیه مراحل در نرم افزار Rapid miner انجام شده است. جدول 5 اطلاعات آماری پژوهش حاضر را نشان میدهد.
جدول (5): اطلاعات آماری پژوهش
نام | مقدار |
حداقل | 1- |
حداکثر | 1+ |
انحراف معیار | 0.125 |
میانگین | 0.051 |
در مرحله بعدی، با کمک درخت های (CHAID, C5.0 , C&RT , QUEST)، قدرت برازندگی شاخصهای مورد بررسی بر کیفیت سود تعیین شده و با استفاده از ماتریس انطباق، عملکرد هر یک از درخت های تصمیم مورد بررسی قرار گرفته است.
3-2- مدلهای درخت تصمیم با کمک تحلیل حساسیت
در نهایت نتایج چهار درخت تصمیم با استفاده از تحلیل حساسیت ترکیب می شود و مدل نهایی شکل میگیرد تا اعتباردهی هر یک از نسبت ها با دقت بیشتری انجام شود. تحلیل حساسیت تکنیکی مبتنی بر ترکیب اطلاعات است که با اجرای آن می توان نتایج چهار درخت تصمیم را ترکیب کرد تا مدل توانمند و صحیح تری ارائه کرد.شش متغیر به عنوان متغیرهای ورودی الگوریتم تعریف شده است. برای تعریف متغیر خروجی از کیفیت سود استفاده شده است. برای پیش بینی کیفیت سود، چهار نوع درخت تصمیم به کار برده شد: CHAID,C&RT, C5.0 , QUEST. ابتدا 70% داده ها برای آموزش و 30% آن ها برای تست درنظرگرفته شدند. همان طور که در جدول 6 مشخص است شاخص استقلال هیئت مدیره در چهار الگوریتم CHAID و C5.0 و C&RT و QUEST بالاترین اهمیت را به خود اختصاص داده است. با توجه به تشریح معیار های عملکرد درخت تصمیم، ابتدا با پیاده سازی ماتریس انطباق چهار درخت تصمیم (جدول 7) به ارزیابی عملکرد هر یک از مدل های درخت تصمیم در جدول 8 پرداخته شد.
[1] Jones
[2] Discretionary Accruals (DA)
[3] Decision tree
[4] Classification
جدول (6): میزان اهمیت هریک از متغیرهای مستقل
مدل | CHAID | C5.0 | C&RT | QUEST |
| 0.636 | 0.487 | 0.539 | 0.474 |
| 0.215 | 0.142 | 0.087 | 0.96 |
| 0.178 | 0.189 | 0.214 | 0.188 |
| 0.187 | 0.263 | 0.218 | 0.269 |
| 0.166 | 0.229 | 0.019 | 0.248 |
| 0.041 | 0.049 | 0.132 | 0.049 |
جدول (7): ماتریس اختلال (انطباق) مدلهای درخت تصمیم
نوع مدل |
| ناموفق (0) | موفق (1) |
|
| صحت کلی (%) | صحت هر گروه (%) |
CHAID | ناموفق (0) | 609 | 35 | صحیح | 1027 | 93.75 | 94.45 |
موفق (1) | 38 | 448 | غلط | 73 | 6.25 | 92.75 | |
جمع | 647 | 483 |
| 1130 |
|
| |
C&RT | ناموفق (0) | 636 | 23 | صحیح | 1096 | 97.09 | 98.39 |
موفق (1) | 11 | 460 | غلط | 34 | 2.91 | 95.24 | |
جمع | 647 | 483 |
| 1130 |
|
| |
C5.0 | ناموفق (0) | 610 | 25 | صحیح | 1068 | 94.69 | 94.60 |
موفق (1) | 37 | 458 | غلط | 62 | 5.31 | 94.82 | |
جمع | 647 | 483 |
| 1130 |
|
| |
QUEST | ناموفق (0) | 593 | 102 | صحیح | 974 | 86.64 | 92.12 |
موفق (1) | 54 | 381 | غلط | 156 | 13.36 | 78.88 | |
جمع | 647 | 483 |
| 1130 |
|
|
جدول (8): ارزیابی عملکرد مدل های درخت تصمیم
نوع مدل | صحت کلی | دقت | حساسیت | ویژگی | نسبت مثبت کاذب | نسبت منفی کاذب | معیار f | منطقه زیر منحنی |
CHAID | 0.934 | 0.925 | 0.929 | 0.942 | 0.052 | 0.074 | 0.921 | 0.984 |
C&RT | 0.971 | 0.958 | 0.973 | 0.968 | 0.039 | 0.029 | 0.968 | 0.974 |
C5.0 | 0.948 | 0.949 | 0.927 | 0.969 | 0.038 | 0.078 | 0.933 | 0.973 |
QUEST | 0.863 | 0.784 | 0.872 | 0.861 | 0.136 | 0.126 | 0.838 | 0.939 |
همانطور که در جدول 5 مشخص است با توجه به تمام معیارهای ارزیابی مدل به جز معیار منطقه زیر منحنی، درخت C&RT بهترین سطح عملکرد را داشته است و با توجه به معیار منطقه زیر منحنی درخت CHAID عملکرد نسبتا بهتری داشته است. درخت C5.0 دومین سطح عملکرد را بر اساس تمام معیارها به خود اختصاص داده است. با این حال درخت CHAID با صحت کلی 75/93 درصد و درخت QUEST با صحت کلی 64/86 درصد عملکرد خوبی را داشته اند. با توجه به جدول 5 می توان دید که صحت گروه ناموفق در سه درخت C&RT CHAID, و QUEST بالاتر از صحت گروه موفق بوده است ولی در درخت C5.0 با تفاوت کمی، صحت گروه موفق بالاتر از صحت گروه ناموفق بوده است.
نمایش نموداری معیارهای عملکرد با استفاده از نمودار کیفیت در شکل 1 به تصویر کشیده شده است. کیفیت به صورت نسبتی از کل موفقیت ها است که در هر چارک اتفاق می افتد و به صورت (تعداد موفقیت ها در چارک/کل تعداد موفقیت ها) * 100% تعریف می شود. مدل C&RT عملکرد بسیار خوبی را در بسیاری از چارک ها نشان می دهد. منحنی ها از نقطه 0% شروع می شود و به به سمت 100% از چپ به راست حرکت می کنند.
تحلیل حساسیت مدل هاي درخت تصمیم :تحلیل حساسیت تکنیکی مبتنی بر ترکیب اطلاعات است که با اجرای آن می توان نتایج چهار درخت تصمیم را ترکیب کرد تا مدل توانمند و صحیح تری ارائه کرد. همانطور که اشاره شد، درجدول 9 میزان اهمیت هر یک از شاخصها در مدلهای درخت تصمیم بیان شده است.
همانطور که در جدول ۹ مشخص شده است سه متغیر استقلال هیئت مدیره، تقسیم سود و استقلال کمیته حسابرسی به ترتیب با میزان 6/35% ، 4/20 % و2 /14% درصد مهم ترین شاخصها در معادله مدل تحلیل حساسیت هستند.با توجه به اینکه الگوریتم C&RT کاراترین درخت تصمیم شناخته شده مجدد جهت افزایش اعتبار نتیجه، این الگوریتم با نرم افزار رپید مایندر نیز مورد بررسی قرار گرفت که در ادامه نتایج آن آورده شده است. در این قسمت ابتدا داده های آموزشی در اختیار درخت تصمیم قرار داده شد تا دانش حاکم بر داده های مدل را سازی کند و در ادامه برای پیش بینی کلاس از داده های آزمایشی استفاده شد. جدول 10 نمایانگر متغیرهای مورد استفاده در پژوهش حاضر می باشد. شکل 2 درخت تصمیم حاصل از داده های پژوهش را نشان می دهد.
شکل (1): نمودار سود مبتنی بر الگوریتمهای درخت تصمیم
جدول (9): میزان اهمیت هریک از متغیرهای مستقل در تحلیل حساسیت
نسبت های مالی | تحلیل حساسیت |
0.356 | |
استقلال کمیته حسابرسی | 0.142 |
مالکیت سازمانی | 0.098 |
تقسیم سود | 0.204 |
تامین مالی از طریق بدهی | 0.102 |
محافظه کاری | 0.098 |
جدول (10): متغیرهای پژوهش در الگوریتم C&RT
علامت اختصاری | متغیر | وزن با همبستگی |
| استقلال هئیت مدیره | 0.356 |
| استقلال کمیته حسابرسی | 0.142 |
| مالکیت سازمانی | 0.098 |
| تقسیم سود | 0.204 |
| تامین مالی از طریق بدهی | 0.102 |
| محافظه کاری | 0.098 |
| کیفیت سود |
|
شکل (2): درخت تصمیم با الگوریتم C&RT
با توجه به درخت ایجاد شده معیاراستقلال هیئت مدیره (BOD) به عنوان ریشه درخت انتخاب شد که نشان دهنده بالابودن اهمیت و تاثیرگذار بودن آن است. اگر مقدار ترکیب هیئت مدیره بالاتر از 0.007 باشد پیش بینی به درستی صورت نمی گیرد.
الف) ماتریس در هم ریختگی
ماتریس در هم ریختگی به ماتریسی گفته می شود که در آن عملکرد الگوریتم های مربوطه را نشان می دهد.این ماتریس دو قطر دارد؛ قطر اصلی نمایانگر داده هایی است که به درستی دسته بندی شده اند و قطر فرعی نمایانگر داده هایی است که به اشتباه دسته بندی شده اند. عناصر این ماتریس به شرح زیر است ]3[:
TP تعداد نمونه های مثبت که به درستی مثبت طبقه بندی شده اند.
FP تعداد نمونه های منفی که به اشتباه مثبت طبقه بندی شده اند.
TN تعداد نمونه های منفی که به درستی منفی طبقه بندی شده اند.
FN تعداد نمونه های مثبت که به اشتباه منفی طبقه بندی شده اند.
حال با استفاده از اپراتورهای این الگوریتم دقت مدل اندازه گیری شد (جدول 11 و 12):
جدول (11): ماتریس درهم ریختگی مدل درخت تصمیم
دقت | درست: 1 | درست: 0 |
|
%97.09 | 636 | 23 | پیش بینی:0 |
%100 | 11 | 460 | پیش بینی:1 |
| %2.91 | %100 | حساسیت |
جدول (12): ارزیابی عملکرد مدل درخت تصمیم
معیار | مقدار(%) | انحراف معیار(%) |
صحت | 79 | ±2.8 |
خطا | 21 | 2.8± |
AUC | 82.9 | 3.2± |
دقت | 100 | 0± |
حساسیت | 55.7 | 4± |
میانگین هارمونیک | 73.4 | 3.2± |
وضوح | 100 | 0± |
ب) ماتریس همبستگی
این ماتریس مشخص میکند در یک پژوهش دو ویژگی باهم ارتباط معنادار دارند یا خیر. میزان همبستگی عددی بین 1- و 1+ است. مقدار 1+ نشان دهنده رابطه مثبت و کامل بین دو ویژگی است و معیار 1- نشان دهنده ارتباط منفی و صفر نشان دهنده عدم ارتباط است ]24[.
جدول (13): ماتریس همبستگی مدل درخت تصمیم
PS | EQ=1 | Dept | Coser |
|
|
| attributes |
0.041- | 0.026- | 0.023 | 0.016- | 0.028 | 0.036 | 1 |
|
0.036 | 0.026- | 0.0024- | 0.003- | 0.026 | 1 | 0.036 |
|
0.048 | 0.039 | 0.047 | 0.214 | 1 | 0.026 | 0.028 |
|
0.055- | 0.116- | 0.043- | 1 | 0.214 | 0.003- | 0.016- | Conser |
0.037 | 0.066 | 1 | 0.043- | 0.047 | 0.0024- | 0.023 | Dept |
0.045 | 1 | 0.466 | 0.116- | 0.039 | 0.026- | 0.026- | EQ=1 |
1 | 0.045 | 0.037 | 0.055- | 0.048 | 0.036 | 0.041- | PS |
ج) نمودارهای ROC و AUC
ROC یک ابزار مدل سازی قوی برای تصمیم گیری ها در زمانی که ارزش های آستانه ای مد نظر است می باشد. این منحنی نمودار پراکندگی از حساسیت برای یک سیستم طیقه بندی کننده دوبه دویی
است. با استفاده از این نمودار می توان سه معیار اساسی در بررسی صحت یک مدل شامل دقت، ویژگی و حساسیت را استخراج کرد. AUC سطح زیر نمودار ROC است که یک معیار استاندارد از میزان تشخیص مربوط به روش شناسایی است. این مقدار نشان دهنده کارایی مدل مورد استفاده است و هرچه این مقدار بیشتر باشد کارایی آن مدل بیشتر است.
3-3- روش اجرایی ماشین بردار پشتیبان
بر اساس توضیحات گفته شده، در این قسمت نتایج روش ماشین بردار پشتیبان آورده شده است. جدول 14 مدل Kernel تکنیک ماشین بردار پشتیبان را نشان می دهد.
در ادامه به بررسی معیارهای ارزیابی و اعتبارسنجی ماشین بردار پشتیبان طراحی شده پرداخته شد. نتیجه حاصل از اجرای عملگر performance classification در جدول 15 و 16 نمایش داده شده است. با توجه به مقدار صحت برای ماشین بردار پشتیبان ایجاد شده که برابر با 98.5 درصد می باشد عملکرد خوب مدل را نشان می دهد.
دقت در این مدل 100% ، میزان حساسیت 56.6% است. در ادامه به مقایسه نتایج دو روش مورد استفاده در پیش بینی کیفیت سود پرداخته شد.
جدول (14): نتایج تکنیک ماشین بردار پشتیبان
عنوان | مقدار | |
مجموع بردارهای پشتیبان | 109 | |
Bias (Offset) | 12.854- | |
درجه معیارها | استقلال هئیت مدیره | 241586.3- |
استقلال کمیته حسابرسی | 9654-32- | |
مالکیت سازمانی | 9141.141- | |
تقسیم سود | 36497.785- | |
تامین مالی از طریق بدهی | 225760.677- | |
محافظه کاری | 3079.977- | |
تعداد کلاس | 2 | |
تعداد بردار پشتیبان برای کلاس صفر | 53 | |
تعداد بردار پشتیبان برای کلاس یک | 56 |
جدول (15): ماتریس درهم ریختگی مدل ماشین بردار پشتیبان
درست: 1 | درست: 0 |
| |
%98.51 | 37 | 458 | پیش بینی:0 |
%100 | 647 | 483 | پیش بینی:1 |
| %1.49 | %100 | حساسیت |
جدول (16): ارزیابی عملکرد مدل ماشین بردار پشتیبان
معیار | مقدار(%) | انحراف معیار(%) |
صحت | 78.3 | 3.8 ± |
خطا | 21.2 | 3.8 ± |
AUC | 99.9 | 0.2 ± |
دقت | 100 | 0 ± |
حساسیت | 56.6 | 4.6 ± |
میانگین هارمونیک | 72.2 | 3.8 ± |
وضوح | 100 | 0 ± |
جدول (17): مقایسه نتایج دو روش درخت تصمیم و ماشین بردار پشتیبان
عنوان | دقت(%) | صحت(%) | حساسیت(%) | خطا(%) | انحراف معیار(%) | میانگین هارمونیک(%) |
درخت تصمیم | 100 | 78 | 55.7 | 22 | 3.2 | 71.2 |
ماشین بردار پشتیبان | 100 | 78.6 | 56.6 | 21.4 | 3.8 | 72.4 |
شکل (3): منحنی ROC دو روش درخت تصمیم و ماشین بردار پشتیبان
4- بحث
نتیجه تحقیق نشان می دهد که در هر دو روش الگوریتم درخت تصمیم و ماشین بردار پشتیبان استقلال هیت مدیره و سیاست تقسیم سود به ترتیب به ترتیب با 6/35%و 04/20% بیشترین تاثیر را جهت پیش بینی کیفیت سود نسبت به سایر متغیرها داشته اند .و ماشین بردار پشتیبان با دقت 5/98% نسبت به روش درخت تصمیم عملکرد بهتری جهت پیش بینی کیفیت سود داشته و کارایی ان بالاتر است . نتیجه این تحقیق تایید کننده نتایج تحقیق حبیب زاده و همکاران در سال 97 می باشد که تاثیر شبکه عصبی و مقایسه آن با درخت تصمیم و ماشین یردار پشتیبان ، بر سود آوری شرکتها را مورد مطالعه قرار دادند. نتایج تحقیق آنها نشان داد که درخت تصمیم با دقت 5/93درصد بیشترین تاثیررا در پیش بینی روند سود اوری شرکتهای پذیرفته شده در بورس اوراق بهادار تهران دارد.یافته های این پزوهش بیان می کند که ماشین بردار پشتیبان نسبت به درخت تصمیم دقت ، صحت بیشترو خطای کمتری در پیش بینی کیفیت سود دارد با نتایج پزوهش گنگ وهمکاران (2015) و کیم و همکاران (2013) تطابق دارد . با توجه به نتیجه این تحقیق استفاده از روشهای داده کاوی جهت افزایش دقت پیش بینی های مبتنی برداده های مالی برای افراد مشارکت کننده دربازارسرمایه سودمنداست، تا ازتحمیل زیان های عمده مرتبط با خطای داده های مالی به سرمایه گذاران جلوگیری شود. باتوجه به یافته های این تحقیق به سرمایه گذاران بایستی هنگام تصمیم گیری درباره خرید یا فروش سهام خود به ویژگی های حاکمیتت شرکتی و مالکیت شرکت ها توجه کنند زیرا بر اساس نتایج این تحقیق ویژگی های حاکمیت شرکتی بر کیفیت سود انها تاثیر دارد و توصیه می شود در شرکت هایی سرمایه گذاری کنند که دارای حاکمیت شرکتی قوی تر و ساختار مالکیت متمرکزتری هستند زیرا هر چه تمرکز مالکیت شرکت متمرکز تر باشد موجب بهبود عملکرد و سود آوری شرکت می شود.
از طرفی سهامداران بایستی از مزایای وجود مدیران غیرموظف و مستقل در هیئت مدیره و مالکیت سازمانی که از معیارهای حاکمیت شرکتی هستند، آگاه شوند. چون در صورتی که اکثریت اعضای هیت مدیره را مدیران غیر موظف تشکیل دهند هیت مدیره از کارایی بیشتری برخوردار خواهد بود.
5- نتیجه گیری
هدف این پژوهش، پیشبینی کیفیت سود با شاخصهای مرتبط با تامین مالی بدهی، استقلال هیئت مدیره، استقلال کمیته حسابرسی، مالکیت سازمانی، محافظه کاری و سیاست تقسیم سود میباشد. برای این منظور دادههای لازم جهت محاسبه متغیرهای مستقل از صورتهای مالی شرکتهای پذیرفته شده در بورس اوراق بهادار برای دوره زمانی 1390 تا 1400 به تعداد 113 شرکت و 1130 مشاهده استخراج شد. بعد از شناسایی عوامل موثر، پیش بینی کیفیت سود با استفاده از الگوریتم های درخت تصمصم شامل شامل (CHAID, C5.0, C&RT, QUEST) و ماشین بردار پشتیبان انجام شد. نتایج الگوریتم درخت تصمیم و ماشین بردار پشتیبان نشان می دهد در هر دو مورد استقلال هیئت مدیره بیشترین تاثیر را درپیش بینی کیفیت سود دارد. مقایسه نتایج تکنیک درخت تصمیم و ماشین بردار نشان می دهد که ماشین بردار پشتیبان با دقت 5/98% ، حساسیت 6/56% و خطای 4/21% نسبت به روش درخت تصمیم عملکرد بهتری جهت پیش بینی کیفیت سود داشته و در هر دو روش استقلال هیئت مدیره بالاترین وزن و اهمیت نسبت به سایر متغیرهای مربوط به پیش بینی کیفیت سود دارد. باتوجه به اینکه پژوهش حاضر تأثیر تعدادی از متغیرها را برکیفیت سود بررسی کرده و به پیش بینی کیفیت سود به وسیله تکنیک درخت تصمیم و ماشین بردار پشتیبان پرداخته است، انجام پژوهش مشابه برای تک تک شرکت ها بااستفاده از گزارش های مالی میان دوره ای و یا استفاده از مدل های دیگر و ترکیب الگوریتم های مختلف، انجام پژوهش درخصوص اثرات روانی پیش بینی و همچنین استفاده از سایر متغیرهای موثر بر کیفیت سود موضوعی است که می تواند در پژوهشهای آتی مد نظر قرار گیرد.
منابع و مأخذ
[1] پریجایی مقدم، احمد و سجاد موسوی. (2012). یادگیري درخت تصمیم بااستفاده ازشبکه عصبی براي افزایش پایداري وانعطاف پذیري،مجله ایرانی انفورماتیک پزشکی، ش 3.
[2] Armstrong, C. S., Guay, W. R., & Weber, J. P. (2010). The role of information and financial reporting in corporate governance and debt contracting. Journal of accounting and economics, 50(2-3), 179-234.
[3] Azizi, Z., Abdolvand, N., Ghalibaf Asl, H., & Rajaee Harandi, S. (2021). The Impact of Persian News on Stock Returns Through Text Mining Techniques. Iranian Journal of Management Studies, 14(4), 799-816.
[4] Ball, R., & Shivakumar, L. (2005). Earnings quality in UK private firms: comparative loss recognition timeliness. Journal of Accounting And Economics, 39(1), 83-128.
[5] Bhatia, S., Bajaj, R., & Hazari, S. (2016). Analysis of credit card fraud detection techniques. International Journal of Science and Research, 5(3), 1302-1307.
[6] Bliss, J. (1924). Management Through Accounts, The Ronald Press Co., New York .
[7] Boediono, G. S.B. (2005). Kualitas Laba: Studi Pengaruh Mekanisme Corporate Governance dan Dampak Manajemen Laba dengan Menggunakan Analisis Jalur. Simposium Nasional Akuntansi 8. Solo.
[8] Chen, S., & Komal, B. (2018). Audit committee financial expertise and earnings quality: A meta-analysis. Journal of Business Research, 84, 253-270.
[9] Clyde, P. S. (2007). Financial accounting an introduction to concepts, methods, and uses. Canada: South Cangage Learning.
[10] Dechow, P. M., & Dichev, I. D. (2002). The quality of accruals and earnings: The role of accrual estimation errors. The accounting review, 77(s-1), 35-59.
[11] Dechow, P., Ge, W., & Schrand, C. (2010). Understanding earnings quality: A review of the proxies, their determinants and their consequences. Journal of accounting and economics, 50(2-3), 344-401.
[12] DeFond, M. L., & Jiambalvo, J. (1994). Debt covenant violation and manipulation of accruals. Journal of accounting and economics, 17(1-2), 145-176.
[13] Domingues, A. (2016). Idiosyncratic Volatility and Earnings Quality: Evidence from United Kingdom. FEP Working Papers, 579: 3–42.
[14] Ewert, R., & Wagenhofer, A. (2013). Accounting standards, earnings management, and earnings quality. Earnings Management, and Earnings Quality (April 30, 2013). papers.ssrn.com.
[15] Fama, E. F., & French, K. R. (2001). Disappearing dividends: changing firm characteristics or lower propensity to pay?. Journal of Financial economics, 60(1), 3-43.
[16] Francis, J., LaFond, R., Olsson, P. M., & Schipper, K. (2004). Costs of equity and earnings attributes. The accounting review, 79(4), 967-1010.
[17] Ghosh, A., & Moon, D. (2010). Corporate debt financing and earnings quality. Journal of Business Finance & Accounting, 37(5‐6), 538-559.
[18] Givoly, D., & Hayn, C. (2000). The changing time-series properties of earnings, cash flows and accruals: Has financial reporting become more conservative?. Journal of accounting and economics, 29(3), 287-320.
[19] Gutierez A.L., Rodriguez, M.C. (2020). Measuring earnings quality: a proposal for a theoretical framework and an empirical method. https://aeca.es method. https://aeca.es/ wp-content/uploads/2014/05/10a.pdf. Accessed 5 June 2020.
[20] Jones, J. J. (1991). Earnings management during import relief investigations. Journal of accounting research, 29(2), 193-228.
[21] Khuong, N. V., Abdul Rahman, A. A., Thuan, P. Q., Liem, N. T., Anh, L. H. T., Thuy, C. T. M., & Ly, H. T. N. (2022). Earnings Management, Board Composition and Earnings Persistence in Emerging Market. Sustainability, 14(3), 1-15.
[22] Kotsiantis, S. B. (2013). Decision trees: a recent overview. Artificial Intelligence Review, 39(4), 261-283.
[23] Lennox, C., Lisowsky, P., & Pittman, J. (2013). Tax aggressiveness and accounting fraud. Journal of accounting research, 51(4), 739-778.
[24] Mathew, R. J., Largen, J., & Claghorn, J. L. (1979). Biological symptoms of depression. Psychosomatic Medicine, 41(6), 439-443.
[25] Muguto, L., & Muzindutsi, P. F. (2022). A Comparative Analysis of the Nature of Stock Return Volatility in BRICS and G7 Markets. Journal of Risk and Financial Management, 15(2), 1-27.
[26] Parte-Esteban, L., & García, C. F. (2014). The influence of firm characteristics on earnings quality. International Journal of Hospitality Management, 42, 50-60.
[27] Perotti, P., & Wagenhofer, A. (2014). Earnings quality measures and excess returns. Journal of business finance & accounting, 41(5-6), 545-571.
[28] Pratiwi, W., & Pralita, T. (2021). The Influence of Corporate Governance Mechanism, Accounting Conservatism, And Company Size on Earnings Quality. Journal of Economics, Finance and Management Studies, 4(01), 26-34.
[29] SeTin, S., & Murwaningsari, E. (2018). The effect of managerial ability towards earning quality with audit committee as moderating variable. Journal of Business and Retail Management Research, 12(3), 178-189.
[30] Siueia, T. T., & Wang, J. (2019). The association between Corporate Social Responsibility and Earnings Quality: Evidence from Extractive Industry: La asociación entre las Actividades de Responsabilidad Social Corporativa y la calidad de los ingresos: Evidencia de la industria extractiva. Revista de Contabilidad-Spanish Accounting Review, 22(1), 112-121.
[31] Skinner, D. J., & Soltes, E. (2011). What do dividends tell us about earnings quality?. Review of Accounting Studies, 16(1), 1-28.