توسعه سیستمهای معاملاتی سبد سهام با استفاده از روشهای یادگیری ماشین
علی حیدریان
1
(
گروه مدیریت، دانشکده علوم مالی، مدیریت و کارآفرینی، دانشگاه کاشان، کاشان، ایران.
)
محدثه مرادی مهر
2
(
گروه مدیریت، دانشکده علوم مالی، مدیریت و کارآفرینی، دانشگاه کاشان، کاشان، ایران.
)
علی فرهادیان
3
(
گروه مدیریت، دانشکده علوم مالی، مدیریت و کارآفرینی، دانشگاه کاشان، کاشان، ایران.
)
الکلمات المفتاحية: مدل میانگین-واریانس, یادگیری ماشین, شبکه عصبی پیچشی, تشکیل سبد سهام, بازار بورس تهران,
ملخص المقالة :
تئوری سبد سرمایهگذاری یکپایه مهم برای مدیریت سبد سهام است که در جامعه دانشگاهی موضوعی است که بهخوبی موردمطالعه قرارگرفته است اما بهطور کامل اشباعنشده است. ادغام پیشبینی بازده در تشکیل سبد سرمایه-گذاری میتواند عملکرد مدل بهینهسازی سبد را بهبود بخشد. ازآنجاییکه مدلهای یادگیری ماشین برتری قابلتوجهی نسبت به مدلهای آماری نشان دادهاند، در این پژوهش، یک رویکرد جدید تشکیل سبد سهام در دو مرحله ارائهشده است. مرحله اول با پیادهسازی شبکه عصبی پیچشی، سهام مناسب برای خرید انتخابشده و در مرحله دوم با استفاده از مدل میانگین-واریانس (MV)، وزن بهینه در سبد سرمایهگذاری برای آنها تعیین میشود. بهطور خاص، مراحل انتخاب سهام مناسب و تشکیل سبد سهام دو مرحله اصلی مدل توسعه دادهشده در این پژوهش است. مرحله اول، یک مدل شبکه عصبی پیچشی برای پیشبینی نقاط خرید و فروش سهام برای دوره بعدی پیشنهادشده است. مرحله دوم، سهامی که برچسب خرید میگیرند بهعنوان سهام با مناسب برای خرید انتخابشده و از مدل MV برای تعیین وزن بهینه آنها در سبد سهام استفاده میشود. نتایج بهدستآمده با استفاده از 5 سهم از بازار بهادار تهران بهعنوان نمونه مطالعه نشان میدهد که بازده و نسبت شارپ روش پیشنهادی از روشهای سنتی (بدون فیلتر کردن سهام مناسب) بهطور قابلتوجهی بهتر است.
_||_
فصلنامه مهندسی مالی و مدیریت اوراق بهادار شماره چهل و هشتم / پائیز 1400
|
|
توسعه سیستمهای معاملاتی سبد سهام با استفاده از روشهای یادگیری ماشین
چکیده
تئوری سبد سرمایهگذاری یکپایه مهم برای مدیریت سبد سهام است که در جامعه دانشگاهی موضوعی است که بهخوبی موردمطالعه قرارگرفته است اما بهطور کامل اشباعنشده است. ادغام پیشبینی بازده در تشکیل سبد سرمایهگذاری میتواند عملکرد مدل بهینهسازی سبد را بهبود بخشد. ازآنجاییکه مدلهای یادگیری ماشین برتری قابلتوجهی نسبت به مدلهای آماری نشان دادهاند، در این پژوهش، یک رویکرد جدید تشکیل سبد سهام در دو مرحله ارائهشده است. مرحله اول با پیادهسازی شبکه عصبی پیچشی، سهام مناسب برای خرید انتخابشده و در مرحله دوم با استفاده از مدل میانگین-واریانس (MV)، وزن بهینه در سبد سرمایهگذاری برای آنها تعیین میشود. بهطور خاص، مراحل انتخاب سهام مناسب و تشکیل سبد سهام دو مرحله اصلی مدل توسعه دادهشده در این پژوهش است. در مرحله اول، یک مدل شبکه عصبی پیچشی برای پیشبینی نقاط خریدوفروش سهام برای دوره بعدی پیشنهادشده است. در مرحله دوم، سهامی که برچسب خرید میگیرند بهعنوان سهام با مناسب برای خرید انتخابشده و از مدل MV برای تعیین وزن بهینه آنها در سبد سهام استفاده میشود. نتایج بهدستآمده با استفاده از 5 سهم از بازار بهادار تهران بهعنوان نمونه مطالعه نشان میدهد که بازده و نسبت شارپ روش پیشنهادی از روشهای سنتی (بدون فیلتر کردن سهام مناسب) بهطور قابلتوجهی بهتر است.
کلمات کلیدی: تشکیل سبد سهام، مدل میانگین-واریانس، یادگیری ماشین، بازار بورس تهران، شبکه عصبی پیچشی
مقدمه وبیان مسئله
در بازارهای مالی، سرمایهگذاران خرد معمولاً مایلاند در زمان حال از تغییرات بازده داراییهای سرمایهگذاری خود، روندهای احتمالی بازده در دوره معاملات آتی و اینکه چه اقداماتی باید برای داشتن بهترین سبد سهام انجام دهند، آگاه باشند (ژانگ 1 و همکاران، 2017). ازآنجاییکه اخیراً استقبال مردم برای حضور در بازار و درنتیجه ورود حجم زیادی از نقدینگی به بازار به دلیل افزایش تورم و عدم فرصت مناسب برای سرمایهگذاری در بازارهای دیگر بیشازپیش شده است، تشکیـل سبد سهـام بهعنوان یـک تصمیمگیری حـساس و حیـاتی بـرای شرکتها و یا افراد سرمایهگذار تبدیلشده اسـت. حـال اگر فرض شـود که ایـن امـر به عهـده ماشـین و یا الگـوریتـمی گذاشـته شود پیچـیدگی و اهمیـت کار را بیشـتر میکند.
ازاینرو، هدف اصلی این پژوهش ساختن یک مدل تصمیمگیری سرمایهگذاری برای سرمایهگذاران خرد است که روش یادگیری عمیق CNN را با روش MV ترکیب میکند. برای تشکیل سبد سهام بهینه از این نظر، مدل پیشنهادی این مطالعه فرآیند پیش انتخاب داراییها را قبل از تشکیل سبد سهام بهینه بررسی میکند که ورودیهای مناسب را برای سبد سهام بهینه تضمین میکند. برخلاف اکثر روشهایی که هدفشان بهبود مدلهای مدیریت سبد سهام موجود است، این مطالعه بر مرحله اولیه تشکیل سبد سهام، یعنی پیش انتخاب داراییها تمرکز دارد. همچنین، راهنماییهای عملی را برای سرمایهگذاران در اتخاذ تصمیمات سرمایهگذاری بهتر ارائه میدهد. بهطور خاص، رویکرد سیستماتیک موجود در پژوهش فعلی میتواند به تصمیمگیری در مورد اینکه کدام دارایی باید بخشی از سبد سهام و ترکیب ارزش داراییها در سبد سهام باشد کمک کند.
مبانی نظری پژوهش
سرمایهگذاری
سرمایهگذاری عبارت است از بـه تعویـق انـداختن مصـرف فعلـی بـرای دستیابی به امکان مصرف بیشتر درآیند (پارسایان و جهان خانی، 1384). سرمایه-گذاری از دید کلی به معنی صرفنظر کردن از عایدات امروز به امید دریافت عایدات بیشتر در آینده است. دو ویژگی عمومی زمان و ریسک در آن وجود دارد. در برخی موارد عامل زمان برجسته است، در برخی از موارد ریسک ویژگی اصلی است. در مواردی هم هر دو عامل زمان و ریسک دارای اهمیت هستند. بهعبارتدیگر فرآیند سرمایهگذاری، نحوه تصمیمگیری سرمایهگذاران در رابطه با انواع اوراق بهادار قابل دادوستدی کـه بایـد سرمایهگذاری کنند، میزان سرمایهگذاری در ایـن اوراق بهادار و زمـان سرمایهگذاری در آنها را تشـریح میکند (شارپ 2 و همکاران، 1392).
آنالیز اوراق بهادار
داراییهای مالی یا اوراق بهادار در حقیقت قراردادهای کتبی بر روی کاغذ هستند که نماینده حق قانونی نسبت به منفعتی در آینده بهحساب میآید. سرمایهگذاری در اوراق بهادار مثل سهام شرکتها که فرد درازای پرداخت مبلغی در حال حاضر، محق به دریافت جریانی از وجوه نقد شرکت به شکل سود سهام و یا بهره اوراق قرضه در آینده میشود، سرمایهگذاری مالی محسوب میگردد. مبنای تصمیمگیری برای خرید یا فروش و ارزیابی یک دارایی ارزش ذاتی آن میباشد. ارزش ذاتی هر دارایی برابر باارزش فعلی عایدات آتی آن دارایی است (حسینی و گرجی، 1398).
مدیریت سبد سهام
سبد سرمایهگذاری یا پرتفوی ترکیبی مناسب از داراییهای مالی و یا سایر داراییها است که یک سرمایهگذار آنها را با نیت سرمایهگذاری خریداری کرده است. هدف از تشکیل سبد سرمایهگذاری، تقسیم کردن ریسک سرمایهگذاری بین چند دارایی است، در این صورت سود یک دارایی میتواند زیان حاصل از دارایی دیگر را جبران کند. تشکیل پرتفوی با این منطق صورت گرفته است که سرمایه-گذار برای کنترل ریسک خود همه تخممرغهای خود را داخل یک سبد قرار ندهد و ریسک ناشی از کاهش ارزش یا از بین رفتن سرمایهگذاری خود را با این کار به حداقل برساند (مارکویتز 3، 1990)
تحلیل تکنیکال
تحلیل تکنیکال مطالعه رفتارهای بازار با استفاده از نمودارها و باهدف پیشبینی آینده روند قیمتها است. درواقع تحلیل تکنیکال روشی برای پیشبینی قیمتها در بازار از طریق وضعیت گذشته بازار است. تحلیل تکنیکال در سرمایهگذاری بر این پایه استوار است که قیمتهای سهام بازتابی از رفتار سرمایهگذاران و تصمیمات آنها نسبت به تغییرات فاکتورهای اقتصادی کلان و بازاری است (مورفی 4، 1999). ازآنجاییکه سرمایهگذاران بهصورت عقلایی تصمیمگیری میکنند، لذا در شرایط مشابه تصمیمات مشابه اتخاذ مینمایند و بنابراین روندهای قیمتی مشابه همواره تکرار میگردند. شاخصهای تحلیل تکنیکال به 4 دسته، روندها، حجمها، بیل ویلیامز و اسیلاتورها تقسیم میشوند. در این پژوهش از مجموعه شاخصهای تکنیکال بکار رفته در پژوهش سزار 5 و همکاران (2018) استفادهشده است.
روشهای یادگیری عمیق
روش DL نوعی ANN است که از چندین لایه پردازش تشکیلشده و انتزاع سطح بالا را برای مدلسازی دادهها امکانپذیر میکند. مزیت اصلی مدلهای DL استخراج ویژگیهای خوب دادههای ورودی بهصورت خودکار با استفاده از یک روش یادگیری باهدف کلیگرایی است؛ بنابراین در ادبیات، از مدلهای DL در بسیاری از مسائل ازجمله طبقهبندی تصویر، فیلم، پردازش صوت و تحلیل احساسات استفاده میشود (لکون 6 و همکاران، 2015).
شبکههای عصبی پیچشی (CNN)
الگوریتم CNN نوعی DNN) 10)است که از لایههای کانولوشنی تشکیلشده است و بر اساس پیچش عمل میکند. CNN متداولترین مدلی است که اغلب برای مسائل طبقهبندی مبتنی بر بینایی ماشین یا پردازش تصویر مانند طبقهبندی تصویر، تشخیص اشیاء، بخشبندی تصویر استفاده میشود (شوانگ 7 و همکاران (2012)؛ کریستن 8 و همکاران (2013) و جاناتان 9 و همکاران (2015)) مزیت استفاده از CNN تعداد پارامترهای آن در مقایسه با مدلهای دیگر مانند DMLP است. عمل فیلتری که با یک پنجره اعمال میشود مزیت معماری CNN برای پردازش تصویر است که برای محاسبه و ذخیرهسازی مفید هستند. در معماریهای CNN، لایههای مختلفی ازجمله، لایه کانولوشنی، max-pooling، dropout و چندلایه کاملاً متصل (MLP11) وجود دارد.
پیشینه پژوهش
در اوایل سال ۲۰۰۰، معاملات الگوریتمی، بیشتر مورد توجه بازار قرار گرفت. این محبوبیت باعث شد در کمتر از ۵ سال، در اوایل سال ۲۰۰۵ حدود ۲۵ درصد حجم معاملات بازار بورس آمریکا با استفاده از این سامانهها صورت پذیرد. این در حالی است که این رقم در سال ۲۰۰۳، فقط ۱۴ درصد بوده است. در سال ۲۰۰۶ حدود ۳۷٪ معاملات در بورس فرانکفورت مبنای الگوریتمی داشته است. این رقم در سال ۲۰۰۸ به حدود ۴۳٪ رسیده است. جذابیتهای معاملات الگوریتمی آنقدر برای بازار محسوس شد که حجم این نوع معاملات در سال ۲۰۰۹ به عدد قابلتوجه ۷۵ درصد رسید. با افزایش قدرت محاسباتی کامپیوترها، بهصورت معجزهآسایی مطابق با قانون مور (سرعت رشد محاسبات پردازندهها هر یک سال، دو برابر میشود)، کامپیوترها تبدیل به یک ابزار اصلی با توان محاسباتی قوی برای معاملات الگوریتمی شدند. بهسرعت اکثر بازیگران اصلی بازار شروع به استفاده از الگوریتمها کردند (جمشیدی، 1396)؛ بنابراین پیشبینی یک سری زمانی مالی، بهویژه پیشبینی قیمت دارایی، یکی از بیشترین حوزههای موردبررسی در مسائل مالی شد که تمرکز اصلی آن پیشبینی روند بعدی دارایی است. در ادبیات روشهای مختلفی برای پیشبینی روند وجود دارد. جدول 1، مقالات پیشبینی روند سهام را نشان میدهد. در این مقالات که اکثراً در بازه زمانی 2016 تا 2020 منتشرشدهاند روشها به سه زیرگروه تقسیم میشوند: مدلهای ANN، DNN و (FFNN12)، مدلهای LSTM، RNN و (NN 13) احتمالی و روشهای جدید.
اما در بعضی مطالعات از روشهای ANN، DNN، DFNN(17) و FFNN استفادهشده است. در پژوهش داس 14 و همکاران (2018)،NN با دادههای قیمت برای پیشبینی روند شاخص S&P500 مورداستفاده قرارگرفته است. تجزیهوتحلیل آنها نشان میدهد که جهت آینده شاخص S&P 500 میتواند به دلیل ضعف حرکتهای گذشته سهام اساسی داخل شاخص، ضعیف پیشبینی شود، اما بهاندازه کافی برای رد کار آیی بازار کافی نیست. ناون و کلر 15 (2017) مدل FNN عمیق را با انتخاب یک استراتژی معاملاتی ترکیب کردند تا جهت بعدی قیمت را پیشبینی کنند. یانگ 16 و همکاران (2017) برای پیشبینی روند، شبکه-ای از چند مدل پس انتشار 18 و (ADAM 19) ایجاد کردند. در ادبیات روشهای LSTM، RNN و شبکه عصبی احتمالی (PNN20) با دادههای سری زمانی قیمت برای پیشبینی روند استفادهشده است. در جدول 1 به برخی از آنها اشارهشده است.
جدول 1-پیشینه تحقیقات روشهای پیش بنی روند
نویسنده | روش پیشبینی |
سد 21 و همکاران (1998) | شبکه عصبی TDNN 22، RNN و PNN را برای تشخیص روند با استفاده از 10 سهم S&P500 مقایسه کردند. |
دیپرسیو و هونچر 23(2017) | 3 مدل RNN مختلف RNN (پایه،LSTM،GRU) را برای پیشبینی حرکت قیمت سهام گوگل مقایسه کردند |
هانسون (2017) | از LSTM (و سایر روشهای پیشبینی کلاسیک) برای پیشبینی روند قیمت سهام استفاده کردند. |
شن و همکاران (2018) | از مدلهای GRU و GRU-SVM برای پیشبینی روند شاخصهای HSI 26، DAX 27،S&P500 استفادهشده است |
همچنین روشهای جدیدی نیز وجود دارد که فقط از دادههای قیمت استفاده میکنند. جدول 2 به برخی از مطالعات انجامشده اشاره میکند.
جدول 2-پیشینه تحقیقات پیشبینی با داده قیمت
نویسنده | روش |
چن 28 و همکاران (2016) | روشی را پیشنهاد میکند که از CNN با (GAF29)، MAM) 30 )و شاخصهای تحلیل تکنیکال تبدیلشده بهعکس برای پیشبینی شاخص سهام تایوان استفاده میکند. |
سزار و ازبایگلو 31 (2019) | در مطالعه خود از مدل CNN روی تصاویر نمودار میلهای دادههای قیمت برای پیشبینی موقعیت-های خریدوفروش و نگهداری (ETF 32) و سهام Dow30) 33) استفاده کردند. آنها درنهایت روش خود را با شبکه LSTM و SVM مقایسه کردند و نشان دادند نتایج بهتری به همراه دارد |
ژو 34 و همکاران (2019) | روشی را ارائه دادهاند که از مدلهای EMD&FNN) 35) استفاده میکند تا جهت قیمت بسته شدن سهام را پیشبینی کند. در این روش در مرحله اول از EMD وبری تجزیه سری زمانی مالی اصلی به چندین مؤلفه به نام توابع حالت ذاتی (IMF 36) استفاده میشود. |
آسمز 37 و همکاران (2017) | DBN با دادههای قیمت برای پیشبینی روند 23 سهام بزرگ از شاخص OMX) 38)استفادهشده است. |
در ادامه مقایسه کارهای نزدیک به این پژوهش ارائه میشود تا جایگاه این پژوهش در مرور ادبیات معین گردد.
جدول 3-مقایسه پژوهش با سایر تحقیقات
اطلاعات | متغیرها | افق زمانی | مدل | پیشبینی | سایر | ||
محققین | تکنیکال | قیمت و مشتقات | روزانه | روش | جهت | قیمت | هزینه معاملات |
فلیپ و همکاران (2019) | * |
| روزانه | SVM+MV | * |
| * |
وانگ و همکاران (2019) | * |
| روزانه | LSTM+MV |
| * |
|
ما 44 و همکاران (2021) | * |
| روزانه | DLs+MV |
| * | * |
پژوهش حاضر | * | * | روزانه | CNN+MV | * |
| * |
روششناسی پژوهش
مدل ارائهشده در این پژوهش ترکیبی از روش یادگیری عمیق CNN و روش مارکویتز (MV ) برای تشکیل سبد سهام بهینه است و روی قدرت پیشبینی شبکههای CNN و در نظرگیری بهطور همزمان ویژگیهای مؤثر مانند اندیکاتورهای تحلیل تکنیکال متمرکز است. ساختار کلی مدل پیشنهادی در شکل 1 نشان دادهشده است:
شکل 1- ساختار کلی مدل پیشنهادی
این پژوهش یک روش جدید متشکل از شبکههای CNN و مدل میانگین- واریانس (CNN+MV) برای تشکیل سبد سهام بهینه را توسعه میدهد. برای نشان دادن فایده روش پیشنهادی ازنظر پیشبینی، استراتژی خرید و نگهداری و مدل پایه مارکویتز در آزمودنهای این مطالعه بهعنوان مدلهای پایه برای مقایسه مورداستفاده قرار میگیرد. در این رویکرد مدل پیشنهادی برخلاف اکثر مطالعات که روی بهبود روشهای تشکیل سبد سهام بهینه تمرکز میکنند روی انتخاب داراییها قبل از تشکیل سبد سهام تمرکز دارد و داراییهایی که پتانسیل رشد قیمتی در دوره بعد رادارند بهعنوان یک ورودی خوب به مدل مارکویتز وارد میکند. برای ورود اطلاعات به مدل شبکه عصبی پیچشی نیاز است تا دادههای مسئله که بهصورت اعداد است به یک تصویر تبدیل شود و به مدل وارد شود. برای این منظور در مرحله ایجاد تصویر، برای هرروز، مقادیر شاخصهای RSI، Williams%R، WMA، EMA، SMA، HMA، CMO، MACD، Stochastic برای بازههای زمانی مختلف ( 6 تا 25 روز) محاسبه میشود. این شاخصهای فنی خاص از نوع روند و اسیلاتور هستند که عمدتاً توسط معامله گران کوتاهمدت و میانمدت ترجیح داده میشوند. همچنین برای هرروز مقادیر قیمت 60 روز گذشته و حجم 30 روز گذشته را نیز در تصاویر میآوریم. ازآنجاکه در این پژوهش از بازههای زمانی 6 تا 25 روز برای محاسبه شاخصهای فنی استفاده میشود، بر نوسانات 1 هفتهای تا 1 ماهه متمرکز است. دامنههای زمانی طولانیتر و انواع دیگر شاخصهای فنی را میتوان برای مدلهایی باهدف بلندمدت و معاملات کمتر انتخاب کرد. بنابراین برای هرروز یک تصویر 20 * 20 با استفاده از 20 متغیر مختلف (شاخص تحلیل فنی و 9 ردیف دادههای قیمت و حجم روزهای قبل) در سطر و 20 فواصل زمانی مختلف از این متغیرها در ستونها تولید میشود. در ضمن، هر تصویر با منطق ارائهشده در الگوریتم برچسبزنی با برچسب خرید یا فروش همراه میشود. ازآنجاکه ترتیبهای مختلف منجر به شکلگیری تصویرهای مختلف میشوند، ترتیب شاخصهای فنی در تصاویر مهم است.
پس از تبدیل دادهها به یک ماتریس، در مرحله بعد لازم است تا دادهها نرمالایز شود. علت این امر آن است که دادههای مربوط به اندیکاتورها ازنظر مقدار دارای مقیاسهای متفاوتی هستند. بهعنوانمثال دادهای که مربوط به میانگین متحرک قیمت سهام است بازهای بین 1300 تا 1500 را برای نوسان دارد ولی داده مربوط به RSI بازه نوسان بین 1 تا 10 را دارد. برای نرمالسازی دادهها روشهای متعددی وجود دارد که در این مطالعه نرمالسازی بین -1 و +1 انتخابشده است. برای این روش میانگین، کمترین و بیشترین مقدار یک متغیر در ماتریسهای مختلف انتخاب میشوند و درنهایت هر داده از میانگین کم و بر اختلاف بین بیشترین و کمترین مقدار تقسیم میشود.
جدول 4_ ماتریس درهمریختگی
برچسب پیشبینیشده | |||
فروش | خرید | ||
FN | TP | خرید | برچسب شناختهشده |
TN | FP | فروش |
همچنین پارامتر دقت (Accuracy)، متداولترین، اساسیترین و سادهترین معیار اندازهگیری کیفیت یک طبقهبندی است و نشاندهنده میزان تشخیص صحیح طبقهبندی درمجموع دوطبقه است. این پارامتر درواقع نشانگر میزان الگوهایی است که درست تشخیص دادهشدهاند و بر اساس ماتریس ارائهشده در بالا، به شکل زیر تعریف میشود:
در این مطالعه، تقریباً 1000 تصویر برای هر دسته آموزش در یک دوره 4 ساله و تقریباً 250 تصویر برای هر دسته آزمودن در یک دوره 1 ساله وجود دارد. برای هر دسته از سال 1388 تا 1398 بهطور جداگانه آموزش و آزمودن انجام میشود و درنهایت نتایج آنها باهم ترکیب میشوند و معیارهای عملکرد سالانه برای دوره 10 ساله گزارش میشود.
تحلیل دادهها و یافتهها
باتوجهبه اینکه شبکههای یادگیری عمیق به داده ورودی زیادی نیاز دارند، این الگوریتم بهگونهای طراحیشده است که برای تمامی شرکتهایی که در 10 سال گذشته مورد معامله بودهاند قابلاستفاده است. دلیل انتخاب سهام مختلف از صنایع مختلف، این است که قدرت مدل در خریدوفروش سهام در زمانهای مناسب بررسی شود. در 5 صنعت، شرکتهایی که در 10 سال گذشته دارای بیشترین تعداد روزهای معاملاتی هستند انتخاب شدند و بعد از پیادهسازی شبکه CNN روی آنها درنهایت شرکت موجود در جدول 5، بهترین نتایج را برمبنای بازدهی متوسط سالیانه داشتند که برای ادامه کار از این 5 شرکت استفاده کردیم.
جدول 5-سهام انتخابی برای تشکیل سبد در این پژوهش
سهام | صنعت | نماد |
صنایع لاستیکی سهند | لاستیک و پلاستیک | پسهند |
نفت پارس | فراوردههای نفتي، كك و سوخت هستهای | شنفت |
گسترش سرمایهگذاری ایرانخودرو | خودرو و ساخت قطعات | خگستر |
ملی صنایع مس ایران | فلزات اساسی | فملی |
بانک پارسیان | بانکها و مؤسسات اعتباری | وپارس |
در مرحله جمعآوری داده در این پژوهش دادههای OCHLV روزانه سهام نمادهای جدول 5 را از تاریخ 01/07/1388 تا تاریخ 31/06/1398 برای تشکیل تصاویر و آموزش و آزمودن مدل از سایت www.Tsetmc.com جمعآوری و اندیکاتورهای فنی را برای این دادهها محاسبهشده است. برای آموزش و آزمودن مدل از رویکرد بازآموزی استفاده شد. به این صورت که مطابق شکل 3، یک پنجره زمانی 4 ساله برای آموزش و یک سال بعد آن را برای آزمودن در نظر گرفته شد؛ یعنی دوره آموزش را از تاریخ 01/07/1388 تا 31/06/1392 و دوره آزمودن را از تاریخ 01/07/1392 تا 31/06/1393 تنظیم شد. سپس هر دو دوره آموزش و آزمودن یک سال به جلو منتقل شد؛ یعنی دوره آموزش از تاریخ 01/07/1389 تا 31/06/1393 و دوره آزمودن از تاریخ 01/07/1393 تا 31/06/1394 تنظیم شد. بهاینترتیب برای یک دوره 10 ساله 6 دسته داده آموزش و آزمودن ایجاد شد.
پسازآن به بررسی توانایی مدل پیشنهادی در تشخیص برچسب دادهها پرداخته شد. قبل از بررسی توانایی مدل در تشخیص برچسبها، نمودار مقدار دقت و تابع ضرر مدل برحسب تعداد ای پوکهای آموزش دادهشده بررسی گردید تا اطمینان حاصل شود آموزش مدل بهخوبی انجامشده و دچار چالشهایی ازجمله بیش برازش نشده باشد. طبق شکل 1 دقت مدل بهمرور افزایش مییابد و همچنین دقت مدل در حالت آزمون از حالت آموزش کمتر است و نشان میدهد مدل در این حالت مشکلی ندارد. اما اگر نمودار تابع ضرر برحسب تعداد ای پوک برای دادههای آموزش با افزایش تعداد ای پوکها ابتدا کاهش و سپس افزایش یابد، نشاندهنده مشکل بیش برازش در مدل است. مدل موردمطالعه در این پژوهش با بیش برازش روبرو نیست.
شکل 1-دقت مدل برحسب تعداد اوپک سهم فملی
پس از اجرای صحیح الگوریتم دستهبندی و انتخاب روش برچسبزنی دادههای آموزش، میتوان عملکرد محاسباتی یک طبقهبندی را به کمک معیارهای ماتریس درهمریختگی محاسبه کرد. بعد از 50 تکرار بهطور میانگین، ماتریس درهمریختگی کل سهام در دوره آزمودن در جدول 6 ارائهشده است.
جدول 6-ماتریس درهمریختگی کلی مدل
SELL | BUY | |
1465 | 2803 | BUY |
2062 | 1170 | SELL |
بر اساس رابطه عنوانشده، دقت مدل در پیشبینی نقاط خریدوفروش 64.86 درصد است. همانطور که مشخص است، مدل نقاط خرید را بهتر از نقاط فروش پیشبینی میکند. بهعبارتدیگر دقت مدل در پیشبینی نقاط فروش این سهم برابر با 63.79 درصد است درحالیکه دقت مدل در تشخیص نقاط خرید این سهم برابر با 65.67 درصد است. این نتایج در جدول 6 خلاصهشده است و نتایج برای هر سهم بهطور مجزا در جدول 7 نشان دادهشده است.
جدول 7-دقت مدل در تعیین نقاط خریدوفروش
65.15% | دقت کل |
63.99% | دقت پیشبینی نقاط خرید |
66.15% | دقت پیشبینی نقاط فروش |
جدول 8- خروجی ارزیابی عملکرد محاسباتی مدل به تفکیک سهام
نماد: پسهند | 64.7% | دقت کل |
55.9% | دقت پیشبینی نقاط خرید | |
73.8% | دقت پیشبینی نقاط فروش | |
نماد: شنفت | 65.9% | دقت کل |
66.4% | دقت پیشبینی نقاط خرید | |
65.6% | دقت پیشبینی نقاط فروش | |
نماد: خگستر | 61.1% | دقت کل |
62.1% | دقت پیشبینی نقاط خرید | |
59.4% | دقت پیشبینی نقاط فروش | |
نماد: فملی | 64.8% | دقت کل |
72.01% | دقت پیشبینی نقاط خرید | |
50.4% | دقت پیشبینی نقاط فروش | |
نماد: وپارس | 67.6% | دقت کل |
69.6% | دقت پیشبینی نقاط خرید | |
63.7% | دقت پیشبینی نقاط فروش |
معیارهای دیگری مانند ارزش اخباری مثبت و صحت و F1-Score نیز برای ارزیابی عملکرد محاسباتی مدل از ماتریس درهمریختگی قابلاستخراج است که نتایج حاصل از آن در جدول 9 و 10 برای کل مدل و 5 سهم انتخابی، ارائهشده است.
جدول 9- نتایج معیارهای دیگر ارزیابی عملکرد محاسباتی مدل برای کل مدل
F1-Score | Recall | Precision | کل مدل |
68% | 65% | 70% | خرید |
61% | 64% | 58% | فروش |
جدول 10- نتایج معیارهای دیگر ارزیابی عملکرد محاسباتی مدل برای 5 سهم موردنظر
F1-Score | Recall | Precision | سیگنال | نماد |
60.1 | 66.4 | 54.9 | خرید | پسهند |
70.2 | 65.6 | 75.5 | فروش | |
66.7 | 62.1 | 72.1 | خرید | شنفت |
53.1 | 59.4 | 48.1 | فروش | |
73.37 | 72.01 | 74.6 | خرید | خگستر |
48.68 | 50.4 | 47.08 | فروش | |
73.69 | 69.6 | 78.3 | خرید | فملی |
57.72 | 63.7 | 52.78 | فروش | |
66.91 | 58.54 | 78.1 | خرید | وپارس |
57.45 | 70.46 | 48.5 | فروش |
در مدل این پژوهش برای ارزیابی مالی، هر سهام باتوجهبه برچسب پیشبینیشده توسط مدل، خریداری، فروش یا نگهداری میشود. اگر برچسب پیشبینیشده خرید باشد و سهم قبلاً خریدارینشده باشد، در آن مرحله با تمام سرمایه موجود خریداری میشود. اگر برچسب پیشبینیشده فروش باشد و سهم قبلاً خریداریشده باشد، با همان قیمت فروخته میشود. اگر یک برچسب بهطور متوالی تکرار شود، فقط اولین برچسب فعال میشود و بعدازآن اقدامی انجام نمیشود و بهعبارتدیگر تکرار برچسبها تا تغییر برچسب همانند برچسب نگهداری عمل میکند. برای انجام معاملات سرمایه اولیه 500000 تومان و هزینه معاملات برای خرید 0.5 و برای فروش 1 درصد ارزش مورد معامله در نظر گرفته شد. همچنین در روزهایی که وارد سهم نشدیم طبق طرح حامی کارگزاری مفید بازدهی بدون ریسک روزانه 0.08 درصد را در نظر میگیریم. درنهایت برای نشان دادن بازدهی سالانه مدل از رابطه زیر استفاده میکنیم.
برای بررسی عملکرد مالی مدل، بازدهی مدل پیشنهادی را با مدلهای پایه نیز مقایسه میکنند. اولین و معروفترین معیار برای مقایسه، مقایسه بازده مدل پیشنهادی با روش خرید و نگهداری است. برای روش خرید و نگهداری با تمام سرمایه ابتدای دوره، سهام خریداری کرده و در انتهای دوره تمام سهام خریداریشده را میفروشیم و ناشی از افزایش و کاهش قیمت سهم سرمایه ما نیز افزایش و کاهش مییابد. در ادامه نمودار سرمایهی سرمایهگذار بر مبنای مدل و مقایسه آن با استراتژی خرید و نگهداری برای هر سهم در دوره آزمودن نشان دادهشده است.
شکل 2-مقایسه سهم شنفت شکل 3- مقایسه سهم فملی
شکل 4- مقایسه سهم و پارس شکل 5-مقایسه سهم خگستر
شکل 6- مقایسه مدل مبتنی بر شبکه پیچشی و استراتژی خرید و نگهداری سهم پسهند
همانطور که مشخص است در تمام سهام مدل پیشنهادی بازدهی بیشتری نسبت به استراتژی خرید و نگهداری داشته است.
جدول 11- مقایسه متوسط بازدهی سالانه مدل پیشنهادی و استراتژی خرید و نگهداری
مدل CNN | خرید و نگهداری | نماد |
77.69% | 28.63% | فملی |
88.95% | 46.11% | شنفت |
61.22% | 33.28% | خساپا |
60.79% | 40.54% | پسهند |
46.79% | 14.60% | وپارس |
72.99% | 46.46% | میانگین |
ازآنجاییکه در طی فرایند تصمیمگیری برای سرمایهگذاری، تشکیل سبد سهام بسیار مفید خواهد بود. برای تشکیل سبد سهام ما چند روش را موردبررسی قرار میدهیم و درنهایت نشان میدهیم مدلهای پیشنهادی ما نتایج بهتری نسبت به سایر روشهای مرسوم خواهد داشت.
تشکیل سبد سهام با روش های مختلف
جدول 12- نتایج تشکیل سبد سرمایهگذاری روش های مختلف
متوسط بازدهی سالانه | ارزش ریالی سبد سرمایهگذاری | روش |
35.13% | 30443899 | مارکویتز ساده |
112.88% | 465416003 | CNN+MV |
48.99% | 54696918 | استفاده از وزنهای برابر |
در شکل 7 مقایسه متوسط بازدهی سالانه 4 روش خلاصهشده است. روش CNN-MV جایگاه اول را در بین روشهای موردبررسی دارد.
شکل7-مقایسه متوسط بازده سالیانه سبد سرمایهگذاری روشهای مختلف
ارزیابی عملکرد سبد سرمایهگذاری ازنظر نسبت شارپ
در پژوهش حاضر 4 روش برای تشکیل سبد سهام بررسی کردیم که برای مقایسه این روشها، نسبت شارپ سالیانه در دورههای آزمودن را محاسبه کردیم و نتایج در شکل 15 قابلمشاهده است. باتوجهبه اینکه بازدهی کسبشده از بازار بورس ایران تفاوت زیادی با بازدهی بدون ریسک دارد و هم چنین کم بودن مقدار انحراف معیار بازدهی سبد، عدد مربوط به این نسبت در بازار ایران عدد بالایی است.
شکل 8-نسبت شارپ در روشهای مختلف تشکیل سبد سهام
همانطور که در شکل 8 نشان دادهشده است، ما هرسال یکبار از نسبت شارپ استفاده میکنیم که از 6 دوره بررسیشده، پنج مورد نشان میدهد که نسبت شارپ مدل CNN-MV نتیجه بهتری نسبت به سایر مدلها در دورههای مربوطه دارد. بعدازآن، مدل1/N نتایج بهتری را نسبت به 2 مدل دیگر داشته است.
نتیجهگیری
هدف از این مطالعه توسعه سیستم معاملاتی سبد سهام با عنوان CNN+MV است که ترکیبی از الگوریتمهای یادگیری عمیق و مدل مارکویتز است. مدل پیشنهادی ما شامل دو مرحله اصلی، انتخاب سهام و بهینهسازی سبد بهصورت روزانه است. در مرحله اول نقاط مناسب برای خرید، نگهداری و فروش با مدل CNN در هر سهم پیشبینی میشود. در مرحله دوم سهام دارای برچسب پیشبینیشده خرید بهعنوان ورودی به مدل MV برای ساخت سبد در نظر گرفته میشود. 5 سهم از 5 صنعت مختلف برای ارزیابی عملکرد مدل استفادهشده است.
نتایج نشان میدهد که مدل پیشنهادی روشی مناسب برای توسعه سیستم معاملاتی در بازار سهام ایران است. با استفاده از مدل پیشنهادی، میتوان سرمایه سرمایهگذاران را به سهام مختلف بهگونهای تخصیص داد که نسبت شارپ بهتری نسبت به سایر مدلهای معیار به دست آید. مدل پیشنهادی ما در مقایسه با مدلهای MV، 1/N و CNN-1/N ازنظر بازده تجمعی بدون هزینه تراکنش تأییدشده است
منابع
1) پارسائیان، علی و جهان خانی، علی (1384) " مدیریت سرمایهگذاری و ارزیابی اوراق بهادار"،چاپ دوم، تهران، انتشارات دانشکده مدیریت.
2) حسینی، حوریه سادات و گرجی آرا، محمد(1398) "مدیریت سرمایهگذاری و ریسک"، چاپ پنجم، انتشارات نگاه دانش.
3) شارپ، ویلیام اف؛ الکساندر، گوردن جی و بیلی، جفری وی (1978) "مدیریت سرمایهگذاری" ،شریعت پناهی، جعفری. نشر اتحاد (1392).
4)Ausmees, S. Milovanović, F. Wrede, and A. Zafari, “Taming Deep Belief Networks,” pp. 1–14, 2017.
5) Chen, W. Chen, and C. Huang, “Financial Time-series Data Analysis using Deep Convolutional Neural Networks,” 2016 7th Int. Conf. Cloud Comput. Big Data (CCBD). IEEE, pp. 99–104, 2016.
6) Christian Szegedy, Alexander Toshev, “Deep Neural Networks for Object Detection,” Adv. Neural Inf. Process. Syst., pp. 2553–2561, 2013.
7) Das, K. Mokashi, and R. Culkin, “Are Markets Truly Efficient ? Experiments Using Deep Learning Algorithms for Market Movement Prediction,” pp. 1–19, 2018. Navon and Yosi Keller, “Financial Time Series Prediction using Deep Learning,” 2017.
8) Di Persio and O. Honchar, “Recurrent neural networks approach to the financial forecast of Google assets,” vol. 11, pp. 7–13, 2017.
9) Felipe Dias Paiva, Rodrigo Tomás Nogueira Cardoso, “Decision-making for financial trading: A fusion approach of machine learning and portfolio selection,” Expert Syst. Appl., pp. 635–655, 2019.
10) Gorgulho, R. Neves, and N. Horta, “Applying a GA kernel on optimizing technical analysis rules for stock picking and portfolio composition,” Expert Syst. Appl., vol. 38, no. 11, pp. 14072–14085, 2011.
11) Hansson, “On stock return prediction with LSTM networks,” 2017.
12) Jonathan Long, Evan Shelhamer, “Fully Convolutional Networks for Semantic Segmentation,” Proc. IEEE Conf. Comput. Vis. pattern Recognit., pp. 3431–3440, 2015.
13) Lecun, Y. Bengio, and G. Hinton, “Deep learning,” Nature, vol. 521, no. 7553, pp. 436–444, 2015.
14) Murphy, Technical analysis of the financial markets: A comprehensive guide to trading methods and applications. Penguin, 1999.
15) Saad, D. V Prokhorov, and D. C. Wunsch, “Comparative Study of Stock Trend Prediction Using Time Delay , Recurrent and,” vol. 9, no. 6, pp. 1456–1470, 1998.
16) Sezer and A. M. Ozbayoglu, “Financial Trading Model with Stock Bar Chart Image Time Series with Deep Convolutional Neural Networks,” p. arXiv preprint arXiv:1903.04610, 2019.
17) Shen, Q. Tan, H. Zhang, P. Zeng, and J. Xu, “Deep Learning with Gated Recurrent Unit Networks for Financial Deep Learning with Gated Recurrent Unit Networks for Financial Sequence Predictions Sequence Predictions,” Procedia Comput. Sci., vol. 131, pp. 895–903, 2018.
18) Shuiwang Ji, Wei Xu, Ming Yang, “3D Convolutional Neural Networks for Human Action Recognition,” IEEE Trans. Pattern Anal. Mach. Intell., pp. 35(1):221–231, 2012.
19) Yang, Z. Gong, and W. Yang, “Stock Market Index Prediction Using Deep Neural Network Ensemble,” 2017 36th Chinese Control Conf. (CCC). IEEE, 2017.
20) Zhang, C. Aggarwal, and G. J. Qi, “Stock price prediction via discovering multi-frequency trading patterns,” Proc. ACM SIGKDD Int. Conf. Knowl. Discov. Data Min., vol. Part F1296, pp. 2141–2149, 2017.
21) Zhou, H. Zhou, Z. Yang, and L. Yang, “EMD2FNN : A strategy combining empirical mode decomposition and factorization machine based neural network for stock market trend,” Expert Syst. Appl., vol. 115, pp. 136–151, 2019.
یادداشت ها
1) Zhang et al
2) Sharp et al
3) Marcottes
4) Murphy
5) Sezer et al
6) Clone et al
7) Shuiwang et al
8) Christian
9) Jonathan et al
10) Deep Neural Network
11) Multi Layer Perceptron
12) Feedforward Neural Network
13) Neural Network
14) Das et al
15) Naveen and kelier
16) Yang et al
17) Deep Feedforward Neural Network
18) Back propagation
19) Adaptive Moment Estimation
20) Probabilistic Neural Network
21) Saad et al
22) Time delay Neural Network
23) ) Di Persio and Honchar
24) Hansson
25) Shen et al
26) Hong Kong Hang Seng Index
27) The Deutscher Aktien index
28) Chen et al
29) Gramian Angular Field
30) Moving Average Mapping
31) Sezer and Ozbayoglu
32) Exchange-Traded Fund
33) Dow Jones Industrial Average 30
34) Zhou et al
35) Empirical Mode Decomposition and Factorization Machine based Neural Network
36) intrinsic mode function
37) Ausmees et al
38) Stockholm Stock Exchange
Development of stock portfolio trading systems using machine learning methods
Abstract
Investment portfolio theory is an important foundation for portfolio management, which is a well-studied but not saturated topic in the academic community. Integrating return forecasting in investment portfolio formation can improve the performance of portfolio optimization model. Since machine learning models have shown superiority over statistical models, in this research, an approach of forming the stock portfolio in two stages is presented.the first step, by implementing neural network, suitable stocks are selected for purchase, in the second step, using the (MV) model, the optimal weight in investment portfolio is determined for them. In particular, the stages of selecting suitable stocks and forming a stock portfolio are the two main stages of the model developed in this research. The first step, a convolutional neural network model is proposed to predict stock buy and sell points for the next period.second step, stocks that are labeled as buys are selected as stocks suitable for buying, and MV model is used to determine their optimal weight in the stock portfolio. The results obtained using 5 shares of Tehran stock market as a study sample show that the efficiency and Sharpe ratio of proposed method is significantly better than traditional methods (without filtering suitable stocks)
Keywords: Stock portfolio formation, mean-variance model, machine learning, Tehran stock market, convolutional neural network