کد مقاله : 140305071127442 بازدید : 301 صفحه: -

نوع مقاله: پژوهشی

ارائه راهکار برای پیش بینی قیمت سهام به کمک تلفیق روش‏های تکامل تفاضلی و جنگل تصادفی

محورهای موضوعی : مجله فناوری اطلاعات در طراحی مهندسی

1 - گروه مدیریت فناوری اطلاعات، دانشکده مدیریت و اقتصاد، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران

تاریخ دریافت : 1403/05/07 تاریخ پذیرش : 1403/06/25 تاریخ انتشار : 1403/09/04

کلید واژه: جنگل تصادفی, تکامل تفاضلی, سری زمانی, یادگیری ماشین,

چکیده مقاله :

پیش بینی قیمت سهام یک کار پیچیده است که برای قرن ها سرمایه گذاران و تحلیلگران مالی را مجذوب خود کرده است. با افزایش هوش مصنوعی و یادگیری ماشینی، محققان مدل‌های مختلفی را برای پیش‌بینی قیمت سهام، استفاده از داده‌های تاریخی و روند بازار توسعه داده‌اند. هدف این مدل‌ها شناسایی الگوها و همبستگی‌های بین شاخص‌های اقتصادی، اخبار بازار و قیمت سهام برای پیش‌بینی دقیق است. با وجود اینکه در زمینه‏ی پیش بینی قیمت سهام، تحقیقات گسترده‏ای صورت گرفته، ولی با این حال با افزایش استفاده از فناوری‏های نوین ضرروت انجام این فعالیت‏ها همچنان پابرجاست، در این مقاله روشی مبتنی بر تلفیق روش‏های تکامل تفاضلی و جنگل تصادفی برای پیش بینی قیمت سهام ارائه شده است. در روش پیشنهادی جنگل تصادفی می تواند به طور موثر قیمت های بازار سهام را با مدیریت و بررسی داده ها پیش بینی کند و روش تکامل تفاضلی با انتخاب بهترین مقادیر برای پارامتر های جنگل تصادفی به بهبود دقت پیش بینی های بازار سهام کمک می کند. نتایج حاصل از پیاده سازی این روش بر روی داده های شرکت AMD بیانگر این است که تا حدود میانگین 74% نسبت به روش‏های جنگل تصادفی، شبکه عصبی و رگرسیون خطی دارای کاهش خطای آموزشی و همچنین تا حدود میانگین 55% نسبت به روش‏های ذکر شده دارای کاهش خطای تست بوده است. این موضوع برتری و موثر بودن روش مورد نظر نسبت به راهکارهایی مقایسه شده را نشان می دهد.

چکیده انگلیسی:

Predicting stock prices is a complex task that has fascinated investors and financial analysts for centuries. With the rise of artificial intelligence and machine learning, researchers have developed various models to forecast stock prices, leveraging historical data and market trends. These models aim to identify patterns and correlations between economic indicators, market news, and stock prices to make accurate predictions. Although extensive research has been done in the field of stock price forecasting, but with the increase in the use of new technologies, it is still necessary to carry out these activities. In this paper, a method based on the integration of differential evolution and random forest are presented for stock price prediction. In the proposed method, random forest can effectively predict stock market prices by reviewing data, and the differential evolution method helps to improve the accuracy of stock market forecasts by choosing the best values for random forest parameters. The results of the implementation of this method on the data of AMD show that up to an average of 74% compared to the methods of random forest, neural network and linear regression with a reduction in training error and also up to an average of 55% compared to the method The mentioned ones have reduced the test error. This issue shows the superiority and effectiveness of the proposed method compared to the compared solutions.

منابع و مأخذ:

B.M. Blau, "Income inequality, poverty, and the liquidity of stock markets," Journal of Development Economics, vol. 130, pp.113–126, 2017.
G. Kumar, J. Sanjeev, S.P. Uday, "Stock market forecasting using computational intelligence: A survey," Archives of Computational Methods in Engineering, 1-33, 2020.
M. Obthong, T. Nongnuch J. Watthanasak, W. Gary, "A survey on machine learning for stock price prediction: algorithms and techniques," 63-71, 2020.
N. Forouzanmanesh, Stock price prediction using expert opinion and fuzzy-neural system, Master's thesis, University of Qom, Seattle, 2016. [Persian]
T.B. Shahi, S. Ashish, N. Arjun, W. Guo, "Stock price forecasting with deep learning: A comparative study," Mathematics, vol. 8, no. 9, p. 1441, 2020.
S.S. Roy, C. Rohan, C.L. Kun, S. Concetto, M. Behnam, "Random forest, gradient boosted machines and deep neural network for stock price forecasting: a comparative analysis on South Korean companies," International Journal of Ad Hoc and Ubiquitous Computing, vol. 33, no. 1, 62-71, 2020.
J. Sen, M. Sidra, "Accurate stock price forecasting using robust and optimized deep learning models, " arXiv preprint arXiv:2103.15096, 2021.
A. Kazemi, S. Ariaie, M. Kazemi, H. Talebi, “Predicting stock returns using data mining methods (case study of Tehran Stock Exchange),” The fourth international industrial management conference, Yazd, Iran, 1398, https://civilica.com/doc/938009. [Persian]
A. Delshad, R. Tehrani, “Investigating the impact of management characteristics on the value and volume of stock transactions; With an emphasis on
data mining methods. Knowledge of financial accounting,” Knowledge of financial accounting, vol. 6, no. 9, pp. 29-60, 2019. [Persian] M. Moshari, H. Didhkhani, K. Kh. Damghani, E. Abbasi, “A combined intelligent model to predict the golden points of stock prices,” Investment
knowledge, vol. 8, no 29, 2019. [Persian] A. Daie, O. M. Ebadati, B. Keyvan, “Application of web mining in forecasting the price direction of chemical products group in the stock exchange,”
Information and communication technology of Iran, vol. 11, no. 39-40, pp. 19-48, 2019. [Persian] J. Zhang, T. Yu-Fan, C. Wei, "Support vector regression with modified firefly algorithm for stock price forecasting," Applied Intelligence, vol. 49, no. 5, pp.
1658-1674, 2019. Z. Yu, Q. Lu, C. Yunjing, D.P. Milan, "Stock price forecasting based on LLE-BP neural network model," Physica A: Statistical Mechanics and its Applications, vol. 553, p. 124197, 2020.
J. Cao, J. Wang, "Stock price forecasting model based on modified convolution neural network and financial time series analysis," International Journal of Communication Systems, vol. 32, no. 12, p. e3987, 2019.
B.K. Gupta, K.M. Manas, H. Sarbeswara, "Survey on Stock Price Forecasting Using Regression Analysis," In Intelligent and Cloud Computing, pp. 147-156, 2021.

متن کامل:

دوره هفدهم، شماره پاییز و زمستان 1403

مجله فناوری اطلاعات در طراحی مهندسی

Information Technology in Engineering Design

http://sanad.iau.ir/journal/ited

ارائه راهکار برای پیش‌بینی قیمت سهام

به کمک تلفیق روش‏های تکامل تفاضلی و جنگل تصادفی

لادن ریاضی*

گروه مدیریت فناوری اطلاعات، دانشکده مدیریت و اقتصاد، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران *

(تاریخ دریافت: 07/05/1403 تاریخ پذیرش: 25/06/1403)

چکیده

پیش‌بینی قیمت سهام یک کار پیچیده است که برای قرن‌ها سرمایه‌گذاران و تحلیلگران مالی را مجذوب خود کرده است. با افزایش هوش مصنوعی و یادگیری ماشینی، محققان مدل‌های مختلفی را برای پیش‌بینی قیمت سهام، استفاده از داده‌های تاریخی و روند بازار توسعه داده‌اند. هدف این مدل‌ها شناسایی الگوها و همبستگی‌های بین شاخص‌های اقتصادی، اخبار بازار و قیمت سهام برای پیش‌بینی دقیق است. با وجود اینکه در زمینه‏ی پیش‌بینی قیمت سهام، تحقیقات گسترده‏ای صورت گرفته، ولی با این حال با افزایش استفاده از فناوری‏های نوین ضرروت انجام این فعالیت‏ها همچنان پابرجاست، در این مقاله روشی مبتنی بر تلفیق روش‏های تکامل تفاضلی و جنگل تصادفی برای پیش‌بینی قیمت سهام ارائه شده است. در روش پیشنهادی جنگل تصادفی می‌تواند به‌طور موثر قیمت‌های بازار سهام را با مدیریت و بررسی داده‌ها پیش‌بینی کند و روش تکامل تفاضلی با انتخاب بهترین مقادیر برای پارامتر‌های جنگل تصادفی به بهبود دقت پیش‌بینی‌های بازار سهام کمک می‌کند. نتایج حاصل از پیاده‌سازی این روش بر روی داده‌های شرکت AMD بیانگر این است که تا حدود میانگین 74% نسبت به روش‏های جنگل تصادفی، شبکه عصبی و رگرسیون خطی دارای کاهش خطای آموزشی و همچنین تا حدود میانگین 55% نسبت به روش‏های ذکرشده دارای کاهش خطای تست بوده است. این موضوع برتری و موثر بودن روش موردنظر نسبت به راهکارهای مقایسه‌شده را نشان می‌دهد.

کلمات کلیدی: جنگل تصادفی، تکامل تفاضلی، سری زمانی، یادگیری ماشین

*عهده‌دار مکاتبات:

لادن ریاضی

نشانی: گروه مدیریت فناوری اطلاعات، دانشکده مدیریت و اقتصاد، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، ایران

پست الکترونیکی: l.riazi@gmail.com

1- مقدمه

در حال حاضر در سرتاسر جهان، حجم بالایی از سرمایه‏ها از طریق بازار سهام معامله می‏شوند و تقریبا اقتصاد ملی هر کشوري با عملکرد بازار سهام آن‏ها در ارتباط است و از آن تاثیر می‏پذیرد. علاوه بر این، اخیرا این گونه بازارها به ابزارهاي سرمایه‌گذاري سرمایه‌گذاران حرفه‌اي و مبتدي تبدیل شده است و تمامی اقشار جامعه را به خود جذب می‏کند [1]. به این ترتیب بازار سهام، نقش اساسی در سازماندهی اقتصادی و اجتماعی یک کشور ایفا می‏کند [2]. معاملات بازار سهام، فعالیتی است که در آن سرمایه‌گذاران برای تصمیم‌گیری موثر به اطلاعات سریع و دقیق نیاز دارند. از آنجا که سهام بسیاری در بورس معامله می‏شوند، عوامل متعددی بر روند تصمیم‌گیری تاثیر می‏گذارد. علاوه بر این، رفتار قیمت سهام نامشخص و پیش‌بینی آن دشوار است. به همین دلایل، پیش‌بینی قیمت سهام یک فرایند مهم و چالش‌برانگیز است [3].

سرمایه‌گذاران این بازار همواره می‏خواهند از روند بعدي قیمت‏ها مطلع شوند. به این ترتیب محققان در صدد یافتن روش‌هایی هستند که بتوانند با پیش‌بینی آتی قیمت سهام، سود سرمایه‌گذاران را افزایش دهند. در این راستا پیدا کردن روش‌هاي مناسب و مبتنی بر اصول علمی در تعیین قیمت آینده سهام برای سرمایه‌گذاران ضروری به نظر می‏رسد [4].

این یک واقعیت انکار ناپذیر است که قیمت سهام به شدت به اخبار، رویدادها و عوامل کلان اقتصادی وابسته است و پیش‌بینی قیمت لحظه‌ای بعدی را به چالش می‌کشد. قیمت تنها بازتابی از احساسات یک بازار یا عملکرد یک شرکت است که به دلیل پیچیدگی متغیرهای اساسی نمی‌توان آن را به‌طور دقیق پیش‌بینی کرد. حتی با الگوریتم‌های یادگیری ماشین، پیش‌بینی دقیق قیمت سهام دشوار است و بهترین چیزی که می‌توان به آن امیدوار بود، شناسایی الگوها یا روندهایی است که ممکن است به تحلیل بازار کمک کند. با این حال، با وجود این محدودیت‌ها، بسیاری از موسسات مالی و محققان از تکنیک‌های یادگیری ماشینی برای پیش‌بینی قیمت سهام استفاده می‌کنند. یکی از دلایل احتمالی این موضوع این است که الگوریتم‌های یادگیری ماشینی می‌توانند الگوهایی را در داده‌های تاریخی شناسایی کنند که ممکن است برای انسان آشکار نباشد. این الگوها می‌توانند برای تجزیه و تحلیل بازار، ارزیابی ریسک و یا حتی تولید سیگنال‌های تجاری مفید باشند. مدل‌های یادگیری ماشین می‌توانند چندین منبع داده از جمله اخبار، رسانه‌های اجتماعی و معیارهای مالی را ترکیب کنند، تا بینشی ایجاد کنند که ممکن است تنها از طریق تجزیه و تحلیل انسانی قابل دستیابی نباشد. به‌طور کلی، در حالی که یادگیری ماشین ممکن است راه‌حل قطعی برای پیش‌بینی قیمت سهام نباشد، اما همچنان می‌تواند ابزار ارزشمندی برای تجزیه و تحلیل رفتار بازار، شناسایی الگوها و بهینه‌سازی عملکرد پرتفوی باشد. با پذیرش محدودیت‌های یادگیری ماشین و ترکیب آن با تخصص انسانی، می‌توان استراتژی‌های سرمایه‌گذاری مؤثرتری ایجاد کرد.

با ظهور هوش محاسباتی در سه دهه گذشته، مدل‌های غیرخطی بیشتری که با تکنیک‏های شبکه‌های عصبی مصنوعی (ANN)، سیستم‌های عصبی فازی، تکنیک‌های تکاملی و غیره توانمند شده‌اند، توسط بسیاری از محققان برای پیش‌بینی بازار سهام پیشنهاد شده‌اند [5]. بسیاری از تکنیک‏های رایانه‏ای مبتنی بر یادگیری ماشین یا مدل‏های آماری برای برآورد تغییرات قیمت در بازار سهام استفاده شده‌اند [6]. تحقیقات نشان می‏دهد که الگوریتم‌های پیچیده و مدل‌های پیش‌بینی پیچیده و بهینه طراحی‌شده مبتنی بر روش‏های یادگیری ماشین و هوش مصنوعی، افراد را قادر می‌سازد تا قیمت‌های سهام آتی را با درجه بالایی از دقت پیش‌بینی کنند [7]. در این پژوهش برای نخستین بار از تلفیق روش‏های تکامل تفاضلی و جنگل تصادفی برای پیش‌بینی قیمت سهام بهره برده خواهد شد. با تلفیق این روش‏ها می‏توان امید به دستیابی به نتایج موثرتر در زمینه پیش‌بینی قیمت سهام داشت؛ لذا در صدد پاسخگویی به سوالات زیر هستیم:

§ چگونه می‏توان با استفاده از روش‏های جنگل تصادفی و روش تکامل تفاضلی راهکار مناسبی برای پیش‌بینی قیمت سهام ارائه داد؟

§ تاثیر استفاده از روش تکامل تفاضلی بر افزایش دقت نتایج روش جنگل تصادفی به چه میزان است؟

2- کارهای مرتبط

قولمز در مقاله‌ی [8]، یک شبکه عمیق LSTM بهینه‌شده با مدل بهینه‌سازی خرگوش‌های مصنوعی (ARO) برای پیش‌بینی قیمت سهام ایجاد کرد. در روش LSTM-ARO الگوریتم ARO، برای بهینه‌سازی فراپارامترهای مدل LSTM و بهبود دقت پیش‌بینی‌های بازار سهام استفاده شد. سهام شاخص DJIA به‌عنوان مجموعه داده استفاده شد که شامل 30 قیمت سهام مختلف است. نتایج نشان داد که LSTM-ARO بر سایر مدل های بررسی‌شده غلبه کرد. ژاو و همکاران در مقاله خود [9] یک مدل رابطه‌ای سری زمانی (TSRM) پیشنهاد کردند که اطلاعات زمان و رابطه را ادغام می‌کند. TSRM از داده‌های معاملات سهام برای به‌‌دست‌‌آوردن خودکار طبقه‌بندی سهام از طریق مدل K-means استفاده می‌کند و روابط سهام را استخراج می‌کند. اطلاعات سری زمانی استخراج‌شده با استفاده از حافظه کوتاه‌مدت بلندمدت (LSTM) و یک شبکه کانولوشن گراف (GCN)، برای پیش‌بینی قیمت سهام یکپارچه شد. این روش در بازارهای سهام شانگهای و شنژن چین مورد آزمایش قرار گرفت و نتایج حاکی از بهبود بازده انباشته به ترتیب 44 و 41 درصد بود.

هان و فو در مقاله‌ی خود [10] یک مدل حافظه کوتاه‌مدت دو جهته (Bi-LSTM) برای پیش‌بینی قیمت آتی سهام بر اساس قیمت‌های تاریخی آن پیشنهاد کردند. مدل Bi-LSTM برای داده‌های تاریخی قیمت سهام شرکت اپل اعمال شد و عملکرد آن با استفاده از میانگین مربعات خطا (MSE) ارزیابی شد. این مدل با MSE 0.00020 در مجموعه تست، عملکرد خوبی از خود نشان داد. در مقاله ژنگ و همکاران [11] عملکرد پیش‌بینی قیمت سهام در زمینه مالی با استفاده از مدل‌های جنگل تصادفی بر روی مجموعه داده‌های اپل، سامسونگ و جنرال الکتریک بررسی شد. طبقه‌بندی‌کننده تصادفی جنگل برای پیش‌بینی روند بلندمدت سهام به دقت قابل‌توجهی دست یافت و ‌توانست به دقت 85 تا 95 درصد برسد. بررسی‌های این تحقیق نشان داد که افزایش تعداد درختان تصمیم در یک جنگل تصادفی می‌تواند به نتایج پایدارتری منجر شود.

ژانگ و همکارانش[12] ، یک رویکرد جدید برای پیش‌بینی قیمت سهام با ترکیب رگرسیون بردار پشتیبان (SVR) و الگوریتم کرم شب‌تاب (FA) ارائه می‏دهد. نتایج تجربی نشان داد که در مقایسه با الگوریتم‏های دیگر، الگوریتم MFA پیشنهاد‌شده دارای عملکرد بهتری است. روش پیش‌بینی MFA-SVR می‏تواند به‌عنوان ابزاری موثر برای پیش‌بینی قیمت سهام در نظر گرفته شود. در مقاله‏ی یو و همکارانش[13] ، یک الگوریتم کاهش خطی ابعاد برای کاهش بعد عوامل موثر بر قیمت سهام انتخاب شده است. داده‏ها پس از کاهش ابعاد به‌عنوان متغیر ورودی جدید شبکه عصبی بازگشت به عقب برای تحقق پیش‌بینی قیمت سهام استفاده می‏شود. نتایج نشان داد که مدل شبکه عصبی LLE-BP که در این مقاله پیشنهاد شد، دارای دقت پیش‌بینی بالاتری در پیش‌بینی قیمت سهام است. در تحقیق کاو و وانگ [14] برای پیش‌بینی روند آینده فعالیت‏های مالی و شاخص سهام، از شبکه عصبی پیچشی (CNN) استفاده شد. در ابتدا، یک مدل پیش‌بینی شاخص سهام CNN ساخته شد، رابطه پارامترهای ساختاری مدل CNN مورد تجزیه و تحلیل قرار گرفت و یک الگوریتم مدل CNN پیاده‌سازی شد. در ادامه، تاثیر پارامترهای مدل بر نتایج پیش‌بینی مورد بحث قرار گرفت و مدل پیش‌بینی شاخص سهام بر اساس ماشین بردار پشتیبان SVM و CNN ایجاد شد. در نهایت، تجزیه و تحلیل تجربی انجام شد و نتایج نشان داد که هر دو مدل پیش‌بینی امکان‌پذیر و موثر هستند. در مقاله[6] ، یک رویکرد مبتنی بر شبکه عصبی عمیق برای پیش‌بینی اینکه آیا قیمت سهام در سال بعد یا در همان سه ماهه 25 درصد افزایش می‏یابد یا خیر، پیشنهاد شد. همچنین روش یادگیری عمیق با رویکردهای جنگل‏های تصادفی و ماشین تقویت گرادیان مقایسه شد. برای آزمایش روش پیشنهادی، پایگاه داده KIS-VALUE متشکل از شاخص قیمت سهام کامپوزیت کره برای دوره 2007 تا 2015 در نظر گرفته شد. روش پیشنهادی عملکرد رضایت‌بخشی را ارائه داد. در تحقیق [7]، طیفی از ده مدل رگرسیون یادگیری عمیق برای پیش‌بینی دقیق قیمت‌های آتی سهام یک شرکت مهم در بخش خودروی هند ارائه شد. نتایج به‌دست‌آمده نشان می‏دهد که مدل‌های CNN سریع‌تر هستند، در حالی که دقت بالاتری توسط مدل‌های LSTM به‌دست می‌آید. در تحقیق [5] بیان شده است که این مطالعه یک مقایسه نرمال‌شده بر روی عملکرد LSTM و GRU برای پیش‌بینی بازار سهام در شرایط یکسان انجام داد و به‌طور عینی اهمیت ترکیب احساسات اخبار مالی در پیش‌بینی بازار سهام را ارزیابی کرد. آزمایش‌ها نشان می‌دهد که اگر فقط از ویژگی‌های بازار سهام استفاده شود، هر دو LSTM و GRU در پیش‌بینی سهام شرایط یکسانی دارند. عملکرد LSTM و GRU برای پیش‌بینی قیمت سهام را می‏توان با ترکیب احساسات اخبار مالی با ویژگی‏های سهام به‌عنوان ورودی به‌طور قابل‌توجهی بهبود بخشید. در تحقیق [15] در مورد تکنیک‏های رگرسیون در زمینه‏ی پیش بینی قیمت سهام مطالعات جامعی انجام شده است. در این تحقیق برخی از روش‌های رگرسیون مناسب برای پیش‌بینی قیمت در بازار سهام مورد بررسی قرار گرفته است. نتیجه این تجزیه و تحلیل رگرسیون نشان داد که با استفاده از تعداد بیشتری از متغیرها و تکنیک‏های یادگیری ماشین یا تکنیک‌های علم داده نتایج به‌دست‌آمده بهبود قابل‌توجهی خواهد یافت.

در تحقیق بیلاح و همکاران[16] ، شبکه‌های حافظه کوتاه‌مدت بلندمدت (LSTM) در زمینه پیش‌بینی سری‌های زمانی تحلیل تجربی شد. این تحقیق مجموعه متنوعی از مجموعه داده‌های دنیای واقعی را تحت تاثیر قرار داد و به میانگین دقت پیش‌بینی 89.7 درصدی در پیش‌بینی‌های بازار مالی دست یافت که با حاشیه قابل‌توجهی از مدل‌های پایه بهتر بود. در مطالعه ارته و همکارانش [17]، بر روی پیش‌بینی جهت قیمت BTC/USD با استفاده از Random Forest به‌عنوان مدل پیش‌بینی و شاخص‌های فنی و الگوهای کندل استیک به‌عنوان متغیرهای ورودی تمرکز شد. نتایج نشان داد بهترین میانگین سودآوری به‌دست‌آمده 1.75٪ در هر عملیات بود. در ادامه در جدول 1 خلاصه‌ی نتایج و مشخصات تعدادی از جدیدترین کارهای انجام شده‌ی گذشته آورده شده است.

تحقیق	روش	مجموعه داده ها	ارزیابی
Gülmez, 2023	LSTM-ARO	سهام AXP سهام AMGN	0.907 R2 0.943 R2
Zhao et al, 2023	TSRM	بازارهای سهام شانگهای بازارهای سهام شنژن چین	بازده انباشته 44 درصد بازده انباشته 41 درصد
Han & Fu, 2023	Bi-LSTM	شرکت اپل	MSE 0.00020
Zheng et al, 2023	Random Forest	مجموعه داده‌های اپل، سامسونگ و جنرال الکتریک دقت 85 تا 95	دقت 85 تا 95 درصد
Billah et al, 2023	LSTM	مجموعه متنوعی از مجموعه داده‌های دنیای واقعی	میانگین دقت 89.7 درصد
Orte et al, 2023	Random Forest	BTC/USD	میانگین سودآوری 1.75٪

جدول 1: خلاصه‌ی تعدادی از کارهای انجام‌شده‌ی گذشته

3- روش پیشنهادی

سیستم پیشنهادی این تحقیق برای پیش‌بینی قیمت سهام ترکیب روش‏های جنگل تصادفی و الگوریتم تکامل تفاضلی می باشد. در این تحقیق روش‌های یادگیری ماشین مختلف مورد بررسی قرار گرفت و از بین آن‌ها روش جنگل تصادفی در ترکیب با روش‌های تکاملی به نتایج بهتری دست یافت. جنگل تصادفی برای مدیریت داده‌های با ابعاد بالا که در مجموعه داده های مالی رایج است، مناسب می‌باشد و می‌تواند مقادیر گم‌شده را با انتخاب ویژگی‌های موثر و نمونه‌ها کنترل و روابط غیرخطی بین متغیرها را ثبت کند. جنگل تصادفی نسبت به سایر الگوریتم‌های یادگیری ماشین کمتر مستعد بیش برازش است که باعث می‌شود در برابر نویز و خطا در داده‌های آموزشی مقاوم‌تر باشد.

الگوریتم‌های تکامل تفاضلی در این تحقیق بهترین مقادیر را برای پارامتر‌های جنگل تصادفی انتخاب می‌کند. وقتی نوبت به آموزش مدل جنگل تصادفی می‌رسد، انتخاب بهترین هایپرپارامترها می‌تواند گامی مهم در دستیابی به عملکرد بهینه باشد. هایپرپارامترها، پارامترهایی هستند که قبل از آموزش مدل تنظیم می‌شوند و می‌توانند به‌طور قابل‌توجهی بر دقت، کارایی محاسباتی و استحکام مدل تاثیر بگذارند. تنظیم هایپرپارامترها، یک مرحله حیاتی در یادگیری ماشین است و انتخاب بهترین هایپرپارامترها می‌تواند فرآیندی زمان‌بر و فشرده باشد. با استفاده از تکنیک‌های بهینه‌سازی مانند تکامل تفاضلی (DE)، می‌توان این فرآیند را خودکار کرد، به‌طوری که بهترین هایپرپارامترها با کارایی بیشتری پیدا شوند. دلیل استفاده از الگوریتم‌های تکامل تفاضلی برای انتخاب پارامترهای موثر این است که این الگوریتم یک الگوریتم بهینه‌سازی محبوب است که به‌طور گسترده در زمینه‌های مختلف از جمله مالی، مهندسی و علوم کامپیوتر استفاده می‌شود. این روش یک نوع الگوریتم بهینه‌سازی مبتنی بر جمعیت است که به‌ویژه در حل مسائل پیچیده بهینه‌سازی موثر است. استحکام، انعطاف‌پذیری، کارایی و سهولت اجرا آن را به انتخابی محبوب تبدیل کرده است. این روش می تواند بهترین هایپرپارامترها را در طیف وسیعی از احتمالات جست‌وجو کند و به سرعت راه‌حل‌های خوبی پیدا کند.

با ترکیب این روش‌ها می‌توان از نقاط قوت هر دو رویکرد استفاده کرد و مدل‌های دقیق و قوی‌تری ایجاد کرد که می‌توانند روابط پیچیده و داده‌های داری نویز را مدیریت کند.

بخش اصلی سیستم پیشنهادی، جنگل تصادفی است که الگو‏های موجود در داده‏ها را با دریافت داده‏های آموزشی جست‌وجو می‏کند. پس از پایان مرحله‏ی آموزش، سیستم می‏تواند برای پیش‌بینی قیمت سهام به‌کار گرفته شود. برای افزایش کارایی روش پیشنهادی از الگوریتم تکامل تفاضلی برای بهبود عملکرد جنگل تصادفی استفاده می‏شود. همان‌طور که بیان شد در این سیستم الگوریتم تکامل تفاضلی به دنبال بهینه کردن پارامتر‏های جنگل تصادفی می‏باشد. به این ترتیب نتایج به‌دست‌آمده مطلوب‌تر خواهد بود. نحوه‏ی ترکیب الگوریتم تکامل تفاضلی و جنگل تصادفی در شکل 1 آورده شده است.

شکل 1: نحوه‏ی ترکیب الگوریتم تکامل تفاضلی و جنگل تصادقی

همان‌طور که در شکل 1 نشان داده شده است، در سیستم پیشنهادی این تحقیق تعیین مقادیر مناسب برای پارامترهای جنگل تصادفی به وسیله‏ی راه‌حل بهینه‏ی الگوریتم تکامل تفاضلی تعیین می‏شود. در الگوریتم تکامل تفاضلی، هر راه‌حل که در جمعیت اولیه قرار دارد، مقادیر مشخص برای پارامتر‏های جنگل تصادفی را نشان می‏دهد و در حقیقت معرف یک جنگل تصادفی خاص می‏باشد. هدف الگوریتم تکامل تفاضلی، پیدا کردن مناسب‌ترین راه‌حل ممکن می‏باشد، به‌طوری که جنگل تصادفی متناظر با آن بهترین عملکرد را داشته باشد.

برای رسیدن به این هدف، در ابتدای کار این الگوریتم، راه‌حل‏های اولیه به‌صورت تصادفی ایجاد می‏شوند و به این ترتیب جمعیت اولیه مقداردهی می‏شود. برای محاسبه‏ی میزان تناسب هر راه‌حل در سیستم پیشنهادی، جنگل تصادفی متناظر با آن راه‌حل ساخته می‏شود و دقت جنگل تصادفی متناظر تعیین می‏گردد. در مرحله‏ی بعد، راه‌حل‏های جدید با اعمال عملیات انتخاب، جهش و بازترکیبی ساخته می‏شود و تناسب آن مشخص خواهد شد و بهترین راه‌حل‏ها به‌عنوان جمعیت در هر تکرار نگه داشته می‏شوند. مراحل ساخت راه‌حل‏های جدید تا زمانی که شرایط توقف الگوریتم خاتمه یابد، تکرار خواهد شد. در نهایت بهترین راه‌حل موجود به‌عنوان نتیجه‏ی نهایی ارائه خواهد شد و جنگل تصادفی متناظر با آن ساخته شده و با داده‏های آموزش، آموزش می‏بیند. در نهایت دقت به‌دست‌آمده از این جنگل تصادفی با داده‌های تست به‌عنوان دقت سیستم پیشنهادی ارائه می‏شود.

4- معرفی و آماده‌سازی داده‌ها

برای پیاده‌سازی راهکار مورد در این پژوهش، نیاز به مجموعه داده‏های سهام شرکت‌ها می‏باشد. از این رو برای تهیه داده‏های مورد نیاز، از بسترهای آنلاین بهره برده شده است. یکی از این بسترها، وب سایت شناخته‌شده yahoo می‏باشد که در یکی از زیر مجموعه‏های خود، خدمات مالی را نیز ارائه می‏دهد. بخشی از خدمات شامل اطلاعات سهام شرکت‏های مطرح می‏باشد. برای استخراج این داده‌ها، واسط‏های کاربری مناسب موجود می‏باشد که می‏توان از آن‏ها بهره برد. یکی از این واسط‌ها، کتابخانه pandas_datareader می‏باشد که امکان بارگذاری داده‏های سهام شرکت‏های موردنظر را در بازه‌ی زمانی مشخص در محیط پیاده‌سازی پایتون، فراهم می‏نماید.

همان‌طور که مطرح شد، با استفاده از رابط کاربری معرفی‌شده، می‏توان اطلاعات سهام شرکت‏های موردنظر در بازه‌ی زمانی مشخص از بخش مالی وب‌سایت yahoo استخراج نمود. بازه‌ی زمانی مورد بررسی در این پژوهش، محدود به سال‏های 2018 تا ابتدای 2022 می‏باشد. نمایی از اطلاعات استخراج‌شده برای شرکت AMD در جدول 2 نشان داده شده است.

جدول 2: نمایی از اطلاعات استخراج‌شده برای شرکت AMD

Date	High	Low	Open	Close	Volume
2018-01-02	11.020000	10.340000	10.420000	10.980000	44146300
2018-01-03	12.140000	11.360000	11.610000	11.550000	154066700
2018-01-04	12.430000	11.970000	12.100000	12.120000	109503000
2018-01-05	12.220000	11.660000	12.190000	11.880000	63808900
2018-01-08	12.300000	11.850000	12.010000	12.280000	63346000
...	...	...	...	...	...
2021-12-23	149.020004	143.850006	143.889999	146.139999	48653800
2021-12-27	154.889999	147.250000	147.509995	154.360001	53296400
2021-12-28	156.729996	151.380005	155.880005	153.149994	58699100
2021-12-29	154.339996	147.289993	152.820007	148.259995	51300200
30-12-2021	148.850006	144.850006	147.440002	145.149994	44358000

برای استفاده موثرتر از این داده‏ها در یادگیری ماشین، باید فعالیت‌هایی پیرامون آماده‌سازی آن‏ها انجام داد که در ادامه به بیان این فعالیت‏ها می‏پردازیم.

شیفت داده: با توجه به اینکه داده‏های مورد استفاده در این پژوهش در قالب سری زمانی می‏باشند، نیاز به فرآیند شیفت یا جابه‌جایی به میزان روزهای مورد نظر برای پیش‌بینی می‏باشد. این فرآیند شیفت، باید بر روی ویژگی هدف که قصد پیش‌بینی آن را داریم، صورت گیرد. به‌طور معمول در داده‏های سهام، میزان قیمت پایانی یا همان ویژگی close به‌عنوان ویژگی هدف که قصد پیش‌بینی آن را داریم، تعیین می‏شود. بنابراین فرآیند شیفت بر روی ویژگی close و میزان یک واحد صورت می‏پذیرد. با توجه به اینکه میزان شیفت معادل یک واحد تعیین شده است، مدل ساخته‌شده می‏تواند برای تخمین قیمت close برای روز بعد، مورد استفاده قرار گیرد.

نرمال سازی: یکی از فرآیندهای لازم برای آماده‌سازی داده‏ها پیش از مدل‌سازی، نرمال‌سازی داده‏ها می‏باشد. نرمال‌سازی داده‏ها به تعیین تغییر بازه‏ی تغییرات آن‌ها در بازه‏ای مشخص می‏باشد. این امر سبب می‏شود که مانع از گرایش الگوریتم یادگیری به سمت ویژگی‌هایی با بازه تغییرات زیاد شود.

حذف ویژگی: در صورتی که در داده‏های مورد استفاده، ستون‏های مازادی وجود داشته باشد که کمکی به مدل‌سازی نمی‏کند، می‏توان آن‏ها را حذف نمود.

استخراج ویژگی‏های تکنیکال: با توجه به اینکه داده‏های استخراج‌شده برای سهام، به‌طور معمول محدود به موارد Open، High، Low، Close و Volume می‏باشد، می‏توان برای غنی‌تر کردن داده‏های مورداستفاده، ویژگی‌های دیگری را بر مبنای همین چند ویژگی پایه استخراج نمود. فرآیند استخراج این ویژگی‏ها پیرامون داده‏های سهام به کمک تحلیل تکنیکال امکان‌پذیر است. برای این منظور کتابخانه‏های متعددی در زبان پایتون فراهم شده است که در این پژوهش از این کتابخانه‏ها برای استخراج ویژگی‏های تکنیکال استفاده خواهد شد.

بخشی از ویژگی‏های استخراج‌شده برای داده‏های شرکت AMD در جدول 3 نشان داده شده است.

جدول 3: بخشی از ویژگی‏های استخراج‌شده برای داده‏های شرکت AMD

momentum_wr	...	volume_cmf	volume_obv	volume adi	Adj Close	Volume	Close	Open	Low	High	Date
77.941102	...	2.558822	44146300	1.129625e+08	10.980000	44146300	11.550000	10.420000	10.340000	11.020000	2018-01-02
1.111136-	...	1.307322	198213000	2.591282e+08	11.550000	154066700	12.120000	11.610000	11.360000	12.140000	2018-01-03
26.315797-	…	0.346996	88710000	1.067761e+08	12.120000	109503000	11.880000	12.100000	11.970000	12.430000	2018-01-04
7.177060-	...	0.495951	152518900	1.842582e+08	11.880000	63808900	12.280000	12.190000	11.660000	12.220000	2018-01-05
…	…	…	...	...	...	...	...	...	...	...	...
32.414866-	...	0.111809-	2030391500	1.186508e+10	153.149994	58699100	148.259995	155.880005	151.380005	156.729996	2021-12-28
44.316902-	…	0.016971-	1979091300	11.178263e+10	148.259995	51300200	145.149994	152.820007	147.289993	154.339996	2021-12-29

تقسیم داده‌ها: داده‏های مورد استفاده باید به مجموعه‏های مجزا برای آموزش و آزمون تقسیم شوند. داده‏های آموزش برای فرآیند آموزش الگوریتم، مورد استفاده قرار می‏گیرد و داده‏های آزمون برای ارزیابی دقت الگوریتم بعد از آموزش مورد استفاده قرار می‏گیرد. تعیین نسبت این تقسیم می‏تواند متفاوت باشد، ولی معمولا قسمت بیشتر داده‏ها برای آموزش و بخش باقی‌مانده برای آزمون لحاظ می‏شود.

5- نتایج پیاده‌سازی

برای پیاده‌سازی راهکار موردنظر در این پژوهش از زبان برنامه‌نویسی پایتون و کتابخانه‏های هوش مصنوعی مطرح در این زبان بهره برده شده است. در ادامه‌ی این بخش نتایج به‌دست‌آمده از پیاده‌سازی سیستم پیشنهادی این تحقیق و روش‌های پایه آورده شده است.

نتایج جنگل تصادفی: در این بخش به بررسی اعمال روش جنگل تصادفی بر روی داده‏های استخراج‌شده می‏پردازیم. روش جنگل تصادفی دارای پارامترهای متعددی می‏باشد که در این قسمت از حداقل پارامترها برای ساخت مدل یادگیری بهره برده خواهد شد. در بخش بعدی این پژوهش به بهبود این پارامترها پرداخته خواهد شد.

در صورتی که پارامترهای روش جنگل تصادفی به‌صورت نامناسب تنظیم شوند، این روش قادر به پیش‌بینی قیمت سهام به شکل معقول نمی‏باشد. به‌عنوان مثال، شکل 2 نمونه هایی از مواردی است که روش جنگل تصادفی نتوانسته است پیش‌بینی مناسبی ارائه دهد. خط آبی در شکل‏های مذکور، بیانگر روند تغییرات قیمت سهام شرکت AMD می‏باشد و خط نارنجی بیانگر پیش‌بینی انجام شده توسط روش جنگل تصادفی می‏باشد.

$C:\Users\hesam-ssd\Desktop\download.png$ $C:\Users\hesam-ssd\Desktop\download (1).png$

شکل 2: پیش‌بینی نامناسب قیمت سهام شرکت AMD توسط روش جنگل تصادفی

در صورت تنظیم مناسب پارامترهای شاهد نتایج بهتری خواهیم بود. در شکل 3، با در نظر گرفتن پارامترهای پیش فرض برای روش جنگل تصادفی و استفاده از کل مجموعه ویژگی‏های آماده‌شده، به میزان خطای 001/0 برای مجموعه داده آموزش دست یافته‌ایم.

$C:\Users\hesam-ssd\Desktop\download (2).png$

شکل 3: نتیجه حاصل از اعمال پارامترهای پیش‌فرض برای روش جنگل تصادفی و استفاده از کل مجموعه ویژگی‏ها برای پیش‌بینی قیمت سهام شرکت AMD

اما نکته قابل‌توجه در این آزمون این است که علی‌رغم دقت بالا در فرآیند آموزش، دقت در نتایج تست، نامناسب است. شکل 4 نشان‌دهنده نتیجه اجرا مدل آموزش‌دیده برای داده‏های تست می‏باشد.

$C:\Users\hesam-ssd\Desktop\download (3).png$

شکل 4: نتیجه اجرا مدل آموزش‌دیده برای داده‏های تست

علت این نتایج نامناسب، به ماهیت داده‏های مورد بررسی مربوط می‏شود. در صورتی که داده‏های سری زمانی، در طول زمان حالت ایستا¹ نداشته باشند، نمی‏توان مدل مناسبی برای پیش‌بینی آن‏ها ساخت. منظور از ایستا بودن داده‏های سری زمانی از نظر شهودی این است که در طول زمان دارای روندی نسبتا تکراری باشند و نظر محاسباتی به این معنی است که مفاهیم آماری نظیر میانگین، واریانس و کوواریانس باید در طول زمان، ثابت باشد. در بخشی بعدی، تغییراتی بر روی داده‏ها اعمال می‏شود تا داده‏های مورد بررسی به‌صورت ایستا تبدیل شوند.

نتایج جنگل تصادفی برای داده‌های ایستا شده: از بین روش‏های مطرح شده برای ایستا‌سازی داده‏ها با توجه به این که راه‌حل‏های لگاریتمی و ریشه‌گیری برای اعداد منفی کارایی ندارد؛ در این پژوهش از روش محاسبه اختلاف داده‏ها در طول سری زمانی استفاده شده است. در این روش، به جای استفاده از داده‏های اصلی، از اختلاف مقدار داده‏ها در واحد زمانی جاری و واحد زمانی بعد استفاده می‏شود. شکل 5 نتیجه حاصل از آزمون با روش جنگل تصادفی برای داده‏های ایستا شده را نشان می‏دهد.

$C:\Users\hesam-ssd\Desktop\download (2).png$

شکل5: نتیجه حاصل از آزمون با روش جنگل تصادفی برای داده‏های ایستا شده

نتایج سیستم پیشنهادی (ترکیب جنگل تصادفی و تکامل تفاضلی): با توجه به اینکه روش جنگل تصادفی دارای پارامترهای متعددی می‏باشد و هر این از این پارامترها می‏توانند مقادیر متعددی بپذیرند، بنابراین باید راهکاری برای تعیین مناسب این پارامترها برای پیش‌بینی قیمت سهام ارائه نمود. همچنین با توجه به اینکه، تعداد ویژگی‏های مورد بررسی در این پژوهش با توجه به اضافه شدن ویژگی‏های تکنیکال نسبتا زیاد می‏باشد، می‏توان فرآیند انتخاب ویژگی را نیز لحاظ نمود. در این بخش، با بهره‌گیری از روش تکامل تفاضلی، به‌طور همزمان هم ساختار جنگل تصادفی و هم تعیین زیرمجموعه مناسب مورد بررسی قرار می‏گیرد. شکل 6 نشان‌دهنده روند بهبود میزان خطا در داده‏های تست در طول اجرای روش تکامل تفاضلی می‏باشد.

$C:\Users\hesam-ssd\Desktop\download.png$

شکل 6: روند بهبود میزان خطا در داده‏های تست در طول اجرای روش تکامل تفاضلی

بهترین نتیجه حاصل در فرآیند اجرای روش تکامل تفاضلی، برای داده‏های آموزش دارای میزان خطای 0001470716/0 و برای داده‏های تست دارای میزان خطای 000571856/0 می‏باشد. همچنین پارامترهای روش جنگل تصادفی که منجر به دست یابی به این نتیجه شده است در جدول 4 آورده شده اند.

جدول 4: بخشی از ویژگی‏های استخراج‌شده برای داده‏های شرکت AMD

پارامتر	Criterion	max_depth	min_samples_leaf	min_samples_split	n_estimators
پارامتر	تابع عملکرد اندازه گیری کیفیت فرآیند تقسیم برای ساخت جنگل	حداکثر عمق درخت	حداقل تعداد نمونه مورد نیاز برای قرار گرفتن در یک گره برگ	حداقل تعداد نمونه مورد نیاز برای تقسیم یک گره داخلی	تعداد درختان جنگل
مقدار	'mae'	3	2	6	30

همچنین برخی از ویژگی‏های مهم استفاده‌شده برای دستیابی به این نتیجه و مفهوم هر یک از آن‌ها به‌صورت زیر می‏باشد:

· High: بالاترین قیمتی که یک سهم در طول روز معاملاتی با آن معامله شد.

· Open: قیمت در دوره شروع معاملات

· Adj Close: قیمت بسته شدن پس از تعدیل برای همه تقسیمات قابل اجرا و تقسیم سود

· volume_cmf: یک شاخص تحلیل تکنیکال است که برای اندازه‌گیری حجم جریان پول در یک دوره زمانی معین استفاده می‏شود.

· volume_sma_em: میانگین قیمت در دوره مشخص شده

· volatility_atr: میانگین دامنه‏های واقعی در دوره مشخص شده

· momentum_kama: میزان افزایش یا کاهش قیمت سهام را اندازه‌گیری می‏کند

مقایسه‌ی روش پیشنهادی و روش‌های پایه: مقایسه نتایج حاصل از راهکار پیشنهادی و سایر روش‏های پایه از جمله روش جنگل تصادفی، شبکه عصبی و رگرسیون خطی در جدول 5 نشان داده شده است. با توجه به جدول 4، به ترتیب روش‏های جنگل‏های تصادفی، شبکه عصبی و رگرسیون خطی به میزان 9/74%، 7/50% و 6/96% نسبت به روش پیشنهادی دارای خطای آموزشی و همچنین به ترتیب به میزان 5/37%، 4/30% و 9/98% نسبت به روش پیشنهادی دارای خطا تست می باشند.

جدول 5: مقایسه نتایج حاصل از راهکار پیشنهادی و سایر روش‌ها

روش	میزان خطای آموزش	درصد میزان خطای آموزش	میزان خطای تست	درصد میزان خطای تست
جنگل تصادفی (پارامترهای پیش‌فرض)	0.0005861	74.9	0.000915	37.5
شبکه عصبی	0.0002987	50.7	0.000821	30.4
رگرسیون خطی	0.0043523	96.6	0.0052316	98.9
روش پیشنهادی	0.0001470	-	0.000571	-

6- نتیجه‌گیری

پیش‌بینی قیمت سهام به دلیل پیچیدگی و عدم قطعیت آن به یک موضوع بسیار چالش‌برانگیز تبدیل شده است. برای رفع این مشکل که پیامدهای اقتصادی قابل‌توجهی دارد، تکنیک‌های مختلفی توسط محققان توسعه داده شده است. رویکردهای مبتنی بر یادگیری ماشین به‌عنوان یکی از امیدوارکننده‌ترین تکنیک‌ها در این زمینه ظاهر شده‌اند. برای پیش‌بینی بهتر قیمت سهام و سپس ارائه پیشنهادهای معقول به سهامداران، این تحقیق یک مدل ترکیبی مبتنی بر تکنیک‏های جنگل تصادفی و روش تکامل تفاضلی پیشنهاد کرده است. برای به‌دست‌آوردن نتایج مناسب در این تحقیق ایستاسازی داده‏ها انجام شده است. برای انجام این کار به جای استفاده از داده‏های اصلی، از اختلاف مقدار داده‏ها در واحد زمانی جاری و واحد زمانی بعد استفاده شده است که تاثیر قابل‌توجهی در نتایج داشته است. مدل مورد استفاده با استفاده از روش تکامل تفاضلی توانسته پارامتر‏های جنگل تصافی را به خوبی تنظیم کند. نتایج پیاده‌سازی سیستم پیشنهادی و مقایسه‏ی آن با روند تغییرات قیمت سهام دقت مناسب سیستم پیشنهادی را نشان می‏دهد. در ادامه به بررسی پرسش‏های پژوهش پرداخته می‏شود:

1-چگونه می‏توان با استفاده از روش‏های جنگل تصادفی و روش تکامل تفاضلی راهکار مناسبی برای پیش‌بینی قیمت سهام ارائه داد؟

با فرض آن که بین داده‌های جمع‌آوری‌شده برای پیش‌بینی قیمت سهام رابطه‌هایی وجود دارد که قابل استخراج است و با در نظر گرفتن پارامترهای پیش فرض برای روش جنگل تصادفی و استفاده از کل مجموعه ویژگی‏های آماده شده، به میزان خطای 001/0 برای مجموعه داده آموزش دست یافته‌ایم.

بهترین نتیجه حاصل در فرآیند اجرای روش تکامل تفاضلی، برای داده‏های آموزش دارای میزان خطای 0001470716/0 و برای داده‏های آزمون دارای میزان خطای 000571856/0 می‏باشد. همچنین با توجه به اینکه روش جنگل تصادفی دارای پارامترهای متعددی می‏باشد و هر این از این پارامترها می‏توانند مقادیر متعددی بپذیرند، بنابراین باید راهکاری برای تعیین مناسب این پارامترها برای پیش‌بینی قیمت سهام ارائه نمود که با تنظیم مناسب پارامترها و ایستاسازی داده‏ها شاهد نتایج بهتری بودیم.

2-تاثیر استفاده از روش تکامل تفاضلی بر افزایش دقت نتایج روش جنگل تصادفی به چه میزان است؟

با فرض اینکه اعمال روش تلفیقی مبتنی بر جنگل تصادفی به تکامل تفاضلی می‏تواند منجر به بهبود نتایج در زمینه پیش‌بینی قیمت سهام شود. مدل مورد استفاده در این تحقیق با استفاده از روش تکامل تفاضلی توانسته پارامتر‏های جنگل تصافی را به درستی تنظیم کند و نتایج حاصل از این تحقیق بیانگر این است که استفاده از تلفیق روش‏های جنگل تصادفی و روش تکامل تفاضلی به این صورت که روش تکامل تفاضلی برای فرآیند انتخاب ویژگی و بهینه‌سازی پارامترها مورد استفاده قرار بگیرد و می‏تواند به نتایج مناسبی در حوزه پژوهش دست یافت. همچنین با توجه به اینکه، تعداد ویژگی‏های مورد بررسی در این پژوهش با توجه به اضافه شدن ویژگی‏های تکنیکال، نسبتا زیاد می‏باشد، می‏توان فرآیند انتخاب ویژگی را نیز لحاظ نمود. بهترین تاثیر و نتیجه حاصل در فرآیند اجرای روش تکامل تفاضلی، برای داده‏های آموزش دارای میزان خطای 0001470716/0 و برای داده‏های آزمون دارای میزان خطای 000571856/0 می‏باشد.

به‌طور کلی نتایج حاصل از پیاده‌سازی روش پیشنهادی، بیانگر برتری و بهبود روش مورد نظر نسبت به راهکارهایی نظیر، جنگل تصادفی، شبکه عصبی و رگرسیون خطی بوده است.

شایان ذکر است در این پژوهش به پیش‌بینی قیمت سهام به کمک تلفیق روش‏های جنگل تصادفی و الگوریتم تکامل تفاضلی پرداخته شد. برای ادامه این پژوهش و بررسی راهکارهای بیشتر می‏توان از سایر روش‏های تکاملی برای بهبود ساختار روش جنگل تصادفی و انتخاب زیرمجموعه داده‏ها پرداخت. همچنین به جای استفاده از راهکار جنگل تصادفی، می‏توان از سایر راهکارهای یادگیری ماشین و یادگیری عمیق بهره برد و کارایی آن‌ها را مورد بررسی قرار داد. از جمله این راهکارهای یادگیری ماشین می‏توان به شبکه عصبی، درخت تصمیم، نایو بیز و ماشین بردار پشتیبان اشاره کرد. همچنین تلفیق نتایج این روش‏ها با استفاده از الگوریتم‌هایی نظیر رای‌گیری و پشته‌سازی نیز می‏تواند مورد توجه پژوهشگران قرار گیرد.

با توجه به در دسترس بودن داده‏های مورد نیاز برای پیاده‌سازی، به‌طور مشخص داده‏های سهام شرکت ها، محدودیت به خصوصی برای این پژوهش وجود نداشت. البته برای گسترش نتایج این پژوهش برای داده‏های سهام بازار بورس تهران، به وجود API لازم برای دسترسی به داده‏های سهام شرکت‏های داخلی در بازار بورس نیاز است.

مراجع

[1] B.M. Blau, "Income inequality, poverty, and the liquidity of stock markets," Journal of Development Economics, vol. 130, pp.113–126, 2017.

[2] G. Kumar, J. Sanjeev, S.P. Uday, "Stock market forecasting using computational intelligence: A survey," Archives of Computational Methods in Engineering, 1-33, 2020.

[3] M. Obthong, T. Nongnuch J. Watthanasak, W. Gary, "A survey on machine learning for stock price prediction: algorithms and techniques," 63-71, 2020.

[4] N. Forouzanmanesh, Stock price prediction using expert opinion and fuzzy-neural system, Master's thesis, University of Qom, Seattle, 2016. [Persian]

[5] T.B. Shahi, S. Ashish, N. Arjun, W. Guo, "Stock price forecasting with deep learning: A comparative study," Mathematics, vol. 8, no. 9, p. 1441, 2020.

[6] S.S. Roy, C. Rohan, C.L. Kun, S. Concetto, M. Behnam, "Random Forest, gradient boosted machines and deep neural network for stock price forecasting: a comparative analysis on South Korean companies," International Journal of Ad Hoc and Ubiquitous Computing, vol. 33, no. 1, 62-71, 2020.

[7] J. Sen, M. Sidra, "Accurate stock price forecasting using robust and optimized deep learning models, " arXiv preprint arXiv:2103.15096, 2021.

[8] B. Gülmez, “Stock price prediction with optimized deep LSTM network with artificial rabbits optimization algorithm,”.Expert Systems with Applications, 227, p.120346, 2023.

[9] C. Zhao, P. Hu, X. Liu, X. Lan, H. Zhang, “Stock market analysis using time series relational models for stock price prediction,” Mathematics, 24;11(5):1130, 2023.

[10] C. Han, X. Fu, “Challenge and opportunity: deep learning-based stock price prediction by using Bi-directional LSTM model,” Frontiers in Business, Economics and Management, 2;8(2):51-4, 2023.

[11] J. Zheng, D. Xin, Q. Cheng, M. Tian, L. Yang, “The Random Forest Model for Analyzing and Forecasting the US Stock Market in the Context of Smart Finance,” arXiv preprint arXiv:17194, 2024.

[12] J. Zhang, T. Yu-Fan, C. Wei, "Support vector regression with modified firefly algorithm for stock price forecasting," Applied Intelligence, vol. 49, no. 5, pp. 1658-1674, 2019.

[13] Z. Yu, Q. Lu, C. Yunjing, D.P. Milan, "Stock price forecasting based on LLE-BP neural network model," Physica A: Statistical Mechanics and its Applications, vol. 553, p. 124197, 2020.

[14] J. Cao, J. Wang, "Stock price forecasting model based on modified convolution neural network and financial time series analysis," International Journal of Communication Systems, vol. 32, no. 12, p. e3987, 2019.

[15] B.K. Gupta, K.M. Manas, H. Sarbeswara, "Survey on Stock Price Forecasting Using Regression Analysis," In Intelligent and Cloud Computing, pp. 147-156, 2021.

[16] M.M, Billah, A. Sultana, F. Bhuiyan, M.G. Kaosar, “Stock price prediction: comparison of different moving average techniques using deep learning model,” Neural Computing and Applications, 36(11), pp.5861-5871, 2024.

[17] F. Orte, J. Mira, M.J. Sánchez, P. Solana, “A random forest-based model for crypto asset forecasts in futures markets with out-of-sample prediction,” Research in International Business and Finance. 1;64:101829, 2023

[1] stationary

مقالات مرتبط

خوشه‌بندی مبتنی بر ماشین بردار پشتیبان دوقلو به منظور انتخاب ویژگی در مساله دسته‌بندی داده‌های ریزآرایه
تاریخ چاپ : 1398/06/01
استفاده از روش بهینه‌سازی ازدحام گربه‌ها به منظور مکان‌یابی گره در شبکه حسگر بی‌سیم
تاریخ چاپ : 1397/12/01
استخراج ویژگی از سیگنال‌های مغزی درسیستم‌های ارتباط مغز – رایانه به منظور کنترل بستن پنجه دست با روش الگوی فضایی مشترک
تاریخ چاپ : 1397/12/01
کنترل مد لغزشی ترمینال جهت کنترل خطای موقعیت عرضی خودرو با رویکرد کاهش چترینگ
تاریخ چاپ : 1397/12/01
سیستم امنیتی فازی دو اولویتی برای تمایز بین حمله منع سرویس و ازدحام در شبکه حسگر بدن
تاریخ چاپ : 1397/12/01
طراحی دو ماژول هسته‌ای برای محاسبه اتوماتیک سطح مقطع‌های رادیوایزوتوپ‌ها با استفاده از پیوند کدهای هسته‌ای MCNPX و NJOY
تاریخ چاپ : 1398/06/01

اشتراک گذاری

آدرس مقاله

ارائه راهکار برای پیش بینی قیمت سهام به کمک تلفیق روش‏های تکامل تفاضلی و جنگل تصادفی