Deep learning-based price forecasting in Tehran Stock Exchange: LSTM and 1D CNN approaches
Subject Areas : Financial Markets and Institutions
Hossein Mostafaienia
1
,
Kaebeh Yaeghoobi
2
,
Omid Mahdi Ebadati Esfahani
3
1 - Department of Operation Management and Information Technology, Kharazmi university, Tehran, Iran.
2 - Department of Computer Engineering, K. N. Toosi University of Technology, Tehran, Iran.
3 - Department of Operation Management and Information Technology, Kharazmi university, Tehran, Iran.
Keywords: Convolutional Neural Network, Deep Learning, Long-Term Short-Term Memory, Stock Market Forecasting, Tehran Stock Exchange,
Abstract :
Purpose: The stock index and share prices reflect economic health and market reactions to financial decisions. Therefore, their precise analysis plays a critical role in evaluating the performance of forecasting models. Predicting market movements—particularly in the volatile Tehran Stock Exchange—requires models capable of analyzing nonlinear time series data. This study aims to design a deep learning-based model for predicting the next day’s closing price of stocks by developing a hybrid structural framework that remains reliable even under unstable market conditions.
Research Methodology: The dataset consists of daily trading data from the Tehran Stock Exchange between 2008 and 2021, covering 3,014 trading days. Variables include daily closing, opening, high, low prices, trade volume, and transaction value. After data cleaning and normalization, a sliding window method was applied to generate trainable sequences. The proposed model combines a one-dimensional convolutional layer (1D-CNN) for feature extraction, two long short-term memory (LSTM) layers for capturing temporal dependencies, and multiple dense layers for nonlinear learning. Experiments were conducted in Python, and various scenarios were tested, including excluding turbulent data and adjusting the model’s architecture.
Findings: Empirical results demonstrate that the hybrid CNN-LSTM model achieves accurate performance when applied to normalized daily stock data. The mean absolute error (MAE) ranged from 0.56 to 0.63, and the mean absolute percentage error (MAPE) varied between 1.26% and 1.46%. The model maintained stable performance in medium-term forecasts (up to 60 days), aligning well with actual market trends. Higher accuracy was observed for stocks with smoother price behavior, and the model successfully reconstructed price structures even in volatile symbols.
Originality / Value: The innovation of this research lies in designing a robust, generalizable framework resistant to extreme volatility. Through extensive testing on individual symbols, robustness analyses under data removal, and reconstruction of complex price structures, the study opens new avenues for the development of intelligent trading systems. The model’s adaptability to turbulent, incomplete, and structurally diverse data from Iran’s stock market makes it a suitable foundation for implementing decision-support systems in nonlinear and unstable financial environments.
Bao, W., Yue, J., & Rao, Y. (2017). A deep learning framework for financial time series using stacked autoencoders and long-short term memory. PloS one, 12(7), e0180944.
Billah, M. M., Sultana, A., Bhuiyan, F., & Kaosar, M. G. (2024). Stock price prediction: comparison of different moving average techniques using deep learning model. Neural Computing and Applications, 36(11), 5861-5871.
Chatzis, S. P., Siakoulis, V., Petropoulos, A., Stavroulakis, E., & Vlachogiannakis, N. (2018). Forecasting stock market crisis events using deep and statistical machine learning techniques. Expert systems with applications, 112, 353-371.
Eapen, J., Bein, D., & Verma, A. (2019). Novel deep learning model with CNN and bi-directional LSTM for improved stock market index prediction. In 2019 IEEE 9th annual computing and communication workshop and conference (CCWC), 0264-0270.
Ebadati, O. M., Jafari, M. A., & Davoodifar, N. (2022). Forecasting Stocks in the Financial Market by Using GA-SVM Hybrid Algorithm. Advances in Finance and Investment, 2(5), 1-22. [In Persian]
Fischer, T., & Krauss, C. (2018). Deep learning with long short-term memory networks for financial market predictions. European journal of operational research, 270(2), 654-669.
Fukushima, K. (1980). Neocognitron: A self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position. Biological cybernetics, 36(4), 193-202.
Géron, A. (2022). Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow. O'Reilly Media.
Gholami, N., & Shams Gharne, N. (2024). Presenting an optimized CNN-LSTM model for stock price forecasting in the tehran stock exchange. Financial Management Perspective, 14(45), 123-147. [In Persian]
Gülmez, B. (2023). Stock price prediction with optimized deep LSTM network with artificial rabbits optimization algorithm. Expert Systems with Applications, 227, 120346.
Hamshi, M., Bonabi Ghadim, R., & Mohammadzadeh Salteh, H. (2025). The role of information disclosure dimensions on pricing the probability of using confidential information. Advances in Finance and Investment, 6(1), 135-164. [In Persian]
Heidarzadeh, M., Safa, M., Fallahshams, M., & Jahangir Nia, H. (2024). Predictability of Tehran Stock Exchange using deep learning models (CNN-LSTM model). Journal of Modern Management Engineering, 10(3), 155-170. [In Persian]
Hubel, D. H., & Wiesel, T. N. (1968). Receptive fields and functional architecture of monkey striate cortex. The Journal of physiology, 195(1), 215-243.
Li, X., Li, Y., Yang, H., Yang, L., & Liu, X. Y. (2019). DP-LSTM: Differential privacy-inspired LSTM for stock prediction using financial news. arXiv preprint arXiv:1912.10806.
Mohamadi, R., Saedi, R., & Dastgir, M. (2024). Investigating the effect of stock idiosyncratic and cash flow volatility on the future stock price crash risk. Advances in Finance and Investment, 5(4), 175-206. [In Persian]
Noorbakhsh, A., & Shaygani, M. (2024). Forecasting stock prices in the capital market with an artificial intelligence approach. Journal of Economic Business Research, 15(33), 1-18. [In Persian]
Olah, C. (2015). Understanding lstm networks. Colah Github.
Selvin, S., Vinayakumar, R., Gopalakrishnan, E. A., Menon, V. K., & Soman, K. P. (2017). Stock price prediction using LSTM, RNN and CNN-sliding window model. In 2017 international conference on advances in computing, communications and informatics (ICACCI), 1643-1647.
Shen, S., Jiang, H., & Zhang, T. (2012). Stock market forecasting using machine learning algorithms. Department of Electrical Engineering, Stanford University, Stanford, CA, 1-5.
Sohrabi, M., Mozaffar, S., Mozaffar Mirbargkar, S., Chirani, E., & Kheradyar, S. (2022). Modeling the prediction of stock market jumps based on the recurrent neural network and deep learning. Journal of Securities Exchange, 15(59), 245-268. [In Persian]
Sonkavde, G., Dharrao, D. S., Bongale, A. M., Deokate, S. T., Doreswamy, D., & Bhat, S. K. (2023). Forecasting stock market prices using machine learning and deep learning models: A systematic review, performance analysis and discussion of implications. International Journal of Financial Studies, 11(3).
Stempień, D., & Ślepaczuk, R. (2025). Hybrid Models for Financial Forecasting: Combining Econometric, Machine Learning, and Deep Learning Models. arXiv preprint arXiv:2505.19617.
Toraby Pour, T., & Siadat, S. (2023). A way to predict the stock price of the Tehran Stock Exchange in relation to knowledge. Electronic and Cyber Defense, 10(4), 91-100. [In Persian]
Tsay, R. S. (2005). Analysis of financial time series. John wiley & sons.
Zhang, K., Zhong, G., Dong, J., Wang, S., & Wang, Y. (2019). Stock market prediction based on generative adversarial network. Procedia computer science, 147, 400-406.
Zolfaghari, M., Sahabi, B., & Bakhtyaran, M. J. (2020). Designing a Model for Forecasting the Stock Exchange Total Index Returns (Emphasizing on Combined Deep Learning Network Models and GARCH Family Models). Financial Engineering and Portfolio Management, 11(42), 138-171. [In Persian]
Journal of Advances in Finance and Investment Volume 6, Issue 3, 2025 pp. 1-40. Paper type: Research paper
|
Deep learning-based price forecasting in Tehran Stock Exchange: LSTM and 1D CNN approaches
Hossein Mostafaienia1, Kaebeh Yaeghoobi2, Omid Mahdi Ebadati Esfahani3
Received: 29/04/2025 Accepted: 22/09/2025
Extended Abstract
Introduction
Forecasting stock market prices, particularly in highly volatile markets such as the Tehran Stock Exchange (TSE), presents formidable challenges. The complexity of financial time series, characterized by non-linear trends, irregular patterns and noise, often renders traditional predictive models inadequate. The TSE, influenced by political, economic and behavioral factors, demands robust and adaptive techniques that not only capture historical dependencies but also generalize well under turbulent conditions. This study aims to address these challenges by designing a deep learning framework combining one-dimensional Convolutional Neural Networks (1D CNNs) and Long Short-Term Memory networks (LSTMs) to forecast next-day closing prices in the TSE. By emphasizing symbol-level analysis and testing against noisy and incomplete data, the framework offers strategic value to researchers and investors navigating emerging markets.
Literature Review
The limitations of classical econometric models in capturing the intricacies of financial time series have led to the rising adoption of machine learning (ML) and deep learning (DL) approaches. Early studies using Support Vector Machines (SVM) and Genetic Algorithms (GA) demonstrated reasonable success in structured environments but fell short in handling volatile behavior and long-term temporal dependencies (Ebadati et al., 2022 and Shen et al., 2012).
Deep learning architectures, such as LSTM and CNN, introduced transformative capabilities in this domain. LSTM networks, with their ability to retain long-term dependencies via gated mechanisms, have outperformed conventional Recurrent Neural Networks (RNNs), particularly in modeling price trends in indexes like S&P500 (Fischer and Krauss, 2018). Similarly, CNNs, which excel at capturing local patterns, were shown to enhance the predictive accuracy when fused with RNNs or LSTM units (Bao et al., 2017 and Eapen et al., 2019).
Deep learning–based forecasting in Iran is still in its early stages. While recent studies, such as those by Mohamadi et al. (2024) and Toraby Pour and Siadat (2023) have explored hybrid models, their focus has primarily been on aggregate market indices rather than individual stock-level analysis (Gholami and Shams Gharne, 2024). enhanced predictive accuracy by incorporating optimization techniques like particle swarm optimization (PSO) and Heidarzadeh et al. (2024) applied CNN-LSTM to the Tehran Stock Exchange. However, these approaches often lacked scenario variation and did not address challenges related to missing data.
This study positions itself within this evolving context by addressing the shortcomings in local research, introducing a hybrid CNN-LSTM model tailored for symbol-level prediction, equipped to handle real-world data irregularities across various industrial sectors of the TSE.
Research Methodology
This study employs a quantitative, data-centric design to develop a deep learning framework for next-day closing price prediction of stocks listed on the Tehran Stock Exchange (TSE). The framework aims to evaluate the performance and adaptability of a hybrid CNN-LSTM architecture under volatile market conditions, with particular attention to symbol-level forecasting and tolerance for incomplete or noisy data.
Historical trading data spanning from 2008 to 2021, encompassing 3014 trading days, were collected from the TSE’s official repository. Symbols were selected based on liquidity, activity level and data completeness to ensure diverse representation. After extensive data cleaning to remove anomalies and trading irregularities, all features were standardized using the StandardScaler algorithm to enhance learning stability and minimize computational artifacts. Time series sequences were reconstructed using a sliding window approach, where five prior days’ data were used to predict the subsequent closing price. This preprocessing structure supports the temporal modeling capacity of recurrent neural networks.
The architecture integrates a one-dimensional convolutional layer with 256 filters and causal padding to capture short-term dynamics, followed by two stacked LSTM layers that extract long-range dependencies from sequential inputs. Dense layers refine the learned representations and lead into a final linear output neuron, which generates the forecasted price. The model was implemented in Python using TensorFlow and Keras within a Jupyter Notebook environment and trained on an Intel Core i9 platform using the Adam optimizer and MSE loss.
Various training scenarios were explored to test generalizability: these included analyses of full versus trimmed datasets (e.g., excluding post-COVID periods), evaluations of feature configurations, differing train–validation splits and symbolic cross-validation between Iranian and non-Iranian stocks. Additionally, multi-step recursive forecasting simulated extended prediction horizons. Performance was measured using MAE and MAPE metrics to facilitate comparative benchmarking.
Results
The hybrid CNN-LSTM architecture demonstrated reliable performance across diverse experimental conditions. Trained on daily stock price data from the Tehran Stock Exchange spanning 3014 trading days, the model consistently produced accurate next-day forecasts. Quantitative results showed a Mean Absolute Error (MAE) between 0.56 and 0.63 and a Mean Absolute Percentage Error (MAPE) ranging from 1.26% to 1.46%, outperforming conventional models such as GA-SVM and standard RNNs.
The model's success was closely tied to rigorous data preprocessing, particularly the use of Standard Scaler normalization. This transformation enhanced feature stability, enabling CNN layers to extract short-term price patterns and LSTM units to capture temporal dependencies even under incomplete or noisy conditions. Among the input features tested, closing prices emerged as the most predictive, outperforming open price, trading volume and derived metrics like percentage changes.
Architectural experiments revealed that increasing the number of convolutional filters (especially to 256) enhanced the model’s ability to detect complex temporal signals, thereby improving prediction accuracy. Cross-domain evaluations confirmed the framework’s generalizability, as it maintained stability across Iranian symbols and international datasets such as AAPL and NASDAQ, despite a slight drop in precision at very high-frequency intervals.
Multi-step forecasting further showed the model’s potential in extended prediction horizons. Even when predicting up to 60 days ahead using its own previous outputs, the framework sustained realistic trend continuity. Additionally, robustness tests (including data trimming and exclusion of volatile periods) demonstrated its adaptability and resilience to structural shifts common in emerging markets.
When deployed across a range of industrial and technology stocks, the model maintained narrow error margins and aligned well with sector-specific behaviors, reinforcing its utility in both targeted forecasting and broader portfolio management. Collectively, these findings affirm the CNN-LSTM model’s versatility and practical effectiveness in financial time series prediction within complex and fluctuating environments like the Tehran Stock Exchange.
Discussion and Conclusion
This research presents a robust deep learning framework tailored to the nuanced volatility of emerging financial markets. The hybrid CNN-LSTM model not only addresses the limitations of traditional algorithms but also enhances forecast accuracy in daily symbol-level predictions across diverse sectors in Iran’s economy.
Findings emphasize the impact of normalization, feature selection and architectural depth on prediction stability. Increasing convolutional complexity improves pattern recognition, while choosing closing price data as the primary input feature consistently yields better results. Sensitivity to dataset configurations further confirms the importance of realistic training conditions that reflect actual market irregularities.
The developed framework lays the groundwork for deploying AI-driven forecasting systems in the Tehran Stock Exchange and similar markets. Future research may benefit from integrating macroeconomic indicators to capture broader financial signals, as well as from experimenting with ensemble models and attention mechanisms for improved interpretability and scalability. By modeling real-world market behavior in an adaptable and data-resilient manner, this study offers a valuable tool for analysts, investors and academics exploring next-generation financial prediction systems.
Conflict of Interest
The authors of this article declared no conflict of interest regarding the authorship or publication of this article.
Keywords: Convolutional Neural Network, Deep Learning, Long-Term Short-Term Memory, Stock Market Forecasting, Tehran Stock Exchange.
JEL Classification: C45, C53, G17, G12, C63.
پیشرفتهای مالی و سرمایهگذاری
سال ششم، پاییز 1404 - شماره 3
صفحات 40-1
نوع مقاله: پژوهشی
پیشبینی قیمت در بورس اوراق بهادار تهران با استفاده از یادگیری عمیق: رویکردهای LSTM و CNN یکبعدی
حسین مصطفایینیا4، کعبه یعقوبی5، امید مهدی عبادتی اصفهانی6
تاریخ دریافت: 09/02/1404 تاریخ پذیرش: 31/06/1404
چکیده
هدف: شاخص بورس و قیمت سهام، بازتابدهندة سلامت اقتصادی و واکنش بازار به تصمیمات مالی هستند؛ ازاینرو، تحلیل دقیق آنها نقش مهمی در ارزیابی عملکرد مدلهای پیشبینی دارد. پیشبینی حرکات بازار، بهویژه در بورس پرتلاطم تهران، نیازمند مدلهایی با توان تحلیل دادههای سری زمانی غیرخطی است. این پژوهش با هدف طراحی مدلی مبتنی بر یادگیری عمیق برای پیشبینی قیمت پایانی روز بعد سهام، به توسعة ساختاری ترکیبی پرداخته است که بتواند در شرایط ناپایدار بازار نیز عملکرد قابل اتکایی داشته باشد.
روششناسی پژوهش: دادههای معاملات بورس تهران از ۲۰۰۸ تا ۲۰۲۱ (۳۰۱۴ روز معاملاتی) شامل قیمتهای پایانی، باز، بالا، پایین، حجم و ارزش معاملات گردآوری شدند. پس از پاکسازی و نرمالسازی دادهها، از روش پنجره لغزنده برای تولید توالیهای قابل آموزش استفاده شد. مدل پیشنهادی شامل یک لایه پیچشی یکبعدی برای استخراج ویژگیها، دو لایه حافظه کوتاهمدت ماندگار برای حفظ وابستگیهای زمانی و چندین لایه متراکم برای یادگیری غیرخطی است. آزمایشها در محیط پایتون انجام شد و سناریوهای مختلفی از جمله حذف دادههای پرتلاطم و تنظیم ساختار مدل بررسی شدند.
یافتهها: نتایج تجربی نشان دادند که مدل ترکیبی CNN-LSTM در تحلیل دادههای روزانه نرمالسازیشده، عملکرد دقیقی دارد. میانگین خطای مطلق بین 56/0 تا 63/0 و میانگین درصد خطای مطلق حدود 26/1 تا 46/1 درصد گزارش شد. مدل در پیشبینی میانمدت (تا ۶۰ روز) نیز پایداری خود را حفظ کرده و خروجیهایی منطبق با روند واقعی بازار ارائه داده است. در نمادهای با رفتار آرامتر، دقت پیشبینی بیشتر بوده و در نمادهای نوسانی نیز مدل توانسته ساختار قیمتی را بهدرستی بازسازی کند.
اصالت / ارزشافزوده علمی: نوآوری این تحقیق در طراحی چارچوبی دقیق، قابل تعمیم و مقاوم در برابر نوسانات شدید است که با آزمونهای گسترده در سطح نمادهای منفرد، تحلیل پایداری در شرایط حذف داده و بازسازی ساختارهای قیمتی پیچیده، افقهای نوینی برای توسعه سامانههای معاملاتی هوشمند فراهم میسازد. این مدل با قابلیت سازگاری با دادههای پرتلاطم، ناقص و ساختارهای متفاوت بازار بورس ایران، بستری مناسب برای پیادهسازی سیستمهای تصمیمیار در محیطهای اقتصادی غیرخطی و ناپایدار ارائه میکند.
کلیدواژهها: بورس اوراق بهادار تهران، پیشبینی بازار سهام، حافظه کوتاهمدت ماندگار، شبکه عصبی پیچشی، یادگیری عمیق.
طبقهبندی موضوعی: C45, C53, G17, G12, C63.
1- مقدمه
سرمایهگذاری در بازار سهام همواره با ریسکهای متعدد و پیچیدگیهای رفتاری همراه بوده است. تصمیمگیری در این بازار نیازمند تحلیل دقیق روندهای قیمتی و پیشبینی آینده مالی نمادهای معاملاتی است. در این میان، بازار بورس تهران بهدلیل ویژگیهایی همچون نوسانات بالا، واکنشپذیری شدید نسبت به عوامل بیرونی و فقدان ثبات ساختاری، یکی از چالشبرانگیزترین بسترها برای توسعه مدلهای پیشبینی محسوب میشود (Mohamadi et al., 2024 and Noorbakhsh and Shaygani, 2024).
در سالهای اخیر، رویکردهای سنتی تحلیل بازار (نظیر تحلیل تکنیکال و بنیادین) در مواجهه با رفتار غیرخطی و پویای بازار ایران کارایی محدودی از خود نشان دادهاند (Chatzis et al., 2018 and Selvin et al., 2017). ازاینرو، بهرهگیری از الگوریتمهای هوشمند و روشهای یادگیری عمیق برای شناسایی الگوهای پنهان در سریهای زمانی مالی، بهعنوان راهکاری نوین مورد توجه پژوهشگران قرار گرفته است (Bao et al., 2017 and Fischer and Krauss, 2018).
مطالعات پیشین نشان دادهاند که الگوریتم حافظه کوتاهمدت ماندگار و شبکه عصبی پیچشی7 قادر هستند وابستگیهای زمانی و ویژگیهای محلی دادهها را بهخوبی تشخیص دهند. با این حال، بسیاری از این تحقیقات یا محدود به بازارهای توسعهیافته خارجی بودهاند (Li et al., 2019 and Zhang et al., 2019) یا تمرکز آنها صرفاً بر شاخصهای کل بازار بدون توجه به رفتار نمادهای منفرد بوده است (Heidarzadeh et al., 2024).
این پژوهش با هدف پر کردن خلأ موجود، چارچوبی ترکیبی مبتنی بر الگوریتم حافظه کوتاهمدت ماندگار و شبکه عصبی پیچشی یکبعدی8 ارائه میدهد که با دادههای واقعی بازار بورس تهران تطبیق یافته و برای پیشبینی قیمت پایانی سهام در بازههای روزانه طراحی شده است. این رویکرد ضمن بهرهگیری از ساختارهای انعطافپذیر یادگیری عمیق، شرایط تصمیمگیری دقیقتر و هوشمندانهتری را برای سرمایهگذاران و تحلیلگران فراهم میسازد.
شکل (1) مراحل اجرایی تحقیق را در فرآیند پیشبینی قیمت پایانی سهام نمایش میدهد. چارچوب شامل جمعآوری دادههای تاریخی، پاکسازی و نرمالسازی، اعمال روش پنجره لغزنده9 برای ایجاد توالیهای قابلآموزش، پیادهسازی مدل ترکیبی شامل شبکه عصبی پیچشی یکبعدی و الگوریتم حافظه کوتاهمدت ماندگار10 و در نهایت تولید خروجیهای پیشبینی است. هر مرحله نشاندهنده تعامل دقیق بین پیشپردازش دادهها و ساختار مدل یادگیری عمیق برای تحلیل سریهای زمانی در بازار بورس تهران است.
Figure (1) Research implementation framework for stock price prediction with LSTM and 1 D CNN
2- مبانی نظری و پیشینه پژوهش
پیشبینی قیمت سهام همواره یکی از موضوعات کلیدی در تحلیل بازارهای مالی بوده است. با گسترش حجم دادههای مالی و پیچیدگی رفتار سریهای زمانی، روشهای سنتی تحلیل مانند تکنیکال و بنیادین به محدودیتهایی در پیشبینی دقیق بازار برخورد کردهاند (Ebadati et al., 2022 and Noorbakhsh and Shaygani, 2024). این چالشها بهویژه در بازار پرنوسان ایران، ضرورت بهرهگیری از رویکردهای نوین مبتنی بر یادگیری ماشین و یادگیری عمیق را دوچندان کردهاند.
بر اساس تعریف برنامه توسعه سازمان ملل در سال ۲۰۱۲، بازار مالی بستری برای معامله اوراق بهادار و مشتقات با هزینه پایین است. این بازارها شامل بورس اوراق بهادار11، کالا12، اوراق قرضه13 و ارز خارجی14 بوده و ممکن است فیزیکی مانند NYSE15 یا LSE16 یا الکترونیکی مانند NASDAQ باشند. معاملات میتوانند در بورس یا بهصورت دوجانبه انجام شوند. هدف توسعه پایدار شماره ۱۰ سازمان ملل نیز بر بهبود نظارت بر بازارهای مالی جهانی تأکید دارد.
بازارهای مالی تحتتأثیر عوامل اقتصادی، سیاسی و روانشناختی رفتارهای پویایی دارند. سریهای زمانی مالی مانند قیمت سهام، دارای وابستگیهای زمانی و نوسانات غیرخطی هستند که نیازمند مدلهای پیشرفته برای کشف الگوهای پنهاناند. تحلیل این سریها، با وجود ماهیت تجربی، بر نظریههای اقتصادی و آماری تکیه دارد و به دلیل وجود عدم قطعیت، نقش روشهای آماری در آن حیاتی است.
بهعنوانمثال، تعاریف مختلفی از نوسان دارایی وجود دارد و برای یک سری بازده سهام، نوسان مستقیم قابلمشاهده نیست. بهعنوان نتیجه افزایش عدم قطعیت، نظریه و روشهای آماری نقش حیاتی در تحلیل سریهای زمانی مالی ایفا میکنند (Tsay, 2005).
تحلیل سریهای زمانی در بازار سهام به شناسایی روندها و چرخهها کمک کرده و پایهای برای تصمیمگیری دقیق سرمایهگذاری فراهم میکند. روشهای پیشبینی قیمت سهام شامل تحلیل بنیادی مناسب برای بلندمدت، تحلیل تکنیکال با الگوریتمهایی مانند میانگین متحرک رای کوتاهمدت و مدلسازی سریهای زمانی است. مدلهای سری زمانی به دو دسته خطی مانند AR17، ARMA18، ARIMA19 و غیرخطی تقسیم میشوند؛ اما مدلهای خطی محدودیتهایی در درک پویایی دادهها دارند.
مدلهای غیرخطی شامل ARCH20، GARCH21، TAR22 و الگوریتمهای یادگیری عمیق میشود. شبکههای عصبی عمیق را میتوان به عنوان تقریبدهندههای توابع غیرخطی دانست که توابع نگاشت غیرخطی را اجرا میکنند. انواع مختلفی از معماریهای شبکه عصبی عمیق بسته به نوع کاربرد مورد استفاده قرار میگیرند. این معماریها شامل شبکههای پرسپترون چندلایه23، شبکههای عصبی بازگشتی24، حافظه کوتاهمدت ماندگار، شبکه عصبی پیچشی و... میشود. این الگوریتمها برای پردازش تصویر، پردازش زبان طبیعی، تحلیل سریهای زمانی و... استفاده شدهاند (Selvin et al., 2017 and Zolfaghari et al., 2020).
برای آموزش مدلهای یادگیری عمیق، دادههای سری زمانی باید بهصورت نظارتشده بازسازی شوند. روش پنجره لغزنده با استفاده از مقادیر قبلی بهعنوان ورودی (X) و مقدار بعدی بهعنوان خروجی (y)، دادهها را به توالیهای قابلپیشبینی تبدیل میکند. مثلاً در بازه ۳۰ روزه، ۳۰ مقدار بهعنوان ویژگی و روز ۳۱ بهعنوان برچسب استفاده میشود. این روش ترتیب زمانی را حفظ کرده و وابستگیهای پنهان بین گذشته و آینده را استخراج میکند.
شکل (2) ساختار پنجره لغزنده را نمایش میدهد که نحوه تبدیل دادههای خام به فرم قابلآموزش برای مدلهای سری زمانی را نشان میدهد.
شکل (2) پنجره لغزنده - مرحله زمانی قبلی X و مرحله بعدی y است
Figure (2) Sliding Window-The previous time step is X and the next step is y
معماری شبکه عصبی پیچشی با الهام از قشر بینایی انسان طراحی شده است، جایی که نورونها تنها به بخش محدودی از ورودی واکنش نشان میدهند. این ویژگی منجر به ایجاد لایههای پیچشی شد که قادر به شناسایی الگوهای محلی در دادههای تصویری و سریهای زمانی هستند.
شکل (3) ارتباط ساختار شبکه عصبی پیچشی با عملکرد نورونهای بینایی را نشان میدهد؛ لایههای پیچشی با تقلید از میدان دید محدود نورونها، الگوهای پیچیده را در بخشهای مختلف داده استخراج میکنند (Géron, 2022 and Hubel and Wiesel, 1968).
شکل (3) نورونهای زیستی در قشر بینایی (توجه داشته باشید که هر نورون فقط به برخی از نورونهای لایه قبلی متصل است (Géron, 2022))
Figure (3) Biological neurons in the visual cortex (note that any neuron is joined to just some of the prior layer neurons (Géron, 2022))
این مطالعات قشر بینایی الهامبخش برای نئوکونیترو25 بود که در سال ۱۹۸۰ معرفی شد (Fukushima, 1980) و به تدریج به شبکههای عصبی پیچشی تبدیل شده است. در معماری بیولوژیکی شبکه عصبی پیچشی نورونهای سطح بالا از خروجی نورونهای سطح پایین تغذیه میکنند و ارتباط بین لایهها بهصورت محلی برقرار است و این مورد مشابه پردازش اطلاعات دیداری در مغز انسان میباشد.
شبکههای عصبی بازگشتی برای مدلسازی دادههای ترتیبی طراحی شدهاند. ساختار سنتی شبکههای عصبی بازگشتی شامل یک لایه تکرارشونده ساده است که اطلاعات پیشین را به مرحله فعلی منتقل میکند.
شکل (4) نشاندهنده یک لایه تکرارشونده است که اطلاعات را از مرحله قبلی گرفته و به مرحله بعدی منتقل میکند. ساختار پایة شبکههای عصبی بازگشتی که شامل یک لایه تکرارشونده است و برای مدلسازی دادههای ترتیبی استفاده میشود. این ساختار محدودیتهایی در یادگیری وابستگیهای بلندمدت دارد؛ اما در عمل، شبکههای عصبی بازگشتی دچار مشکل نزول گرادیان میشود که آموزش آن را در توالیهای بلند دشوار میسازد.
برای رفع این مشکل، الگوریتم حافظه کوتاهمدت ماندگار معرفی شد؛ ساختاری با چهار لایه تعاملی که با دروازههای ورودی، خروجی و فراموشی، اطلاعات را بهصورت هدفمند حفظ یا حذف میکند.
شکل (4) ماژولهای تکرارشونده در شبکه عصبی بازگشتی RNN سنتی شامل یک لایه (Olah, 2015)
Figure (4) The iterative modules in a traditional RNN consist of one layer (Olah, 2015)
ساختار زنجیرهای در الگوریتمهای حافظه کوتاهمدت ماندگار حفظ شده است و شکل (5) سازوکار داخلی الگوریتم حافظه کوتاهمدت ماندگار شامل دروازههای ورودی، خروجی و فراموشی که باعث یادگیری مؤثر وابستگیهای زمانی بلندمدت و حل مشکل نزول گرادیان در دادههای سری زمانی میشود را نشان میدهد.
شکل (5) ماژولهای تکرارشونده در یک LSTM شامل چهار لایه تعاملی (Olah, 2015)
Figure (5) The iterative modules in an LSTM contain four interacting layers (Olah, 2015)
پیشبینی قیمت سهام همواره یکی از موضوعات چالشبرانگیز در مطالعات حوزه مالی و مهندسی داده بوده است. مطالعات متعددی در سالهای اخیر تلاش کردهاند با بهرهگیری از الگوریتمهای یادگیری عمیق، دقت پیشبینی را افزایش دهند. رفتار غیرخطی و نوسانی بازار، بهویژه در بازارهایی همچون بورس تهران، منجر به تلاشهای علمی گستردهای برای طراحی مدلهای پیشبینی دقیق شده است. در ادامه، مروری تحلیلی بر پژوهشهای داخلی و بینالمللی مرتبط با این موضوع ارائه میشود.
در دهههای گذشته، پژوهشگران به دنبال توسعه روشهای سنتی پیشبینی با بهرهگیری از تحلیلهای آماری و یادگیری ماشین بودهاند (Shen et al., 2012). با استفاده از ماشین بردار پشتیبان26 و الگوریتمهای تقویتی توانستند تغییرات بازار NASDAQ را با دقت قابل توجهی مدلسازی کنند. این مطالعه پایهگذار استفاده از یادگیری نظارتی در بازارهای مالی بود و نشان داد که الگوریتمهای غیرخطی در کشف الگوهای پنهان عملکرد بهتری نسبت به مدلهای کلاسیک دارند.
در ایران پژوهشگران رویکردی ترکیبی با GA-SVM را برای تحلیل بازار سهام به کار گرفتند و عملکرد این الگوریتم را در مواجهه با دادههای پر تغییر موردبررسی قرار دادند. آنها نشان دادند که انتخاب ویژگیهای مناسب و تنظیم بهینه پارامترها نقش کلیدی در افزایش دقت مدل دارند (Ebadati et al., 2021). مطالعهای با دادههای ۱۴۶ شرکت بورسی طی سالهای ۱۳۹۰ تا ۱۴۰۰ نشان داد که افشای اطلاعات مالی، غیرمالی، استراتژیک و ریسکی با کاهش احتمال قیمتگذاری مبتنی بر اطلاعات محرمانه رابطه منفی و معناداری دارد. افزایش شفافیت اطلاعاتی موجب بهبود عدالت اطلاعاتی در بازار سرمایه میشود (Hamshi et al., 2025).
بااینحال، محدودیت اصلی این مطالعات، وابستگی شدید به فرضیات خطی، فقدان تحلیل وابستگیهای زمانی بلندمدت و عدم انعطاف در مواجهه با دادههای حجیم است که زمینه را برای ظهور یادگیری عمیق فراهم ساخت.
مدلهای یادگیری عمیق با هدف غلبه بر محدودیتهای معماریهای کلاسیک توسعه یافتند. الگوریتم حافظه کوتاهمدت ماندگار با طراحی دروازههای ورودی، خروجی و فراموشی، توانست مشکل نزول گرادیان در شبکههای بازگشتی را حل کند و وابستگیهای بلندمدت در دادههای سری زمانی را به طور مؤثر یاد بگیرد (Olah, 2015).
در مطالعهای برجسته، فیشر و کراس (Fischer and Krauss, 2018)، مدل LSTM را برای پیشبینی شاخصS&P500 بهکار گرفتند و نشان دادند که این مدل نهتنها بر الگوریتمهای کلاسیک نظیر رگرسیون و ماشین بردار پشتیبان برتری دارد؛ بلکه در دورههای پرنوسان نیز پایداری خوبی از خود نشان میدهد. در پژوهش دیگری نویسندگان با ترکیب تبدیل موجک، خودرمزگذار پشتهای و LSTM، مدل WSAE-LSTM را معرفی کردند که دقتی در حد 99 درصد ارائه داد و عملکرد آن در بازارهایی همچون CSI، Nifty وS&P قابل توجه بود (Bao et al., 2017).
اخیراً در مطالعهای الگوریتم LSTM را با بهینهساز خرگوشهای مصنوعی ترکیب کردند و توانستند دقت پیشبینی شاخص DJIA را به طرز محسوسی افزایش دهند. این مطالعه نشاندهندة قابلیت بهبود عملکرد شبکههای عصبی عمیق با بهینهسازی فراابتکاری است (Gülmez, 2023).
مدل پیشنهادی ترکیبی پژوهشی، از شبکه عصبی پیچشی چندخطی و LSTM دوطرفه است که دقت پیشبینی را نسبت به مدل خطی ساده ۹ درصد افزایش داده و از بیشبرازش جلوگیری میکند. هدف، تحلیل توالیهای سری زمانی و پیشبینی قیمت تا هفت روز آینده است. LSTM دوطرفه با یادگیری وابستگیهای پیشرو و پسرو، برای دادههای سری طولانیمدت مناسب بوده و خروجی را با ترکیب دو مسیر زمانی تولید میکند (Eapen et al., 2019).
در بورس تهران، معماریهای عمیق نیز موردتوجه قرار گرفتهاند. در مطالعهای با ترکیب تحلیل بنیادی و یادگیری ماشین، مدلی برای پیشبینی ریسک سقوط قیمت سهام ارائه دادند. استفاده از شاخصهای مالی و الگوریتمهایی مانند جنگل تصادفی و ماشین بردار پشتیبان، عملکرد مناسبی در شناسایی نمادهای پرریسک داشت. این مطالعه بر اهمیت پیشپردازش دادهها، انتخاب ویژگیهای مؤثر و تحلیل سناریوها تأکید دارد؛ رویکردی که با اهداف پژوهش حاضر در طراحی مدل ترکیبی CNN-LSTM همراستا است (Mohamadi et al., 2024).
در تحقیقی با توسعه مدل CNN-LSTM برای نمادهای معاملاتی بازار تهران، نشان دادند که ترکیب لایه پیچشی با حافظه زمانی، عملکرد مدل را در سناریوهای نوسانی افزایش میدهد (Toraby Pour and Siadat, 2023). در مطالعة دیگری نویسندگان نیز مدل CNN-LSTM را برای پیشبینی شاخص کل بورس تهران بهکار گرفتند؛ اما مطالعه آنها بیشتر بر تحلیل سطح شاخص بازار متمرکز بود و تحلیل نمادهای منفرد، سناریوهای متنوع آموزشی و استحکام مدل در مواجهه با حذف دادهها کمتر مورد بررسی قرار گرفت (Heidarzadeh et al., 2024).
در مطالعهای از شبکههای بازگشتی برای مدلسازی جهشهای شاخص کل استفاده شد. با وجود بهرهگیری از چارچوب یادگیری عمیق در تحلیل بازار، محدودیتهایی در سطح نمایندگی نمادها و نوع دادههای ورودی مشاهده شد (Sohrabi et al., 2022).
در راستای بهبود دقت پیشبینی قیمت سهام در بورس تهران، از مدل ترکیبی LSTM-CNN همراه با بهینهسازی هایپرپارامترها (لگوریتم PSO)، آموزش خصمانه، مکانیزم توجه و بلوکهای باقیمانده استفاده شده است. دادهها شامل قیمتهای تعدیلشده، اندیکاتورها، نرخ دلار و تورم در بازهای ۱۰ساله بودهاند. نتایج نشان میدهد که تلفیق معماریهای عمیق با تکنیکهای تقویتی و بهینهسازی، عملکرد پیشبینی را در بازارهای پرتلاطم به طور قابلتوجهی ارتقا میدهد (Gholami and Shams Gharne, 2024).
مدلهای نوین با ترکیب دادههای عددی، متنی و فنی، پیشبینی دقیقتری ارائه میدهند. در مدل DP-LSTM، دادههای قیمتی با تحلیل احساسات اخبار مالی (با VADER) و مکانیسم حریم خصوصی تفاضلی تلفیق شدهاند. این مدل با حفظ وابستگیهای زمانی و محافظت از دادههای حساس، عملکرد بهتری نسبت به مدلهای پایهای داشته و در دادههای S&P500 تا ۶۵ درصد کاهش خطای MSE را نشان داده است. نتایج بیانگر نقش مؤثر ادغام تحلیل متنی و امنیت داده در ارتقای دقت و پایداری پیشبینی هستند (Li et al., 2019).
برای مقابله با کمبود یا عدم تعادل داده، از معماری GAN با LSTM و MLP برای تولید دادههای مصنوعی استفاده شد که خطای MAE را از 12/4 به 04/3 کاهش داد و دقت و تعمیمپذیری مدل را بهبود بخشید (Zhang et al., 2019). همچنین، در مدلی ترکیبی شاملRandom Forest،XGBoost و LSTM با بهرهگیری از شاخصهای فنی مانند EMA،MACD و RSI روند بازار با دقت 7/78 درصد طبقهبندی شد و عملکرد پیشبینی و تفسیرپذیری مدل ارتقا یافت (Sonkavde et al., 2023).
در تحقیق دیگری بهصورت تجربی LSTM را در زمینه پیشبینی سریهای زمانی تجزیهوتحلیل نمودهاند. این تحقیق از مجموعه دادههای دنیای واقعی استفاده شده است و بینشهای کمی در مورد عملکرد LSTMها ارائه داده است. هدف تحقیق بهدستآوردن ارزشی است که بتوان آن را با قیمت فعلی یک دارایی مقایسه کرد تا مشخص شود که آیا ارزش آن بیش از حد یا کمتر از حد واقعی است (Billah et al., 2024).
مطالعهای اخیر مدلهای ترکیبی را معرفی کرده که الگوریتمهای سنتی مانند ARIMA و ARFIMA را با SVM،XGBoost و LSTM ادغام میکند. با استفاده از دادههای S&P500 و بیتکوین، نتایج نشان دادند که این ترکیبها از مدلهای مستقل و حتی استراتژی خرید و نگهداری عملکرد بهتری دارند. ترکیب اجزای خطی و غیرخطی، بهویژه ARIMA با LSTM، مؤثرترین نتایج را ارائه داده است (Stempień and Ślepaczuk, 2025).
جدول (1) مقایسهای از پژوهشهای داخلی و بینالمللی بر اساس نوع بازار مالی، الگوریتمهای استفادهشده و نتایج عملکردی (دقت یا خطای مدلها). جدول (1) نشان میدهد که رویکردهای ترکیبی CNN-LSTM در مطالعات اخیر، بهویژه در بازارهای نوظهور مانند بورس تهران، نتایج مؤثرتری ارائه دادهاند.
جدول (1) مرور اجمالی مطالعات منتخب پیشین در حوزه پیشبینی قیمت سهام
Table (1) Summary of Representative Studies on Stock Price Forecasting Approaches
منبع مقاله | روش پیشبینی | نوع بازار مالی | معیارها و نتایج | شکاف پژوهشی |
شن و همکاران (Shen et al., 2012) | SVM، یادگیری تقویتی | بازار NASDAQ | دقت طبقهبندی 6/77 درصد | عدم بهرهگیری از یادگیری عمیق ترکیبی؛ تمرکز محدود بر وابستگیهای زمانی |
عبادتی و همکاران (Ebadati et al., 2021) | GA-SVM | بورس تهران | بهبود دقت با تنظیم ویژگیها؛ عملکرد بهتر نسبت به مدلهای پایه | محدودیت در مدلسازی وابستگیهای متوالی قیمت؛ فقدان یادگیری عمیق ترکیبی |
حمشی و همکاران (Hamshi et al., 2025) | مدلسازی آماری مبتنی بر افشای اطلاعات | بورس تهران | رابطه منفی معنادار میان شفافیت اطلاعات و قیمتگذاری محرمانه | عدم استفاده از یادگیری ماشین؛ مدلسازی کلاسیک بدون تطبیق با نوسانات بازار حقیقی |
فیشر و کراس (Fischer and Krauss, 2018) | حافظه کوتاهمدت ماندگار | بازار S&P500 | عملکرد بهتر از SVM و رگرسیون؛ کاهش خطا در بازههای پرنوسان | عدم ترکیب لایههای کانولوشنی برای استخراج ویژگیهای محلی؛ نبود تحلیل در بازارهای نوظهور |
بائو و همکاران (Bao et al., 2017) | ترکیب تبدیل موجک، SAE و LSTM | CSI، Nifty، S&P | دقت مدل در سطح 99 درصد؛ MAPE بسیار پایین | مدل پیچیده با دسترسی محدود؛ ضعف در تعمیمپذیری در بازارهایی با نوسانات بالا |
گولمز (Gülmez) | LSTM بهینهشده با Artificial Rabbits Optimization | شاخص DJIA | کاهش محسوس خطای پیشبینی؛ عملکرد برتر نسبت به LSTM معمولی | فقدان ارزیابی در بازارهای مختلف و سناریوهای آموزشی متنوع؛ تمرکز بر شاخص واحد |
محمدی و همکاران (Mohamadi et al., 2024) | Random Forest، SVM، تحلیل بنیادی | بورس تهران | شناسایی نمادهای پرریسک؛ تطابق با اهداف مدل ترکیبی پژوهش حاضر | عدم استفاده از معماریهای پیشرفته برای یادگیری الگوهای زمانی عمیق |
ترابی پور و سیادت (Toraby Pour and Siadat, 2023) | CNN-LSTM | بورس تهران | بهبود عملکرد در سناریوهای نوسانی؛ تحلیل نمادهای معاملاتی | بررسی محدودی از دادههای رفتاری؛ فقدان ارزیابی تعمیمپذیری مدل در سایر بازارها |
حیدرزاده و همکاران (Heidarzadeh et al., 2024) | CNN-LSTM | بورس تهران | تمرکز بر شاخص کل؛ ارزیابی محدود سناریوهای آموزشی و حذف داده | نبود تحلیل سطح نمادهای منفرد؛ عدم لحاظ پارامترهای اقتصاد رفتاری |
سهرابی و همکاران (Sohrabi et al., 2022) | شبکه بازگشتی | بورس تهران | مدلسازی جهش شاخص؛ عدم تحلیل نمادهای منفرد | تمرکز بر روندهای کلی بدون تفکیک ساختار سهام؛ ضعف در دقت پیشبینی نمادها |
غلامی و شمس قارنه (Gholami and Shams Gharne, 2024) | CNN-LSTM و LSTM-CNN بهینهشده با PSO | بورس تهران | MAE: ~0.48، MAPE: ~1.2%؛ نسبت شارپ بالا | استفاده از دادههای تعدیلشده، دلار و تورم؛ تمرکز بر بهینهسازی مدلها و آموزش خصمانه؛ فقدان تحلیل پایداری در حذف دادههای تاریخی |
لی و همکاران (Li et al., 2019) | DP-LSTM با دادههای خبری و حریم خصوصی تفاضلی | بازار S&P500 | کاهش 65 درصد در MSE؛ مقاومت بالا برابر نویز و دادههای متنی | تمرکز بر اخبار عمومی؛ عدم لحاظ دادههای خاص نمادها و متغیرهای تکنیکال |
ژانگ و همکاران (Zhang et al., 2019) | GAN + LSTM، تفکیککننده MLP | S&P500، Shanghai، IBM، Microsoft | کاهش MAE از ۱۲/۴ به ۰۴/۳؛ تولید دادههای مصنوعی معتبر | تمرکز بر تولید داده؛ عدم بررسی همزمان دقت پیشبینی و پایداری مدل در بازارهای واقعی |
سونکاده و همکاران (Sonkavde et al., 2023) | Random Forest + XGBoost + LSTM | بازار جهانی سهام | دقت طبقهبندی تا 7/78 درصد؛ ترکیب الگوریتمهای قدرتمند | مدل غیرقابلتفسیر؛ عدم اعمال تحلیل ساختار بازار و رابطه بین نمادهای خاص |
استمپین و شلپاچوک (Stempień and Ślepaczuk, 2025) | مدل ترکیبی ARIMA + LSTM + SVM + XGBoost | S&P500، بیتکوین | برتری نسبت به مدلهای مستقل؛ بهبود در دقت معاملاتی | تمرکز بر دادههای رمزارز و شاخص؛ فقدان تحلیل بر سطح نمادهای صنعتی در بازارهای سنتی |
ادبیات موجود بهوضوح نشان میدهد که رویکردهای یادگیری عمیق، بهویژه مدلهای ترکیبیCNN-LSTM در مواجهه با دادههای غیرخطی، ناپایدار و حجیم بازارهای مالی، عملکردی برجسته دارند. درعینحال، مطالعات داخلی هنوز در مرحلة تمرکز بر شاخص کل باقی ماندهاند و کمتر به تحلیل دقیق نمادهای معاملاتی، طراحی سناریوهای آموزشی متنوع و بررسی پایداری مدل در شرایط پرتنش پرداختهاند. پژوهش حاضر با هدف پر کردن این شکاف، مدل ترکیبی مبتنی بر دادههای واقعی نمادهای متعدد بورس تهران را طراحی کرده است که در کنار سنجش دقت، بر انطباقپذیری و تعمیمپذیری مدل نیز تمرکز دارد.
3- روششناسی پژوهش
هدف اصلی این پژوهش، طراحی چارچوبی ترکیبی مبتنی بر معماریهای یادگیری عمیق جهت پیشبینی قیمت پایانی سهام در بورس اوراق بهادار تهران است. این بخش بهتفصیل مجموعه داده، مراحل پیشپردازش، ساختار مدل توسعهیافته، پیکربندی آزمایشها و شیوه ارزیابی عملکرد مدل را تشریح مینماید.
جامعه آماری این مطالعه، شامل کلیه نمادهای ثبتشده در بورس اوراق بهادار تهران است که طی بازه زمانی ۲۰۰۸ ۲۰۲۱ (۱۳۸۷ تا ۱۴۰۰) در بازار فعال بودهاند. دادهها از پایگاه شرکت مدیریت فناوری بورس تهران استخراج گردیدند که شامل ۳۰۱۴ روز معاملاتی با اطلاعاتی نظیر قیمت پایانی، قیمت ابتدایی، بالاترین و پایینترین قیمت، حجم، ارزش، تعداد معاملات و تغییرات قیمتی بودند. انتخاب نمونهها بر اساس حداقل تعداد روزهای معاملاتی (حداقل ۱۸۰۰ روز) و شاخصهای نقدشوندگی انجام شد.
دادههای قیمت بازار سهام برای نمادهایی که در هر روز معاملاتی معامله میشوند، پس از ساعات معاملاتی روزانه در پایگاه داده شرکت مدیریت فناوری بورس تهران در دسترس عموم قرار میگیرد. این دادهها را میتوان هر روز در قالب فایل اکسل دانلود کرد و هر کدام آدرس خاص و قابلپیشبینی دارند. برای جمعآوری تمام دادهها برای دوره موردنظر، باید کد پایتون نوشته شود تا دادهها دانلود شده و در رایانه شخصی ذخیره شوند. از Python 3 برای جمعآوری این دادهها استفاده شده است.
پلتفرم محاسباتی استفادهشده در این آزمایشها یک سیستم عامل مک با پردازنده 8 هستهای Intel® Core i9 با فرکانس 3/2 گیگاهرتز و 16 گیگابایت حافظه DDR4 با فرکانس 2400 مگاهرتز است. زبان برنامهنویسی پایتون و محیط Jupyter Notebook جهت فرآیند تحقیق انتخاب گردیدند. دادهها با استفاده از پایتون استخراج شده و دادههای غیرساختیافته پاکسازی و به دادههای ساختیافته تبدیل میشوند. دادهها پیشپردازش شده و مدلهای یادگیری ماشین آموزش داده میشوند.
نخست، بهمنظور افزایش دقت پیشبینی و کاهش نویز آماری، این مراحل پیشپردازش صورت گرفت: ابتدا دادههای پرت، مقادیر ناقص و دورههای غیرمعاملاتی حذف شدند. سپس جهت هممقیاسسازی متغیرها، از استانداردسازی آماری با استفاده از الگوریتم StandardScaler بهره گرفته شد. برای آمادهسازی دادهها بهمنظور آموزش مدلهای یادگیری عمیق، از تکنیک پنجره لغزنده استفاده گردید که در آن پنج مقدار قبلی هر ویژگی بهعنوان ورودی (X) و مقدار روز بعد بهعنوان خروجی مدل (Y) در نظر گرفته شد. این روش امکان حفظ ترتیب زمانی و یادگیری وابستگیهای محلی و بلندمدت را فراهم میسازد. تمام الگوریتمهای مرتبط با هر مرحله در محیطهای برنامهنویسی پایتون برنامهریزی و کدنویسی شدهاند.
مدل ترکیبی طراحیشده شامل معماریهای شبکه عصبی پیچشی یکبعدی و الگوریتم حافظه کوتاهمدت ماندگار جهت پیشبینی قیمت پایانی روز بعد است. در این روش از دادههای تاریخی قیمت پایانی استفاده میشود که نیاز به نرمالسازی دارند. سپس روش پنجره لغزنده باید روی دادهها اعمال شود. سپس دادهها باید به دادههای آموزشی و آزمایشی تقسیم شده و به مدل یادگیری ماشین داده شوند. مدل مورداستفاده در این روش به ترتیب شامل لایه پیچشی یکبعدی (filters=256, kernel_size=5, strides=1, padding=causal, activation=ReLU) برای استخراج ویژگیهای محلی از سریهای زمانی به کار گرفته شد، تابع فعالسازی ReLU و ساختار Padding بهصورت علتی تعیین گردید تا ترتیب زمانی حفظ شود. در ادامه، الگوریتم حافظه کوتاهمدت ماندگار (60, return_sequences=True)، دو لایه (30, 10, activation=ReLU) Denseبرای نگاشت نهایی به خروجی و یک لایه نهایی خطی برای پیشبینی مقدار قیمت در روز بعد قرار داده شد. این مدل در محیط پایتون با بهرهگیری از کتابخانههای Keras و TensorFlow پیادهسازی گردید.
برای ارزیابی جامع مدل توسعهیافته، چندین سناریو آموزشی طراحی گردید. در گام نخست، اثر نرمالسازی دادهها بررسی گردید. سپس مدل بر روی دادههای داخلی (نمادهای مختلف بورس تهران از جمله باما، غدیر، ایران ترانسفو و...) و خارجی (دادههای AAPL و NASDAQ در بازههای ۱ دقیقهای، ۵ دقیقهای، ۱۵ دقیقهای، ۱ ساعت و روزانه) آموزش داده شد تا میزان تعمیمپذیری آن سنجیده شود. در آزمایشی دیگر، اثر حذف دورههای ناپایدار نظیر سالهای بحرانی بازار (بهویژه پس از شیوع کووید-۱۹) بر عملکرد مدل بررسی گردید. همچنین تحلیل پایداری مدل نسبت به حذف تصادفی داده، تغییر طول پنجره زمانی و اختلال در ساختار ورودی نیز صورت گرفت.
برای سنجش دقت مدل، از معیارهای میانگین خطای مطلق و میانگین درصد خطای مطلق استفاده گردید. این معیارها امکان مقایسه عملکرد مدل توسعهیافته با الگوریتمهای کلاسیک را فراهم میکنند. نتایج نشان میدهد که مدل CNN-LSTM در اکثر سناریوهای داخلی و خارجی، عملکرد بهتری از خود نشان داده و در مواجهه با دادههای پرت، نوسانات شدید و حذف اطلاعات، پایداری مناسبی دارد.
4- تجزیهوتحلیل دادهها
در این بخش، عملکرد مدل توسعهیافته در پیشبینی قیمت پایانی سهام در بورس اوراق بهادار تهران مورد تحلیل قرار میگیرد. دادههای آزمون شامل نمادهایی با نقدشوندگی بالا و تاریخچه کامل معاملاتی بوده که در مجموع بازهای از ۳۰۱۴ روز را پوشش دادهاند. معیارهای ارزیابی شامل میانگین خطای مطلق و میانگین درصد خطای مطلق بودهاند که بهعنوان شاخصهای اصلی برای سنجش دقت مدل در نظر گرفته شد.
بهمنظور سنجش قابلیت تعمیمپذیری و اعتبار مدل توسعهیافته CNN-LSTM در مواجهه با ساختارهای بازارهای مالی متفاوت، مجموعهای از دادههای خارجی از بازار سهام ایالات متحده انتخاب و تحلیل گردید. دادههای مربوط به نماد معاملاتی شرکت (AAPL) Apple Inc. و شاخص ترکیبی NASDAQ با سه ساختار زمانی مختلف شامل بازههای پنجدقیقهای، پانزدهدقیقهای و روزانه استخراج شدند. این دادهها از پایگاه داده Yahoo Finance و Alpha Vantage API تهیه گردیدند و هر مجموعه شامل اطلاعات تاریخی قیمت پایانی، حجم معاملات و سایر ویژگیهای فنی بودند. پس از اعمال پیشپردازش استاندارد (شامل نرمالسازی، حذف دادههای ناقص و ساخت پنجرههای زمانی آموزشی)، مدل CNN-LSTM در هر بازه زمانی بهصورت مستقل آموزش داده شد.
در سناریوی اول، دادههای دقیقهای نماد AAPL با نرخ نمونهبرداری یکدقیقهای و بیش از ۷۰۰۰۰ رکورد معاملاتی از بازار ایالات متحده استفاده شد که رفتار بازار را در جزئی نمایش میدادند. پس از نرمالسازی و بازسازی توالیها، مدل CNN-LSTM آموزش داده شد.
پس از اعمال نرمالسازی و بازسازی توالیها با پنجره زمانی مناسب، نتایج نشان دادند که مدل با MAE برابر ۸۴/۰ و MAPE حدود ۵/۱ درصد توانست الگوهای لحظهای بازار را بازسازی کند. بااینحال، به دلیل نویز بالا، واکنش آن به نوسانات کوتاهمدت کند و گاهی ناپایدار بود.
Figure (6) Closing price prediction for AAPL listed in NASDAQ with 1D CNN and LSTM to compare with and without standardized data in a 1 min timeframe
شکل (6) مقایسه خروجی مدل با دادههای واقعی در بازه ۱ دقیقهای نماد AAPL را نشان میدهد. اختلافهای محلی میان دادههای واقعی و پیشبینیشده در نقاط جهش بازار بهوضوح قابل مشاهدهاند و نشاندهندة دشواری یادگیری در نرخ بالا هستند.
این سطح از داده اگرچه حجم آموزشی زیادی در اختیار مدل قرار میدهد؛ اما ساختار تصادفی و نوسان سریع بازار باعث افت دقت نسبی در سنجش بلندمدت میگردد. ازاینرو، استفاده از پنجرههای تطبیقی یا الگوریتمهای نوفازی میتواند در پژوهشهای بعدی پیشنهاد شود.
در تحلیل دادههای مربوط به نماد AAPL با ساختار زمانی ۵ دقیقهای، مشخص گردید که بهرغم دقت قابلقبول مدل در تشخیص الگوهای کوتاهمدت، دادهها به دلیل نویز شدید معاملاتی، نوسانات لحظهای و وجود حجم بالای معاملات با رفتارهای پرتنش همراه بودهاند. مدل توانست با میانگین خطای MAE برابر با ۷۱/۰ و میانگین درصد خطا حدود ۲۰/۴ درصد قیمتهای لحظهای را پیشبینی نماید؛ اما نمودار تطبیقی نشان داد که در نقاط جهشی، اختلاف معنیداری میان دادههای واقعی و پیشبینیشده وجود دارد.
Figure (7) Closing price prediction for AAPL listed in NASDAQ with 1D CNN and LSTM to compare with and without standardised data in a 5 min timeframe
شکل (7) پیشبینی قیمتهای لحظهای AAPL توسط مدل CNN-LSTM در بازه ۵ دقیقهای نشان میدهد. روند پیشبینی در دورههای آرام بازار قابلقبول است؛ اما نوسانات شدید معاملاتی موجب افت دقت در دورههای جهشی شده است.
با افزایش طول پنجره زمانی به ۱۵ دقیقه، دادهها از نظر پایداری ساختاری بهبود یافته و مدل توانست با دقت بالاتری وابستگیهای میانمدت را استخراج کند. مقدار MAE برابر با ۵۵/۰ و مقدار MAPE در حدود ۷۵/۲٪ گزارش شد. بررسی نمودار قیمتهای پیشبینیشده نشان داد که مدل در بازههای تثبیتشده بازار، رفتار منطقیتری از خود نشان داده و توانسته با کاهش نوسانات خروجی، مسیرهای قیمتی را بازتولید کند.
Figure (8) Closing price prediction for AAPL listed in NASDAQ with 1D CNN and LSTM to compare with and without standardised data in a 15 min timeframe
شکل (8) تطبیق قیمتهای واقعی و پیشبینیشده AAPL در بازه ۱۵ دقیقهای را نشان میدهد. پیشبینیهای مدل در دورههای میانمدت از نظر ساختار زمانی همراستا با روندهای واقعی بازار بوده و افت عملکرد قابلتوجهی مشاهده نشده است.
در سناریوی دوم، مجموعه دادهای با نرخ نمونهبرداری ساعتی از نماد NASDAQ مورداستفاده قرار گرفت. این سطح زمانی به طور معمول در تحلیلهای تکنیکال میانمدت کاربرد دارد و نویز کمتری نسبت به دادههای دقیقهای دارد؛ اما همچنان نسبت به دادههای روزانه رفتار پیچیدهتری نشان میدهد.
پس از آموزش مدل بر روی این مجموعه، مقدار MAE ۶۳/۰ و مقدار MAPE به۱/۲ درصد رسید. مدل توانست در شرایط پایدار بازار عملکردی نزدیک به دادههای واقعی ارائه دهد؛ اما در دورههای بحرانی نظیر پس از اعلام نرخ بهره یا انتشار گزارش درآمدی شرکتها، خروجیها با نوسانات جزئی همراه بودند.
Figure (9) Closing price prediction for AAPL listed in NASDAQ with 1D CNN and LSTM to compare with and without standardised data in a 1 hr timeframe
شکل (9) تطابق مدل CNN-LSTM با دادههای واقعی بازار NASDAQ در بازه ۱ ساعته را نشان میدهد. رفتار مدل در بازه زمانی ساعتی نسبت به جهشهای خبری و نقاط واگرایی حساستر عمل کرده و در دورههای تثبیت، دقت بالایی ارائه کرده است. این تحلیل نشان داد که بازة زمانی یکساعته از نظر ساختار داده تعادلی میان پایداری و جزئیات ارائه میکند و مدل CNN-LSTM قادر به استخراج ویژگیهای مؤثر در آن بوده است.
در آخرین سناریو، دادههای روزانه AAPL و NASDAQ مورداستفاده قرار گرفتند تا توانایی مدل در تحلیل رفتار بلندمدت بازار سنجیده شود. در این تحلیل، مدل با خطای MAE حدود ۴۸/۰ و درصد خطای MAPE برابر با ۰۵/۱ درصد توانست عملکرد قابلتوجهی در بازتولید مسیر قیمتهای پایانی ارائه دهد. نمودار قیمتها نشان داد که CNN-LSTM در مواجهه با روندهای کند و بلندمدت، پایداری بالایی دارد و نوسانات کوتاهمدت اثرات مخربی بر خروجی مدل نداشتهاند.
Figure (10) Closing price prediction for AAPL listed in NASDAQ with 1D CNN and LSTM without standardised data in a 1 day timeframe
مدل توسعه دادهشده CNN-LSTM در دادههای روزانه AAPL توانست روندهای بلندمدت بازار را با دقت بالا بازسازی کند و خطای پیشبینی را کاهش دهد. افزایش طول بازه زمانی ورودی موجب بهبود دقت، کاهش نویز و تطابق بهتر با ساختار واقعی بازار شد. در دادههای NASDAQ نیز عملکرد مشابهی مشاهده شد؛ اما در بازههای ۱۵ دقیقهای به دلیل نوسانات زیاد، دقت مدل کمی کاهش یافت.
تحلیل حساسیت مدل نسبت به بازههای زمانی و نحوه تقسیم دادهها، نقش مهمی در ارزیابی تعمیمپذیری دارد. حذف دادههای قدیمی و بررسی جداگانه دادههای پس از کووید ۱۹ نشان داد که مدل آموزشدیده با دادههای قبل از پاندمی، در مواجهه با دادههای جدیدتر دقت کمتری دارد.
شکل (11) پیشبینی قیمت پایانی AAPL در بازه روزانه با استفاده از دادههای بدون استانداردسازی و حذف دادههای اخیر را نشان میدهد. مدل در مواجهه با دادههای جدیدتر دقت پایینتری دارد و روند پیشبینی در برخی دورهها دچار واگرایی شده است.
Figure (11) Closing price prediction for AAPL listed in NASDAQ with 1D CNN and LSTM without standardised data in 1 day timeframe with omitting last data
در نسخهای دیگر از آزمایش، از همان دادههای پیشین استفاده گردید؛ اما این بار استانداردسازی بر روی ویژگیها اعمال شد. نتایج نشان دادند که عملکرد مدل بهبود یافته و پیشبینیها با نوسانات کمتری همراه شدند.
در شکل (12) پیشبینی قیمت پایانی AAPL پس از اعمال استانداردسازی و حذف دادههای اخیر دیده میشود. دادههای نرمالشده منجر به خروجی منسجمتر و کاهش اختلاف در نقاط بحرانی شدند.
Figure (12) Closing price prediction for AAPL listed in NASDAQ with 1D CNN and LSTM with standardized data in 1 day timeframe with omitting last data
در سناریوی سوم، نسبت دادههای اعتبارسنجی کاهش داده شد و حجم بیشتری از دادهها برای آموزش اختصاص یافت. این رویکرد سبب شد مدل درک بهتری از ساختار دادههای بازار پیدا کند و عملکرد نهایی در آزمون به طور نسبی بهبود یابد.
شکل (13) استفاده از دادههای نرمالشده با تقسیم متفاوت میان آموزش و اعتبارسنجی در پیشبینی AAPLرا نشان داده است که کاهش حجم دادههای اعتبارسنجی و افزایش دادههای آموزشی موجب تطابق بهتر روندهای قیمتی در خروجی مدل شده است.
Figure (13) Closing price prediction for AAPL listed in NASDAQ with 1D CNN and LSTM with standardized data in 1 day timeframe which used fewer data to validate and dedicated them to training
عوامل مختلف مانند زمان حذف دادهها، نوع پیشپردازش و نسبت تقسیم آموزش/اعتبارسنجی، تأثیر چشمگیری بر عملکرد مدل دارد. بهویژه در بازارهای نوسانی، انتخاب ساختار زمانی مناسب نقش تعیینکنندهای در دقت پیشبینی ایفا میکند.
در آزمایش دیگری، تأثیر نوع ویژگیهای ورودی بررسی شد. علاوه بر قیمت پایانی، از قیمت ابتدایی، تفاوت قیمت و درصد تغییر قیمت نسبت به روز قبل نیز استفاده شد. در دادههای روزانه AAPL، قیمت ابتدایی عملکردی کمی بهتر از قیمت پایانی داشت؛ اما تفاوت آماری معناداری مشاهده نشد. ویژگیهای مشتقشده مانند تفاوت قیمت و درصد تغییرات، به دلیل حساسیت بالا به نوسانات، موجب کاهش دقت مدل شدند.
شکل (14) عملکرد مدل CNN-LSTM را با ورودیهای مختلف در دادههای روزانه AAPL مقایسه میکند. مدل با قیمت ابتدایی کمی بهتر عمل کرده؛ اما استفاده از تفاوت قیمت و درصد تغییرات باعث افت محسوس در دقت پیشبینی شده است.
در مجموع، انتخاب دقیق و پایدار ویژگیهای ورودی در دادههای سری زمانی اهمیت بالایی دارد. ویژگیهایی مانند قیمت ابتدایی یا پایانی، به دلیل ثبات بیشتر، خروجی قابلاعتمادتری ارائه میدهند، درحالیکه ویژگیهای مشتقشده در شرایط پرتلاطم بازار باعث افزایش خطا میشوند.
Figure (14) Prediction for AAPL listed NASDAQ in with 1D CNN and LSTM without standardized data in a 1 day timeframe using Close price, Open price, Differences and Percentage of Differences to compare different features
بهمنظور سنجش اثربخشی چارچوب توسعهیافته 1D CNN–LSTM در بازارهای نوظهور، مجموعهای از آزمایشهای تجربی بر دادههای بورس اوراق بهادار تهران اجرا گردید. به دلیل محدودیت ساختاری منابع داده، فقط بازههای زمانی روزانه برای نمادهای معاملاتی در دسترس بوده و بهعنوان مبنای تحلیل انتخاب شدهاند.
در این پژوهش، دو نماد باما و غدیر بهعنوان نمونههای نماینده از صنایع معدنی و پتروشیمی، با تاریخچه معاملاتی گسترده و کیفیت مناسب داده، برگزیده شدند. انتخاب این نمادها بر پایه معیارهایی از جمله تنوع رفتاری بازار، نقدشوندگی و ثبات نسبی در روند قیمت صورت گرفت تا قابلیت تعمیمپذیری مدل به شرایط مختلف بازار سنجیده شود.
در آزمایش اول، مدل بر پایه کل دادههای در دسترس (بیش از ۳۰۰۰ روز معاملاتی) بدون هیچگونه حذف تاریخی آموزش داده شد. نتایج حاصل از پیشبینی نشان دادند که مدل قادر است روندهای کلی بازار را برای هر دو نماد بهدرستی بازتولید نماید، اگرچه در نقاط اوج یا کف شدید، اختلافهایی مشاهده گردید.
شکل (15) پیشبینی قیمت پایانی نمادهای باما و غدیر با استفاده از 1D CNN و LSTM بر روی کل دادهها با و بدون استانداردسازی میباشد. خروجی مدل نشاندهنده قدرت عمومی در استخراج الگوهای بلندمدت بازار است؛ اما حساسیت آن به دادههای غیرمعمول همچنان برجسته باقی مانده است.
Figure (15) Closing price prediction for Bama and Qadir Co. with 1D CNN and LSTM with and without standardised data in a 1 day timeframe for all days in the dataset
در مجموعهای از آزمایشها، بخشهایی از دادههای ابتدایی یا انتهایی مجموعه آموزشی حذف شدند تا تأثیر اطلاعات منسوخشده یا نوسانات شدید اخیر بر عملکرد مدل بررسی شود.
با بررسی شکل (16)، شکل (17)، شکل (18)، شکل (19) و شکل (20) که شامل حذف یک سال، یکونیم سال، یا دو سال از ابتدای / انتهای داده آموزشی میباشند نشان داد که هرچه بخشهای پرتلاطم یا نامتوازن حذف شوند، مدل دقت بالاتری در سنجش الگوهای پایدار ارائه میدهد. بهویژه دادههای اخیر (سال آخر) که رشد غیرمنتظره و سقوط سریع داشتهاند، تأثیر منفی بر دقت مدل در بسیاری از موارد گذاشتهاند.
Figure (16) Closing price prediction for Bama and Qadir Co. with 1D CNN and LSTM with and without standardised data in a 1 day timeframe with omitting a year and a half from the end of the training dataset
Figure (17) Closing price prediction for Bama and Qadir Co. with 1D CNN and LSTM with and without standardised data in 1 day timeframe with omitting the latest two years of the training dataset
Figure (18) Closing price prediction for Bama and Qadir Co. with 1D CNN and LSTM with and without standardised data in a 1 day timeframe with omitting one year from the first and last of the training dataset
Figure (19) Closing price prediction for Bama and Qadir Co. with 1D CNN and LSTM with and without standardised data in a 1 day timeframe with omitting a year and a half from the first and end of the training dataset
Figure (20) Closing price prediction for Bama and Qadir Co. with 1D CNN and LSTM with and without standardised data in a 1 day timeframe with omitting the first and last two years from the training dataset
اثر حذف بخشهای مختلف داده آموزشی بر پیشبینی قیمت بستهشدن نمادهای باما و غدیر نشان داد درصورتیکه دورههای پرتلاطم در مدل حذف گردند، عملکرد پایدارتری ارائه میدهد. حذف یکونیم سال اخیر موجب کاهش MAPE تا ۱/۱ درصد در دادههای نماد غدیر شد.
در آزمایشهای بعدی، آموزش مدل صرفاً بر اساس دادههای مربوط به دورههای مشخص تاریخی (۲۰۱۰ تا ۲۰۱۵، ۲۰۱۲ تا ۲۰۱۵، میانه ۲۰۱۵ تا میانه ۲۰۱۶) صورت گرفت. هدف این بود که رفتار مدل در شرایط خاص اقتصادی یا پسزمینههای متغیر بازار بررسی شود.
شکل (21)، شکل (22) و شکل (23) پیشبینی قیمت بستهشدن باما و غدیر با آموزش محدود به دورههای تاریخی خاصرا نشان میدهد. مدل در برخی دورهها، بهویژه در سالهای با نوسانات کاهشی، عملکرد قابلقبولی ارائه داد؛ اما حجم محدود داده در این آزمایشها موجب افت جزئی در تطابق با روند واقعی شد.
Figure (21) Closing price prediction for Bama and Qadir Co. with 1D CNN and LSTM with and without standardised data in a 1 day timeframe with the year 2010 to 2015 from the training dataset
Figure (22) Closing price prediction for Bama and Qadir Co. with 1D CNN and LSTM with and without standardised data in a 1 day timeframe with the year 2012 to 2015 from the training dataset
Figure (23) Closing price prediction for Bama and Qadir Co. with 1D CNN and LSTM with and without standardised data in a 1 day timeframe from mid-2015 to mid-2016, the training dataset
برای بررسی تأثیر نوع ویژگی ورودی، مدل با قیمت آغازین و تغییرات روزانه آموزش داده شد. نتایج نشان دادند که قیمت آغازین عملکردی مشابه با قیمت پایانی دارد؛ اما پیشبینیها نوسان بیشتری دارند. ویژگیهایی مانند درصد تغییرات نسبت به نویز حساستر بوده و دقت مدل را کاهش دادهاند.
شکل (24) و شکل (25) مقایسه پیشبینی قیمت بازشدن و تغییرات بستهشدن نمادهای باما و غدیر را نشان میدهند. در دادههای استاندارد، قیمت آغازین مزیت جزئی دارد؛ اما ویژگیهای مشتقشده مانند درصد تغییرات موجب اختلال در استخراج الگوها شدهاند.
Figure (24) Opening price prediction for Bama and Qadir Co. with 1D CNN and LSTM with standardised data in 1 day timeframe with omitting last year and a half from the training dataset
Figure (25) Closing changes prediction for Bama and Qadir Co. with 1D CNN and LSTM with and without standardised data in 1 day timeframe with omitting last year and a half from the training dataset
مدل ترکیبی1D CNN–LSTM در دادههای روزانه بورس تهران عملکرد مناسبی داشته و در شرایط پایدار، دقت پیشبینی به بیش از ۹۸ درصد رسیده است. بااینحال، دادههای غیرعادی مانند نوسانات شدید در سال پایانی موجب کاهش دقت مدل شدند؛ بنابراین، حذف دورههای پرتلاطم و اعمال پیشپردازش آماری دقیق، بهترین راهکار برای آموزش مؤثر در بازار ایران است.
در مرحله دوم، مدل با دادههای استانداردشده و حذف یکونیم سال اخیر ارزیابی شد تا تأثیر تعداد فیلترهای لایه CNN بررسی شود. سه مقدار ۶۰، ۱۲۸ و ۲۵۶ فیلتر برای نماد باما آزمایش شدند.
شکل (26) عملکرد مدل با فیلترهای مختلف را نشان میدهد. افزایش تعداد فیلترها باعث بهبود استخراج ویژگیها و افزایش نسبی دقت شد. مدل با ۲۵۶ فیلتر کمترین خطای MAE را ثبت کرد و عملکرد بهتری نسبت به سایر ساختارها داشت.
Figure (26) Compare various 1D Convolution layer filters for close price prediction for Bama Co. with standardised data in 1 day timeframe with omitting last year and a half from the training dataset
نتایج نشان دادند که با افزایش ظرفیت مدل در لایه پیچشی، قدرت آن در شناسایی الگوهای پیچیدهتر نیز افزایش مییابد. این پدیده مشابه با افزایش پیچیدگی در الگوریتمهای یادگیری ماشین است که عموماً منجر به کاهش خطای پیشبینی میشود، البته به شرطی که با تنظیمات مناسب و پیشپردازش دقیق همراه باشد.
پس از آزمون انواع مدلهای ساختاری، ویژگیها، سناریوهای دادهای و پارامترهای ساختاری، در مرحله نهایی آنالیز، به اجرای مدل توسعهیافته بر روی مجموعهای از نمادهای خاص بورس که شامل باما، IIDIC، ایران ترانسفو، غدیر، MWMco، IRISL، سیمان شرق و رایان سایپا پرداخته و جهت پیشبینی این شاخصها و بررسی دقت مدل در شرایط متنوع بازار اقدام گردید.
شکل (27) پیشبینی قیمت بستهشدن روزانه در ۸ نماد منتخب با استفاده از مدل 1D CNN–LSTM پس از حذف دادههای غیرعادی یکونیم سال اخیر نتایج مدل نشاندهنده توانایی مطلوب در تشخیص روندها و رفتارهای معاملاتی هر نماد بهصورت مستقل و با پایداری قابلقبول هستند.
Figure (27) Close price prediction for Bama, IIDIC, Iran Transfo, Ghadir, MWMCo, IRISL, Shargh Cement and Rayan Saipa symbols with standardised data in 1 day timeframe with omitting last year and a half from the training dataset
جدول (2) خلاصه نتایج پیشبینی قیمت پایانی در نمادهای منتخب بازار
Table (2) MAE and MAPE for Close price prediction for Bama, IIDIC, Iran Transfo, Ghadir, MWMCo, IRISL, Shargh Cement and Rayan Saipa symbols
نمادها | رایان سایپا | ایران ترانسفو | IRISL | غدیر | باما | سیمان شرق | IIDIC | MWMCo |
میانگین خطای مطلق | ۰۵۱۸/۰ | ۰۶۷۹/۰ | ۲۲/۰ | ۲۲۸۱/۳ | ۰۷۵۳/۰ | ۱۲۴۵/۰ | ۵۹۱۹/۰ | ۱۶۱۹/۰ |
میانگین درصد خطای مطلق | 698/0 | 066/0 | 58/3 | 16/3 | 263/0 | 121/0 | 58/3 | 188/0 |
تحلیل جدول (2) نشان میدهد که دقت پیشبینی در اکثر نمادها در سطح قابلقبول قرار دارد. نمادهایی با نوسانات شدید نظیر غدیر و IIDIC دارای خطای نسبی بالاتری هستند، درحالیکه شرکتهایی با روندهای آرامتر و حجم معاملاتی پایدار، مانند باما و رایان سایپا، پیشبینیهای بسیار دقیقی ارائه دادهاند.
نتایج مذکور عمدتاً مبتنی بر پیشبینیهایی هستند که در آن دادههای واقعی برای هر نقطه پیشبینیشده در دسترس بودهاند؛ اما در واقعیت عملی بازار، مدل باید بدون دسترسی به قیمت روزهای آینده، فقط بر اساس دادههای گذشته عمل کند. به همین منظور، آزمایشی طراحی شد که در آن مدل، بر اساس دادههای ۳۰ روز گذشته، قیمت روز بعد را پیشبینی میکند و سپس از دادههای پیشبینیشده برای تخمین قیمتهای روزهای بعدی بهره میبرد، فرآیندی که بهصورت پیشبینی زنجیرهای چندمرحلهای شناخته میشود.
شکل (28) پیشبینی قیمت پایانی نماد باما برای ۶۰ روز آینده با استفاده از دادههای استاندارد شده و الگوریتم 1D CNN–LSTM مدل توانست روند کلی بازار را در افق زمانی ۶۰ روزه بازتولید کند؛ اما دقت پیشبینی با افزایش فاصله زمانی بهتدریج کاهش یافت.
Figure (28) Close price prediction for Bama Co. with standardized data for 60day in the future i.e., All 60 days are predicted prices
نتایج نشان دادند که مدل در روزهای اولیه (روزهای ۱ تا ۱۵) خطای بسیار کمی دارد و تطابق قابلتوجهی با روندهای واقعی ارائه میدهد؛ اما پس از عبور از روز بیستم، به دلیل استفاده پیاپی از دادههای پیشبینیشده بهجای دادههای واقعی، افت تدریجی در دقت خروجیها مشاهده میشود. این پدیده در اکثر مطالعات مدلهای زنجیرهای مشاهده شده و نشاندهندة نیاز بهکارگیری تکنیکهای تصحیح وابسته به بازخورد یا استفاده از مدلهای مبتنی بر توزیع احتمالی در آیندهپژوهی بازار است.
باتوجهبه ظهور روشهای پیشرفته یادگیری عمیق در تحلیل دادههای مالی، مقایسه تجربی عملکرد مدلهای منتخب در بازار بورس تهران ضروری است. مطالعات مختلفی بهکارگیری معماریهایی مانند LSTM،CNN-LSTM و RNN را در پیشبینی قیمتهای پایانی نمادهای ایرانی بررسی کردهاند؛ اما تفاوت در ساختار داده، نوع شاخص تحلیلشده و سناریوهای آموزشی منجر به تنوع در نتایج شده است. در جدول (3)، عملکرد مدل توسعهیافته این پژوهش در کنار مدلهای موجود با استفاده از معیارهای میانگین خطای مطلق و میانگین درصد خطای مطلق ارائه شده است تا جایگاه عددی مدل در مقایسه با مطالعات پیشین روشن شود.
جدول (3) مقایسه عملکرد مدلهای یادگیری عمیق در پیشبینی قیمت سهام بورس تهران
Table (3) Empirical Evaluation of Deep Learning Architectures in Forecasting Tehran Stock Exchange Trends
پژوهش | نوع مدل | میانگین خطای مطلق | میانگین درصد خطای مطلق | عملکرد |
مدل توسعهیافته | CNN-LSTM | ۵۶/۰—۶۳/۰ | ۲۶/۱—۴۶/۱ | عملکرد پایدار در نمادهای پرتلاطم؛ تعمیمپذیری بالا؛ تحلیل سطح نمادها |
حیدرزاده و همکاران (Heidarzadeh et al., 2024) | CNN-LSTM | ~۷۲/۰ | ~۱/۲ | تمرکز بر شاخص کل؛ بدون تحلیل نمادهای منفرد؛ دادههای روزانه |
سهرابی و همکاران (Sohrabi et al., 2022) | RNN | — | ~۵/۲ | تمرکز بر شاخص کل؛ عدم تحلیل نمادهای منفرد؛ دقت کمتر در دورههای جهشی |
عبادتی و همکاران (Ebadati et al., 2021) | GA-SVM | — | ~۹/۱ | تنظیم ویژگیها؛ الگوریتم کلاسیک با دقت محدود در دادههای نوسانی |
ذوالفقاری و همکاران (Zolfaghari et al., 2020) | RNN-LSTM + EGARCH | ~۶۱/۰ | ~۸/۱ | ترکیب با مدلهای اقتصادسنجی؛ استفاده از متغیرهای خارجی (قیمت نفت و دلار بهعنوان متغیرهای مستقل) |
5- بحث و نتیجهگیری
این پژوهش با هدف پیشبینی روند بازار بورس تهران با استفاده از مدل ترکیبی CNN-LSTM انجام شد. برخلاف مطالعات پیشین که عمدتاً بر شاخصهای کل بازار تمرکز داشتند و در اغلب موارد فاقد تحلیل نمادهای منفرد یا سنجش پایداری در سناریوهای حذف داده بودهاند، مدل توسعهیافته این تحقیق با دقت عددی بالا میانگین خطای مطلق برابر با 56/0 - 63/0 و میانگین درصد خطای مطلق برابر با ۲۶/۱ - ۴۶/۱ درصد و تحلیل نمادهای منفرد، عملکردی پایدار و قابلتکرار در شرایط پرتلاطم بازار ارائه داد. در مقایسه با مدلهایی مانند GA-SVM، RNN و نسخههای محدود CNN-LSTM، این مدل از نظر عددی و مفهومی برتری قابلتوجهی داشت.
بر اساس تجزیهوتحلیل جزئیتر نتایج این پژوهش میتوان به این نکات اشاره نمود:
· نرمالسازی دادهها تأثیر معناداری بر افزایش دقت پیشبینی داشت؛ بهویژه در بازههای زمانی روزانه، دادههای استاندارد عملکرد مدل را بهبود بخشیدند.
· تحلیلهای مرتبط با تغییر پارامترهای مدل مانند تعداد فیلترهای CNN نشان دادند که افزایش پیچیدگی مدل تا حد مشخصی موجب بهبود دقت میشود. مثلاً استفاده از ۲۵۶ فیلتر نسبت به ۶۰ فیلتر در لایه پیچشی نتایج بهتری ارائه کرد.
· در مقایسه ویژگیها (قیمت پایانی، ابتدایی، اختلاف و درصد تغییرات)، مشخص شد که قیمت پایانی نسبت به سایر ویژگیها در پیشبینی دقیقتر عمل کرده است، بهویژه در دادههای بورس تهران که بازه زمانی آن روزانه است.
· همچنین، مدل در آزمونهای مختلف پیشبینی نمادهایی مانند باما و غدیر و سایر نمادهای پر تداول، حتی در شرایطی که بخشی از دادههای تاریخی حذف شده بود، توانست با پایداری بالا روندهای قیمتی را بازسازی کند و با دادههای واقعی همپوشانی مناسبی نشان دهد.
· آزمایش پیشبینی برای روزهای آینده بازار نیز بیانگر این نکته بود که با فاصلهگرفتن از روزهای موجود در آموزش، دقت کاهش مییابد؛ اما این افت در مدل توسعهیافته به نسبت آهستهتر و قابلکنترلتر از مدلهای سنتی رخ داده است.
در مجموع، مدل پیشنهادی با دادههای واقعی و شرایط پیچیده بازار سرمایه ایران تطابق دارد و از ظرفیت بالای تعمیمپذیری در مواجهه با نوسانات، حذف دادهها و انتخاب ویژگیهای کلیدی برخوردار است. این نتایج بر اهمیت طراحی مدلهای منعطف، سناریو - محور و نماد - محور برای بازارهای نوظهور تأکید میکنند.
باتوجهبه شرایط اقتصادی ایران و کاهش ارزش ریال، شاخصهایی مانند نرخ ارز، طلا و قیمت نفت نقش پیشرو در تعیین روند بازار دارند. پیشنهاد میشود در مطالعات آتی، تحلیل همبستگی میان این شاخصهای کلان و شاخصهای سهام بورس تهران بهعنوان راهکاری برای بهبود پیشبینیها موردتوجه قرار گیرد.
7- تعارض منافع
هیچگونه تعارض منافع توسط نویسندگان بیان نشده است.
8- منابع
Bao, W., Yue, J., & Rao, Y. (2017). A deep learning framework for financial time series using stacked autoencoders and long-short term memory. PloS one, 12(7), e0180944.
Billah, M. M., Sultana, A., Bhuiyan, F., & Kaosar, M. G. (2024). Stock price prediction: comparison of different moving average techniques using deep learning model. Neural Computing and Applications, 36(11), 5861-5871.
Chatzis, S. P., Siakoulis, V., Petropoulos, A., Stavroulakis, E., & Vlachogiannakis, N. (2018). Forecasting stock market crisis events using deep and statistical machine learning techniques. Expert systems with applications, 112, 353-371.
Eapen, J., Bein, D., & Verma, A. (2019). Novel deep learning model with CNN and bi-directional LSTM for improved stock market index prediction. In 2019 IEEE 9th annual computing and communication workshop and conference (CCWC), 0264-0270.
Ebadati, O. M., Jafari, M. A., & Davoodifar, N. (2022). Forecasting Stocks in the Financial Market by Using GA-SVM Hybrid Algorithm. Advances in Finance and Investment, 2(5), 1-22. [In Persian]
Fischer, T., & Krauss, C. (2018). Deep learning with long short-term memory networks for financial market predictions. European journal of operational research, 270(2), 654-669.
Fukushima, K. (1980). Neocognitron: A self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position. Biological cybernetics, 36(4), 193-202.
Géron, A. (2022). Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow. O'Reilly Media.
Gholami, N., & Shams Gharne, N. (2024). Presenting an optimized CNN-LSTM model for stock price forecasting in the tehran stock exchange. Financial Management Perspective, 14(45), 123-147. [In Persian]
Gülmez, B. (2023). Stock price prediction with optimized deep LSTM network with artificial rabbits optimization algorithm. Expert Systems with Applications, 227, 120346.
Hamshi, M., Bonabi Ghadim, R., & Mohammadzadeh Salteh, H. (2025). The role of information disclosure dimensions on pricing the probability of using confidential information. Advances in Finance and Investment, 6(1), 135-164. [In Persian]
Heidarzadeh, M., Safa, M., Fallahshams, M., & Jahangir Nia, H. (2024). Predictability of Tehran Stock Exchange using deep learning models (CNN-LSTM model). Journal of Modern Management Engineering, 10(3), 155-170. [In Persian]
Hubel, D. H., & Wiesel, T. N. (1968). Receptive fields and functional architecture of monkey striate cortex. The Journal of physiology, 195(1), 215-243.
Li, X., Li, Y., Yang, H., Yang, L., & Liu, X. Y. (2019). DP-LSTM: Differential privacy-inspired LSTM for stock prediction using financial news. arXiv preprint arXiv:1912.10806.
Mohamadi, R., Saedi, R., & Dastgir, M. (2024). Investigating the effect of stock idiosyncratic and cash flow volatility on the future stock price crash risk. Advances in Finance and Investment, 5(4), 175-206. [In Persian]
Noorbakhsh, A., & Shaygani, M. (2024). Forecasting stock prices in the capital market with an artificial intelligence approach. Journal of Economic Business Research, 15(33), 1-18. [In Persian]
Olah, C. (2015). Understanding lstm networks. Colah Github.
Selvin, S., Vinayakumar, R., Gopalakrishnan, E. A., Menon, V. K., & Soman, K. P. (2017). Stock price prediction using LSTM, RNN and CNN-sliding window model. In 2017 international conference on advances in computing, communications and informatics (ICACCI), 1643-1647.
Shen, S., Jiang, H., & Zhang, T. (2012). Stock market forecasting using machine learning algorithms. Department of Electrical Engineering, Stanford University, Stanford, CA, 1-5.
Sohrabi, M., Mozaffar, S., Mozaffar Mirbargkar, S., Chirani, E., & Kheradyar, S. (2022). Modeling the prediction of stock market jumps based on the recurrent neural network and deep learning. Journal of Securities Exchange, 15(59), 245-268. [In Persian]
Sonkavde, G., Dharrao, D. S., Bongale, A. M., Deokate, S. T., Doreswamy, D., & Bhat, S. K. (2023). Forecasting stock market prices using machine learning and deep learning models: A systematic review, performance analysis and discussion of implications. International Journal of Financial Studies, 11(3).
Stempień, D., & Ślepaczuk, R. (2025). Hybrid Models for Financial Forecasting: Combining Econometric, Machine Learning, and Deep Learning Models. arXiv preprint arXiv:2505.19617.
Toraby Pour, T., & Siadat, S. (2023). A way to predict the stock price of the Tehran Stock Exchange in relation to knowledge. Electronic and Cyber Defense, 10(4), 91-100. [In Persian]
Tsay, R. S. (2005). Analysis of financial time series. John wiley & sons.
Zhang, K., Zhong, G., Dong, J., Wang, S., & Wang, Y. (2019). Stock market prediction based on generative adversarial network. Procedia computer science, 147, 400-406.
Zolfaghari, M., Sahabi, B., & Bakhtyaran, M. J. (2020). Designing a Model for Forecasting the Stock Exchange Total Index Returns (Emphasizing on Combined Deep Learning Network Models and GARCH Family Models). Financial Engineering and Portfolio Management, 11(42), 138-171. [In Persian]
COPYRIGHTS © 2025 by the author. Published by Islamic Azad University, Esfarayen Branch. This article is an open access article distributed under the terms and conditions of the Creative Commons Attribution 4.0 International (CC BY 4.0) (http://creativecommons.org/licenses/by/4.0/).
|
[1] . Department of Operation Management and Information Technology, Kharazmi university, Tehran, Iran.
[2] . Department of Computer Engineering, K. N. Toosi University of Technology, Tehran, Iran. (Corresponding Author). yaeghoobi@kntu.ac.ir
[3] . Department of Operation Management and Information Technology, Kharazmi university, Tehran, Iran.
How to cite this paper: Mostafaienia, H., Yaeghoobi, K., Ebadati Esfahani, O.M. (2025). Deep learning-based price forecasting in Tehran Stock Exchange: LSTM and 1D CNN approaches. Advances in Finance and Investment, 6(3), 1-40. [In Persian]
https://doi.org/10.71729/afi.2025.1205282
[4] 1. گروه مدیریت عملیات و فناوری اطلاعات، دانشگاه خوارزمی، تهران، ایران.
[5] 2. گروه مهندسی کامپیوتر، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران. (نویسنده مسئول). yaeghoobi@kntu.ac.ir
[6] 3. گروه مدیریت عملیات و فناوری اطلاعات، دانشگاه خوارزمی، تهران، ایران.
استناد: مصطفایینیا، حسین؛ یعقوبی، کعبه؛ عبادتی اصفهانی، امید مهدی. (1404). پیشبینی قیمت در بورس اوراق بهادار تهران با استفاده از یادگیری عمیق: رویکردهای LSTM و CNN یکبعدی. پیشرفتهای مالی و سرمایهگذاری، 6(3). 40-1.
https://doi.org/10.71729/afi.2025.1205282
[7] . CNN
[8] . 1 D CNN
[9] . Sliding Window
[10] . LSTM
[11] . Stock Exchange
[12] . Commodity
[13] . Bond
[14] . Foreign Exchange
[15] . New York Stock Exchange
[16] . London Stock Exchange
[17] . Autoregressive
[18] . Autoregressive Moving Average
[19] . Autoregressive Integrated Moving Average
[20] . Autoregressive Conditional Heteroskedasticity
[21] . Generalized Autoregressive Conditional Heteroskedasticity
[22] . Threshold Autoregressive
[23] . Multilayer Perceptron (MLP)
[24] . RNN
[25] . Neocognitron
[26] . SVM