یادگیری عمیق برای پیشبینی بازار سهام با استفاده از اطلاعات عددی و متنی (رویکرد الگوریتم حافظه کوتاه مدت ماندگارLSTM)
محورهای موضوعی : بورس اوراق بهادارسیده مژگان بهشتی مسئله گو 1 , محمدعلی افشارکاظمی 2 , جلال حقیقت منفرد 3 , علی رضاییان 4
1 - گروه مدیریت فناوری اطلاعات، واحد تهران مرکزی، دانشگاه آزاد اسلامی، تهران، ایران
2 - گروه مدیریت صنعتی، واحد تهران مرکزی، دانشگاه آزاد اسلامی، تهران، ایران
3 - گروه مدیریت صنعتی، واحد تهران مرکزی، دانشگاه آزاد اسلامی، تهران، ایران
4 - گروه مدیریت دولتی، دانشکده مدیریت و حسابداری، دانشگاه شهید بهشتی، تهران، ایران
کلید واژه: یادگیری عمیق, پیش بینی بازار سهام, پردازش زبان طبیعی, شاخص های فنی, حافظه طولانی کوتاه مدت,
چکیده مقاله :
قیمت سهام تحت تأثیر عوامل بسیاری است،که کار پیشبینی را چالشبرانگیز میکند. این پیشبینی اگر فقط دادههای عددی یا اطلاعات متنی را در نظر بگیرد، اغلب بیاثر میشود. هدف این پژوهش ارائه یک روش پیشبینی قیمت روز آینده سهام بر اساس ساختار شبکه عصبی عمیق با استفاده از دادههای قیمت، مجموعهای از شاخصهای فنی و سر تیتر اخبار بهعنوان ورودی مدل است. برای این منظور از دادههای سهام شاخص داوجونز و دادههای خبری کانال ردیت استفاده شده است. از دادههای سهام ویژگیهای مبتنی بر شاخص فنی استخراج میشوند و دادههای خبری توسط روش کولهکلمات به بردار ویژگی تبدیل میشوند و به شبکه حافظه کوتاهمدت ماندگار (LSTM) برای پیشبینی داده میشوند.از دقت بهعنوان معیار ارزیابی عملکرد استفاده شده و آزمایشهایی بر روی دو مجموعه داده فقط عددی و فقط متنی برای ارزیابی استفاده همزمان دو منبع اطلاعاتی انجام پذیرفته است. همچنین ازسه شبکه ،SVM ، MLPوRNN برای ارزیابی مدل استفاده شده است. نتایج نشان میدهد که مدل LSTM بالاترین دقت پیشبینی 69.19% را با استفاده از اخبار و دادههای مالی به دست آورده است. دادههای خبری با دقت65.62% و دادههای عددی با دقت51.89% میباشند.همچنین مدل LSTMدر مقایسه با شبکههای عصبی SVM وMLP و RNN از عملکرد بهتری برخوردار میباشد.
Stock prices are influenced by many factors, making forecasting challenging. This prediction is often ineffective if it only considers numerical data or textual information. This research aims to provide a method of forecasting the future price of stocks based on the structure of a deep neural network using price data, a set of technical indicators, and news headlines as input to the model. For this purpose, Dow Jones stock data and Reddit channel news data have been used. Technical features are extracted from the stock data, and the news data are converted into a feature vector by the Bag of Words method and fed into the Long-Short term memory network for prediction. Accuracy is used as a performance evaluation measure and experiments on two data sets. The only numerical and only text has been used to evaluate the simultaneous use of two information sources. Also, three networks, SVM, MLP, and RNN, have been used to evaluate the model. The results show that the LSTM model achieved the highest prediction accuracy of 69.19% using news and financial data. News data is 65.62% accurate, and numerical data is 51.89%. Also, the LSTM model performs better than SVM, MLP, and RNN neural networks.
_||_