بهینهسازی پیشبینی تابش خورشیدی بر اساس بستر اینترنت اشیاء در نیروگاه فوتولتائیک
محورهای موضوعی : اینترنت اشیاندا اشرفی خوزانی 1 , مریم محمودی 2 , شبنم نصر اصفهانی 3
1 - دانشکده مهندسی کامپیوتر، واحد میمه، دانشگاه آزاد اسلامی، میمه، ایران
2 - دانشکده مهندسی کامپیوتر، واحد میمه، دانشگاه آزاد اسلامی، میمه، ایران
3 - دانشکده مهندسی برق، واحد میمه، دانشگاه آزاد اسلامی، میمه، ایران
کلید واژه: الگوریتم خفاش, اينترنت اشياء, درخت تصميم, نيروگاههاي فتوولتائيک, يادگيري ماشين,
چکیده مقاله :
ارامتر مقدار تابش خورشيدي يکي از مهمترين پارامترها در تعيين مقدار توان خروجي پنلهاي فتوولتائيک است. پيش¬بيني دقيق اين پارامتر براي برنامه¬ريزي در واحدهاي دیسپچینگ(Dispatching ) و مديريت بار از اهميت ويژهاي برخوردار است. عدم قطعيت در ميزان تابش خورشيدي و سختي پيشبيني آن، طراحان را با چالشهاي اقتصادي و مديريتي مواجه ميکند. در اين پژوهش يک روش پيشبيني با دقت بالا با استفاده از روشهاي مبتني بر درخت و بهبود عملکرد اين روشها به کمک الگوريتمهاي فرا ابتکاري ارائه ميشود. تأکید اصلي در روش پيشنهادي عدم بيش-برازش و قابليت اتکاي بالا و قابليت بهکارگيري در سيستمهاي اينترنت اشياء است. بنابراین، الگوريتمهاي فراابتکاري در بهينهسازي روشهاي مبتني بر درخت و همینطور در انتخاب ويژگي و انتخاب نمونهها نيز دخيل شدهاند. لذا استفاده از روشهاي فراابتکاري به عنوان جنبهي نوآوري اصلي اين پژوهش، نه تنها استفاده براي به دست آوردن تنظيمات بهينهي مدلهاي يادگيري ماشين بلکه در کاهش اثر نويزها، دادههاي پرت(Outlier) و وروديهاي کماثر نيز به بهبود کيفيت خروجي نهايي کمک کرده است. به علاوه مناسبسازي نتايج پيشبيني براي استفاده عملي در محيط نيروگاههاي فتوولتائيک موضوع پراهميتي است. اين موضوع که از طريق تابع برازش نوآورانه اين پژوهش در بهينهسازي مدلها انجام پذيرفته است، باعث ميشود که خروجي نهايي علاوه بر دقت بالا از نظر سهولت پيادهسازي در محيطهاي واقعي نيروگاههاي فتوولتائيک نيز بهينه باشد. خروجي نهايي، يک مدل قوي است که با معيار مربع-R داراي امتياز95/0 است و از نظر سادگي تا حد زيادي بهينه است.
The solar radiation value parameter is one of the most important parameters in determining the output power value of photovoltaic panels. Accurate prediction of this parameter is crucial for dispatching and load management planning. Managers and designers encounter economic and managerial challenges due to the uncertainty and difficulty in predicting solar radiation levels. This research introduces a highly accurate prediction method utilizing tree-based methods, enhanced by meta-heuristic algorithms to boost performance. The proposed method emphasizes preventing overfitting and ensuring high reliability for use in Internet of Things systems. Meta-heuristic algorithms are utilized for optimizing tree-based methods, as well as for feature and instance selection. Employing meta-heuristic methods as the main innovation in this research not only optimizes machine learning model settings but also mitigates the impact of noise, outliers, and ineffective inputs, thereby enhancing the final output quality. Utilizing an innovative fitness function in model optimization enhances prediction accuracy and adaptability to real photovoltaic power plant environments. The final outcome is a strong model that has a score of 0.95 with the R-square criterion and is optimal model.
پيشبيني دقيق پارامتر مقدار تابش خورشيدي به عنوان یک پارامتر مهم در تعيين مقدار توان خروجي پنلهاي فتوولتائيک
بهینهسازی مدل های مبتنی بر درخت توسط الگوریتمهای فراابتکاری برای مدلسازی پارامتر مقدار تابش خورشیدی
حفظ تعادل ميان دقت مدل و سادگي و قابليت پيادهسازي آن در دستگاههاي اينترنت اشياء بهينهسازي شده است.
در نهايت يک مدل قوي که با معيار مربع-R داراي امتياز 95/0 است در این پژوهش به دست آمد.
مدل نهایی قابلیت پیاده سازی در محیط نیروگاه های مبتنی بر اینترنت اشیا را داراست.
[1] N. M. Kumar, K. Atluri and S. Palaparthi, “Internet of Things (IoT) in Photovoltaic Systems,” National Power Engineering Conference (NPEC), 2018, pp. 1-4, doi: 10.1109/NPEC.2018.8476807.
[2] A. Mellit, M. Menghanem and M. Bendekhis, “Artificial neural network model for prediction solar radiation data: application for sizing stand-alone photovoltaic power system,” IEEE Power Engineering Society General Meeting, 2005, San Francisco, CA, USA, 2005, pp. 40-44 Vol. 1, doi: 10.1109/PES.2005.1489526.
[3] A. Angstrom, “Solar and terrestrial radiation: Report to the international commission for solar research on actinometric investigations of solar and atmospheric radiation,” Quarterly Journal of the Royal Meteorological Society, 1924, pp. 121-126,1924, doi:10.1002/qj.49705021008.
[4] J. Prescott, “Evaporation from a water surface in relation to solar radiation,” Transactions of the Royal Society of South Australia, vol. 64, pp 114-118, 1940, doi: 10.4236/epe.2017.912045.
[5] A. A. Trabea and M.M. Shaltout, “Correlation of global solar radiation with meteorological parameters over Egypt,” Renewable Energy, vol. 21, pp. 297-308, Oct. 2000, doi:10.1016/S0960-1481(99)00127-5.
[6] D.Yeboah-Amankwah and K.Agyeman, “Differential Ångstrom model for predicting insolation from hours of sunshine,” Solar Energy, vol. 45, pp. 371-377, 1990, doi:10.1016/0038-092X(90)90158-9.
[7] H. Ninomiya, “Study on application of amedas meteorological data to the simulation of building heat environment,” University of Tokyo, 1994.
[8] J. C . Cao and S. H. Cao, “Study of forecasting solar irradiance using neural networks with preprocessing sample data by wavelet analysis,” Energy, vol. 31, pp. 3435-3445, Dec. 2006, doi: 10.1016/j.energy.2006.04.001.
[9] X. Qing and Y. Niu, “Hourly day-ahead solar irradiance prediction using weather forecasts by LSTM,” Energy, vol. 148, pp. 461-468, Apr. 2018, doi: 10.1016/j.energy.2018.01.177.
[10] D. Pothineni, M. R. Oswald, J. Poland and M. Pollefeys,“KloudNet: Deep Learning for Sky Image Analysis and Irradiance Forecasting,” German Conference on Pattern Recognition, 2018, pp. 535-551, doi:10.1007/978-3-030-12939-2_37.
[11] J. Lago, K. D. Brabandere, F. D. Ridder and B. D. Schuttera, “Short-term forecasting of solar irradiance without local telemetry: A generalized model using satellite data,” SolarEnergy, vol. 173, pp. 566-577, Oct. 2018, doi: 10.1016/j.solener.2018.07.050.
[12] N. Dong, J. F. Chang, A. G. Wu and Z. K. Gao, “A novel convolutional neural network framework based solar irradiance prediction method,” International Journal of Electrical Power & Energy Systems, vol. 114, pp. 1-19, Jan. 2020, doi: 10.1016/j.ijepes.2019.105411.
[13] N. Sharma, P. Sharma, D. Irwin and P. Shenoy, “Predicting solar generation from weather forecasts using machine learning,” IEEE International Conference on Smart Grid Communications (SmartGridComm), 2011, pp. 528-533, doi: 10.1109/SmartGridComm.2011.6102379.
[14] P. J. M. Ali and R. H. Faraj, “Data normalization and standardization: a technical report,” Mach. Learn. Tech. Rep., vol. 1, no. 1, pp. 1-6, 2014, doi: 10.13140/RG.2.2.28948.04489.
[15] Y.-Y. Song and L. Ying, “Decision tree methods: applications for classification and prediction,” Shanghai archives of psychiatry, vol. 27, no. 2, pp. 130-135, Apr. 2015, doi: 10.11919/j.issn.1002-0829.215044.
[16] N. Bhargava, G. Sharma, R. Bhargava and M. Mathuria, “Decision tree analysis on j48 algorithm for data mining,” Intrenational Journal of Advanced Research in Computer Science and Software Engineering, vol. 3, no. 6, 2013.
[17] D. Borup, B.J. Christensen, N.S. Mühlbach and M.S. Nielsen, “Targeting predictors in random forest regression,” International Journal of Forecasting, vol. 39, pp. 841–868, 2023, doi:10.1016/j.ijforecast.2022.02.010.
[18] Y. Li et al., “Random forest regression for online capacity estimation of lithium-ion batteries,” Applied energy, vol. 232, pp. 197-210, Dec. 2018, doi: 10.1016/j.apenergy.2018.09.182.
[19] R. Seyghaly, J. Garcia, X. Masip-Bruin and M. M. Varnamkhasti, “Interference Recognition for Fog Enabled IoT Architecture using a Novel Tree-based Method,” IEEE International Conference on Omni-layer Intelligent Systems (COINS), 2022, pp. 1-6, doi: 10.1109/COINS54846.2022.9854944.
[20] G. Sembina, “Building a scoring model using the ADABOOST ensemble model,” International Conference on Smart Information Systems and Technologies (SIST), 2022, doi:10.1109/sist54437.2022.9945713.
[21] D. P. Solomatine and D. L. Shrestha, “AdaBoost.RT: a boosting algorithm for regression problems,” IEEE International Joint Conference on Neural Networks (IEEE Cat. No.04CH37541), Budapest, Hungary, 2004, pp. 1163-1168 vol.2, doi: 10.1109/IJCNN.2004.1380102.
[22] X. S. Yang, “A New Metaheuristic Bat-Inspired Algorithm,” Nature Inspired Cooperative Strategies for Optimization (NICSO 2010), vol. 284, pp. 65–74, 2010, doi: 10.1007/978-3-642-12538-6_6.
[23] M.Banerjee, “Cook's distance in linear longitudinal models,” Communications in Statistics-Theory and Methods, vol. 27, pp. 2973-2983, 1998, doi: 10.1080/03610929808832267.
[24] J. Carmona, I. Lopez, J. Mateo, L. Jimenez and E. Aldana, “A distance-based method for outlier detection on high dimensional datasets,” IEEE Latin America Transactions, vol. 18, pp. 589–597, 2020, doi:10.1109/tla.2020.9082731.
[25] E. -S. M. El-Kenawy et al., “Advanced Ensemble Model for Solar Radiation Forecasting Using Sine Cosine Algorithm and Newton’s Laws,” in IEEE Access, vol. 9, pp. 115750-115765, 2021, doi: 10.1109/ACCESS.2021.3106233.
13 بهينهسازي پيشبيني تابش خورشيدي بر اساس بستر اينترنت اشياء در نيروگاه فوتولتائيک
مقاله پژوهشی |
بهينهسازي پيشبيني تابش خورشيدي بر اساس بستر اينترنت اشياء در نيروگاه فوتولتائيک
|
تاریخ دریافت: تاریخ بازنگری: تاریخ پذیرش:
|
کلید واژهها: اينترنت اشياء، درخت تصميم، يادگيري ماشين، الگوريتم
خفاش، نيروگاههاي فتوولتائيک
https://doi.org/... |
1-مقدمه
به طور کلي، سيستمهاي فوتوولتائيک به سيستمهايي اطلاق ميشود که از نور خورشيد براي توليد برق استفاده ميکنند. اين سيستمها شامل مجموعهاي از ماژولهاي فوتوولتائيک(سلولهاي خورشيدي) هستند که نور خورشيد را به انرژي الکتريکي تبديل ميکنند. استفاده از سيستمهاي فوتوولتائيک به عنوان يکي از انواع منابع توليد انرژي پاک، در سالهاي اخير به طور چشمگيري در بسياري از کشورها افزايش يافته است. اما اين سيستمها داراي عدم قطعيت در توليد انرژي هستند که ميتواند براي شبکههاي برق مشکلاتي ايجاد کند. براي مثال، افزايش توليد انرژي در سيستمهاي فوتوولتائيک در روزهاي آفتابي باعث افزايش ولتاژ در شبکه ميشود و در صورت عدم مديريت مناسب ميتواند باعث اتلاف انرژي، خرابي تجهيزات و حتي ايجاد نقص در شبکه شود. بنابراين، براي جلوگيري از اين مشکلات، مديريت دقيق توليد انرژي سيستمهاي فوتوولتائيک و پيشبيني دقيق عدم قطعيت در توليد انرژي اين سيستمها براي شبکههاي برق بسيار مهم و ضروري است.
اينترنت اشياء1 امروزه نقشي حياتي در جنبههاي مختلف زندگي انسانها از کشاورزي و صنعت تا پزشکي و شهرهاي هوشمند بازي ميکند. ﺑﻪ ﺻﻮرت ﺧﻼﺻﻪ اﯾﻨﺘﺮﻧﺖ اﺷﯿﺎء ﻓﻨﺎوري نويني اﺳﺖﮐﻪ در آن ﺑﺮاي ﻫﺮ ﻣﻮﺟﻮديتي(اعم از اﻧﺴﺎن و ﯾﺎ اﺷﯿﺎء) ﻗﺎﺑﻠﯿﺖ دريافت و ارﺳﺎل داده از ﻃﺮﯾﻖ ﺷﺒﮑﻪي اﯾﻨﺘﺮنت يا اﯾﻨﺘﺮاﻧﺖ، ﻓﺮاﻫﻢ ﻣﯽﮔﺮدد. اينترنت اشياء در واقع زيرساختي از شبکه پوياي خود تنظيم شونده با پروتکلهاي ارتباطي استاندارد و يکپارچه است که در آن اشياء فيزيکي و مجازي، داراي هويت، ويژگيهاي فيزيکي و شخصيتهاي مجازي هستند و به صورت يکپارچه درون زيرساخت اطلاعاتي تجميع شدهاند. نيروگاههاي خورشيدي فتوولتائيک2 نيز از اين موضوع مستثني نيستند و سيستمهاي اينترنت اشياء با هدف پايش لحظهاي و جلوگيري از بروز خطاهاي احتمالي در اين نيروگاهها مورد توجه قرار گرفتهاند.
به عنوان نمونه، يک سيستم کنترل نيروگاه فتوولتائيک در سال 2018 در [1] پيشنهاد شدهاست که داراي سه لايه مختلف است. لايهي اول شامل تجهيزات محيطي در مکان نيروگاه اعم از پنلهاي فتوولتائيک، سنسورها، سوئيچها و غيره است. لايهي دوم شامل سرور مرکزي و روتر براي اتصال امن به شبکه است و آخرين لايه شامل اينترنت و پايگاههاي داده است که کنترل و پايش اين سيستم را به عهده دارد. معماري کلي اين سيستم در شکل 1 نمايش داده شدهاست. در این معماری، لایه اول شامل محیط طراحی سیستم فتوولتائيک است، که در آن تمام اجزا مطابق با تنظیمات مورد نیاز برای تکمیل کامل نیازهای کاربر به هم متصل شدند. لایه دوم که به عنوان اتصال بین طراحی های سخت افزاری سیستم فتوولتائيک به وب سرور از طریق یک روتر با گزینه فایروال اینترنتی عمل میکند. اطلاعات از سرور به لایه سوم که لایه نظارت و کنترل از راه دور است داده می شود. در اینجا سرور اطلاعات جمع آوری شده در مورد سیستم فتوولتائيک را به دستگاههای ذخیره سازی که میتوان از آنها گزارش های دوره ای تولید کرد، تحویل میدهد.
از آنجایی که با توجه به این معماری و روشهای مشابه، کنترل سیستمهای فتوولتائيک به کمک اینترنت اشیا مورد توجه قرار گرفتهاست، نیاز به توسعه مدلهای متناسب با اینترنت اشیا که پارامترهای مهم را به منظور کنترل دقیقتر این نیروگاهها پیشبینی میکند از اهمیت ویژهای برخوردار است.
شکل 1: معماري اينترنت اشيا براي کنترل نيروگاه فتوولتائيک[1]
پارامتر مقدار تابش خورشيدي يکي از مهمترين پارامترها در تعيين مقدار توان خروجي پنلهاي فتوولتائيک است. این پارامتر که به شدت یا توان تابشی خورشید نیز شناخته میشود، با میزان انرژش تولیدی در نیروگاههای فتوولتائيک رابطه مستقیم دارد و آن را با W/m2 نشان میدهند. اگر شدت تابش را در پارامتر زمان ضرب کنیم به انرژی تابشی خورشید میرسیم و واحد آنرا با Wh/m2 یا Kwh/m2 نشان میدهند. پيش بيني دقيق اين پارامتر براي برنامهريزي در واحدهاي ديسپچينگ و مديريت بار از اهميت ويژهاي برخوردار است. اين پارامتر همچنين در حفظ پايداري ولتاژ و فرکانس شبکه و آمادهسازي نيروگاههاي پشتيبان نيز حائز اهميت است. عدم قطعيت در ميزان تابش خورشيدي و سختي پيشبيني کوتاه مدت آن، مديران و طراحان سيستمهايي که از انرژي خورشيدي بهره ميگيرند را با چالشهاي اقتصادي و مديريتي مواجه ميکند. از اين رو يک چارچوب دقيق و داراي عموميت بالا که بتواند در سيستمهاي اينترنت اشيايي که محيطهاي اين نيروگاهها را کنترل ميکنند به خوبي اجرا شود، ميتواند کمک شاياني در اين زمينه داشته باشد [2]. در اين پژوهش، يک چارچوب پيشبيني تابش خورشيدي با ويژگيهاي زير ارائه ميشود:
§ قابليت پيادهسازي در سيستمهاي اينترنت اشيا با مصرف بهينه منابع
§ دقت و عموميت بالا
§ عدم وجود مشکل بيش برازش2
اهميت قابلتوجه تحليل تابش خورشيدي حتي پيش از اينکه مدلهاي يادگيري ماشين در حوزههاي مختلف علمي و مهندسي به طور گسترده بهکار گرفته شوند، دانشمندان را بر آن داشت که مدلهايي براي تحليل اين پديده ارائه کنند. مدل انگستروم [3] و حالت ارتقا يافتهي آن يعني مدل انگستروم-پرسکات [4] را ميتوان اولين تلاشها در اين زمينه دانست. در طي ساليان متمادي، روشهاي متعدد ديگري بر مبناي همين پژوهشها ارائه شد که برخي از آنها در منابع [5-7] قابل مشاهده هستند. اما آنچه براي ما به عنوان پيشينه اين پژوهش از اهميت بيشتري برخوردار است استفاده از روشهاي يادگيري ماشين در اين زمينه است که در ادامه به برخي از آنها ميپردازيم. شبکههاي عصبي مصنوعي و ساير روشهاي مبتني بر آن، پايه بسياري از پژوهشها در اين زمينه قرار گرفتهاند. از جمله مليت و همکارانش در [2] يک مدل شبکه عصبي براي مدلسازي دادههاي تابش خورشيدي با کاربد سايزينگ سيستم فتوولتائيک ارائه کردهاند. همچنين، کائو و همکارانش در [8]، يک روش ترکيبي با استفاده از شبكههاي عصبي مصنوعي و تحليل موجک را براي پيشبيني تابش خورشيدي در يک شبانهروز را توسعه دادهاند. دادههاي استفاده شده در اين تحقيق ديتاي تاريخي روزانه مقدار تابش است. در [9] نيز مدل شبكههاي عصبي نوع 3LSTM براي پيشبيني اين پارامتر استفاده شده است با اين تفاوت که دادههاي مورد استفاده در آن دادههاي هواشناسي مانند دما، رطوبت و غيره است. روش متفاوتي در [10] براي پيشبيني نوسانات تابش ارائه شدهاست که بر تصويربرداري از آسمان مبتني است. بازه زماني پيشبيني در اين تحقيق 5 تا 10 دقيقه است و بر همين اساس، پيشبيني کوتاه مدت به شمار ميآيد. تكنيک يادگيري ماشيني که در اين تحقيق به كار رفته است، شبكههاي عصبي کانولوشني عميق است. همچنين در [11] مدلي را براي پيشبيني تابش خورشيدي در بازههاي کوتاه مدت معرفي شده است که ميتواند براي هر موقعيت جغرافيايي مورد استفاده قرار بگيرد، بدون اينكه به اندازهگيريهاي ميداني نياز داشته باشد. اين روش به جاي اينکه استفاده از اطلاعات ماهوارهاي کند پيشبينيهاي هواشناسي را در قالب شبكههاي عصبي عميق استفاده کردهاست. همچنين در رويکردي که در [12] پيشنهاد شده است، مدلي براي پيشبيني تابش با استفاده از شبكههاي عصبي نوع کانولوشني ارائه شده است. دادههاي ورودي به صورت 15 حالت هواشناسي شامل ابري، نيمهابري، صاف و غيره است که از دادههاي ايستگاه هواشناسي نمونهبرداري ميشوند. به منظور بهينهسازيهاي ابرپارامترهاي شبكهي عصبي پيشنهادي، از الگوريتم ترکيبي 4PSO/GA استفاده شدهاست که از اين جنبه شباهت بيشتري به پژوهش موجود دارد. ماشين بردار پشتيبان نيز در [13] به منظور مدلسازي و پيشبيني تابش در بازههاي زماني 3 ساعته به کار گرفته شدهاست. اين پژوهش به طور خاص براي خانههاي هوشمند که از انرژي خورشيدي استفاده ميکنند طراحي شده است و پارامترهايي همچون دما، روز، سال، سرعت باد، پوشش ابر و غيره براي انجام پيشبيني مورد استفاده قرار گرفتهاند.
در پژوهشهاي مشابه انجام شده که به مهمترين آنها اشاره شد، عموما به دست آوردن يک مدل پيشبيني تابش خورشيدي با دقت بالا هدف قرار گرفتهاست. به همين دليل، هرچند مدلهاي دقيقي براي پيشبيني تابش خورشيدي به دست آمده است در بسياري از موارد فاقد تحليلهاي مربوط به عموميت مدلها(بيش-برازش) هستند. از طرفي امکان عملي استفاده از مدلها در سيستمهاي اينترنت اشياي در محيط نيروگاههاي فتوولتائيک در مدلسازي در نظر گرفته نشده است. لذا در اين پژوهش سعي شده است که با انتخاب مدل مناسب و روش مناسب براي بهينهسازي مدل به دست آمده داراي سرعت و سهولت پيادهسازي کافي براي استفاده در اين نوع محيطها مدنظر قرار داده شود. به طور خلاصه در اين پژوهش، استفاده از روشهاي فرا ابتکاري به عنوان جنبه اصلي نوآوري، نهتنها براي بهدستآوردن تنظيمات بهينه مدلهاي يادگيري ماشين بلکه به منظور کاهش اثر نويزها، دادههاي پرت و وروديهاي کماثر نيز به بهبود کيفيت خروجي نهايي مورد استفاده قرار گرفته است. علاوه بر اين، مناسبسازي نتايج پيشبيني براي استفاده عملي در محيطهاي نيروگاههاي فتوولتائيک، که در اين پژوهش مورد توجه قرار گرفته است، جنبهي نوآوري پراهميتي است. با استفاده از تابع برازش نوآورانه مورد استفاده در اين پژوهش براي بهينهسازي مدلها، خروجي نهايي علاوه بر داشتن دقت بالا، از نظر سهولت پيادهسازي در محيطهاي واقعي نيروگاههاي فتوولتائيک نيز بهبود يافته است.
2-روش پیشنهادی
در اين پژوهش، هدف اصلي توسعهي يک مدل دقيق براي پيشبيني تابش خورشيدي است که قابليت استفاده در اينترنت اشيا را دارد. لذا مدلهاي گروهي(تجميعي) مبتني بر درخت تصميم به عنوان پايهي اصلي مدلسازي انتخاب شدند. دليل اين انتخاب تفسيرپذير بودن ذاتي روشهاي مبتني بر درخت است. اين روشها در واقع از تعدادي درخت تصميم مختلف که در کنار يکديگر، يک مدل قويتر را ميسازند، تشکيل ميشوند. در اين بخش ابتدا به معرفي بلوکهاي سازنده چارچوب اين پژوهش پرداخته ميشود و در پايان روش پيشنهادي ارائه ميشود.
2-1-پيش پردازش
پيشپردازش دادهها يک مرحله مهم در فرآيند يادگيري ماشين است که شامل تبديل و تهيه دادهها قبل از ورود به مدل يادگيري ميشود. دو فعاليت مهم اين مراحل مهم شامل حذف دادههاي پرت و نرمالسازي هستند. حذف دادههاي پرت به منظور حذف دادههاي نامناسب، نادرست يا غيرعادي استفاده ميشود. اين دادهها ممکن است ناقص يا با مقادير غيرمنطقي باشند و ممکن است تحت تأثير خطاهاي اندازهگيري، نويزهاي تصادفي يا خطاهاي ديگر قرار گرفته باشند. حذف اين دادهها ميتواند باعث بهبود کيفيت دادهها و دقت مدل يادگيري شود، زيرا دادههاي پرت ممکن است در تصميمگيري مدل تأثير منفي داشته باشند [8].
نرمالسازي دادهها به منظور قرار دادن دادهها در يک مقياس يکسان و قابل مقايسه استفاده ميشود. اين فرآيند معمولاً با استفاده از روشهاي مختلف مانند مقياسبندي، زيرگروهبندي يا تبديلات رياضي انجام ميشود. با نرمالسازي دادهها، واحدهاي مختلف و مقياسهاي متفاوت دادهها به يک مقياس مشترک تبديل ميشوند. اين موضوع باعث ميشود که مدلهاي يادگيري ماشين بتوانند بهخوبي الگوها و روابط بين دادهها را درک کنند و عملکرد بهتري در پيشبيني و تصميمگيري داشته باشند [14].
2-2-درخت تصميم
مدل درخت تصميم يک الگوريتم يادگيري ماشين است که براي مسائل طبقهبندي و پيشبيني استفاده ميشود. اين مدل بر اساس يک ساختار درختي تصميمگيري ساخته ميشود و به صورت سلسله مراتبي قواعد و شرايط را بررسي ميکند تا به تصميمات نهايي برسد. در مدل درخت تصميم، هر گره از درخت نمايانگر يک ويژگي است که به عنوان يک شرط بر روي دادهها بررسي ميشود. با توجه به مقدار ويژگي در دادهها، درخت به شاخههاي مختلف تقسيم ميشود [15]هر شاخه از درخت نمايانگر يک مقدار ممکن براي ويژگي و يا يک مجموعه از مقادير است. در نهايت، برگها (گرههاي پاياني درخت که فاقد گرههاي فرزند هستند) نمايانگر کلاسهاي طبقهبندي شده يا مقدار پيوسته پيشبيني شده براي دادهها هستند. مزيت اصلي مدل درخت تصميم اين است که آن راحت قابل فهم و تفسير است و همچنين ميتواند به صورت مجموعهاي از قوانين بيان شود. به علاوه، درخت تصميم قابليت کاربرد در دادههاي عددي و دستهاي را دارد و به خوبي با دادههاي کمکاربرد يا ناقص سازگاري دارد. در کل، مدل درخت تصميم به عنوان يک ابزار قوي در يادگيري ماشين مورد استفاده قرار ميگيرد که قابليت طبقهبندي و پيشبيني دقيق را در مسائل مختلف ارائه ميدهد [16].
2-3-جنگل تصادفي
مدل جنگل تصادفي يک الگوريتم يادگيري ماشين است که بر پايه ترکيب چندين درخت تصميم ساخته ميشود. اين مدل از ترکيب تصميمهاي گوناگون چندين درخت تصميم بهره ميبرد تا بهترين و تصميمهاي قابل اطمينانتري را در مورد دادهها ارائه دهد. در مدل جنگل تصادفي، هر درخت تصميم به صورت مستقل ساخته ميشود. اين درختها بر اساس تصادفيسازي در فرآيند ساخت شاخهبندي مورد استفاده قرار ميگيرند. به عبارت ديگر، در هر مرحله از ساخت درخت، فقط يک زيرمجموعه تصادفي از ويژگيها براي تقسيم دادهها استفاده ميشود. اين عمل تصادفي باعث ايجاد تنوع در درختها ميشود و از بيشبرازش جلوگيري ميکند. در نهايت، تصميم نهايي مدل جنگل تصادفي بر اساس آرايهاي از تصميمهاي هر درخت تصميم درخت ميشود. با ترکيب نتايج چندين درخت، مدل جنگل تصادفي قادر است به صورت همزمان بر روي دادههاي آموزش و دادههاي تست پيشبيني دقيقي ارائه دهد.
مزيت اصلي مدل جنگل تصادفي اين است که از توانايي کاهش واريانس و بيشبرازش در مدلهاي تصميمگيري تک درخت استفاده ميکند. همچنين، اين مدل قابليت مقابله با دادههاي پرت، توانايي برخورد با دادههاي بزرگ، و قابليت استخراج اهميت ويژگيها را داراست [17].
2-4-ادابوست
مدل ادابوست يک الگوريتم يادگيري ماشين مبتني بر مجموعههاي ضعيف است که با استفاده از ترکيب آنها يک مدل قويتر و دقيقتر را ايجاد ميکند. ايده اصلي اين الگوريتم اين است که ترکيب چندين تصميمگيري ضعيف به وسيله وزندهي به هر يک از آنها، منجر به ساخت يک تصميمگيري قوي ميشود [18]. در مدل ادابوست، درختهاي تصميم به عنوان تصميمگيريهاي ضعيف مورد استفاده قرار ميگيرند. ابتدا هر درخت تصميم با استفاده از مجموعه دادههاي آموزش ساخته ميشود. سپس به هر دادهي آموزشي وزني اختصاص داده ميشود و درخت با استفاده از اين وزنها آموزش داده ميشود. در اين مرحله، تمرکز بر دادههايي که به درستي تشخيص داده نشدهاند، بيشتر ميشود. سپس درخت تصميم نهايي با توجه به وزنهاي دادهها ساخته ميشود. درختهايي که توانستند دادههاي نادرست را به خوبي تشخيص دهند، وزن بيشتري در ادامه فرآيند اختصاص ميدهند. اين روند تکرار ميشود و در هر مرحله، درختي جديد با توجه به وزنهاي جديد ساخته ميشود. در نهايت، تمام درختهاي ساخته شده با استفاده از روش اجماع ترکيب ميشوند تا مدل نهايي ادابوست به دست آيد. اين مدل، با توجه به وزنهاي اختصاص داده شده به هر درخت، تصميماتي را اتخاذ ميکند که به دقت بيشتري در پيشبيني و تصميمگيري ميانجامد. در واقع، اين وزنها به مدل اجازه ميدهند تا در تصميمگيري بيشترين تأثير را داشته باشند. به عبارت ديگر، درختهايي که در تشخيص دادههاي پيچيده و دشوار موفقيت بيشتري دارند، نقش مهمتري در تصميمگيري نهايي دارند.
مزيت اصلي مدل ادابوست اين است که با ترکيب چندين درخت تصميم ضعيف، يک مدل قويتر و مقاومتر در برابر بيشبرازش ايجاد ميکند. همچنين، با تمرکز بر دادههايي که توسط درختهاي قبلي اشتباه تشخيص داده شدهاند، مدل توانايي بهبود دقت و عملکرد خود را افزايش ميدهد. اين الگوريتم قابليت استفاده در مسائل دستهبندي و رگرسيون را دارد و در بسياري از موارد با عملکرد برتر نسبت به الگوريتمهاي تک درخت مانند درخت تصميم استفاده مي شود [19].
2-5-روش پيشنهادي
در اينجا از دو روش جنگل تصادفي(که در آن تعدادي درخت تصميم به صورت مستقل از هم پيشبيني را انجام ميدهند و در مدل نهايي نتايج آنها با هم ترکيب ميشود) و ادابوست (که در آن هر مدل درخت تصميم بر اساس دادههايي که در مراحل قبل با خطاي بالا پيش بيني شدهاست توسعه مييابد) استفاده ميکنيم. اما از آنجايي که اين مدلها خود داراي ابر-پارامترهايي هستند که مقدار آنها تاثير مستقيمي در نتيجه نهايي دارد، انتخاب اين پارامترهاي حياتي و همچنين انتخاب ويژگيها (وروديها) و نمونههاي مورد استفاده در مرحلهي آموزش از اهميت خاصي برخوردار است. به عنوان جنبهي اصلي نوآوري، در اين پژوهش بر مبناي ايدهي مطرح شده در [18] براي بهينهسازي اين موارد از الگوريتم فراابتکاري خفاش [20] استفاده شده است که همانند الگوريتم ژنتيک يک الگوريتم الهام گرفته شده از طبيعت است و براي مسائل بهينهسازي بسيار پرکاربرد است. در ادامه به توضيح جزئيات روش پيشنهادي که معماري کلي آن در شکل 2 نمايش داده شده است، ميپردازيم.
يکي از اولين اقدامات در هر مساله يادگيري نظارتشده، پيشپردازش است. در اينجا در مرحله پيشپردازش ابتدا دادههاي پرت شناسايي و حذف ميشوند. به اين منظور از روش فاصلهي کوک [21] استفاده ميشود. به علاوه در اين مرحله عمل نرمالسازي دادهها نيز انجام ميشود، عدم نرمالسازي وروديها ميتواند باعث شود که ويژگيهايي که بازهي تغيير گستردهتري دارند تاثير زيادي در مدلنهايي به صورت غير عادي ايفا کرده و از دقت مدل بکاهد. لذا مقادير همه وروديها در اين مرحله نرمالسازي ميشوند. در آخرين فعاليت از مراحل پيشپردازش، دادهها به دو زير مجموعه دادههاي آموزش و دادههاي تست تقسيم ميشوند. از آنجايي که دادههاي تست براي آزمايش و محاسبهي معيارهاي مختلف در مدلهاي توليد شده مورد استفاده قرار ميگيرند و در مرحله آموزش نقشي ندارد، تعداد اين دادهها بايد محدود و بسيار کوچکتر از دادههاي آموزش باشد. لذا اين تقسيم با نسبت 9 به 1 انجام ميپذيرد و صرفا 10 درصد از دادهها به صورت تصادفي به عنوان دادههاي تست انتخاب ميشوند.
شکل 2: معماري کلي روش پيشنهادي
پس از پيشپردازش، نوبت به فعاليتهاي سهگانهاي ميرسد که تحت عنوان کلي انتخاب مدل شناخته ميشوند. اما اين فعاليتها صرفا شامل انتخاب يک الگوريتم براي انجام مدلسازي نيستند. در اين پژوهش انتخاب الگوريتم مورد استفاده (يکي از دو الگوريتم جنگل تصادفي و ادابوست که پيشتر ذکر شد)، انتخاب مقادير ابرپارامترها و انتخاب نمونهها و ويژگيهاي مورد استفاده در اين مرحله انجام ميپذيرد. در واقع اگر هر ترکيب از مواردي که ذکر شد را به عنوان يک راهحل در نظر بگيريم اين راهحل يک آرايه عددي است که اولين عنصر آن الگوريتم مورد استفاده را به صورت 0 و 1 مشخص ميکند. سپس 5 عنصر بعدي مقادير ابرپارامترها را مشخص ميکند. اين ابرپارامترها عبارتند از:
§ تعداد درخت تصميم(مدلهاي پايه)
§ حداکثر عمق درخت تصميم
§ حداکثر تعداد ويژگي مورد بررسي در هر گره از درخت تصميم
§ تعداد نمونه لازم براي تشکيل يک انشعاب در درخت تصميم
§ نرخ يادگيري(براي ادابوست)
ساير عناصر يک راهحل نيز حضور/عدم حضور ويژگيها و نمونههاي موجود در مجموعه داده هاي آموزش را براي الگوريتم مشخص ميکند. بنابراين با هر يک راهحل که در بالا توضيح داده شد ميتوانيم يک مدل کامل بسازيم که بر اساس مقادير موجود در آرايه ذکر شده پيکرهبندي شدهاست. با اين توضيحات در واقع ما يک مساله بهينهسازي داريم که با روشهاي تکاملي و فراابتکاري قابل حل است. در اينجا ما الگوريتم خفاش را انتخاب کردهايم. انگيزهي اين انتخاب همگرايي سريع اين الگوريتم است.
از آنجايي که در مدل نهايي به دست آمده از اين پژوهش بايد علاوه بر دقت پيشبيني بالا، تا جاي ممکن از پيچيدگي کمي برخوردار باشد. لذا در مقايسه ترکيبهاي مختلف با يکديگر علاوه بر پارامتر دقت مدل بايد تعداد درخت تصميم و حدکثر عمق درخت را نيز مورد بررسي قرار دهيم. به دست آوردن نوعي تعادل بين دقت مدل و پيچيدگي آن باعث ميشود مدل نهايي از نظر مصرف منابع محاسباتي در زمان پيادهسازي در اين اينترنت اشياء بهينگي بيشتري داشته باشد. به بيان ديگر، داشتن مدلي که علاوه بر دقت بالا داراي پيچيدگي بهينه نيز باشد هدف قابليت پيادهسازي در سيستمهاي کنترلي مبتني بر اينترنت اشيا را تامين ميکند. بر همين اساس، تابع برازش را با استفاده از امتياز R2 که نمايانگر دقت مدل است و تعداد درخت تصميم و حداکثر عمق که پيچيدگي مدل را نشان ميدهند، اينگونه تعريف ميکنيم:
(1)
(2)
در معادلات فوق n تعداد کل نقاط داده را مشخص ميکند، t مقدار اندازهگيري شده (مقدار مورد انتظار) را نشان ميدهد و o مقدار پيشبيني شده توسط مدل را مشخص ميکند.
پس از انجام بهينهسازي، يک مدل نهايي بهدست ميآيد که بهترين و دقيقترين پيشبيني را از ميان راهحل هاي مختلف توليد شده انجام ميدهد. در اين مرحله با توجه به اينکه هر درخت تصميم (مدل پايهي روشهاي مورد استفاده) ميتواند به صورت مجموعهاي از قوانين بيان شود، ميتوانيم قوانين همهي درختهاي توليد شده توسط مدل نهايي را استخراج کرده و مجموعه قوانين از پيش تعيين شدهاي را براي استفاده در محيط اينترنت اشياء داشته باشيم. اين قوانين با توجه به اينکه ثابت بوده و نيازي به تغيير منظم و مدلسازي در سمت گرههاي اينترنت اشيا نيست. بنابراين سربار اضافي نيز براي پيش بيني تابش خورشيد اعمال نميشود.
با توجه به امکان استخراج قوانين در روش پيشنهادي، اين مدل به صورت خودکار براي تشخيص آفلاين تابش به کار ميرود و ميتواند در برابر شکست بستر مخابراتي و قطعي ارتباطات کمک کننده باشد. در واقع با اين روش، قوانين پيشبينيکننده ميتواند جايگزين توسعه تکراري مدلها شده و اين ميتواند به بهبود قابل توجه ارتباطات و کاهش ريسک ناشي از قطعي ارتباطات در برابر شکست بستر مخابراتي منجر شود.
2-6-مجموعه داده ها و روش ارزيابي
به منظور آزمايش روش پيشنهادي که در بخش قبل بيان شد، مجموعه دادههاي ارائه شده در يکي از چالشهاي ناسا در پيشبيني شدت تابش در نظر گرفته شده است که در تعدادي از کارهاي مشابه مانند [22] استفاده شده است. اين مجموعه دادهها مشتمل بر بيش از 30 هزار بردار داده است که داراي 11 ستون (ويژگي) مختلف است و در اکثر پژوهشهاي اخير به عنوان يک مجموعه دادهاي استاندارد به منظور مقايسه روشها استفاده شده است. در اين پژوهش ويژگيهاي مربوط به تاريخ و زمان ثبت رکورد مربوط حذف شدهاند تا مدلسازي صرفا بر اساس پارامترهاي آب و هوايي ديگر انجام شود. در نهايت خروجي هدف مقدار تابش و وروديهاي مدلسازي عبارتند از:
§ دما
§ فشار
§ رطوبت هوا
§ جهت باد
§ سرعت باد
تحليل ضرايب همبستگي پيرسون پارامترهاي ورودي و خروجي در شکل 3 نمايش داده شده است. از اين نمودار ميتوانيم نتيجه بگيريم که هيچ رابطه کاملا خطي بين مقادير پارامترها وجود ندارد. لذا با توجه به اينکه تعداد پارامترها به نسبت کم است، ميتوانيم نيازي به حذف هيچکدام از وروديها احساس نميشود. هرچند در ادامه در فعاليت انتخاب ويژگي ممکن است بعضي از اين ويژگيها حذف شوند اما در اينجا از هيچيک از وروديها صرف نظر نميکنيم.
شکل 3: تحليل همبستگي پيرسون
شکل 4: تحليل دادههاي پرت با روش فاصله کوک
3-نتایج شبیه سازی
در اين بخش نتايج روش پيشنهادي که به کمک زبان برنامهنويسي پايتون پيادهسازي شده است بررسي ميکنيم. در مرحله پيشپردازش تحليل کوک همانطور که در بخش روش پيشنهادي گفته شد انجام شده که نتايج آن در شکل 4 نمايش داده شده است. بر اين اساس 2/7 درصد از دادهها به عنوان داده پرت تشخيص داده شد و از مرحله آموزش مدلها کنار گذاشته شد.
بعد از حذف دادههاي پرت، بر مبناي آنچه در روش پيشنهادي بيان شد با اجراي تکرارهاي الگوريتم خفاش، بهترين پيکرهبندي براي پيشبيني شدت تابش به دست آمد. خروجي نهايي اين بهينهسازي مدل جنگل تصادفي با ابرپارامترهاي نمايش داده شده در جدول 1 است.
جدول 1: پارامترهاي مدل نهايي
نمونه لازم براي انشعاب | حداکثر تعداد ويژگي | حداکثر عمق | تعداد درخت تصميم | ابر پارامتر |
32 | 4 | 25 | 89 | مقدار |
مدل نهايي به دست آمده داراي امتياز R2 معادل 956/0 در مرحله آموزش و 948/0 براي دادههاي تست است که نشاندهندهي يک دقت قابل قبول براي پيشبيني شدت تابش است. لازم به ذکر است که در تکرارهاي الگوريتم بهينهسازي تعدادي از مدلهاي کانديد دقت بالاتري نيز از خود نشان دادند اما با توجه به اينکه فاصله دقت آموزش و تست در آنها قابل توجه بود(بيش برازش) و يا مدل پيچيدگي بالايي داشت(تعداد بالاي درخت تصميم)، اين مدلها با توجه به تابع برازشي که در اين پژوهش تعريف کردهايم به عنوان خروجي نهايي بهينهسازي انتخاب نشدند.
مدل نهايي جنگل تصادفي به دست آمده در اين پژوهش داراي حداکثر عمق 25 و تعداد درخت 89 است، بنابراين استخراج همهي قوانين براي پيشبيني شدت تابش به تعداد محدودي قانون منجر شده و ميتواند به صورت آفلاين و مستقر در حافظه در دستگاههاي اينترنت اشياء مورد استفاده قرار گيرد.
همچنين به منظور اعتبارسنجي مدل نهايي از روش k-fold استفاده شد. این روش به کمک تقسيم دادهها به k بخش، هر بار يکي از بخشها را به عنوان دادههاي اعتبارسنجي و بقيه بخشها را به عنوان دادههاي آموزش استفاده کرده و مدل را با استفاده از دادههاي آموزش آموزش داده و عملکرد آن را با دادههاي اعتبارسنجي ارزيابي ميکند. اين فرايند را k بار (در اینجا k=10) تکرار ميکند و در هر مرحله، بخشهاي ديگر را به عنوان دادههاي آموزش و اعتبارسنجي استفاده ميکند. سپس عملکرد مدل در هر بار تکرار، ميانگين شده و به عنوان عملکرد نهايي مدل گزارش ميشود. اين روش اعتبارسنجي مدل را بهبود ميبخشد و به دقت و استنباط قويتري از عملکرد مدل در مواجهه با دادههاي تست ميانجامد. نتيجه اين الگوريتم اعتبارسنجي در مدل نهايي نشان دهنده انحراف معيار 00148/0 در شاخص R2 است. اين عدد نشان ميدهد که مدل به دست آمده از عموميت بالايي برخوردار است.
جدول 2: مقايسه با روشهاي موجود
انحراف معیار R2 در 10 تکرار | ميانگين امتياز R2 در 10 تکرار | روش |
00148/0 | 956/0 | روش پيشنهادي |
00942/0 | 948/0 | شبكههاي عصبي مصنوعي [2] |
01240/0 | 893/0 | شبكههاي عصبي مصنوعي و تحليل موجک [3] |
01107/0 | 941/0 | LSTM [9] |
09849/0 | 971/0 | شبكههاي عصبي کانولوشني [11] |
00144/0 | 939/0 | شبكهي عصبي و الگوريتم ترکيبي PSO/GA [12] |
00166/0 | 921/0 | ماشين بردار پشتيبان [13] |
همچنين برخي ديگر از روشهاي ارائه شده بر روي دادههاي مشابه مورد آزمايش قرار گرفتند که مقايسه آنها با روش پيشنهادي در جدول 2 نمايش داده شده و نشاندهنده اين واقعيت است که روش پيشنهادي عليرغم بهينهسازي براي حفظ سادگي مدل نهايي در بدترين حالت مشابه روشهاي موجود عمل کرده و در بسياري از موارد از اين روشها دقيق تر است.
در این مقایسه، تنها در یک مورد امتیاز روش پیشنهادی از سایر روشها بر روی مجموعهداده مشابه کمتر است که با توجه انحراف معیار کمتر و همچنین سادگی بیشتر مدل بهینگی روش پیشنهادی قابل توجیه است.
لازم به ذکر است که با توجه به يکسان نبودن مجموعه دادهها و همچنين معيارهاي ارزيابي گزارش شده در پژوهشهاي موجود، اين روشها مجددا بر اساس پارامترهاي موجود در مقالات مربوط پيادهسازي شده و نتايج بر مجموعه دادههاي مشابه در اين جدول گزارش شده است.
4-نتیجهگیری
در اين پژوهش، يک روش مبتني بر درخت تصميم به منظور پيشبيني شدت تابش ارائه شدهاست. روش پيشبيني با استفاده از الگوريتم فرا ابتکاري خفاش با منظور حفظ تعادل ميان دقت مدل و سادگي و قابليت پيادهسازي آن در دستگاههاي اينترنت اشياء بهينهسازي شدهاست. در نهايت به يک مدل قوي که با معيار مربع-R داراي امتياز 95/0 است و همچنين از نظر سادگي مدل گروهي تا حدود زيادي بهينه است، به دست آمد. لذا از روش پيشنهادي ميتوان به منظور ساختن مدلهاي آفلاين در محيط هاي نيروگاههاي فتوولتائيک که با اينترنت اشياء مديريت ميشوند استفاده کرد. آنچه بهعنوان آيندهي اين روش پيشنهادي به منظور بهبود و گسترش نتايج آن ميتوان بيان نمود عبارتند از: ارائه يک معماري جامع اينترنت اشياء براي نيروگاههاي فتوولتائيک بر مبناي مدل ارائه شده در اين پژوهش، ارائه يک مکانيزم هرس و بهينهسازي براي قوانين استخراج شده از مدلهاي مبتني بر درخت و توسعه يک مجموعه دادههاي بومي از پارامترهاي هواشناسي داخلي به منظور استفاده به عنوان ورودي روش پيشنهادي که ميتواند کارآيي مدل را براي نيروگاههاي داخلي افزايش دهد.
مراجع
[1] N. M. Kumar, K. Atluri and S. Palaparthi, “Internet of Things (IoT) in Photovoltaic Systems,”2018 National Power Engineering Conference (NPEC), 2018, pp. 1-4, doi: 10.1109/NPEC.2018.8476807.
[2] A. Mellit, M. Menghanem and M. Bendekhis, “Artificial neural network model for prediction solar radiation data: application for sizing stand-alone photovoltaic power system,” IEEE Power Engineering Society General Meeting, 2005, San Francisco, CA, USA, 2005, pp. 40-44 Vol. 1, doi: 10.1109/PES.2005.1489526.
[3] A.Angstrom, “Solar and terrestrial radiation: Report to the international commission for solar research on actinometric investigations of solar and atmospheric radiation,” Quarterly Journal of the Royal Meteorological Society, 1924, pp. 121-126, doi:10.1002/qj.49705021008.
[4] J.Prescott,“Evaporation from a water surface in relation to solar radiation,”Transactions of the Royal Society of South Australia,vol. 64, pp 114-118, 1940, doi: 10.4236/epe.2017.912045.
[5] A. A. Trabea and M.M. Shaltout, “Correlation of global solar radiation with meteorological parameters over Egypt,”Renewable Energy, vol. 21, pp. 297-308, Oct. 2000, doi:10.1016/S0960-1481(99)00127-5.
[6] D.Yeboah-Amankwah and K.Agyeman, “Differential Ångstrom model for predicting insolation from hours of sunshine,”Solar Energy, vol. 45, pp. 371-377, 1990, doi:10.1016/0038-092X(90)90158-9.
[7] H.Ninomiya, “Study on application of amedas meteorological data to the simulation of building heat environment,” University of Tokyo, 1994.
[8] J.C.Cao and S.H.Cao, “Study of forecasting solar irradiance using neural networks with preprocessing sample data by wavelet analysis,” Energy, vol. 31, pp. 3435-3445, Dec. 2006, doi: 10.1016/j.energy.2006.04.001.
[9] X. Qing and Y. Niu, “Hourly day-ahead solar irradiance prediction using weather forecasts by LSTM,”Energy, vol. 148, pp. 461-468, Apr. 2018, doi: 10.1016/j.energy.2018.01.177.
[10] D.Pothineni, M.R.Oswald, J.Poland and M. Pollefeys,“KloudNet: Deep Learning for Sky Image Analysis and Irradiance Forecasting,”In: Brox, T., Bruhn, A., Fritz, M. (eds) Pattern Recognition. GCPR 2018. Lecture Notes in Computer Science(2019)-Springer, vol. 11269, doi:10.1007/978-3-030-12939-2_37.
[11] J. Lago, K. D. Brabandere, F. D. Ridder and B. D. Schuttera, “Short-term forecasting of solar irradiance without local telemetry: A generalized model using satellite data,” SolarEnergy, vol. 173, pp. 566-577, Oct. 2018, doi: 10.1016/j.solener.2018.07.050.
[12] N. Dong, J.F.Chang, A. G. Wu and Z. K. Gao, “A novel convolutional neural network framework based solar irradiance prediction method,” International Journal of Electrical Power & Energy Systems, vol. 114, pp. 1-19, Jan. 2020, doi: 10.1016/j.ijepes.2019.105411.
[13] N. Sharma, P. Sharma, D. Irwin and P. Shenoy, “Predicting solar generation from weather forecasts using machine learning,”2011 IEEE International Conference on Smart Grid Communications (SmartGridComm), 2011, pp. 528-533, doi: 10.1109/SmartGridComm.2011.6102379.
[14] P. J. M. Ali, and R. H. Faraj, “Data normalization and standardization: a technical report,” Mach. Learn. Tech. Rep., vol. 1, no. 1, pp. 1-6, 2014, doi: 10.13140/RG.2.2.28948.04489.
[15] Y.-Y. Song and L. Ying, “Decision tree methods: applications for classification and prediction,” Shanghai archives of psychiatry, vol. 27, no. 2, pp. 130-135, Apr. 2015, doi: 10.11919/j.issn.1002-0829.215044.
[16] N. Bhargava, G. Sharma, R. Bhargava, and M. Mathuria, “Decision tree analysis on j48 algorithm for data mining,” Intrenational Journal of Advanced Research in Computer Science and Software Engineering, vol. 3, no. 6, 2013.
[17] Y. Li et al., “Random forest regression for online capacity estimation of lithium-ion batteries,” Applied energy, vol. 232, pp. 197-210, Dec. 2018, doi: 10.1016/j.apenergy.2018.09.182.
[18] R. Seyghaly, J. Garcia, X. Masip-Bruin and M. M. Varnamkhasti, “Interference Recognition for Fog Enabled IoT Architecture using a Novel Tree-based Method,”2022 IEEE International Conference on Omni-layer Intelligent Systems (COINS), 2022, pp. 1-6, doi: 10.1109/COINS54846.2022.9854944.
[19] D. P. Solomatine and D. L. Shrestha, “AdaBoost.RT: a boosting algorithm for regression problems,” 2004 IEEE International Joint Conference on Neural Networks (IEEE Cat. No.04CH37541), Budapest, Hungary, 2004, pp. 1163-1168 vol.2, doi: 10.1109/IJCNN.2004.1380102.
[20] X. S. Yang, “A New Metaheuristic Bat-Inspired Algorithm,”Nature Inspired Cooperative Strategies for Optimization (NICSO 2010), springer, pp. 65–74, 2010, doi: 10.1007/978-3-642-12538-6_6.
[21] M.Banerjee, “Cook's distance in linear longitudinal models,” Communications in Statistics-Theory and Methods,vol 27, pp. 2973-2983, 1998, doi: 10.1080/03610929808832267.
[22] E. -S. M. El-Kenawy et al., “Advanced Ensemble Model for Solar Radiation Forecasting Using Sine Cosine Algorithm and Newton’s Laws,” in IEEE Access, vol. 9, pp. 115750-115765, 2021, doi: 10.1109/ACCESS.2021.3106233.
Optimizing Solar Radiation Prediction Based on The Internet of Things Platform in Photovoltaic Power Plant
|
Abstract
Received: Revised: Accepted:
|
Keywords: Internet of Things, Decision Tree, Machine Learning, Bat Algorithm, Photovoltaic Power Plants
[1] Internet of Things
[2] Overfitting
[3] Long-Short Term Memory
[4] Particle Swarm Optimization/Genetic Algorithm