پیشبینی رطوبت نسبی به وسیله مدل یادگیری ماشین XGBoost، مطالعه موردی باجگاه، ایران
الموضوعات :رضا پیرایی 1 , علی محمدی 2 , سید حسین افضلی 3
1 - دانشجو دکتری رشته مهندسی و مدیریت منابع آب، بخش عمران و محیط زیست، دانشکده مهندسی، دانشگاه شیراز، شیراز، ایران
2 - دانشجو کارشناسی ارشد رشته مهندسی و مدیریت منابع آب، دانشکده مهندسی عمران و محیط زیست، دانشگاه تربیت مدرس، تهران، ایران
3 - دانشیار مهندسی عمران، بخش عمران و محیط زیست، دانشکده مهندسی، دانشگاه شیراز، شیراز، ایران
الکلمات المفتاحية: رطوبت نسبی, مدل XGBoost, یادگیری ماشین, باجگاه,
ملخص المقالة :
مقدمه: رطوبت نسبی هوا یکی از مهمترین پارامترهای هیدرولوژیکی است که در مدیریت منابع آب، رشد گیاهان و حتی گیرش بتن تاثیر زیادی دارد. لذا پیش بینی و تخمین آن از اهمیت بسزایی برخوردار است.
روش: در این پژوهش از آنجا که پارامترهای رطوبت نسبی و میزان دمای حداقل و حداکثر روزهای قبل، بیشترین تاثیر را در تخمین رطوبت نسبی روز آینده دارند و همچنین وجود آمار تنها این پارامترها در برخی از نقاط کشور، سناریوهای مختلفی مشتمل بر این دو پارامتر مورد مطالعه قرار گرفته است و بهترین سناریو برای پیش بینی رطوبت نسبی با استفاده از مدل XGBoost بدست آمده است. جهت بررسی کارآیی مدل مذکور، منطقه باجگاه در استان فارس مورد تحلیل قرار گرفته و با استفاده از آمار مربوط به سی سال گذشته (1372تا 1402) صحت و دقت سناریوهای مختلف مورد مقایسه قرار گرفته اند. در این راستا ابتدا مقادیری برای دادههای گمشده به کمک KNN Imputer تخمین زده شده است. سپس میزان ارتباط دادههای پیشین به کمک همبستگی پیرسون بین متغیر هدف (رطوبت نسبی روز t) و میانگین رطوبت روزانه در بازه یک تا ده روز قبل، محاسبه شده و با توجه به نتایج حاصله مبنی بر کم تاثیر بودن آمار روز چهارم به قبل، آمار مربوط به سه روز قبل مورد استفاده قرار گرفته است.
یافتهها و نتیجه گیری: در نهایت بر اساس مقایسه نتایج حاصل از 6 شاخص آماری RMSE, MAE, MARE, MXARE, NSE و R2، مشخص گردید که در بین سناریوهای مختف، سناریو مبتنی بر رطوبت نسبی و دمای حداکثر و حداقل 3 روز قبل بهترین تخمین را ارایه می دهد.
1. Khatibi, R., L. Naghipour, M.A. Ghorbani, and M.T. Aalami, Predictability of relative humidity by two artificial intelligence techniques using noisy data from two Californian gauging stations. Neural Computing and Applications, 2013. 23(7): p. 2241-2252.
2. Tao, H., S.M. Awadh, S.Q. Salih, S.S. Shafik, and Z.M. Yaseen, Integration of extreme gradient boosting feature selection approach with machine learning models: application of weather relative humidity prediction. Neural Computing and Applications, 2022. 34(1): p. 515-533.
3. Allen, R.G., L.S. Pereira, D. Raes, and M. Smith, Crop evapotranspiration-Guidelines for computing crop water requirements-FAO Irrigation and drainage paper 56. Fao, Rome, 1998. 300(9): p. D05109.
4. Fan, J., et al., Evaluation of SVM, ELM and four tree-based ensemble models for predicting daily reference evapotranspiration using limited meteorological data in different climates of China. Agricultural and Forest Meteorology, 2018. 263: p. 225-241.
5. Ferreira, L.B. and F.F. da Cunha, New approach to estimate daily reference evapotranspiration based on hourly temperature and relative humidity using machine learning and deep learning. Agricultural Water Management, 2020. 234: p. 106113.
6. Bellido-Jiménez, J.A., J. Estévez, and A.P. García-Marín, New machine learning approaches to improve reference evapotranspiration estimates using intra-daily temperature-based variables in a semi-arid region of Spain. Agricultural Water Management, 2021. 245: p. 106558.
7. Abdallah, M., et al., Reference evapotranspiration estimation in hyper-arid regions via D-vine copula based-quantile regression and comparison with empirical approaches and machine learning models. Journal of Hydrology: Regional Studies, 2022. 44: p. 101259.
8. Bayatvarkeshi, M., K. Mohammadi, O. Kisi, and R. Fasihi, A new wavelet conjunction approach for estimation of relative humidity: wavelet principal component analysis combined with ANN. Neural Computing and Applications, 2020. 32(9): p. 4989-5000.
9. Merabet, K. and S. Heddam, Improving the accuracy of air relative humidity prediction using hybrid machine learning based on empirical mode decomposition: a comparative study. Environmental Science and Pollution Research, 2023. 30(21): p. 60868-60889.
10. Gezgen, D., Comparison of missing data imputation methods applied to daily temperature and precipitation data in Turkey. 2023, Middle East Technical University.
11. Bisong, E., Building machine learning and deep learning models on Google cloud platform. 2019: Springer.
12. Bandara, A., et al. A generalized ensemble machine learning approach for landslide susceptibility modeling. in Data Management, Analytics and Innovation: Proceedings of ICDMAI 2019, Volume 2. 2020. Springer.
13. Lu, H. and X. Ma, Hybrid decision tree-based machine learning models for short-term water quality prediction. Chemosphere, 2020. 249: p. 126169.
14. Katipoğlu, O.M. and M. Sarıgöl, Prediction of flood routing results in the Central Anatolian region of Türkiye with various machine learning models. Stochastic Environmental Research and Risk Assessment, 2023: p. 1-20.
15. Han, Y., et al., Coupling a bat algorithm with xgboost to estimate reference evapotranspiration in the arid and semiarid regions of china. Advances in Meteorology, 2019. 2019: p. 1-16.
16. Piraei, R., S.H. Afzali, and M. Niazkar, Assessment of XGBoost to Estimate Total Sediment Loads in Rivers. Water Resources Management, 2023.
17. Piraei, R., M. Niazkar, and S.H. Afzali, Assessment of data-driven models for estimating total sediment discharge. Earth Science Informatics, 2023. 16(3): p. 2795-2812.