پيشبيني توزيع منطقهاي اجزاء بافت خاک دشت سيلابي سيستان با استفاده از روش جنگل تصادفي
محورهای موضوعی : مباحث نوین در فیزیک خاکمحمد شهریاری 1 , معصومه دلبری 2 , پیمان افراسیاب 3 , محمدرضا پهلوان راد 4
1 - محقق بخش تحقيقات فني و مهندسي، مرکز تحقيقات و آموزش کشاورزي و منابع طبيعي سيستان. سازمان تحقيقات، آموزش و ترويج کشاورزي. زابل.
2 - دانشیارگروه مهندسی آب، دانشکده آب و خاک دانشگاه زابل
3 - دانشیارگروه مهندسی آب، دانشکده آب و خاک دانشگاه زابل.
4 - دانشيار بخش تحقيقات خاک و آب، مرکز تحقيقات و آموزش کشاورزي و منابع طبيعي گلستان. سازمان تحقيقات، آموزش و ترويج کشاورزي. گرگان.
کلید واژه: بافت خاک, تغييرات مکاني, سنجشازدور, جنگل تصادفي, متغير محيطي,
چکیده مقاله :
زمينه و هدف: خصوصيات خاک در دشتهاي سيلابي داراي تغييرات مکاني زيادي هستند بافت خاک يکي از خصوصيات مهم خاک است که تأثير زيادي بر بسياري از فعاليتهاي کشاورزي و مديريت خاک دارد بهطوريکه مقدار نگهداري آب و عناصر غذايي، نفوذپذيري، زهکشي، تخلخل و بسياري از خواص مکانيکي و هيدروليکي خاک تحتتأثير آن است؛ لذا داشتن آگاهي از توزيع مکاني آن بهويژه در دشتهاي سيلابي که تغييرات آن زياد است، ضرورتي مضاعف دارد. مطالعات صحرايي تغييرات مکاني خصوصيات خاک به علت برداشت تعداد زياد نمونه بهويژه در مقياس بزرگ پرهزينه و زمانبر است. روش نقشهبرداري رقومي خاک در تلفيق با دادههاي سنجشازدور بهعنوان راهکاري سودمند براي توليد نقشه رقومي خصوصيات خاک با دقت بالا و صرف هزينه و زمان کمتر است.
روش پژوهش: در اين پژوهش پيشبيني تغييرات مکاني اجزاء بافت خاک در دشت سيلابي سيستان در مقياس بزرگ (مساحت 1300 کيلومتر مربع) انجام شده است. براي اين منظور بر اساس روش تصادفي طبقهبندي شده در سريهاي مختلف خاک اراضي کشاورزي دشت سيستان تعداد 160 نقطه انتخاب گرديد و سپس نمونهبرداريها از لايه سطحي خاک ( cm0-30) انجام گرديد. همچنين از دادههاي سنجش از دور تصوير ماهواره لندست 8 شامل تصاوير باندهاي يک تا هشت، نسبت تصاوير باند چهارم به هشتم، باند چهارم به باند سوم و شاخص پوشش گياهي، شاخص روشنايي، شاخص رس و شاخص اندازه ذرات خاک به عنوان متغيرهاي کمکي براي ميانيابي اجزاء بافت خاک کمک گرفته شد. براي يافتن ارتباط بين متغيرهاي کمکي و اجزاء بافت خاک از روش جنگل تصادفي استفاده شد. اين تکنيک، مدل توسعه يافتهاي از روش طبقهبندي و رگرسيون درختي ميباشد که در آن به جاي رشد يک درخت صدها يا هزارن درخت طبقهبندي توليد مي شود. 80 درصد دادهها به دادههاي آموزش و 20 درصد به دادههاي آزمون اختصاص يافتند. مدلسازي بر روي دادههاي آموزش و ارزيابيها بر اساس دادههاي آزمون انجام گرديد. از معيارهاي RMSE, MBA MAE, و nRMSE و همچنين شاخص توافق ويلموت (dr) و ضريب کارايي (EF) براي ارزيابي و کارايي مدل استفاده شد.
يافتهها: تجزيه و تحليل همبستگي پيرسون نشان داد که در بين کسرهاي بافت خاک، محتواي شن و ماسه با بيشترين متغيرهاي محيطي داراي بيشترين رابطه معنيدار است. باند 8 بيشترين همبستگي را با ميزان شن، سيلت و رس داشت. يافتههاي پژوهش بيانگر اين است که استفاده از دادههاي سنجشازدور موجب افزايش دقت پيشبينيها شدهاند. همچنين بااينحال که روش جنگل تصادفي مقادير کمتري براي RMSE در مقايسه با يک مدل ساده کريجينگ براي پيشبيني مکاني ذرات شن، سيلت و رس خاک ارائه داد؛ اما به علت تغييرات زياد خصوصيات خاک در دشتهاي سيلابي، مقادير RMSE نسبتاً بزرگتر مقادير شن و سيلت نسبت به رس به دليل فراگيرتر بودن آنها در منطقه موردمطالعه است. مقدار RMSE در روش جنگل تصادفي براي پيشبيني شن، سيلت و رس در دادههاي اعتبارسنجي به ترتيب برابر 42/15، 56/12 و 97/8 درصد به دست آمد. اين در حالي است که RMSE براي مدل کريجينگ معمولي به ترتيب 2/18، 3/13 و 53/9 برآورد شد که نسبت به روش جنگل تصادفي به ترتيب 18، 9/5 و 2/11 درصد بيشتر است. مقادير نسبتاً زياد RMSE در اين مطالعه ناشي از تغييرات زياد خصوصيات خاک و شرايط تشکيل رسوبات در دشتهاي سيلابي است. مقادير nRMSE براي اجزاء شن، سيلت و رس خاک به ترتيب برابر 19/0، 13/0 و 21/0 براي دادههاي پيشبيني و برابر 39/0، 29/0 و 34/0 براي دادههاي اعتبارسنجي است. همچنين بين متغيرهاي کمکي، نتايج نشان داد که شاخص رس و شاخص اندازه دانه مهمترين متغيرهاي محيطي براي پيشبيني بافت خاک به روش جنگل تصادفي در منطقه مورد مطالعه بودند. نتايج مقادير ضريب توافق ويلموت (dr) نشان ميدهد که مدلسازي بادقت قابلقبولي انجام شده است. همچنين بررسي مقادير ضريب کارايي مدل (EF) نيز نشان ميدهد که روش جنگل تصادفي بهدرستي نقشههاي اجزاء بافت خاک را در محدوده موردمطالعه توليد کرده است. ساير متغيرهاي محيطي مانند نسبت باند 4 - باند 8، باند 1، باند 8 و باند 7 نيز بر پيشبيني کسر بافت خاک تأثير گذاشتند.
نتايج: نتايج نشان داد در بين اجزاء بافت خاک شن داراي بالاترين ضريب همبستگي پيرسون با متغيرهاي محيطي بود و در بين متغيرهاي کمکي باند 8 بيشترين ضريب همبستگي را با اجزاء بافت خاک دارد. شاخص رس و شاخص اندازه ذرات خاک مهمترين متغيرهاي محيطي در جريان مدلسازي با روش جنگل تصادفي بودند. همچنين متغيرهاي محيطي نسبت باند 4 به باند 8، باند 8، باند 7 و باند 2 ماهواره لندست 8 از ديگر متغيرهايي هستند که بر پيشبيني توزيع مکاني اجزاء بافت خاک تأثير داشتند. در مجموع به علت تغييرات زياد خصوصيات خاک در دشتهاي سيلابي مقادير معيارهاي ارزيابي نسبتاً زياد برآورد گرديد که اين به دليل تغييرپذيري زياد خصوصيات فيزيکي خاک در دشت سيستان است. دليل ديگر آن ميتواند به تعداد نمونههاي مورداستفاده ارتباط داشته باشد؛ بنابراين پيشنهاد ميشود که براي بهدستآوردن نقشههاي بادقت بهتر براي خصوصيات خاک بهويژه خصوصيات فيزيکي آن در دشتهاي آبرفتي، تعداد نمونهبرداريهاي خاک افزايش يابد و همچنين تعداد نقاط بهينه در اين مناطق تعيين گردد. همچنين به دليل اينکه خصوصيات خاک در دشتهاي سيلابي تابع نحوه رسوبگذاري است که خود تابع نحوه پراکنش مسيرهاي جريان آب منطقه است، پيشنهاد ميشود در مطالعات آتي از شاخصهاي که به نحوي به اين موضوع مرتبط است نظير فاصله تا رودخانهها، شبکه انهار منطقه، نقشه کاربري اراضي بهعنوان متغيرهاي کمکي استفاده شود.
Introduction: Soil properties are highly spatially variable in flood plains. Soli texture is an important physical soil properties that have affect many agricultural and environmental activities, so it has strongly influenced water retention curve, fertility, drainage and porosity. So, knowledge on its spatial distribution is essential especially in alluvial plains and large scale. Field studies of Spatial Distribution of soil properties, especially on a large scale and in floodplains, a large number of soil samples may need to be collected, which is cost- and time-consuming. Digital soil mapping (DSM) method using remote sensing data are coupled as significant impact on predicting spatial distribution soil properties.
Methods: The aim of this study was to predict the spatial distribution of soil texture fractions in Sistan flood plain at a regional scale (area 1300 km2). In this study, 160 soil samples collected under different of various soil series of the surface layer (0–30 cm) in the agriculture land of Sistan plain and soil texture fractions including percentage of sand, silt and clay content were measured. So, remotely sensed data including Landsat 8’s Band 1, Band 2, Band 3, Band 4, Band 5, Band 6, Band 7, Band 8 and Band 4/ Band 8, Band 4/ Band 3, NDVI index, brightness index, clay index, grain size index were used as auxiliary variables for interpolation of soil texture fractions. Random forest technique was used to examine the relation between auxiliary variables and the soil texture components. Random forest is a developed model of classification and regression tree (CART). In the RF model, hundreds or thousands of classification trees are produced. 80 % of data was used for prediction and 20 % of data was used for validation, and RMSE, nRMSE, Willmott index (dr), Effectiveness index (EF), MBE and MAE were used for evaluation.
Results: Pearson's correlation analysis showed that among soil texture fractions, sand content has the highest significant relationship with the most environmental variables. Band 8 had the highest correlation with sand, silt and clay content. The findings of the research show that the use of remote sensing data has increased the accuracy of predictions. The results show that the values of RMSE and MAE are lower for prediction set than validation set whereas the values of ME are similar for both sets. The values of RMSE of estimating percentage of sand, silt, clay at validation sites using RF method were 15.42, 12.56 and 8.97 %, respectively. Also, the values of RMSE of estimation by ordinary kriging were 18.2, 9.53 and 15.1% for sand, silt and clay, respectively that were 18, 5.9 and 11.2 % higher than those obtained by RF model. Also, the values of nRMSE were 0.19, 0.13 and 0.2 for prediction dataset and it was 0.39, 0.21 and 0.34 for validation dataset for sand, silt and clay fractions, respectively. The results of dr coefficient value shows that the modeling has been done with acceptable accuracy. Also value of EF shows that spatial maps of soil texture fraction produced by using RF model has good accurate.
So, RF method when combined by remotely sensed data is a suitable method for mapping soil texture fractions in a regional scale. Also, between auxiliary variables, results showed that the clay index and grain size index were the most important environmental variables for predicting soil texture by the random forest method in the study area. The results of Wilmot's coefficient of agreement (dr) show that the modeling has been carried out with acceptable accuracy. Also, the evaluation of the efficiency factor (EF) values of the model shows that the random forest method has correctly produced the maps of soil texture components in the studied area. Other environmental variables such as Band 4 - Band 8 ratio, Band 1, Band 8 and Band 7 also influenced soil texture fractions prediction.
Conclusion: Remote sensing data combined with the random forest model can be applied for an appropriate prediction of spatial distribution pattern of soil texture fractions in large scale floodplains with a hot and dry climate condition. Highly of RMSE value for sand and silt than clay, which could be due to the wider range of silt and sand over the study region. Another reason for this could be related to the number of samples used. Therefore, it is recommended that for better accuracy in soil property maps, especially physical properties, the number of soil sampling points be increased, and optimal sampling points in these areas be determined. For future works, the use of other co-variables such as land use map, distance from the river, soil series, and salinity map or remote sensing data of smaller resolution, as well as hyperspectral visible and near-infrared reflectance spectroscopy should be evaluated for a regional spatial prediction of soil fractions in floodplains.
Akpa, S.I.C., Odeh, I.O.A., Bishop, T.F.A., Hartemink, A.E., 2014. Digital mapping of soil particle size fractions for Nigeria. Soil Sci. Soc. Am. J. 78, 1953–1966.
Boettinger, J.L., Ramsey, R.D., Bodily, J.M., Cole, N.J., Kienast_Brown, S., Nield, S.J., Saundes,A.M., Stum, A.K., 2008. Landsat spectral data for digital soil mapping. In: Hartemink, A.E., McBratney, A.B., Mendonca Santos, M.L. (Eds.) , Digital Soil MappingWith Limited Data. Springer science, Australia, pp. 193–203
Bui, E. N., Ballabio, C., & Panagos, P., 2020. Soil texture mapping over Europe: Machine learning and its potential for sustainable soil management. European Journal of Soil Science, 71(1), 13-28.
Carvalho Junior, W., Chagas, C. D. S., Pereira, G. T. 2020. Regional-scale digital soil mapping in tropical areas using machine learning: A case study in Brazil. Geoderma, 363, 114151.
Carvalho Junior, W., Lagacherie, P., Chagas, C.S., Calderano Filho, B., Bhering, S.B., 2014. A regional-scale assessment of digital mapping of soil attributes in a tropical hillslope environment. Geoderma 232, 479–486.
Chagas, C.S., Junior, W.C., Bhering, S.B and Filho, B.C. 2016. Spatial prediction of soil surface texture in a semiarid region using random forest and multiple linear regressions. Catena, 139: 232–240
Chen, J.C., Chang, N.B., and Shieh, W.K. (2003). Assessing wastewater reclamation potential by neural network model. Journal of Engineering Application of Artificial Intelligence, 16:149-157.
Demattê, J.A.M., Fiorio, P.R., Ben-Dor, E., 2009. Estimation of soil properties by orbital and laboratory reflectance means and its relation with soil classification. Open Remote Sens. J. 2, 12–23.
Gambill, D.R., Wall, W.A., Fulton, A.J. and Howard, H.R. 2016. Predicting USCS soil classification from soil property variables using Random Forest. Journal of Terramechanics, 65:85–92
Heung, B., Bulmer, C. E., Schmidt, M. G., 2016. Predictive soil parent material mapping at a regional-scale: A random forest approach. Geoderma, 279, 68-80.
Jafari A., Finke P.A., de Wauw J.V., Ayoubi S., and Khademi H. 2012. Spatial prediction of USDA- great soil groups in the arid Zarand region, Iran: comparing logistic regression approaches to predict diagnostic horizons and soil types. E. J. Soil Sci, 63: 284–298.
Islam, K., Singh, B., McBratney, A., 2003. Simultaneous estimation of several soil properties by ultra-violet, visible, and near infrared reflectance spectroscopy. Aust. J. Soil Res. 41, 1101–1114.
Liao, K., Xu, S.,Wu, J., Zhu, Q., 2013. Spatial estimation of surface soil texture using remote sensing data. Soil Sci. Plant Nutr. 59, 488–500.
Liaw, A. and Wiener, M. 2002. Classification and regression by random Forest. R news The newsletter of the R project, 2(3): 18-22.
Ließ, M., Glaser, B., and Huwe, B. 2012. Uncertainty in the spatial prediction of soil texture comparison of regression tree and random forest models. Groderma, 170: 70-79.
Mirzaee, S.; Ghorbani-Dashtaki, S.; Mohammadi, J.; Asadi, H.; Asadzadeh, F. Spatial variability of soil organic matter using remote sensing data. Catena 2016, 145, 118–127.
Pahlavan-Rad, M.R., K.H. Dahmardeh, M. Hadizadeh, G. Keykha, N. Mohammadnia, M. Gangali, M. Keikha, N. Davatgar, C. Brungard. 2020. Prediction of soil water infitration using multiple linear regression and random forest in a dry flod plain, eastern Iran. Catena, 194(2020) 104715.
Poggio, L., de Sousa, L. M., Kempen, B., Heuvelink, G. B. M., Brus, D. J. 2021. Soil property mapping using machine learning models: A review and challenges. Earth-Science Reviews, 223, 103786.
Pringle, M.J., Romano, N., Minasny, B., Chirico, G.B., and Lark, R.M. 2007. Spatial evaluation of pedotransfer functions using wavelet analysis. Hydrology, 333: 182-198.
R Development Core Team, 2007. R: A Language and Environment for Statistical Computing.
Zhao, W., Zhang, G. L., Zhao, Y. G., & Pan, W., 2018. Predicting soil properties using remote sensing data and machine learning models. Geoderma, 322, 1-10.
Shahriari, M., Delbari, M., Afrasiab, P., & Pahlavan-Rad, M. R. 2019. Predicting regional spatial distribution of soil texture in floodplains using remote sensing data: A case of southeastern Iran. Catena, 182, 104149.
Taghizadeh-Mehrjardi, R., Schmidt, K., Mahmoodi, S., Omid, M. 2020. Spatial prediction of soil properties using machine learning techniques: A case study from Iran. Soil Systems, 4(4), 63.
Vaysse, K., Lagacherie, P., 2015. Evaluating Digital Soil Mapping approaches for mapping Global Soil Map soil properties from legacy data in Languedoc-Roussillon (France).Geoderma Reg. 4, 20–30.
Willmott, C.J., Robeson, S.M., Matsuura, K. (2011). A refined index of model performance. International Journal of Climatology, 32(13): 2088-2094.
Xiao, J., Shen, Y., Tateishi, R., Bayaer, W., 2006. Development of topsoil grain size index for monitoring desertification in arid land using remote sensing. Int. J. Remote Sens. 12, 2411–2422.