Using the bootstrap approach for comparing statistical modeling methods to estimate remotely-sensed aboveground biomass in Zagros forests
Subject Areas : Agriculture, rangeland, watershed and forestryAmir Safari 1 , Hormoz Sohrabi 2
1 - PhD of Forestry, Faculty of Natural Resources and Marine Sciences, University of Tarbiat Modares, Thehran, Iran
2 - Associate Professor, Department of Forestry, Faculty of Natural Resources and Marine Sciences, University of Tarbiat Modares, Iran
Keywords: LANDSAT 8, Aboveground biomass, Zagros forest, Bootstrap, Statistical modeling,
Abstract :
Background and ObjectiveConsidering the increasing importance of forest ecosystems in climate change mitigation projects, reliable and cost-effective methods are required to estimate the aboveground biomass (AGB). Common methods used to estimate the aboveground biomass (AGB) include in-situ measurement, the biomass calculation using aalometric equations and using remote sensing techniques. Remote sensing has been widely used to estimate the biomass of forests in recent decades.The used statistical modeling method is one of the most important factors to use remotely-sensed data for estimation of the aboveground biomass. A large number of researches have been carried out about using the modeling methods. However, these studies face the following different challenges: 1) no modeling method has been recommended as the best method 2) the performence of these modeling methods is affected by forest type, the forest structure, and the present disturbance intensity 3) the performance evaluation and the comparion of the results of these methods were done by using goodness-of-fit test and cross-validation methods. The purpose of this study is to considering the role of choosing statistical modeling methods to estimate remotely-sensed aboveground biomass, the current study was conducted to investigate nine statistical modeling methods including linear regression (LR), generalized additive model (GAM), random forest (RF), support vector machine (SVM), boosted regression tree (BRT), k-nearest neighbor (kNN), cubist regression (CR), Gaussian process model (GPR), multivariate adaptive regression spline (MARS) using bootstrap process and 1000-repeated 10-fold cross-validation approach to estimate the aboveground biomass of Zagros forests using Landsat 8 images. Materials and Methods The cuurent study was conducted in Kermanshah forests which is mostly dominated by oak species trees (Quercus spp.) and is located in western Iran on the Zagros Mountains. Zagros forests are generally sparse and open and comprise approximately 20% of Iran’s area and 40% forest regions of Iran. In order to conduct this study, two forest regions with different levels of human disturbances were chosen; SarfiruzAbad region with highly degraded (HD) forests, and Gahvareh forest region with minor degradation (MD). Geographical coordinates of SarfiruzAbad and Gahvareh regions are 33º57′-34º04′N / 47º03′-47º17′E & 34º21′- 34º24′N / 46º16′-46º23′ E respectively. The Leaf area index (LAI) map derived from the Landsat images based on a global model was used to collect field-based sample plots in both regions of the study. Both regions were divided into three low, moderate and high Leaf area index (LAI) strata, and the locations of the sample plots were located by using a systematic inventory at the intersections of a 200m×200 m grid in each stratum. 124 georeferenced square plots of field-based sample plots (63 plots in Gahvareh region and 61 plots in SarfiruzAbad region) with 30m×30m dimensions the same size as a Landsat 8 image’s pixel were collected. Allometric equation developed for oak tree in Zagros forests was used to calculate the amount of the aboveground biomass of each individual tree or sprout-clump. The allometric equation used in this study uses two vertical tree crown diameters to estimate the amount of the biomass of each individual tree or sprout-clump. The sum of the amount of the biomass of each individual tree in sample plot was used to calculate the amount of the biomass plot in sample plot level at a ton per hectare. Our study regions were located in a frame of Landsat 8 images (path/row:167/36). A cloud-free Landsat image relating to 19th Mordad 1394 (10th August 2015) relating to the time when the tree canopies are completely closed and near to the date of land inventory was downloaded from earthexplorer.usgs.gov site. Based on the previous studies, the pre-processing of the used image comprising the radiometric and topographic corrections was done.using C method. To estimate the aboveground biomass in the study areas by using remote sensing, 38 spectral variables including band values, simple band ratios, vegetation indices and common linear transformations like tasseled cap and principle component analysis were extracted from the used Landsat 8 image. Generally, the efficiency of nine different statistical modeling methods including parametric methods (Linear Regression, LR), semiparametric (Generalized Additive Model, GAM), and nonparametric Random Forest (RF), Support Vector Machine (SVM), K-nearest neighbor (KNN), Boosted regression trees (BRT), multivariate additive regression splines, cubist regression (CR), and Gaussian processes regression/model) were compared in order to estimate aboveground biomass. To assess the models, two common quality statistics: (i) determination coefficient and (2) root mean square error via 10 fold cross validation repeated 1000 times approach were calculated. This number of repeats helps to ensure an acceptable assessment of robustness of the results. Results and Discussion The measuredstatistical characteristics of the field sample plots showed that the mean aboveground biomass of SarfiruzAbad and Gahvareh regions were 12.6 ton/ha and 20.5 ton/ha respectively. ANOVA indicated significant differences between modelling methods (treatment effect: p< 0.001) for both R2 and RMSPE calculated in 1000-time repeats using 10-fold cross- validation.The Cubist modeling method with the mean determination coefficient of 0.61 outperformed other methods in SarfiruzAbad region.These resultsfor Gahvareh region showed better efficiency of linear regression (LR), generalized additive model (GAM), and k-nearest neighbor (KNN) with the mean determination coeffieient of 0.87.The multiple comparisons of different models by using Tukey test concerning RMSE showed that in SarfiruzAbad region, cubist method with the mean of RMSE 3.3 ton/ha and kNN and RF methods with the mean of RMSE 5.8 ton/ha had a significant difference in comparison to the other methods. Totally, the results of the research revealed the suitable efficiency of Landsat 8 image for AGB estimation in Zagros forests. The acceptable results are due to the low AGB in our study regions that did not reached the saturation point as one of challenges of using optical images like Landsat. The other results of this research is the assessment of the effiecieny of modeling method in order to increase the accuracy of the estimation of remotely-sensed aboveground biomass.Unlike the results of the previous studies, linear regression yielded better results compared to nonparametric methods that can be due to the presence of the linear relationship between aboveground biomass and spectral variables derived from Landsat images. Among the used various spectral variables, red, near infrared, and shortwave infrared 1 and 2 band ratios were selected as the final variable in most modeling methods. Conclusion In this study, we evaluated the effieincy of different statistical modeling methods to estimate AGB in Zagros forests by using Landsat images. The biomass estimations were compared by using nine parametric, semi-parametric, and non-parametric methods and using 1000-repeated 10-fold cross-validation. The results illustrated the acceptable potentiality of Landsat images for cost-efficient AGB estimating in Zagros oak forests. The accuracy of AGB estimation in Gahvareh region with low-degraded forest stands was higher than SarfiruzAbad region with highly degraded stands.
Aghababaie M, Ebrahimi A, Tahmasebi P. 2018. Comparison vegetation indices and tasseled cap transformation for estimates of soil organic carbon using Landsat-8 OLI images in a semi-steppe rangelands. Journal of RS and GIS for Natural Resources, 9(3): 58-59. (In Persian)
Calvao T, Palmeirim J. 2004. Mapping Mediterranean scrub with satellite imagery: biomass estimation and spectral behaviour. International Journal of Remote Sensing, 25(16): 3113-3126. doi:https://doi.org/10.1080/01431160310001654978.
Castillo JAA, Apan AA, Maraseni TN, Salmo SG. 2017. Estimation and mapping of above-ground biomass of mangrove forests and their replacement land uses in the Philippines using Sentinel imagery. ISPRS Journal of Photogrammetry and Remote Sensing, 134: 70-85. doi:https://doi.org/10.1016/j.isprsjprs.2017.10.016.
Dai L, Jia J, Yu D, Lewis BJ, Zhou L, Zhou W, Zhao W, Jiang L. 2013. Effects of climate change on biomass carbon sequestration in old-growth forest ecosystems on Changbai Mountain in Northeast China. Forest Ecology and Management, 300: 106-116. doi:https://doi.org/10.1016/j.foreco.2012.06.046.
Domingo D, Lamelas MT, Montealegre AL, García-Martín A, De la Riva J. 2018. Estimation of total biomass in aleppo pine forest stands applying parametric and nonparametric methods to low-density airborne laser scanning data. Forests, 9(4): 158. doi:https://doi.org/10.3390/f9040158.
Du H, Cui R, Zhou G, Shi Y, Xu X, Fan W, Lü Y. 2010. The responses of Moso bamboo (Phyllostachys heterocycla var. pubescens) forest aboveground biomass to Landsat TM spectral reflectance and NDVI. Acta Ecologica Sinica, 30(5): 257-263. doi:https://doi.org/10.1016/j.chnaes.2010.08.005.
Dube T, Mutanga O. 2015. Evaluating the utility of the medium-spatial resolution Landsat 8 multispectral sensor in quantifying aboveground biomass in uMgeni catchment, South Africa. ISPRS Journal of Photogrammetry and Remote Sensing, 101: 36-46. doi:https://doi.org/10.1016/j.isprsjprs.2014.11.001.
Eisfelder C, Kuenzer C, Dech S. 2012. Derivation of biomass information for semi-arid areas using remote-sensing data. International Journal of Remote Sensing, 33(9): 2937-2984. doi:https://doi.org/10.1080/01431161.2011.620034.
Fassnacht FE, Hartig F, Latifi H, Berger C, Hernández J, Corvalán P, Koch B. 2014. Importance of sample size, data type and prediction method for remote sensing-based estimations of aboveground forest biomass. Remote Sensing of Environment, 154: 102-114. doi:https://doi.org/10.1016/j.rse.2014.07.028.
Fernández-Manso O, Fernández-Manso A, Quintano C. 2014. Estimation of aboveground biomass in Mediterranean forests by statistical modelling of ASTER fraction images. International Journal of Applied Earth Observation and Geoinformation, 31: 45-56. doi:https://doi.org/10.1016/j.jag.2014.03.005.
Fu L, Zhao Y, Xu Z, Wu B. 2015. Spatial and temporal dynamics of forest aboveground carbon stocks in response to climate and environmental changes. Journal of Soils and Sediments, 15(2): 249-259. doi:10.1007/s11368-014-1050-x.
Gao Y, Lu D, Li G, Wang G, Chen Q, Liu L, Li D. 2018. Comparative analysis of modeling algorithms for forest aboveground biomass estimation in a subtropical region. Remote Sensing, 10(4): 627. doi:https://doi.org/10.3390/rs10040627.
Gasparri NI, Parmuchi MG, Bono J, Karszenbaum H, Montenegro CL. 2010. Assessing multi-temporal Landsat 7 ETM+ images for estimating above-ground biomass in subtropical dry forests of Argentina. Journal of Arid Environments, 74(10): 1262-1270. doi:https://doi.org/10.1016/j.jaridenv.2010.04.007.
Gizachew B, Solberg S, Næsset E, Gobakken T, Bollandsås OM, Breidenbach J, Zahabu E, Mauya EW. 2016. Mapping and estimating the total living biomass and carbon in low-biomass woodlands using Landsat 8 CDR data. Carbon balance and management, 11(1): 13. doi:https://doi.org/10.1186/s13021-016-0055-8.
Görgens EB, Montaghi A, Rodriguez LCE. 2015. A performance comparison of machine learning methods to estimate the fast-growing forest plantation yield based on laser scanning metrics. Computers and Electronics in Agriculture, 116: 221-227. doi:https://doi.org/10.1016/j.compag.2015.07.004.
Huffman T, Liu J, McGovern M, McConkey B, Martin T. 2015. Carbon stock and change from woody biomass on Canada’s cropland between 1990 and 2000. Agriculture, Ecosystems & Environment, 205: 102-111. doi:https://doi.org/10.1016/j.agee.2014.10.009.
Iranmanesh Y. 2013. Assessment on biomass estimation methods and carbon sequestration of Quercus brantii Lindl. in Chaharmahal & Bakhtiari Forests. PhD Thesis, Tarbiat Modares University, 106 pp, (In Persian)
Karlson M, Ostwald M, Reese H, Sanou J, Tankoano B, Mattsson E. 2015. Mapping tree canopy cover and aboveground biomass in Sudano-Sahelian woodlands using Landsat 8 and random forest. Remote Sensing, 7(8): 10017-10041. doi:https://doi.org/10.3390/rs70810017.
Krahwinkler P, Rossman J. 2011. Using decision tree based multiclass support vector machines for forest mapping. In: Lena Halounová EE (ed) IEEE Int. Geoscience and Remote Sensing Symp., Vancouver, Canada. pp 307-318.
Kwak D-A, Lee W-K, Cho H-K, Lee S-H, Son Y, Kafatos M, Kim S-R. 2010. Estimating stem volume and biomass of Pinus koraiensis using LiDAR data. Journal of Plant Research, 123(4): 421-432. doi:10.1007/s10265-010-0310-0.
Latifi H, Fassnacht F, Koch B. 2012. Forest structure modeling with combined airborne hyperspectral and LiDAR data. Remote Sensing of Environment, 121: 10-25. doi:https://doi.org/10.1016/j.rse.2012.01.015.
McRoberts RE, Magnussen S, Tomppo EO, Chirici G. 2011. Parametric, bootstrap, and jackknife variance estimators for the k-Nearest Neighbors technique with illustrations using forest inventory and satellite image data. Remote Sensing of Environment, 115(12): 3165-3174. doi:https://doi.org/10.1016/j.rse.2011.07.002.
Nolè A, Law B, Magnani F, Matteucci G, Ferrara A, Ripullone F, Borghetti M. 2009. Application of the 3-PGS model to assess carbon accumulation in forest ecosystems at a regional level. Canadian Journal of Forest Research, 39(9): 1647-1661. doi:https://doi.org/10.1139/X09-077.
Noorian N, Shataee S, Mohamadi J. 2019. Evaluation of RapidEye satellite data for estimation some quantitative structure variables in the Caspian forests of Gorgan region. Journal of RS and GIS for Natural Resources, 9(4): 1-16. (In Persian)
Pan Y, Birdsey RA, Fang J, Houghton R, Kauppi PE, Kurz WA, Phillips OL, Shvidenko A, Lewis SL, Canadell JG. 2011. A large and persistent carbon sink in the world’s forests. Science, 333(6045): 988-993. doi:https://doi.org/10.1126/science.1201609.
Powell SL, Cohen WB, Healey SP, Kennedy RE, Moisen GG, Pierce KB, Ohmann JL. 2010. Quantification of live aboveground forest biomass dynamics with Landsat time-series and field inventory data: A comparison of empirical modeling approaches. Remote Sensing of Environment, 114(5): 1053-1068. doi:https://doi.org/10.1016/j.rse.2009.12.018.
Rajashekar G, Fararoda R, Reddy RS, Jha CS, Ganeshaiah KN, Singh JS, Dadhwal VK. 2018. Spatial distribution of forest biomass carbon (Above and below ground) in Indian forests. Ecological Indicators, 85: 742-752. doi:https://doi.org/10.1016/j.ecolind.2017.11.024.
Riaño D, Chuvieco E, Salas J, Aguado I. 2003. Assessment of different topographic corrections in Landsat-TM data for mapping vegetation types (2003). IEEE Transactions on Geoscience and Remote Sensing, 41(5): 1056-1061. doi:https://doi.org/10.1109/TGRS.2003.811693.
Safari A, Sohrabi H. 2019. The effect of digital preprocessing and modeling method on an estimation of aboveground carbon stock of Zagros forests using Landsat 8 imagery. Journal of RS and GIS for Natural Resources, 9(4): 73-89. (In Persian)
Safari A, Sohrabi H, Powell SL. 2018. Comparison of satellite-based estimates of aboveground biomass in coppice oak forests using parametric, semiparametric, and nonparametric modeling methods. Journal of Applied Remote Sensing, 12(4): 046026. doi:https://doi.org/10.1117/1.JRS.12.046026.
Sagheb-Talebi K, Pourhashemi M, Sajedi T. 2014. Forests of Iran. The Netherlands: Springer Netherlands, 152 pp. https://doi.org/10.1007/978-94-007-7371-4.
Sarker LR, Nichol JE. 2011. Improved forest biomass estimates using ALOS AVNIR-2 texture indices. Remote Sensing of Environment, 115(4): 968-977. doi:https://doi.org/10.1016/j.rse.2010.11.010.
Shao Z, Zhang L. 2016. Estimating forest aboveground biomass by combining optical and SAR data: A case study in Genhe, Inner Mongolia, China. Sensors, 16(6): 834. doi:https://doi.org/10.3390/s16060834.
Wang X, Shao G, Chen H, Lewis BJ, Qi G, Yu D, Zhou L, Dai L. 2013. An Application of Remote Sensing Data in Mapping Landscape-Level Forest Biomass for Monitoring the Effectiveness of Forest Policies in Northeastern China. Environmental Management, 52(3): 612-620. doi:10.1007/s00267-013-0089-6.
Zhao K, Suarez JC, Garcia M, Hu T, Wang C, Londo A. 2018. Utility of multitemporal lidar for forest and carbon monitoring: Tree growth, biomass dynamics, and carbon flux. Remote Sensing of Environment, 204: 883-897. doi:https://doi.org/10.1016/j.rse.2017.09.007.
Zhao P, Lu D, Wang G, Wu C, Huang Y, Yu S. 2016. Examining spectral reflectance saturation in Landsat imagery and corresponding solutions to improve forest aboveground biomass estimation. Remote Sensing, 8(6): 469. doi:https://doi.org/10.3390/rs8060469.
Zhu X, Liu D. 2015. Improving forest aboveground biomass estimation using seasonal Landsat NDVI time-series. ISPRS Journal of Photogrammetry and Remote Sensing, 102: 222-231. doi:https://doi.org/10.1016/j.isprsjprs.2014.08.014.
Aghababaie M, Ebrahimi A, Tahmasebi P. 2018. Comparison vegetation indices and tasseled cap transformation for estimates of soil organic carbon using Landsat-8 OLI images in a semi-steppe rangelands. Journal of RS and GIS for Natural Resources, 9(3): 58-59. (In Persian)
Calvao T, Palmeirim J. 2004. Mapping Mediterranean scrub with satellite imagery: biomass estimation and spectral behaviour. International Journal of Remote Sensing, 25(16): 3113-3126. doi:https://doi.org/10.1080/01431160310001654978.
Castillo JAA, Apan AA, Maraseni TN, Salmo SG. 2017. Estimation and mapping of above-ground biomass of mangrove forests and their replacement land uses in the Philippines using Sentinel imagery. ISPRS Journal of Photogrammetry and Remote Sensing, 134: 70-85. doi:https://doi.org/10.1016/j.isprsjprs.2017.10.016.
Dai L, Jia J, Yu D, Lewis BJ, Zhou L, Zhou W, Zhao W, Jiang L. 2013. Effects of climate change on biomass carbon sequestration in old-growth forest ecosystems on Changbai Mountain in Northeast China. Forest Ecology and Management, 300: 106-116. doi:https://doi.org/10.1016/j.foreco.2012.06.046.
Domingo D, Lamelas MT, Montealegre AL, García-Martín A, De la Riva J. 2018. Estimation of total biomass in aleppo pine forest stands applying parametric and nonparametric methods to low-density airborne laser scanning data. Forests, 9(4): 158. doi:https://doi.org/10.3390/f9040158.
Du H, Cui R, Zhou G, Shi Y, Xu X, Fan W, Lü Y. 2010. The responses of Moso bamboo (Phyllostachys heterocycla var. pubescens) forest aboveground biomass to Landsat TM spectral reflectance and NDVI. Acta Ecologica Sinica, 30(5): 257-263. doi:https://doi.org/10.1016/j.chnaes.2010.08.005.
Dube T, Mutanga O. 2015. Evaluating the utility of the medium-spatial resolution Landsat 8 multispectral sensor in quantifying aboveground biomass in uMgeni catchment, South Africa. ISPRS Journal of Photogrammetry and Remote Sensing, 101: 36-46. doi:https://doi.org/10.1016/j.isprsjprs.2014.11.001.
Eisfelder C, Kuenzer C, Dech S. 2012. Derivation of biomass information for semi-arid areas using remote-sensing data. International Journal of Remote Sensing, 33(9): 2937-2984. doi:https://doi.org/10.1080/01431161.2011.620034.
Fassnacht FE, Hartig F, Latifi H, Berger C, Hernández J, Corvalán P, Koch B. 2014. Importance of sample size, data type and prediction method for remote sensing-based estimations of aboveground forest biomass. Remote Sensing of Environment, 154: 102-114. doi:https://doi.org/10.1016/j.rse.2014.07.028.
Fernández-Manso O, Fernández-Manso A, Quintano C. 2014. Estimation of aboveground biomass in Mediterranean forests by statistical modelling of ASTER fraction images. International Journal of Applied Earth Observation and Geoinformation, 31: 45-56. doi:https://doi.org/10.1016/j.jag.2014.03.005.
Fu L, Zhao Y, Xu Z, Wu B. 2015. Spatial and temporal dynamics of forest aboveground carbon stocks in response to climate and environmental changes. Journal of Soils and Sediments, 15(2): 249-259. doi:10.1007/s11368-014-1050-x.
Gao Y, Lu D, Li G, Wang G, Chen Q, Liu L, Li D. 2018. Comparative analysis of modeling algorithms for forest aboveground biomass estimation in a subtropical region. Remote Sensing, 10(4): 627. doi:https://doi.org/10.3390/rs10040627.
Gasparri NI, Parmuchi MG, Bono J, Karszenbaum H, Montenegro CL. 2010. Assessing multi-temporal Landsat 7 ETM+ images for estimating above-ground biomass in subtropical dry forests of Argentina. Journal of Arid Environments, 74(10): 1262-1270. doi:https://doi.org/10.1016/j.jaridenv.2010.04.007.
Gizachew B, Solberg S, Næsset E, Gobakken T, Bollandsås OM, Breidenbach J, Zahabu E, Mauya EW. 2016. Mapping and estimating the total living biomass and carbon in low-biomass woodlands using Landsat 8 CDR data. Carbon balance and management, 11(1): 13. doi:https://doi.org/10.1186/s13021-016-0055-8.
Görgens EB, Montaghi A, Rodriguez LCE. 2015. A performance comparison of machine learning methods to estimate the fast-growing forest plantation yield based on laser scanning metrics. Computers and Electronics in Agriculture, 116: 221-227. doi:https://doi.org/10.1016/j.compag.2015.07.004.
Huffman T, Liu J, McGovern M, McConkey B, Martin T. 2015. Carbon stock and change from woody biomass on Canada’s cropland between 1990 and 2000. Agriculture, Ecosystems & Environment, 205: 102-111. doi:https://doi.org/10.1016/j.agee.2014.10.009.
Iranmanesh Y. 2013. Assessment on biomass estimation methods and carbon sequestration of Quercus brantii Lindl. in Chaharmahal & Bakhtiari Forests. PhD Thesis, Tarbiat Modares University, 106 pp, (In Persian)
Karlson M, Ostwald M, Reese H, Sanou J, Tankoano B, Mattsson E. 2015. Mapping tree canopy cover and aboveground biomass in Sudano-Sahelian woodlands using Landsat 8 and random forest. Remote Sensing, 7(8): 10017-10041. doi:https://doi.org/10.3390/rs70810017.
Krahwinkler P, Rossman J. 2011. Using decision tree based multiclass support vector machines for forest mapping. In: Lena Halounová EE (ed) IEEE Int. Geoscience and Remote Sensing Symp., Vancouver, Canada. pp 307-318.
Kwak D-A, Lee W-K, Cho H-K, Lee S-H, Son Y, Kafatos M, Kim S-R. 2010. Estimating stem volume and biomass of Pinus koraiensis using LiDAR data. Journal of Plant Research, 123(4): 421-432. doi:10.1007/s10265-010-0310-0.
Latifi H, Fassnacht F, Koch B. 2012. Forest structure modeling with combined airborne hyperspectral and LiDAR data. Remote Sensing of Environment, 121: 10-25. doi:https://doi.org/10.1016/j.rse.2012.01.015.
McRoberts RE, Magnussen S, Tomppo EO, Chirici G. 2011. Parametric, bootstrap, and jackknife variance estimators for the k-Nearest Neighbors technique with illustrations using forest inventory and satellite image data. Remote Sensing of Environment, 115(12): 3165-3174. doi:https://doi.org/10.1016/j.rse.2011.07.002.
Nolè A, Law B, Magnani F, Matteucci G, Ferrara A, Ripullone F, Borghetti M. 2009. Application of the 3-PGS model to assess carbon accumulation in forest ecosystems at a regional level. Canadian Journal of Forest Research, 39(9): 1647-1661. doi:https://doi.org/10.1139/X09-077.
Noorian N, Shataee S, Mohamadi J. 2019. Evaluation of RapidEye satellite data for estimation some quantitative structure variables in the Caspian forests of Gorgan region. Journal of RS and GIS for Natural Resources, 9(4): 1-16. (In Persian)
Pan Y, Birdsey RA, Fang J, Houghton R, Kauppi PE, Kurz WA, Phillips OL, Shvidenko A, Lewis SL, Canadell JG. 2011. A large and persistent carbon sink in the world’s forests. Science, 333(6045): 988-993. doi:https://doi.org/10.1126/science.1201609.
Powell SL, Cohen WB, Healey SP, Kennedy RE, Moisen GG, Pierce KB, Ohmann JL. 2010. Quantification of live aboveground forest biomass dynamics with Landsat time-series and field inventory data: A comparison of empirical modeling approaches. Remote Sensing of Environment, 114(5): 1053-1068. doi:https://doi.org/10.1016/j.rse.2009.12.018.
Rajashekar G, Fararoda R, Reddy RS, Jha CS, Ganeshaiah KN, Singh JS, Dadhwal VK. 2018. Spatial distribution of forest biomass carbon (Above and below ground) in Indian forests. Ecological Indicators, 85: 742-752. doi:https://doi.org/10.1016/j.ecolind.2017.11.024.
Riaño D, Chuvieco E, Salas J, Aguado I. 2003. Assessment of different topographic corrections in Landsat-TM data for mapping vegetation types (2003). IEEE Transactions on Geoscience and Remote Sensing, 41(5): 1056-1061. doi:https://doi.org/10.1109/TGRS.2003.811693.
Safari A, Sohrabi H. 2019. The effect of digital preprocessing and modeling method on an estimation of aboveground carbon stock of Zagros forests using Landsat 8 imagery. Journal of RS and GIS for Natural Resources, 9(4): 73-89. (In Persian)
Safari A, Sohrabi H, Powell SL. 2018. Comparison of satellite-based estimates of aboveground biomass in coppice oak forests using parametric, semiparametric, and nonparametric modeling methods. Journal of Applied Remote Sensing, 12(4): 046026. doi:https://doi.org/10.1117/1.JRS.12.046026.
Sagheb-Talebi K, Pourhashemi M, Sajedi T. 2014. Forests of Iran. The Netherlands: Springer Netherlands, 152 pp. https://doi.org/10.1007/978-94-007-7371-4.
Sarker LR, Nichol JE. 2011. Improved forest biomass estimates using ALOS AVNIR-2 texture indices. Remote Sensing of Environment, 115(4): 968-977. doi:https://doi.org/10.1016/j.rse.2010.11.010.
Shao Z, Zhang L. 2016. Estimating forest aboveground biomass by combining optical and SAR data: A case study in Genhe, Inner Mongolia, China. Sensors, 16(6): 834. doi:https://doi.org/10.3390/s16060834.
Wang X, Shao G, Chen H, Lewis BJ, Qi G, Yu D, Zhou L, Dai L. 2013. An Application of Remote Sensing Data in Mapping Landscape-Level Forest Biomass for Monitoring the Effectiveness of Forest Policies in Northeastern China. Environmental Management, 52(3): 612-620. doi:10.1007/s00267-013-0089-6.
Zhao K, Suarez JC, Garcia M, Hu T, Wang C, Londo A. 2018. Utility of multitemporal lidar for forest and carbon monitoring: Tree growth, biomass dynamics, and carbon flux. Remote Sensing of Environment, 204: 883-897. doi:https://doi.org/10.1016/j.rse.2017.09.007.
Zhao P, Lu D, Wang G, Wu C, Huang Y, Yu S. 2016. Examining spectral reflectance saturation in Landsat imagery and corresponding solutions to improve forest aboveground biomass estimation. Remote Sensing, 8(6): 469. doi:https://doi.org/10.3390/rs8060469.
Zhu X, Liu D. 2015. Improving forest aboveground biomass estimation using seasonal Landsat NDVI time-series. ISPRS Journal of Photogrammetry and Remote Sensing, 102: 222-231. doi:https://doi.org/10.1016/j.isprsjprs.2014.08.014.
بهرهگیری از رویکرد بوتاسترپ برای مقایسه روشهای مدلسازی آماری در برآورد سنجشازدوری زیتوده روی زمینی جنگلهای زاگرس
چکیده:
با توجه به اهمیت جنگلها در پروژههای تعدیل تغییر اقلیم، روشهای دقیق و کمهزینه برای برآورد زیتوده روی زمینی موردنیاز است. سنجشازدور بهطور گسترده برای برآورد زیتوده جنگلها در دهههای اخیر مورداستفاده قرارگرفته است، ولی بهطور مؤثر، روشهای مدلسازی در مناطق با زیتوده کم بهطور کامل بررسی نشده است. مطالعه حاضر باهدف بررسی نه روش مدلسازی شامل رگرسیون خطی، مدل تجمعی تعمیمیافته، جنگل تصادفی، ماشینبردارپشتیبان، درختان رگرسیون تقویتشده، k-امین نزدیکترین همسایه، مدل پردازش گوسی و رگرسیون اسپلاین تطبیقی چندگانه با استفاده از فرآیند بوت استرپ و روش ارزیابی fold-10 با 1000 مرتبه تکرار برای برآورد زیتوده روی زمینی جنگلهای زاگرس با استفاده از تصویرهای لندست 8 انجام شد. برای رسیدن به این هدف، دو منطقه در جنگلهای استان کرمانشاه انتخاب شد. نتایج نشان داد روش کوبیست با میانگین ضریب تبیین و ریشه میانگین مربعات خطای محاسبهشده به ترتیب 61/0 و 3/3 تن در هکتار در منطقه سرفیروزآباد بهعنوان بهترین روش معرفی شد. روشهای رگرسیون خطی، مدل تجمعی تعمیمیافته و k-امین نزدیکترین همسایه با میانگین ضریب تبیین و ریشه میانگین مربعات خطای 87/0 و 8/5 تن در هکتار در منطقه گهواره و روش درختان رگرسیون تقویتشده با میانگین ضریب تبیین و ریشه میانگین مربعات خطای 76/0 و 3/5 تن در هکتار با اختلاف معنیداری آماری از دیگر روشها صحت بهتری برآورد کردند. نتایج بیانگر وابستگی عملکرد روشهای مدلسازی به شرایط تودههای جنگلی است. بهطورکلی، تصویرهای رایگان لندست با روش مدلسازی بهینه میتواند بهعنوان یک ابزار مناسب برای برآورد زیتوده روی زمینی در جنگلهای با تراکم کم باشد.
واژههای کلیدی: زیتوده رویزمینی، بوتاسترپ، مدلسازی آماری، جنگلهای زاگرس، لندست
مقدمه
برآورد دقیق انتشار گازهای گلخانهای و پایش جزئیات چرخه کربن برای متعادل کردن تغییرات اقلیمی ضروری است. (16 و 36). تغییرات اقلیمی و اثرات زیانبار آن بر حیات زیستکره زمین سبب شده تا کاهش اثرات تغییرات اقلیمی بهعنوان یک موضوع مهم موردتوجه دانشمندان و سیاستگذاران علوم مختلف قرارگرفته است (4 و 17). یکی از مهمترین راهکارهای معرفیشده برای مقابله با تغییرات اقلیمی کاهش انتشار و افزایش ترسیب کربن است (1 و 4). جنگلها با ذخیره 80 درصد کربن روی زمینی و 40 درصد کربن زیرزمینی بهعنوان یک منبع حیاتی جذبکننده کربن معرفیشده است که میتوانند سالانه تقریباً 33 درصد از انتشار کربن ناشی از سوختهای فسیلی و تغییرات کاربری اراضی را ترسیب کنند (25 و 27). با توجه به اینکه 50 درصد زیتوده درختان کربن است، بنابراین، برآورد زیتوده درختان برای کمی کردن اندوخته کربن و مدلسازی تغییرات اقلیم بهعنوان یک ابزار کلیدی معرفیشده است (32).
اندازهگیری زیتوده با استفاده از نمونهبرداری زمینی با مشکلات مختلفی مانند صرف زمان و هزینه زیاد، محدودیت در مقیاسهای وسیع و مشکلات اجرایی متعدد بهویژه در مناطق صعبالعبور و دور از دسترس مواجه میباشد (32 و 35). در مقابل، استفاده از مدلهای شبیهسازی نیازمند اطلاعات کامل و طولانیمدت است که استفاده از آنها را در کشورهای درحالتوسعه با چالش اساسی روبرو میکند. ازاینرو توسعه روشهای ساده، سریع، کمهزینه و دقیق برای برآورد زیتوده جنگل در مقیاسهای مختلف یک اقدام حیاتی و ضروری است (10 و 20). خوشبختانه با توسعه فنون و دادههای سنجشازدوری و ترکیب آنها با اطلاعات جمعآوریشده از نمونهبرداری زمینی امکان برآورد زیتوده جنگلها را با حداقل عملیات میدانی و هزینه فراهم آورده است (5 و 32).
مطالعات مختلفی برای برآورد زیتوده جنگل از مقیاسهای محلی تا جهانی با استفاده از دادههای مختلف سنجشازدوری مانند داده فعال (لیدار و رادار) و دادههای غیرفعال (انواع تصویرهای نوری) انجامشده است. اغلب این مطالعات در جنگلهای متراکم با میانگین بالای زیتوده روی زمینی مناطق گرمسیری و مرطوب انجامشده است (18). بااینحال، تحقیقات بسیار اندکی در این رابطه در جنگلهای مناطق خشک و نیمهخشک با میانگین اندوخته کم زیتوده انجامگرفته است. در چنین مناطقی به دلیل تراکم پایین پوشش گیاهی، انعکاس طیفی ثبتشده توسط سنجندههای نوری بهشدت تحت تأثیر بازتاب آمیخته خاک، پوشش گیاهی و سایه قرار میگیرند (8 و 10). یکی از بارزترین چنین منطقی جنگلهای زاگرس است که با وسعت حدود 6 میلیون هکتار میتواند نقش مهمی در تعدیل تغییرات اقلیمی و فراهمکننده آب در مقیاس محلی تا جهانی باشد (31).
ازآنجاکه جنگلهای زاگرس تولیدکننده چوب صنعتی بهعنوان اقتصادیترین محصول جنگلها نیستند، بودجه کمی برای آماربرداری و پایش آنها اختصاص داده میشود. بنابراین، توسعه روشهای سنجشازدوری با حداقل هزینه برای برآورد زیتوده این جنگلها لازم و ضروری است. تصویرهای لندست به دلیل داشتن آرشیو رایگان و قابلدسترس برای عموم و پوشش زمانی و مکانی مناسب میتواند بهعنوان ابزاری مفید برای برآورد و پایش زیتوده موردتوجه قرار گیرد. دقت برآورد زیتوده با استفاده از دادههای سنجشازدوری وابسته به نکات مختلفی است که از مهمترین آنها میتوان به انتخاب روش مدلسازی مناسب اشاره کرد. تحقیق فسناچت و همکاران (9) اظهار کردند که روش مدلسازی اهمیتی برابر با نوع داده سنجشازدوری دارد.
روشهای مدلسازی مختلفی برای برآورد سنجشازدوری مشخصههای کمی جنگل ازجمله زیتوده مورداستفاده قرارگرفته که در دودسته کلی مدلهای پارامتری (رگرسیونهای خطی) و مدلهای ناپارامتری (ماشینبردارپشتیبان، جنگل تصادفی و...) تقسیمبندی میشوند که در دهههای اخیر توسعهیافتهاند (24 و 30). مرور منابع بیانگر این موضوع است که روشهای مدلسازی در مطالعات مختلف نتایج متفاوتی ارائه کردهاند و نمیتوان یک روش را بهعنوان بهترین روش مدلسازی معرفی کرد. مطالعات گورگن و همکاران (15)، کاستیلو و همکاران (3) و دومینگو و همکاران (5) از کارایی مناسب روشهای رگرسیون خطی در برآورد سنجشازدوری زیتوده یادکردهاند، درحالیکه، تعدادی از پژوهشهای دیگر نشان دادهاند که روشهای ناپارامتری کاربرد بهتری نسبت به روشهای پارامتری دارند (21، 26 و 33). جمعبندی مرور منابع نشان میدهد استفاده از روشهای مدلسازی با سه چالش عمده روبرو است: 1) هیچ روشی تاکنون بهعنوان بهترین معرفی نشده است، 2) عملکرد این روشها تحت تأثیر نوع و ساختار جنگل دارد، 3) در اغلب مطالعات صحت روشهای مدلسازی فقط با استفاده از روش ارزیابی متقابل سنجیده شده است. بههرحال چالش آخر سبب میشود تا استفاده از این مدلها در تعداد دادههای زمینی کم که اغلب پژوهشها با آن روبرو است، نتواند بهطور کامل توان و پایداری نتایج روشهای مدلسازی را منعکس کند. یکی از رویکردهای مفید و قابلقبول برای مقایسه روشهای مدلسازی استفاده از نمونهبرداری مجدد مانند فرآیند بوتاسترپ است (12 و 22). هدف اصلی مطالعه حاضر، مقایسه روشهای مختلف مدلسازی برای برآورد کمهزینه زیتوده روی زمینی جنگلهای زاگرس است.
روش تحقیق
منطقه مورد مطالعه:
تحقیق حاضر در بخشی از جنگلهای زاگرس، در استان کرمانشاه و دو منطقه جنگلی گهواره در شهرستان دالاهو با طول 616795 تا 628077 و عرض 3798433 تا 3808702 وجنگلهای سرفیروزآباد در شهرستان کرمانشاه با طول 686348 تا 713695 و عرض 3754363 تا 3770951 در سیستم مختصات UTM در زون 38 انجامگرفته است (شکل 1). جنگلهای گهواره و سرفیروزآباد به ترتیب دارای اقلیمهای نیمهمرطوب و نیمهخشک هستند. گهواره در دامنه ارتفاعی 1462 تا 2097 متر از سطح آزاد دریا و سرفیروزآباد در دامنه 1230 تا 2127 متر از سطح دریا قرار دارند. فاصله دو منطقه از هم حدود 70 کیلومتر بوده و ساختار هر دو منطقه جنگلی بهصورت شاخهزاد است.
شکل 1. منطقههای موردمطالعه
Fig 1. Study area
نمونهگیری داده زمینی
مونهبندی جنگل سبب پراکنش متناسب قطعات نمونه در شرایط مختلف تودههای جنگلی برای جمعآوری اطلاعات زمینی شده و درنهایت دقت برآورد ویژگیهای جنگل را بهبود بخشد (21). با توجه به اینکه، ساختار جنگل در هر دو منطقه بهصورت شاخهزاد و بهصورت غالب از گونه بلوط ایرانی (Quercus branttii Lindl) تشکیلشدهاند؛ بنابراین، برای مونهبندی جنگلهای موردبررسی از نقشه شاخص سطح برگ (LAI: Leaf Area Index) استفاده شد، زیرا استفاده از این شاخص کمک میکند تا قطعات نمونه در کل ساختار تاج جنگل موردبررسی پراکنده شوند. نقشه LAI با استفاده از تصاویر لندست 8 و یک مدل جهانی ارائهشده برای این کار تهیه شد (25). پس از تهیه نقشه LAI، هر دو جنگل موردبررسی به سهطبقه (با تراکم کم ، متوسط و بالا) با مساحتهای تقریباً برابر تقسیم و در هر طبقه چند پلیگون انتخاب شد. پس از انتخاب پلیگونها، با استفاده از جنگلگردشی درنهایت در هر طبقه یکچند پلیگون برای نمونهبرداری تعیین شد. نمونهبرداری در هر طبقه با استفاده از طرح منظم با شروع نقطه تصادفی و در غالب یک شبکه آماربرداری 200 × 200 متر انجام گرفت. تعداد 124 قطعهنمونه مربعی شکل به ابعاد 30 × 30 متر مشابه با ابعاد پیکسل لندست در مردادماه سال 1395 برداشت شد (63 نمونه در جنگل گهواره و 61 نمونه در جنگل سرفیروزآباد). پس از تعیین موقعیت مکانی نمونهها با استفاده از دستگاه موقعیتیاب جهانی (GPS) دستی، اندازهگیری اندوخته زیتوده تکتک درختان با اندازهگیری تاج پوشش آنها و استفاده از روابط آلومتری توسعه دادهشده برای جنگلهای زاگرس (17) محاسبه شد، که درنهایت با جمع مقدار زیتوده تمامی درختان موجود در قطعهنمونه میزان زیتوده قطعهنمونه برحسب تن در هکتار محاسبه شد.
تصاویر ماهوارهای
در این مطالعه یک فریم از تصاویر لندست 8 (OLI)، به شماره گذر 167 و ردیف 36 مربوط به تاریخ دهم آگوست سال 2015 برابر با 19 مرداد سال 1394 مربوط به زمانی که تاج درختان کاملاً بسته است و نزدیک به زمان آماربرداری از وبسایتearthexplorer.usgs.gov دریافت شد. برای پیشپردازش تصویر لندست 8 (OLI) طبق مطالعه صفری و همکاران (29) تصحیحات رادیومتری و توپوگرافی استفاده شد. تصحیح رادیومتری با استفاده از مشخصات حسگر اخذ کننده تصویر انجامشده که سبب تبدیل تصویر به انعکاس بالای اتمسفر شد. تصحیح توپوگرافی با استفاده از روش C انجام شد که دارای کارایی مناسب برای تصاویر لندست است (28)، جهت اجرای تصحیح توپوگرافی از مدل رقومی زمین استخراجشده از تصاویر ASTER استفاده شد. تصحیحهای رادیومتری و توپوگرافی در نرمافزار منبع باز R و با استفاده از بستههای landsat و RStoolbox انجام شد.
متغیرهای طیفی استخراجشده:
تعداد زیادی از انواع متغیرهای طیفی از تصاویر لندست 8 استخراج شد که شامل باندهای اصلی، نسبتگیریهای باندی ساده، شاخصهای گیاهی، تبدیلهای ساده مانند تسلدکپ و تجزیه مؤلفههای اصلی بود (جدول 1). درمجموع 38 متغیر طیفی از تصویر لندست 8 مورداستفاده تهیه و مقدارهای طیفی متناظر با قطعات نمونه زمینی برداشتشده استخراج شد. شکل 2 نشاندهندۀ تصویر برخی از این متغیرها است.
جدول 1. متغیرهای طیفی استخراجشده از تصویر لندست 8
Table 1. Landsat 8 derived spectral variables
ردیف | متغیر طیفی | شرح |
1 | باندهای طیفی | آبی (B)، سبز (G)، قرمز (R)، مادونقرمزنزدیک (NIR)، مادونقرمز با طولموج کوتاه اول (SWIR1) و مادونقرمز با طولموج کوتاه دوم (SWIR2) |
2 | نسبتهای باندی ساده | B/G, B/R, B/N, B/S1, B/S2, G/R, G/N, G/S1, G/S2 ,N/R ,N/S1,N/S2, S1/S2, R/S1, R/S2 |
3 | شاخصهای گیاهی | NDVI, DVI, MSAVI2, SAVI, NDVIC, SATVI |
4 | تسلدکپ و تجزیه مؤلفههای اصلی | PC1, PC2, PC3, PC4, PC5, PC6, BRIGHTNESS, GREENESS, WETNESS, TCA TCD |
(13، 18، 26، 30 و 37)
روشهای مدلسازی:
بهطورکلی 9 روش مدلسازی شامل روشهای پارامتری (رگرسیون خطی)، نیمهپارامتری (مدل جمعی تعمیمیافته) و ناپارامتری (جنگل تصادفی، ماشینبردار پشتیبان، k-امین نزدیکترین همسایه، درختان رگرسیون تقویتشده، رگرسیون اسپلاین تطبیقی چندمتغیره، کوبیست و مدل پردازش گوسی) برای برآورد زیتوده روی زمینی مورد مقایسه قرار گرفت. شرح جزئیات هرکدام از روشهای مذکور در (12 و 29) ارائهشده است.
ارزیابی عملکرد روشهای مدلسازی
برای ارزیابی صحت روشهای مدلسازی مورداستفاده از فرآیند بوت استرپ و ارزیابی متقابل fold-10 با 1000 مرتبه تکرار انجام شد. این تعداد تکرار کمک میکند تا یک ارزیابی قابلقبول از اجرای مدلها ارائه گردد. ضریب تبیین (R2) و ریشه میانگین مربعات خطای برآوردها (RMSPE) محاسبهشده از هر تکرار مدلسازی، بهعنوان دو شاخص آماری عمومی برای مقایسه مدلها محاسبه شد (روابط 1 و 2).
]1[
]2[
R2: ضریب تبیین، yiمقدار مشاهدهشده،: مقدار برآورد شده، : مقدار میانگین مشاهدات، RMSPE: ریشه میانگین مربعات خطای برآوردها و n: تعداد مشاهدات
درنهایت، وجود اختلاف معنیدار بين روشهای موردبررسی ازنظر آماری R2 و RMSPE توسط تجزيه واريانس یکطرفه و مقايسه ميانگينها توسط آزمون آماری Tukey موردبررسی قرار گرفت. تحلیلهای آماری این تحقیق با استفاده از نرمافزار R انجام شد.
نتایج:
خلاصه مشخصههای آماری محاسبهشده برای زیتوده درختان منطقه موردبررسی با استفاده از اطلاعات جمعآوریشده از 124 قطعهنمونه برداشتشده در جدول (2) ارائهشده است. منطقه جنگلی گهواره دارای میانگین زیتوده بالاتری (5/20 تن در هکتار) در مقایسه با منطقه جنگلی سرفیروزآباد (6/12 تن در هکتار) دارد. میانگین زیتوده در منطقه جنگلی سرفیروزآباد 39 درصد کمتر از میانگین زیتوده در منطقه گهواره بود.
جدول 2- خلاصه مشخصههای آماری زیتوده روی زمینی در منطقههای موردبررسی برحسب تن در هکتار
Table 2. Summary of descriptivee statistics of AGB in study areas (unit: ton/ha)
منطقه موردمطالعه | تعداد نمونه | میانگین | بیشینه | کمینه | انحراف معیار |
گهواره | 63 | 5/20 | 0/53 | 0 | 9/11 |
سرفیروزآباد | 61 | 6/12 | 5/20 | 7/4 | 0/5 |
مجموع دو منطقه | 124 | 6/16 | 0/53 | 0 | 9/9 |
مقایسه روشهای مدلسازی با استفاده از روش fold-10 با 1000 مرتبه تکرار
نتایج تجزیه واریانس نشان داد اختلاف معنیداری بین روشهای مدلسازی برای هر دو شاخص آماری ضریب تبیین و ریشه میانگین مربعات خطای برآوردها محاسبهشده از 1000 بار تکرار وجود دارد (001/0 > p-value). در سرفیروزآباد ازنظر ضریب تبیین، روشهای مدلسازی اختلاف معنیداری در سطح 05/0 داشته و روش مدلسازی کوبیست با کسب ضریب تبیین 61/0 نسبت به سایر روشها عملکرد بهتری ارائه کرده است. برای منطقه گهواره، مقدارهای ضریب تبیین محاسبهشده توسط نمونهبرداری مجدد در فرآیند بوتاسترپ توسط مدل رگرسیون خطی، k-امین نزدیکترین همسایه و مدل جمعی تعمیمیافته با محاسبه بالاترین ضریب تبیین با مقدار 87/0 نسبت به سایر روشها بهتر عمل کردند، بااینحال، سه روش مدلسازی اختلاف معنیداری باهم نداشتند. مدل جمعی تعمیمیافته و درختان رگرسیون تقویتشده برای محاسبه ضریب تبیین با مقدار 76/0 در مورد مجموع دو منطقه نتایج بهتری از دیگر روشها کسب کرد (شکلهای 3 و 4). مدل کوبیست حداقل میانگین مربعات خطای برآوردها (3/3 تن در هکتار) را در سرفیروزآباد محاسبه کرد. روشهای k-امین نزدیکترین همسایه و جنگل تصادفی در گهواره با ریشه میانگین مربعات خطای برآوردها (8/5 تن در هکتار) بهطور معنیداری با روشهای دیگر اختلاف داشتند. در حالت مجموع کل نمونهها بدون تفکیک به دو منطقه، روشمدلسازی درختان رگرسیون تقویتشده با میانگین 3/5 تن در هکتار عملکرد بهتری از دیگر روشها ارائه نمودند (شکل 5 و 6).
در سرفیروزآباد، میانگین مقدار ضریب تبیین بین 48/0 (محاسبهشده با مدل جنگل تصادفی) و 61/0 (محاسبهشده توسط مدل کوبیست) بود. این مقدارها برای گهواره از 68/0 (محاسبهشده با مدل پردازش گوسی) و 87/0 برای روشهای k-امین نزدیکترین همسایه و رگرسیون خطی بود. بیشینه و کمینه ریشه میانگین مربعات خطای برآوردها برای سرفیروزآباد به ترتیب 0/4 تن در هکتار (محاسبهشده با روش جنگل تصادفی) و 3/3 تن در هکتار (محاسبهشده با روش کوبیست) بهدست آمد. کمینه و بیشینه ریشه میانگین مربعات خطای برآوردها برای منطقه گهواره به ترتیب 8/5 تن در هکتار (محاسبهشده با روش جنگل تصادفی) و 4/7 تن در هکتار (محاسبهشده با مدل پردازش گوسی) بهدست آمد. بهطورکلی، حداکثر و حداقل میانگین ریشه میانگین مربعات خطای برآوردها برای مجموع دو منطقه به ترتیب 0/6 و 1/5 تن در هکتار به ترتیب توسط روشهای ماشینبردارپشتیبان و درختان رگرسیون تقویتشده محاسبه شد (شکل 2 و 3).
شکل 2. تصویرهای برخی از متغیرهای بهدستآمده از لندست 8 شامل مادونقرمز نزدیک (الف)، مادونقرمز نزدیک با طولموج کوتاه 2 (ب)، نسبت باند قرمز به مادونقرمز نزدیک (ج)، نسبت مادونقرمز نزدیک با طولموج کوتاه 1 به 2 (د)، شاخص گیاهی DVI (ه) و شاخص گیاهی NDVI (و)
Fig 2. Landsat derived variables such as near infrared, shortwave infrered 2, ratio red to near infrared, ratio shortwave infrared 1 to shortwave infrared 2, vegetation indices difference vegetataion index and normalized difference vegetation index.
شکل 3. ضریب تبیین محاسبهشده برای منطقه سرفیروزآباد (نمودار بالا)، منطقه گهواره (نمودار وسط) و مجموع دو منطقه (نمودار پایین) با استفاده از روش ارزیابی متقابل fold-10 و 1000 مرتبه تکرار براي 9 روش مدلسازی مورداستفاده، LM: رگرسیون خطی، GAM: مدل جمعی تعمیمیافته، RF: جنگل تصادفی، SVM: ماشینبردارپشتیبان، kNN: k-امین نزدیکترین همسایه، BRT: درختان رگرسیون تقویتشده، MARS: رگرسیون اسپلاین تطبیقی چندمتغیره، CR: کوبیست و GPR: مدل پردازش گوسی
Fig 3. Calculated R2 for SarfiruzAbad (top), Gahvareh (middle) and combined two sites (bottom) with 1000-repeated 10-fold cross-validation for nine modeling methods: including linear regression (LR), generalized additive model (GAM), random forest (RF), boosted regression tree (BRT), support vector machine (SVM), k-nearest neighbor (kNN), cubist regression (CR), Gaussian process model (GPR), multivariate adaptive regression spline (MARS)
اهمیت متغیرهای پیشگو:
نتایج مطالعه نشان داد که متغیرهای طیفی استخراجشده از تصویرهای لندست توانایی مختلفی را در مدلهای مختلف از خود نشان دادند (جدول 3). بهطورکلی، فراوانی نسبی نسبتهای باندی ساده، تبدیل خطی (مانند TCA و PCA)، و شاخصهای گیاهی به ترتیب 48 ، 21 ، 20 و 11 درصد کل متغیرهای استفادهشده در تمامی مدلها را به خود اختصاص دادهاند.
شکل 4. نمودار جعبهای محاسبهشده برای ضریب تبیین برای منطقه سرفیروزآباد (نمودار بالا)، منطقه گهواره (نمودار وسط) و مجموع دو منطقه (نمودار پایین) با استفاده از روش ارزیابی متقابل fold-10 و 1000 مرتبه تکرار براي 9 روش مدلسازی مورداستفاده، LM: رگرسیون خطی، GAM: مدل جمعی تعمیمیافته، RF: جنگل تصادفی، SVM: ماشینبردارپشتیبان، kNN: k-امین نزدیکترین همسایه، BRT: درختان رگرسیون تقویتشده، MARS: رگرسیون اسپلاین تطبیقی چندمتغیره، CR: کوبیست و GPR: مدل پردازش گوسی
Fig 4. Calculated box-plot for R2 in SarfiruzAbad (top), Gahvareh (middle) and combined two sites (bottom) with 1000-repeated 10-fold cross-validation for nine modeling methods: including linear regression (LR), generalized additive model (GAM), random forest (RF), boosted regression tree (BRT), support vector machine (SVM), k-nearest neighbor (kNN), cubist regression (CR), Gaussian process model (GPR), multivariate adaptive regression spline (MARS)
روش مدلسازی | منطقه موردمطالعه | ||
سرفیروزآباد | گهواره | مجموع دو منطقه | |
LM | NR, R | S1S2, MSAVI2 | NR, Greeness |
GAM | R, N | GS1, NS2 | NR, S1S2 |
RF | NR, R | S1S2, MSAVI2 | NR, Greeness |
SVM | NR, R | S1S2, MSAVI2 | NR, GREENESS |
kNN | R, NDVIC | TCA, GREENESS | NR, GN, S1S2 |
BRT | NR, NDVI | TCA, S1S2 | NR, GN, S1S2 |
MARS | NR, BR | TCA, S1S2 | NR, S1S2 |
CR | G, DVI, GREENESS | S1, S2, GREENESS | N, R, B |
GPR | NR, R, NDVIC | TCA, NR | PC5, GREENESS, S1S2 |
شکل 5. ریشه میانگین مربعات خطای محاسبهشده برای منطقه سرفیروزآباد (نمودار بالا)، منطقه گهواره (نمودار وسط) و مجموع دو منطقه (نمودار پایین) برحسب تن در هکتار با استفاده از روش ارزیابی متقابل fold-10 و 1000 مرتبه تکرار براي 9 روش مدلسازی مورداستفاده، LM: رگرسیون خطی، GAM: مدل جمعی تعمیمیافته، RF: جنگل تصادفی، SVM: ماشینبردارپشتیبان، kNN: k-امین نزدیکترین همسایه، BRT: درختان رگرسیون تقویتشده، MARS: رگرسیون اسپلاین تطبیقی چندمتغیره، CR: کوبیست و GPR: مدل پردازش گوسی
Fig 3. Calculated RMSPE for SarfiruzAbad (top), Gahvareh (middle) and combined two sites (bottom) with 1000-repeated 10-fold cross-validation for nine modeling methods: including linear regression (LR), generalized additive model (GAM), random forest (RF), boosted regression tree (BRT), support vector machine (SVM), k-nearest neighbor (kNN), cubist regression (CR), Gaussian process model (GPR), multivariate adaptive regression spline (MARS)
شکل 6- نمودار جعبهای برای ریشه میانگین مربعات خطای محاسبهشده برای منطقه سرفیروزآباد (نمودار بالا)، منطقه گهواره (نمودار وسط) و مجموع دو منطقه (نمودار پایین) با استفاده از روش ارزیابی متقابل fold-10 و 1000 مرتبه تکرار براي 9 روش مدلسازی مورداستفاده، LM: رگرسیون خطی، GAM: مدل جمعی تعمیمیافته، RF: جنگل تصادفی، SVM: ماشینبردارپشتیبان، kNN: k-امین نزدیکترین همسایه، BRT: درختان رگرسیون تقویتشده، MARS: رگرسیون اسپلاین تطبیقی چندمتغیره، CR: کوبیست و GPR: مدل پردازش گوسی
Fig 4. Calculated box-plot for RMSPE in SarfiruzAbad (top), Gahvareh (middle) and combined two sites (bottom) with 1000-repeated 10-fold cross-validation for nine modeling methods: including linear regression (LR), generalized additive model (GAM), random forest (RF), boosted regression tree (BRT), support vector machine (SVM), k-nearest neighbor (kNN), cubist regression (CR), Gaussian process model (GPR), multivariate adaptive regression spline (MARS)
جدول 4. متغیرهای پیشگو نهایی انتخابشده در هر مدل
Table 4. selected explanatory variables in each model
روش مدلسازی | منطقه موردمطالعه | ||
سرفیروزآباد | گهواره | مجموع دو منطقه | |
LM | NR, R | S1S2, MSAVI2 | NR, GREENESS |
GAM | R, N | GS1, NS2 | NR, S1S2 |
RF | NR, R | S1S2, MSAVI2 | NR, GREENESS |
SVM | NR, R | S1S2, MSAVI2 | NR, GREENESS |
kNN | R, NDVIC | TCA, GREENESS | NR, GN, S1S2 |
BRT | NR, NDVI | TCA, S1S2 | NR, GN, S1S2 |
MARS | NR, BR | TCA, S1S2 | NR, S1S2 |
CR | G, DVI, GREENESS | S1, S2, GREENESS | N, R, B |
GPR | NR, R, NDVIC | TCA, NR | PC5, GREENESS, S1S2 |
بحث و نتیجهگیری:
تصمیمگیری و اجرای برنامههای تعدیل تغییر اقلیم برای اکوسیستمهای جنگلی، نیازمند وجود اطلاعات منطقی و ابزارهای لازم برای برآورد دقیق اندوختۀ کربن در مقیاسهای منطقهای تا جهانی است (26). تحقیق حاضر باهدف مقایسه روشهای مختلف مدلسازی بر صحت برآورد زیتوده با استفاده از تصویرهای لندست 8 انجام شد. تعداد زیادی از متغیرهای استخراجشده از تصویر ماهوارهای لندست مانند شاخصهای گیاهی، مقدارهای باندی، تبدیلهای ساده میتواند برای برآورد زیتوده استفاده شود. بههرحال، تعداد محدودی از متغیرهای سنجشازدوری دارای ضریب همبستگی بالایی با مشخصههای کمی جنگل مانند زیتوده هستند. مثلاً مادونقرمزنزدیک، شاخص گیاهی تفاضلی نرمال شده و سبزینه از تسلدکپ اطلاعات مشابهی دارند و ترکیبی از چنین متغیرهایی نمیتواند سبب ارتقاء صحت مدلسازی زیتوده شوند.
نقش متغیرهای طیفی در برآورد سنجشازدوری زیتوده بستگي به وضعیت ساختار جنگل دارد. در تحقیق حاضر، متغیرهای مورداستفاده در مدلهای نهایی در دو منطقه باهم متفاوت بودند. این مطالعه نشان داد که نسبتهای باندی ساده حاصل مادونقرمز نزدیک با طولموج کوتاه 1 به مادونقرمز نزدیک با طولموج کوتاه 2 و مادونقرمز نزدیک به قرمز یک نقش مهمتری از سایر متغیرهای طیفی داشتهاند. کارایی بهتر باندهای مادونقرمز نزدیک با طولموج کوتاه به سبب این موضوع است که این باندها حساسیت بیشتری به مؤلفههای ساختار تودههای جنگلی داشته و شرایط اتمسفر اثر کمتری بر روی ضبط دادهها در این طولموجها نسبت به سایر باندها دارد، این نتیجه مشابه با نتایج کارلسون و همکاران (18) است.
ديگر آنكه، برای مدلسازی زیتوده متغیرهای مختلف از دادههای سنجشازدوری در هرکدام از مدلهای مورداستفاده به کار گرفته شد و یک یا چند متغیر واحد که بتوانند بهطور مؤثر پیچیدگی ساختار تودههای جنگلی را مدل کرده و بهبود قابلتوجهی در برآوردهای زیتوده ارائه دهد قابل گزارش نیست. زیتودۀ برآورد شده توسط روشهای مدلسازی مختلف برای دو منطقه موردبررسی بیانگر صحت بالاتر برآوردها در منطقه گهواره نسبت به سرفیروزآباد است. فعالیتهای انسانی که منجر به قطع و تغییر شکل درختان در سرفیروزآباد شده سبب دو عامل مهم شده است، اول اينکه باعث برآورد نادرست زیتوده در سطح تکدرخت میشود. از طرف دیگر، کاهش سطح تاج درختان سبب افزایش انعکاس خاک بدون پوشش و اختلاط بیشتر بازتابهای منعکسشده در سطح پیکسل میگردد.
پیکسلهای آمیخته بهعنوان یکی از عوامل تأثیرگذار بر صحت برآورد زیتوده در مناطق خشک و نیمهخشک با پوشش گیاهی تنک مانند زاگرس میگذارد (2 و 8). مقایسه نتایج نشاندهنده برآورد بهتر زیتوده روی زمینی جنگلهای زاگرس در مقایسه با سایر تحقیقات انجامشده در خصوص برآورد زیتوده با تصویرهای لندست است (6، 14 و 26). این موضوع میتواند به دلیل تراکم نسبتاً کم زیتوده در منطقه موردبررسی باشد که از وقوع پدیده اشباع جلوگیری میکند. اشباع یکی از مشکلات موجود در استفاده از تصاویر ماهوارهای در تراکم بالای زیتوده است که سبب انحراف برآوردهای سنجشازدوری میگردد (8 و 14). زیرا مقدار نسبتاً کم زیتوده در تاج پوشش کم تراکم سبب انعکاس کم در دامنه باند مادونقرمز شده که میتواند بر پدیده اشباع غلبه کند (13 و 37).
کارایی روشهای مختلف مدلسازی مورداستفاده در دو منطقه موردبررسی و مجموع دو منطقه باهم متفاوت است و نمیتوان یک روش را بهعنوان بهترین روش برای مناطق موردبررسی معرفی کرد. روشهای کوبیست، k-امین نزدیکترین همسایه و درختان رگرسیون تقویتشده به ترتیب در منطقههای سرفیروزآباد، گهواره و مجموع دو منطقه برآورد بهتری ارائه کردند. مطالعات گذشته نشاندهنده کارایی بالای روش جنگل تصادفی در برآورد زیتوده است، که در این مطالعه چنین نتیجهای حاصل نشد. جنگل تصادفی بهطورمعمول نیازمند تعداد زیاد نمونه برای بهبود برآوردها است (7). علاوه براین کراوینکلر و روسمن (19) اظهار کردند که روش جنگل تصادفی از ترکیب مرزهای خطی در تصمیمگیری استفاده کرده و این کار در مورد تعداد نمونههای کم امکانپذیر نیست. این نتیجه مشابه با تحقیق گائو و همکاران (12) است که بیان کردند وقتیکه مقدارهای زیتوده کم است روشهای ناپارامتری میتوانند سبب بهبود برآورد زیتوده شوند. این موضوع نشاندهندۀ اهمیت موضوع انتخاب روش مدلسازی برای بهبود صحت برآورد، مخصوصاً در مورد مناطق با تراکم کم زیتوده مانند زاگرس است.
دیگر نتایج این مطالعه بیان کرد که نمیتوان یک روش مدلسازی واحد را برای هر دو منطقه و مجموع دو منطقه معرفی کرد، و بهتر است که در مطالعات آتی روشهای مختلف مدلسازی برای بهبود صحت برآوردها مورد آزمون قرار گیرند. بههرحال باوجود نتایج قابلقبول این مطالعه، هنوز بخشي از واریانس زيتوده تبيين نشده است. قطعات نمونهبرداری یک از بنیانهای برآورد سنجشازدوری زیتوده است. عدم قطعیت دادههای قطعهنمونه میتواند ناشی از رویکرد نمونهبرداری، اندازه نمونه، مدل آلومتری و اندازهگیری ویژگیهای درختان طی آماربرداری باشد. تعداد کافی قطعهنمونه سبب بهبود صحت برآورد و استفاده از مدلهای آلومتری تا حدود 20 درصد خطای برآورد را شامل میشوند (12 و 34). علاوه بر این نکات، مقدار کم زیتوده سبب پیچیدگی ترکیب نوع پوشش زمین از قبیل زمین بدون پوشش و پوشش گیاهی و درختی و تشکیل پیکسلهای آمیخته میگردد، که بازتاب ثبتشده توسط سنجنده دقیقاً جداکننده عوارض موجود در پیکسل نیست (8 و 10). ازاینرو سبب کاهش همبستگی بین مقدار زیتوده اندازهگیری شده در قطعهنمونه و اطلاعات استخراجشده از دادههای سنجشازدوری متناظر با موقعیت مکانی قطعهنمونه میشود.
نتایج این تحقیق نشان داد که عملکرد روشهای مدلسازی بسته به شرایط توده موردبررسی متفاوت بوده و ازاینرو نمیتوان یک روش را بهعنوان بهترین روش معرفی کرد. علاوهبراین، صحت نسبتاً بالای برآوردهای زیتوده با استفاده از تصویرهای رایگان لندست این موضوع را نمایان میسازد که استفاده از روشهای مدلسازی ناپارامتری و تصویر لندست 8 میتواند یک راه ساده، کمهزینه و اجرایی برای جنگلهای زاگرس و دیگر مناطق مشابه باشد. اهمیت این نتیجه برای جنگلهای غیراقتصادی و در کشورهای درحالتوسعه که بودجه محدودی برای مدیریت جنگلها اختصاص میدهند بسیار قابلتوجهتر خواهد بود.
منابع مورداستفاده
1. Aghababaie M, Ebrahimi A, Tahmasebi P. (2018) Comparison vegetation indices and tasseled cap transformation for estimates of soil organic carbon using Landsat-8 OLI images in a semi-steppe rangelands. Journal of RS and GIS for Natural resources, 9(3): 58-59.
2. Calvao T, & Palmeirim J. 2004. Mapping Mediterranean scrub with satellite imagery: biomass estimation and spectral behaviour. International journal of remote sensing, 25(16): 3113-3126.
3. Castillo JAA, Apan AA, Maraseni TN, Salmo SG. 2017. Estimation and mapping of above-ground biomass of mangrove forests and their replacement land uses in the Philippines using Sentinel imagery. ISPRS Journal of Photogrammetry, 134: 70-85.
4. Dai L, Jia J, Yu D, Lewis BJ, Zhou L, Zhou W, Jiang L. 2013. Effects of climate change on biomass carbon sequestration in old-growth forest ecosystems on Changbai Mountain in Northeast China. Forest Ecology and Management, 300: 106-116.
5. Domingo D, Lamela, M, Montealegre A, García-Martín A, de la Riva J. 2018. Estimation of Total Biomass in Aleppo Pine Forest Stands Applying Parametric and Nonparametric Methods to Low-Density Airborne Laser Scanning Data. Forests, 9(4): 158.
6. Du H, Cui R, Zhou G, Shi Y, Xu X, Fan W, Lü Y. 2010. The responses of Moso bamboo (Phyllostachys heterocycla var. pubescens) forest aboveground biomass to Landsat TM spectral reflectance and NDVI. Acta Ecologica Sinica, 30(5): 257-263.
7. Dube T, Mutanga O, & Sensing R. 2015. Evaluating the utility of the medium-spatial resolution Landsat 8 multispectral sensor in quantifying aboveground biomass in uMgeni catchment, South Africa. ISPRS Journal of Photogrammetry, 101, 36-46.
8. Eisfelder C, Kuenzer C, & Dech S. 2012. Derivation of biomass information for semi-arid areas using remote-sensing data. International journal of remote sensing, 33(9): 2937-2984.
9. Fassnacht, F, Hartig, F, Latifi, H., Berger, C, Hernández, J, Corvalán, P, & Koch B. 2014. Importance of sample size, data type and prediction method for remote sensing-based estimations of aboveground forest biomass. Remote Sensing of Environment, 154: 102-114.
10. Fernández-Manso, O, Fernández-Manso, A, Quintano, C. 2014. Estimation of aboveground biomass in Mediterranean forests by statistical modelling of ASTER fraction images. International journal of applied earth observation, 31: 45-56.
11. Fu L, Zhao Y, Xu Z, Wu B. 2015. Spatial and temporal dynamics of forest aboveground carbon stocks in response to climate and environmental changes. 15(2): 249-259.
12. Gao Y, Lu D, Li G, Wang G, Chen, Q, Liu L, Li D. 2018. Comparative analysis of modeling algorithms for forest aboveground biomass estimation in a subtropical region. Remote Sensing, 10(4): 627.
13. Gasparri, N I, Parmuchi MG., Bono J, Karszenbaum, H, & Montenegro CL. 2010. Assessing multi-temporal Landsat 7 ETM+ images for estimating above-ground biomass in subtropical dry forests of Argentina. Journal of Arid Environments, 74(10): 1262-1270.
14. Gizachew B, Solberg S, Næsset E, Gobakken T, Bollandsås OM, Breidenbach J, Mauya, EWJC. 2016. Mapping and estimating the total living biomass and carbon in low-biomass woodlands using Landsat 8 CDR data. Carbon balance & management, 11(1): 13.
15. Görgens EB, Montaghi A, & Rodriguez LCEJC. 2015. A performance comparison of machine learning methods to estimate the fast-growing forest plantation yield based on laser scanning metrics. Computers and Electronics in Agriculture, 116: 221-227.
16. Huffman T, Liu J, McGovern M, McConkey B, & Martin T. 2015. Carbon stock and change from woody biomass on Canada’s cropland between 1990 and 2000. Agriculture, Ecosystems & Environment, 205: 102-111.
17. Iranmanesh, Y. 2013. Assessment on Biomass Estimation Methods and Carbon Sequestration Of Quercus brantii Lindl. in Chaharmahal & Bakhtiari Forests, Ph.D. dissertstion of Tarbiat Modares University, 106 pp (In Persian).
18. Karlson M, Ostwald, M, Reese H, Sanou J., Tankoano B, & Mattsson E. 2015. Mapping tree canopy cover and aboveground biomass in Sudano-Sahelian woodlands using Landsat 8 and random forest. Remote Sensing of Environment, 7(8):10017-10041.
19. Krahwinkler P, Rossman J. 2011. Using decision tree based multiclass support vector machines for forest mapping. IEEE Int. Geoscience and Remote Sensing, Symp., Vancouver, Canada.
20. Kwak D-A, Lee W.-K, Cho H.-K, Lee S-H, Son Y, Kafatos M, & Kim SR. 2010. Estimating stem volume and biomass of Pinus koraiensis using LiDAR data. Journal of plant research, 123(4): 421-432.
21. Latifi H, Fassnacht F, & Koch, B. 2012. Forest structure modeling with combined airborne hyperspectral and LiDAR data. Remote Sensing of Environment, 121: 10-25. doi:https://doi.org/10.1016/j.rse.2012.01.015
22. McRoberts RE, Magnussen S, Tomppo EO, & Chirici G. 2011. Parametric, bootstrap, and jackknife variance estimators for the k-Nearest Neighbors technique with illustrations using forest inventory and satellite image data. Remote Sensing of Environment, 115(12): 3165-3174.
23. Nolè A, Law B, Magnani F, Matteucci G, Ferrara A, Ripullone F, & Borghetti M. 2009. Application of the 3-PGS model to assess carbon accumulation in forest ecosystems at a regional level. Canadian journal of forest research, 39(9): 1647-1661.
24. Noorian N, Shataee Sh, Mohamadi J. 2019. Evaluation of RapidEye satellite data for estimation some quantitative structure variables in the Caspian forests of Gorgan region. Journal of RS and GIS for Natural resources, 9(4): 73-89.
25. Pan Y, Birdsey RA, Fang J, Houghton R, Kauppi PE, Kurz WA., Canadell JG. 2011. A large and persistent carbon sink in the world’s forests. Science, 333(6045): 988-993.
26. Powel SL, Cohen WB, Healey SP, Kennedy RE, Moisen G G, Pierce KB, & Ohmann JL. 2010. Quantification of live aboveground forest biomass dynamics with Landsat time-series and field inventory data: A comparison of empirical modeling approaches. Remote Sensing of Environment, 114(5): 1053-1068.
27. Rajashekar G, Fararoda R, Reddy RS, Jha CS, Ganeshaiah K, Singh JS, Dadhwal VK 2018. Spatial distribution of forest biomass carbon (Above and below ground) in Indian forests. Ecological indicators, 85: 742-752.
28. Riaño D, Chuvieco E, Salas J, Aguado IJ. 2003. Assessment of different topographic corrections in Landsat-TM data for mapping vegetation types . 41(5):1056-1061.
29. Safari A, & Sohrabi H. 2019. The effect of digital preprocessing and modelling method on estimation of aboveground carbon stock of Zagros forests using Landsat 8 imagery. Journal of RS and GIS for Natural resources, 9(4): 73-89.
30. Safari A, Sohrabi H, & Powell S. 2018. Comparison of satellite-based estimates of aboveground biomass in coppice oak forests using parametric, semiparametric, and nonparametric modeling methods. Journal of Applied Remote Sensing, 12(4): 046026-1:15. doi: 10.1117/1.JRS.12.046026
31. Sagheb-Talebi K, M. Pourhashemi and T Sajedi. 2014. Forests of Iran. The Netherlands: Springer Netherlands.
32. Sarker LR, & Nichol J.E. 2011. Improved forest biomass estimates using ALOS AVNIR-2 texture indices. Remote Sensing of Environment, 115(4): 968-977.
33. Shao Z, Zhang L. 2016. Estimating forest aboveground biomass by combining optical and SAR data: a case study in Genhe, Inner Mongolia, China. Sensors, 16(6): 834.
34. Wang X, Shao G, Chen H, Lewis BJ, Qi G, Yu D, Dai L. 2013. An application of remote sensing data in mapping landscape-level forest biomass for monitoring the effectiveness of forest policies in northeastern China. Environmental management, 52(3): 612-620.
35. Zhao K, Suarez JC, Garcia M, Hu T, Wang C, & Londo A. 2018. Utility of multitemporal lidar for forest and carbon monitoring: Tree growth, biomass dynamics, and carbon flux. Remote Sensing of Environment, 204: 883-897.
36. Zhao P, Lu D, Wang G, Wu C, Huang Y, & Yu S. 2016. Examining spectral reflectance saturation in Landsat imagery and corresponding solutions to improve forest aboveground biomass estimation. International journal of remote sensing, 8(6): 469.
37. Zhu X, Liu D, 2015. Improving forest aboveground biomass estimation using seasonal Landsat NDVI time-series. ISPRS Journal of Photogrammetry, 102: 222-231.
Using the bootstrap approach for comparing statistical modeling methods for remotely-sensed aboveground biomass estimates in Zagros forests
Abstract
Statement of the Problem: Forests have a key role in climate change mitigation globally. Accurate mapping of forests’ aboveground biomass (AGB) is essential for several purpose such as sustainable forest management and understanding forest's contribution to the carbon cycle and terrestrial carbon budget. The common procedures for forest AGB mapping include in-situ measurement, calculation of field-based AGB by species-specific allometric equation, and remote sensing technique. Selection of the suitable modeling method is one of the most important factors for remotely-sensed AGB estimation. A large number of researches have conducted for comparing the modeling methods. However, these studies have been faced with the following challenges: 1) no modeling method has been recommended as the best, 2) the ability of these modeling methods is affected by forest type, structure, and the intensity of disturbance, 3) the performance of these modeling methods was evaluated by goodness-of-fit or cross-validation methods such as leave-one-out or k-fold.
Purpose: Considering the importance of statistical modeling methods for remotely-sensed AGB estimates, the current study was conducted with goal of the investigating the nine methods with 1000-repeated 10-fold cross-validation to estimate AGB in Zagros forests.
Methodology: The study was conducted in Kermanshah forests which is mostly dominated by oak species trees (Quercus spp.) and is located in western Iran on the Zagros Mountains. Zagros forests are generally sparse and open park-like forest and they cover approximately 20% of Iran’s area comprise 40% forests of Iran. Two test sites were chosen with different levels of human disturbances: one is Sarfiruz-Abad region with highly degraded (HD) forests, and the second site is located in the Gahvareh region with un-degraded (UD) forests. Geographical coordinates for HD and UD sites are 33º57′-34º04′N / 47º03′-47º17′E & 34º21′- 34º24′N / 46º16′-46º23′ E, respectively. We firstly stratified both test sites using a Landsat-derived leaf area index (LAI) map based on a global model. Each test sites were divided into three strata (low, moderate and high LAI value), and the locations of sample plots were located at the intersections of a 200m × 200 m grid in a random-systematic design in each stratum. Field-based sample plots were collected using 124 georeferenced square plots (63 plots in UD site and 61 plots in MD site) with 30m × 30m dimensions same as a Landsat 8’s pixel size. For predicting tree-level AGB, we used species-specific allometric equation developed for oak tree or sprout-clump in Zagros forests. The species-specific allometric equation in this study was constructed based on two perpendicular tree or sprout-clump crown diameters. The AGB of individual tree or sprout-clump were summed over the plots to calculate plot-level AGB estimates (ton/ha). Our tests sites were covered by one Landsat 8 OLI (Operational Land Imager) tile (path/row:167/36). A cloud-free image was acquired by Landsat 8 on 10th August 2015, which in the closed canopy trees and near to the date of forest inventory. Based on the literature review the image pre-processing was comprises the geometric, radiometric and topographic corrections. The geometric accuracy of the Landsat image was checked by digital map. By applying the orbital and sensor parameters, the digital numbers were calibrated to at-sensor radiance. The C-correction method was applied to topographic correction. To estimate the remotely-sensed AGB in study areas, 38 spectral variables such as original raw bands, simple band ratios, vegetation indices and common linear transformations like principle component analysis and tasseled cap were calculated. Generally, the performance of nine different statistical modeling methods including parametric (linear modeling: LM), semiparametric (generalized additive model: GAM), and nonparametric (random forest: RF, support vector machine: SVM, k-nearest neighbor: kNN, boosted regression trees: BRT, multivariate additive regression splines, cubist regression: CR, and Gaussian processes regression) were compared for AGB estimates. To assess the ability of models, two common quality statistics: (i) determination coefficient and (2) root mean square error via 10-fold cross-validation by 1000-repeats was calculated. This number of repeats helps to ensure an acceptable assessment of robustness for model performance.
Results and discussion: Descriptive statistics for the field plot was calculated and AGB of UD site and HD sites were 20.5 ton/ha and 12.6 ton/ha, respectively. The mean AGB in the UD site was 39% higher than in the HD site. ANOVA indicated significant differences between modelling methods (treatment effect: p < 0.001) for both R2 and RMSPE calculated in 1000-time repeats using 10-fold cross- validation. For The CR algorithm with bootstrapped mean R2 of 0.61 outperformed other methods in HD site. For UD site, R2 values calculated in bootstrapping resampling by LM, kNN and GAM and their differences were not significant (R2 ~ 0.87). The multiple comparisons of different models by Tukey test in term of RMSPE showed a different precision of modelling methods. For HD site, CR with lowest mean of RMSPE 3.3 ton/ha; and for UD site kNN and RF methods achieved lowest mean RMSPE (5.8 ton/ha and 5.8 ton/ha, respectively) showed a significant difference with other methods. Totally, our results revealed the capability of Landsat 8 OLI for AGB estimations in Zagros forests. The acceptable results are due to the low AGB in our tests sites which did not reached the saturation point. In contrast to the previous studies, LM yielded better results compared to other methods which can be expressed by the linear relationship between Landsat-derived spectral variables and field-based AGB. Among the various spectral information, original raw bands such as red, near infrared, and shortwave infrared 1 & 2 were selected in the final models.
Conclusion: In this study, we evaluated the potential of different statistical modeling methods to estimate AGB in Zagros forests by using Landsat imagery. The estimations were performed using nine parametric, semi-parametric, and non-parametric. 1000-repeated 10-fold cross-validation were run to compare the applied modeling methods. The results illustrated the acceptable accuracy for cost-efficient AGB estimating. The accuracy of AGB estimation in Gahvareh region with low-degraded forest stands was higher than SarfiruzAbad region with highly degraded stands. Cubist regression and kNN methods outperformed other in SarfiruzAbad and Gahvareh regions, respectively.
Keywords: Aboveground biomass, Bootstrap, Statistical modeling, Zagros forest, Landsat 8
بهرهگیری از رویکرد بوتاسترپ برای مقایسه روشهای مدلسازی آماری در برآورد سنجشازدوری زیتوده روی زمینی جنگلهای زاگرس
چکیده مبسوط
طرح مسئله: با توجه به اهمیت جنگلها در پروژههای تعدیل تغییر اقلیم، روشهای دقیق و کمهزینه برای برآورد زیتوده روی زمینی موردنیاز است. روشهای معمول مورد استفاده برای برآورد زیتوده روی زمینی شامل اندازهگیری در عرصه، محاسبه زیتوده با استفاده از معادلات آلومتری و استفاده از فنون سنجش از دوری است. سنجشازدور بهطور گسترده برای برآورد زیتوده جنگلها در دهههای اخیر مورداستفاده قرارگرفته است. یک از عوامل بسیار مهم در استفاده از دادههای سنجشازدوری برای برآورد زیتوده رویزمینی روش مدلسازی آماری مورد استفاده است. تعداد زیادی تحقیق در زمینه استفاده از روشهای مدلسازی انجام شده است. بههرحال، این مطالعات با چالشهای مختلفی روبرو هستند که برای مثال میتوان به موارد زیر اشاره کرد: 1) هیچ روش مدلسازی بهعنوان بهترین روش معرفی نشده است، 2) عملکرد این روشها متأثر از نوع جنگل، ساختار جنگل و میزان آشفتگیهای موجود است و 3) ارزیابی عملکرد و مقایسه نتایج آنها با استفاده از آزمون نکویی برازش و روشهای ارزیابی متقابل انجام گرفته است.
روش تحقیق: مطالعه حاضر در جنگلهای کرمانشاه با گونه درختی غالب بلوط انجام شد. جنگلهای زاگرس اغلب به صورت تنک و باز بوده و حدود 20 درصد از سطح ایران و 40 درصد از مناطق جنگلی این کشور را شامل میشود. برای اجراي این مطالعه دو منطقه جنگلی با شدت دخالتهای انسانی مختلف انتخاب شد: منطقه سرفیروزآباد با شدت تخریب بالا و منطقه جنگلی گهواره با حداقل تخریب. مختصات جغرافیایی این مناطق به ترتیب برای سرفیروزآباد و گهواره عبارتند از 33 درجه و 57 دقیقه تا 34 درجه و 4 دقیق شمالی و 47 درجه و 3 دقیقه تا 47 درجه و 17 دقیقه شرقی، و 34 درجه 21 دقیق تا 34 درجه و 24 دقیقه شمالی و 46 درجه و 16 دقیق تا 46 درجه و 23 دقیق شرقی است. برای جمعآوری نمونههای زمینی در دو منطقه مورد مطالعه، از نقشه شاخص سطح برگ تهیه شده از تصویرهای لندست براساس مدل جهانی استفاده شد. هر دو منطقه به سه طبقه کم، متوسط و زیاد شاخص سطح برگ طبقه بندی شده و در هر طبقه موقعیت مکانی نمونهها با استفاده از آماربرداری منظم در قالب یک شبکه 200 × 200 متر مشخص گردید. نمونههای زمینی به تعداد 124 نمونه مربعی شکل (63 نمونه در منطقه گهواره و 61 نمونه در منطقه سرفیروزآباد) با ابعاد 30 × 30 متر به اندازه پیکسهای تصویر لندست مورد استفاده برداشت شد. مقدار زیتوده روی زمینی هر درخت یا جست گروه توسط معادله آلومتری پیشنهاد شده برای گونههای بلوط جنگلهای زاگرس محاسبه شد. معادله آلومتری مورد استفاده برای برآورد اندوخته زیتوده هر درخت یا جست گروه از دو قطر عمود بر هم تاج درختان استفاده میکند. از جمع اندوخته زیتوده تک تک درختان موجود در قطعه نمونه، مقدار قطعه زیتوده در سطح قطعه نمونه بر حسب تن در هکتار محاسبه شد. منطقههای مورد مطالعه در یک فریم از تصویرهای لندست 8 به شماره گذر 167 و شماره ردیف 36 قرار داشتند. یک تصویر لندست بدون پوشش ابرناکی مربوط به تاریخ 19 مرداد سال 1394 (10 آگوست 2015) مربوط به زمانی که تاج درختان کاملاً بسته بوده و نزدیک به زمان آماربرداری زمینی از سایت earthexplorer.usgs.gov دانلود شد. پیشپردازش تصویر مورد استفاده شامل تصحیحات رادیومتری و توپوگرافی به روش C اعمال شد که در مطالعات قبلی پیشنهاد شده است. برای برآورد زیتوده روی زمینی در منطقههای مورد مطالعه با استفاده از سنجشازدور، تعداد 38 متغیر طیفی شامل مقدارهای باندی، نسبتهای ساده باندی، شاخصهای گیاهی و تبدیلهای خطی رایج مانند تسلدکپ و آنالیز مولفههای اصلی از تصویر لندست 8 مورد استفاده استخراج شدند. بهطورکلی کارایی 9 روش مدلسازی آماری مختلف شامل روشهای پارامتری (رگرسیون خطی)، نیمهپارامتری (مدل جمعی تعمیمیافته) و ناپارامتری (جنگل تصادفی، ماشینبردار پشتیبان، k-امین نزدیکترین همسایه، درختان رگرسیون تقویتشده، رگرسیون اسپلاین تطبیقی چندمتغیره، کوبیست و مدل پردازش گوسی) برای برآورد زیتوده روی زمینی مورد مقایسه قرار گرفت. ارزیابی مدلها با استفاده از روش fold-10 و با 1000 مرتبه تکرار و با محاسبه دو آماره ضریب تبیین و جذر میانگین مربعات خطا انجام گرفت. این تعداد اطمینان از پایداری نتایج را تامين ميكند.
نتایج و بحث: مشخصههای آماری اندازهگیری شده از قطعه نمونههای زمینی نشان داد که میانگین زیتوده روی زمینی برای منطقههای سرفیروزآباد و گهواره به ترتیب 6/12 و 5/20 تن در هکتار است. تجزیه واریانس نشان داد که اختلاف معنی داری در سطح 001/0 برای مشخصههای ضریب تبیین و جذر میانگین مربعات خطای محاسبه شده برای 1000 مرتبه تکرار توسط fold-10 وجود دارد. روش مدلسازی کوبیست در منطقه سرفیروزآباد با میانگین ضریب تبیین محاسبه شده 61/0 نتایج بهتری نسبت به سایر روشها ارائه کرد. این نتایج برای منطقه گهواره بیانگر کارایی بهتر روشهای رگرسیون خطی، مدل جمعی تعمیمیافته و k-امین نزدیکتریین همسایه با میانگین ضریب تبیین 87/0 بود. مقایسههای روشهای مختلف مدلسازی در مورد جذرمیانگین مربعات خطای برآوردها با استفاده از آزمون Tukey نشان داد که در منطقه سرفیروزآباد روش کوبیست با مقدار میانگین 3/3 تن در هکتار و روشهای k-امین نزدیکترین همسایه و جنگل تصادفی با میانگین 8/5 تن در هکتار اختلاف معنیداری با سایر روشها داشت. بهطورکلی، نتایج این تحقیق بیانگر کارایی مناسب تصویر لندست 8 در برآورد زیتوده روی زمینی جنگلهای زاگرس است. این موضوع میتواند به دلیل مقدار کم زیتوده در منطقههای مورد بررسی و نرسیدن آنها به نقطه اشباع بعنوان یکی از چالشهای استفاده از تصویرهای نوری مانند لندست باشد. نتایج دیگر این تحقیق ارزيابي اثر روش مدلسازی برای افزایش صحت برآورد سنجشازدوری زیتوده روی زمینی است. برخلاف نتایج پژوهشهاي قبلی، رگرسیون خطی نتایج بهتری نسبت به روشهای ناپارامتری ارائه کرد که دلیل آن میتواند وجود رابطه خطی زیتوده روی زمینی و متغیرهای طیفی استخراج شده از تصویرهای لندست باشد. در بین متغیرهای طیفی مختلفی که استفاده شد مقدارهای باند قرمز، مادون قرمز نزدیک و مادون قرمز با طول موج کوتاه 1 و 2 به عنوان متغیر نهایی در اغلب روشهای مدلسازی استفاده شدند.
نتیجهگیری: در این تحقیق، کارایی روشهای مختلف مدلسازی را در برآورد زیتوده روی زمینی با استفاده از تصویرهای لندست مورد بررسی قرار گرفت. برآوردهای زیتوده با استفاده از 9 روش پارامتری، نیمهپارامتری و ناپارامتری و با استفاده از ارزیابی متقابل fold-10 و با 1000 مرتبه تکرار مورد مقایسه قرار گرفتند. نتایج بیانگر قابلیت خوب تصویرهای لندست برای برآورد زیتوده روی زمینی جنگلهای بلوط زاگرس با هزینه کم است. برآورد زیتوده در منطقه جنگلی گهواره با دستخوردگی کمتر صحت بالاتری نسبت به منطقه جنگلی سرفیروزآباد با تخریب بالاتر داشت.
واژگان کلیدی: زیتوده رویزمینی، بوتاسترپ، مدلسازی آماری، جنگلهای زاگرس، لندست
Using the bootstrap approach for comparing statistical modeling methods for remotely-sensed aboveground biomass estimates in Zagros forests
Abstract:
Considering the increasing importance of forest ecosystems in climate change mitigation projects; simple, reliable and cost-effective methods for aboveground biomass (AGB) estimates are required. In the last decades, remote sensing techniques to estimate AGB has been extensively studied, but there is a lack of a comprehensive study of different modeling algorithms in low biomass forests. This study compared nine statistical modeling methods including linear regression (LR), generalized additive model (GAM), random forest (RF), boosted regression tree (BRT), support vector machine (SVM), k-nearest neighbor (kNN), cubist regression (CR), Gaussian process model (GPR), multivariate adaptive regression spline (MARS) using 1000-repeated 10-fold cross-validation in bootstrapped resampling approach. To achieve this goal, two forest regions in Kermanshah province with different human activities were selected: 1) SarfiruzAbabd region with highly-degraded forest (HD) and Gahvareh region with minor degradation (MD). Results indicated CR outperformed other methods for the HD site (R2 = 0.61 and RMSE = 3.3 ton/ha), in contrast, LM, kNN, and GAM algorithms resulted in the highest accuracy for the MD site (R2 = 0.87 and RMSE = 5.8 ton/ha). The BRT method presented the best results with mean R2 and RMSPE in the 0.76 and 5.3 ton/ha for the combined two test sites. Our findings showed that the accuracy of algorithms for AGB estimation depends on forest stand characteristics. Generally, free archive of Landsat imagery with optimal modeling method can be applied as a suitable tool to estimate AGB in low biomass forests.
Keywords: Aboveground biomass, Bootstrap, Statistical modeling, Zagros forest, Landsat 8