اثر بهینه سازی کرنل در مدلسازی پدیده خشکسالی با بهرهگیری از هوش محاسباتی (مطالعه موردی: شهر سنندج)
محورهای موضوعی : برنامه های کاربردی در تغییرات آب و هوایی زمینجهانبخش محمدی 1 , علیرضا وفایی نژاد 2 * , سعید بهزادی 3 , حسین آقامحمدی 4 , امیر هومن حمصی 5
1 - دانشجوی دکتری تخصصی سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده منابع طبیعی و محیط زیست، دانشگاه آزاد اسلامی واحد علوم و تحقیقات،
2 - دانشیار دانشکده مهندسی عمران، آب و محیط زیست، دانشگاه شهید بهشتی، تهران، ایران
3 - استادیار دانشکده مهندسی عمران، دانشگاه تربیت دبیر شهید رجائی، تهران، ایران
4 - استادیار گروه سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده منابع طبیعی و محیط زیست، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی،
5 - استاد، مهندسی منابع طبیعی، دانشکده منابع طبیعی و محیطزیست، واحد علوم و تحقیقات تهران، دانشگاه آزاد اسلامی، تهران، ایران
کلید واژه: کرنل, هوش محاسباتی, شبکه عصبی, رگرسیون بردار پشتیبان,
چکیده مقاله :
خشکسالی یکی از مهمترین بلایای طبیعی است که اثرات مخرب و زیانباری در زمینههای مختلف اقتصادی، اجتماعی و زیستمحیطی بهجای میگذارد. با توجه به رفتار تکرارشوندگی این پدیده، در صورت عدم اجرای راهکارهای مناسب، آثار مخرب آن تا سالها پس از وقوع میتواند در منطقه باقی بماند. اکثر بحرانهای طبیعی از قبیل سیل، زلزله، طوفان و رانش زمین در دورهای کوتاه ممکن است خسارات سنگین مالی و جانی به جامعه وارد کنند، اما خشکسالی ماهیت آرام و خزشی دارد و آثار مخرب آن بهتدریج و در مدت طولانیتری ظاهر میشود. ازاینرو با مدلسازی خشکسالی میتوان طرحهایی جهت آمادهسازی در مقابل خشکسالی و کاهش خسارات ناشی از آن ارائه کرد. در این پژوهش از الگوریتمهای هوش محاسباتی شبکه عصبی پرسپترون چندلایه (Multi-Layer Perceptron)، شبکه عصبی رگرسیونی تعمیمیافته (Generalized Regression Neural Network)، رگرسیون بردار پشتیبان با کرنل گوسین (Support Vector Regression) و رگرسیون بردار پشتیبان با کرنل پیشنهادی (Support Vector Regression New kernel) جهت مدلسازی خشکسالی با در نظر گرفتن شاخص استانداردشده بارش Standardized Precipitation Index) ( استفاده شده است. نتایج مدلسازیها در اغلب حالات بیانگر کارایی بهتر مدل پیشنهادی SVR_N نسبت به دیگر مدلها بود که در SPI 48 ماهه بهترین دقت مدلسازی حاصل گردید و مقدار RMSE و R2 به ترتیب برابر 093/0 و 991/0 به دست آمد. همچنین مدلهای GRNN، MLP و SVR به ترتیب بعد از SVR_N کارایی بهتری در مدلسازی از خود نشان دادند. نتایج این تحقیق بیانگر اهمیت انتخاب و بهینهسازی کرنل بر رفتار مدلسازی پدیده خشکسالی در مدلسازی به روش رگرسیون بردار پشتیبان است.
Drought is one of the most important natural disasters with devastating and harmful effects in various economic, social, and environmental fields. Due to the repetitive behavior of this phenomenon, if the appropriate solutions are not implemented, its destructive effects can remain in the region for years after its occurrence. Most natural disasters, such as floods, earthquakes, hurricanes, and landslides in the short term, can cause severe financial and human damage to society, but droughts are slow-moving and creepy in nature, and their devastating effects appear gradually and over a longer period of time. Therefore, by modeling drought, it is possible to provide plans for drought preparation and reduce the damage caused by it. In this study, computational intelligence algorithms of Multi-Layer Perceptron neural network, Generalized Regression Neural Network, Support Vector Regression with support kernel, and Support Vector regression with the proposed kernel (Support Vector) Regression New kernel has been used to model the drought using the Standardized Precipitation Index. The modeling results, in most cases, showed better performance of the proposed SVR_N model than other models. The values of RMSE and R2 were 0.093 and 0.991, respectively, and the GRNN, MLP, and SVR models performed better in modeling after SVR_N, respectively. Modeling of drought phenomenon in modeling is supported by vector regression method.
_||_
اثر بهینهسازی کرنل در مدلسازی پدیده خشکسالی با بهرهگیری از هوش محاسباتی (مطالعه موردی: شهر سنندج)
چکیده
خشکسالی یکی از مهمترین بلایای طبیعی است که اثرات مخرب و زیانباری در زمینههای مختلف اقتصادی، اجتماعی و زیستمحیطی بهجای میگذارد. با توجه به رفتار تکرارشوندگی این پدیده، در صورت عدم اجرای راهکارهای مناسب، آثار مخرب آن تا سالها پس از وقوع میتواند در منطقه باقی بماند. اکثر بحرانهای طبیعی از قبیل سیل، زلزله، طوفان و رانش زمین در دورهای کوتاه ممکن است خسارات سنگین مالی و جانی به جامعه وارد کنند، اما خشکسالی ماهیت آرام و خزشی دارد و آثار مخرب آن بهتدریج و در مدت طولانیتری ظاهر میشود. ازاینرو با مدلسازی خشکسالی میتوان طرحهایی جهت آمادهسازی در مقابل خشکسالی و کاهش خسارات ناشی از آن ارائه کرد. در این پژوهش از الگوریتمهای هوش محاسباتی شبکه عصبی پرسپترون چندلایه (Multi-Layer Perceptron)، شبکه عصبی رگرسیونی تعمیمیافته (Generalized Regression Neural Network)، رگرسیون بردار پشتیبان با کرنل گوسین (Support Vector Regression) و رگرسیون بردار پشتیبان با کرنل پیشنهادی (Support Vector Regression New kernel) جهت مدلسازی خشکسالی با در نظر گرفتن شاخص استانداردشده بارش Standardized Precipitation Index) ( استفاده شده است. نتایج مدلسازیها در اغلب حالات بیانگر کارایی بهتر مدل پیشنهادی SVR_N نسبت به دیگر مدلها بود که در SPI 48 ماهه بهترین دقت مدلسازی حاصل گردید و مقدار RMSE و R2 به ترتیب برابر 093/0 و 991/0 به دست آمد. همچنین مدلهای GRNN، MLP و SVR به ترتیب بعد از SVR_N کارایی بهتری در مدلسازی از خود نشان دادند. نتایج این تحقیق بیانگر اهمیت انتخاب و بهینهسازی کرنل بر رفتار مدلسازی پدیده خشکسالی در مدلسازی به روش رگرسیون بردار پشتیبان است.
واژگان کلیدی: هوش محاسباتی، شبکه عصبی، کرنل، رگرسیون بردار پشتیبان
مقدمه
خشکسالی به سبب تعداد، فراوانی، گستردگی و تبعات کوتاه و بلندمدت اقتصادی اجتماعی و زیستمحیطی، ازجمله مهمترین حوادث طبیعی به شمار میرود (18). بر همین اساس، مطالعه این پدیده نقش مهمی در برنامهریزیها و تصمیمگیریهای کلان مدیریتی برای رسیدن به اهداف توسعه پایدار دارد (21). خشکسالی پدیدهای است که اساساً با کمبود بارش و یا در برخی موارد با تبخیر و تعرق زیاد در یک منطقه مرتبط است (23). با توجه به اینکه خشکسالی در هر اقلیمی اعم از مناطق خشک، نیمهخشک تا مناطق مرطوب و خیلی مرطوب ممکن است اتفاق بیافتد و ایران نیز دارای تنوع اقلیمی مختلفی است، لذا بررسی و مدلسازی خشکسالی بهصورت محلی و منطقهای امری ضروری است. در این تحقیق شهر سنندج که دارای اقلیمی نیمهخشک است انتخاب شده است. با در نظر گرفتن مطالب فوق، ایجاد سیستمی که بتواند با دقت بالایی پدیده خشکسالی را مدلسازی کند امری ضروری و اجتنابناپذیر است. روشهای متفاوتی برای مدلسازی پدیده خشکسالی وجود دارد که میتوان به مطالعه رحمتی و همکاران (19) جهت مدلسازی خشکسالی کشاورزی در منطقه جنوب شرقی استرالیا با استفاده از روشهای یادگیری ماشین اشاره کرد. روشهای استفادهشده در این تحقیق شامل ماشین بردار پشتیبان، درختان طبقهبندی و رگرسیون، درختان رگرسیون تقویتشده، خطوط رگرسیون تطبیقی و تحلیل تفکیک انعطافپذیر بود. نتایج این تحقیق نشان داد که مدل ماشین بردار پشتیبان توانایی بالای در مدلسازی خشکسالی در منطقه جنوب شرقی استرالیا دارد. محمود زاده و عزیز مرادی (13) جهت مدلسازی جنگلزدایی در جنگلهای اطراف خرمآباد از شبکه عصبی و سیستم اطلاعات جغرافیایی استفاده کردند. نتایج حاصل از این تحقیق نشان داد شبکه عصبی پرسپترون چندلایه توانایی بالایی در مدلسازی و برآورد مقدار واقعی جنگلزدایی دارد. علیزاده و نیکو (1) برای تخمین خشکسالی هواشناسی در استان فارس از یک روش مبتنی بر ادغام روشهای مختلف هوش محاسباتی (MLP، Group Method of Data Handling، SVR و Adaptive Neuro-Fuzzy Inference System) به همراه استفاده از دادههای سنجشازدور استفاده کردند. نتایج نشاندهنده دقت بالاتر روش ترکیبی نسبت به روشهای منفرد است. غلام نیا و همکاران (9) با استفاده از روشهای آنالیز سری زمانی دادههای NDVI به تحلیل مکانی – زمانی پارامترهای فنولوژی مستخرج شده از شاخص NDVI در مناطق نیمهخشک کردستان پرداختند. نتایج حاصل از این تحقیق نشان داد بهطورکلی، نتایج رفتار NDVI را ازنظر سرسبزی، طول عمر، تغییرات ناگهانی برای پوششهای مختلف زمین و در طول سالهای مختلف و ارتباط آن با شاخص خشکسالی نشان داد که چگونه شمال غرب و غرب منطقه موردمطالعه میتواند بیشتر مستعد شرایط خشکسالی باشند. همچنین مطالعات مختلفی درزمینه کاربرد الگوریتمهای یادگیری ماشین و هوش محاسباتی در مدلسازی پدیدههای مختلف موردمطالعه محققین قرارگرفته است. ازجمله میتوان به مطالعه قاسمی و همکاران (8) جهت پیشبینی سطح تاج پوشش جنگلهای مانگرو از چهار الگوریتم نزدیکترین همسایه، ماشین بردار پشتیبان، جنگل تصادفی و رگرسیون خطی چند متغیره با استفاده از تصاویر دوربین هوایی استفاده کردند. نتایج این تحقیق نشاندهنده دقت بالاتر روشهای ناپارامتریک جنگل تصادفی، ماشین بردار پشتیبان و نزدیکترین همسایه نسبت به الگوریتم پارامتریک رگرسیون چند متغیره دارد. نتایج تمامی تحقیقاتی که از مدل رگرسیون بردار پشتیبان استفاده شده است، حاکی از کارآمدی بالای این مدل در پیشبینی و مدلسازی خشکسالی دارد. بهعنوان نمونه خسروی و همکاران (11) برای مدلسازی خشکسالی هواشناسی در شرق اصفهان از چهار مدل رگرسیون بردار پشتیبان کمترین مربعات، رگرسیون بردار پشتیبان، شبکه عصبی پرسپترون چندلایه و فازی- عصبی استفاده کردند. نتایج این تحقیق نشان داد مدل رگرسیون بردار پشتیبان دارای بالاترین دقت و مدل شبکه عصبی پرسپترون چندلایه پایینترین دقت را داشت. نتایج این تحقیق نشان داد رگرسیون بردار پشتیبان کمترین مربعات نسبت به بقیه مدلها سرعت عملکرد بیشتر دارد. میشرا و سینگ (16) در یک مقاله مروری به انواع روشهای مورداستفاده در مدلسازی خشکسالی پرداختهاند. نتایج این تحقیق حاکی از دقت بالای روشهای هوش محاسباتی و روشهای هیبریدی در کارهای گذشته دارد. تمام این پژوهشها، بر کارایی روشهای هوش محاسباتی در مدلسازی رفتار غیرخطی سری زمانی شاخصهای خشکسالی اذعان دارند. شاخصهای زیادی برای ارزیابی کمی و کیفی خشکسالی وجود دارد. برای تعریف خشکسالی از شاخصهای مختلفی در پژوهشها استفاده شده است. ازجمله شاخصهای خشکسالی میتوان به شاخص دهکهای بارندگی (Deciles Precipitation Index)، شاخص درصد نرمال بارش (Percent of Normal Precipitation Index)، شاخص ذخیره آب سطحی (Surface Water Storage Index)، شاخص خشکسالی احیایی (Reconnaissance Drought Index ) و شاخص بارش استانداردشده (Standardized Precipitation Index) اشاره کرد که میتوان در میان شاخصهای مختلف، شاخص بارش استانداردشده (SPI) را بهعنوان معروفترین شاخص خشکسالی نام برد. یکی از مهمترین ویژگیهای مفید شاخص SPI توانایی بیان خشکسالی در مقیاسهای زمانی مختلف است. ابراهیمی و همکاران (6) در ارزیابی و پایش تغییرات رطوبت تالاب میقان از تکنیک سنجشازدور و ارتباط آن با شاخص هواشناسی SPI استفاده کردند. علیزاده و نیکو (1) برای تخمین خشکسالی هواشناسی در استان فارس از شاخص خشکسالی SPI استفاده کرده است. لازم به ذکر است در خصوص مدلسازی خشکسالی با استفاده از شاخص SPI درروش رگرسیون بردار پشتیبان، مطالعات مشخصی در خصوص میزان کارایی اثر کرنل و تغییر آن بر کارایی نتایج مدلسازی انجام نشده است. در این تحقیق به بررسی اثر تغییر کرنل بر رفتار رگرسیون بردار پشتیبان پرداختهشده است. جهت مقایسه نتایج با روشهای دیگر در این پژوهش از چهار مدل رگرسیون بردار پشتیبان با کرنل گوسی، رگرسیون بردار پشتیبان با کرنل جدید (پیشنهادی)، مدل شبکه عصبی پرسپترون چندلایه و مدل شبکه عصبی رگرسیون تعمیمیافته جهت مدلسازی خشکسالی با استفاده از شاخص خشکسالی SPI در پنج مقیاس زمانی شامل 6، 12، 18، 24 و 48 ماهه استفاده شده است.
منطقه موردمطالعه
منطقه موردمطالعه در این تحقیق شهرستان سنندج از توابع استان کردستان است که در عرض جغرافیایی 35 درجه و 3 دقیقه عرض تا 35 درجه و 40 دقیقه شمالی و 46 درجه و 25 دقیقه تا 47 درجه و 20 دقیقه طول جغرافیایی شرقی است. این شهرستان منطقهای کوهستانی بوده و دارای اقلیم نیمهخشک بر پایه شاخص اقلیمی دمارتن و نیمهخشک سرد بر پایه اقلیم آمبروژه است که میزان میانگین بارش سالانه 458 میلیمتر و با حداکثر و حداقل دمای سالانه 8/36 و 4/5- درجه است. شکل 1 موقعیت جغرافیایی منطقه موردمطالعه را نشان میدهد.
شکل 1. موقعیت منطقه موردمطالعه (شهرستان سنندج)
Fig.1. Study area (Sanandaj city)
روششناسی
در این پژوهش ابتدا با مراجعه به سایت سازمان هواشناسی کشور به آدرس اینترنتی https://Data.irimo.ir اطلاعات بارش ماهانه ایستگاه سنندج دریافت شد. دادههای بارش ماهانه ایستگاه سینوپتیک شهر سنندج از سال 1959 تا 2017 در زمان انجام تحقیق در دسترس بود. به توجه به نقص اطلاعات بارش ماهانه ایستگاه سنندج بین سالهای 1959 تا 1980، از اطلاعات بارش ماهانه بین سالهای 1981 تا 2017 در این تحقیق استفاده شد. با استفاده از دادههای بارش تجمعی ماهانه ایستگاه سینوپتیک شهرستان سنندج شاخص خشکسالی SPI در مقیاسهای زمانی 6، 12، 18، 24 و 48 ماهه استخراج گردید. سپس با استفاده از روشهای شبکه عصبی پرسپترون چندلایه (MLP)، شبکه عصبی رگرسیون تعمیمیافته (GRNN) و رگرسیون بردار پشتیبان (SVR) با کرنل گوسی و رگرسیون بردار پشتیبان با کرنل جدید (پیشنهادی این تحقیق) مدلسازی سری زمانی خشکسالی انجام شد. در شکل 2 فلوچارت کلی و روند انجام پژوهش نشان داده شده است. شاخص خشکسالی محاسبهشده به دو گروه دادههای آموزشی مدلها (80 درصد دادهها) و دادههای تست مدلها (20 درصد باقیمانده دادهها) تقسیم شد. از دادههای آموزشی جهت آموزش مدلها استفاده شد و از 20 درصد باقیمانده دادهها جهت مقایسه کارایی چهار مدل استفاده شد.
شکل 2. فلوچارت روند کلی انجام پژوهش
Fig. 2. Diagram of methodology
محاسبه شاخص SPI
مراحل محاسبه SPI و نحوه استخراج آن برای مقیاسهای زمانی مختلف در مراجع (2 و 14 و 15) با جزئیات بیشتر بیانشده است. در این تحقیق الگوریتم محاسبه شاخص SPI در محیط نرمافزار MATLAB پیادهسازی گردید و ابتدا صحت سنجی کدهای پیادهسازی شده با دو نرمافزار علمی MDM (https://agrimetsoft.com/mdm.aspx) و Drinc (https://drought-software.com/download/) کنترل گردید، سپس داده ماهانه بارش ایستگاه سنندج بین سالهای 1981 تا 2017 (دادههای مربوط به 37 سال) جهت استخراج مقادیر SPI در مقیاسهای زمانی 6، 12، 18، 24 و 48 برای این دوره زمانی استفاده شد.
شبکه عصبی رگرسیونی تعمیمیافته
یکی از الگوریتمهای استفادهشده در این تحقیق، الگوریتم شبکه عصبی GRNN است که نخستین بار در سال 1991 توسط اسپکت (Specht) معرفی شد (20). شبکه عصبی GRNN که در این تحقیق استفاده شد، شامل چهار لایه ورودی، الگو، جمع و لایه خروجی است که ورودی با نماد X و خروجی شبکه GRNN با نماد Y نشان دادهشده است که از رابطه 1 محاسبه شد که در آن A, B خروجی دو نورون لایه جمع میباشند (3).
]1[ |
|
که در آن تنها پارامتر قابل تنظیم است که مقدار آن در این تحقیق از طریق سعی و خطا محاسبه شد.
شبکه عصبی پرسپترون چندلایه
یکی از روشهای خانواده بزرگ شبکههای عصبی، شبکه عصبی پرسپترون چندلایه است. این نوع از شبکه عصبی کارایی بالایی در حل مسائل غیرخطی دارد. MLP در حالت کلی شامل سه بخش لایه ورودی، لایههای مخفی و یک لایه خروجی است (7). لایههای مخفی میتواند بیش از یک لایه باشد و معمولاً در مسائل غیرخطی از دو یا حداکثر سه لایه مخفی استفاده میشود. در این تحقیق از یک شبکه عصبی با دولایه پنهان استفاده شد. در لایه اول پنهان از 50 نورون و در لایه دوم از پنج نورون استفاده شد. در شکل 3 معماری شبکه عصبی MLP استفادهشده در این تحقیق آمده است. روشهای مختلفی جهت آموزش شبکه عصبی MLP وجود دارد که از جمله کارآمدترین روشها میتوان به روش لونبرگ – مارکواردت (Levenberg-Marquardt) اشاره کرد که در این تحقیق نیز جهت آموزش شبکه عصبی MLP از این روش استفاده شد. در لایههای پنهان اول و دوم از تابع فعالساز سیگموئید و در لایه خروجی از تابع فعالساز خطی استفاده شد (17).
شکل 3. ساختار شبکه MLP استفادهشده در این تحقیق (دولایه پنهان با 50 نورون در لایه اول و پنج نورون در لایه دوم)
Fig. 3. The structure of the MLP network used in this study (two hidden layers with 50 neurons in the first layer and five neurons in the second layer)
رگرسیون بردار پشتیبان
در این تحقیق از رگرسیون بردار پشتیبان که درواقع تعمیمی از ماشین بردار پشتیبان است و در سال 1995 توسط وپنیک معرفی شد بهعنوان مبحث اصلی تحقیق استفادهشده است و به نحوی با تغییر در کرنل به توسعه و بهبود این الگوریتم پرداختهشده است. رگرسیون بردار پشتیبان برخلاف انواع شبکههای عصبی ازجمله MLP، RBF و حتی ANFIS بهجای کمینه کردن خطای مدلسازی، ریسک عملیاتی را بهعنوان تابع هدف در نظر گرفته و مقدار بهینه آن را محاسبه میکند (5). جهت حل مسائل غیرخطی از توابع کرنل که بر اساس ضرب داخلی دادهها است، استفاده میشود. هر تابعی که در تئوری مرسر صدق کند میتواند بهعنوان تابع کرنل در رگرسیون بردار پشتیبان استفاده شود (22 و 4). در این تحقیق از کرنل سیگموئید (25) بهعنوان کرنل معمولی SVR و از کرنل توسعهیافته (پیشنهادی) در فرآیند الگوریتم SVR استفاده شد. معادلات ریاضی مربوط به کرنل سیگموئید و کرنل پیشنهادی در روابط 2 و 3 به ترتیب آمده است.
]2[ |
|
]3[ |
|
]4[ |
|
]5[ |
|