بررسی کارایی شبکه یادگیری عمیق در شناسایی تغییرات اراضی با استفاده از تصاویر دو زمانه لندست-8
الموضوعات :سهند طاهرمنش 1 , بهنام اصغری بیرامی 2 , مهدی مختارزاده 3
1 - دانشجوی کارشناسی ارشد سنجش از دور ، دانشکده مهندسی نقشه برداری، دانشگاه صنعتی خواجه نصیرالدین طوسی، ایران
2 - دانشجو دکترا سنجش از دور و فتو گرامتری
3 - دانشیار دانشگاه خواجه نصیر الدین طوسی
الکلمات المفتاحية: جنگل تصادفی, شبکه عصبی مصنوعی, شبکه عصبی کانولوشن, یادگیری عمیق, پایش تغییرات,
ملخص المقالة :
علم سنجشازدور با بهکارگیری تصاویر چند زمانه ماهوارهای، امکان پایش تغییرات در فواصل زمانی مختلف را فراهم کرده است. رویکرد پیکسل مبنا در شناسایی تغییرات توانایی ارائه دقت بالا را ندارد و ازاینرو باید ویژگیهای مکانی در کنار ویژگیهای طیفی بکار روند. استفاده از روشهای سنتی تولید ویژگی مکانی مانند ماتریس هم رخداد با چالشهایی روبهرو است. تولید این ویژگیها علاوه بر اینکه وابسته به انتخاب کاربر است، بهصورت ناخواسته باعث افزایش فضای ویژگی میگردد. تمرکز اصلی مقاله حاضر در بهکارگیری ویژگیهای طیفی-مکانی در راستای حل محدودیت روشهای سنتی در شناسایی تغییرات میباشد. در این تحقیق، ویژگیهای طیفی-مکانی توسط خود شبکه یادگیری عمیق پیشنهادی استخراج شده و در طبقهبندی بکار گرفتهشدهاند. تصاویر لندست-8، ورودی شبکه بوده و فرایند استخراج ویژگی بهصورت سلسله مراتبی صورت گرفته است. بر اساس ویژگیهای طیفی-مکانی عمیق تولیدی از لایههای شبکه، خروجی شبکه تصاویر طبقهبندیشدهی قبل و بعد میباشد. درنهایت، بر اساس رویکرد پساطبقهبندی نقشه تغییرات حاصل میگردد. از شبکه پیشنهادی جهت ارزیابی تغییرات شهر سهند با استفاده از تصاویر سنجنده لندست-8 در بین سالهای 2013 تا 2021 استفاده شده است. برای اثبات قابلیت شبکه پیشنهادی در بهکارگیری ویژگی و طبقهبندی دقیق تصاویر، نتایج حاصلشده با نتایج روشهای جنگل تصادفی و شبکه عصبی مصنوعی مقایسه شده است. نتایج شناسایی تغییرات نشان داد که بهکارگیری شبکه یادگیری عمیق پیشنهادی دقت کلی شناسایی تغییرات باینری را به ترتیب به میزان 88/13% و 80/12% نسبت به شبکه عصبی مصنوعی و جنگل تصادفی افزایش میدهد. همچنین بهکارگیری شبکه پیشنهادی دقت کلی نقشه ماهیت تغییرات را به ترتیب به میزان 81/57% و7/65% در مقایسه با جنگل تصادفی و شبکه عصبی مصنوعی افزایش داده است. روشهای جنگل تصادفی و شبکه عصبی مصنوعی علیرغم اینکه توانستهاند محل تغییرات را شناسایی کنند اما در ارائه نوع ماهیت تغییرات عملکرد نامناسبی ارائه کردهاند.
_||_
بررسی کارایی شبکه یادگیری عمیق در شناسایی تغییرات اراضی با استفاده از تصاویر دو زمانه لندست-8
چکیده
علم سنجشازدور با بهکارگیری تصاویر چند زمانه ماهوارهای، امکان پایش تغییرات در فواصل زمانی مختلف را فراهم کرده است. رویکرد پیکسل مبنا در شناسایی تغییرات توانایی ارائه دقت بالا را ندارد و ازاینرو باید ویژگیهای مکانی در کنار ویژگیهای طیفی بکار روند. استفاده از روشهای سنتی تولید ویژگی مکانی مانند ماتریس هم رخداد با چالشهایی روبهرو است. تولید این ویژگیها علاوه بر اینکه وابسته به انتخاب کاربر است، بهصورت ناخواسته باعث افزایش فضای ویژگی میگردد. تمرکز اصلی مقاله حاضر در بهکارگیری ویژگیهای طیفی-مکانی در راستای حل محدودیت روشهای سنتی در شناسایی تغییرات میباشد. در این تحقیق، ویژگیهای طیفی-مکانی توسط خود شبکه یادگیری عمیق پیشنهادی استخراجشده و در طبقهبندی بکار گرفتهشدهاند. تصاویر لندست-8، ورودی شبکه بوده و فرایند استخراج ویژگی بهصورت سلسله مراتبی صورت گرفته است. بر اساس ویژگیهای طیفی-مکانی عمیق تولیدی از لایههای شبکه، خروجی شبکه تصاویر طبقهبندیشدهی قبل و بعد میباشد. درنهایت، بر اساس رویکرد پساطبقهبندی نقشه تغییرات حاصل میگردد. از شبکه پیشنهادی جهت ارزیابی تغییرات شهر سهند با استفاده از تصاویر سنجنده لندست-8 در بین سالهای 2013 تا 2021 استفادهشده است. برای اثبات قابلیت شبکه پیشنهادی در بهکارگیری ویژگی و طبقهبندی دقیق تصاویر، نتایج حاصلشده با نتایج روشهای جنگل تصادفی و شبکه عصبی مصنوعی مقایسه شده است. نتایج شناسایی تغییرات نشان داد که بهکارگیری شبکه یادگیری عمیق پیشنهادی دقت کلی شناسایی تغییرات باینری را به ترتیب به میزان 88/13% و 80/12% نسبت به شبکه عصبی مصنوعی و جنگل تصادفی افزایش میدهد. همچنین بهکارگیری شبکه پیشنهادی دقت کلی نقشه ماهیت تغییرات را به ترتیب به میزان 81/57% و7/65% در مقایسه با جنگل تصادفی و شبکه عصبی مصنوعی افزایش داده است. روشهای جنگل تصادفی و شبکه عصبی مصنوعی علیرغم اینکه توانستهاند محل تغییرات را شناسایی کنند اما در ارائه نوع ماهیت تغییرات عملکرد نامناسبی ارائه کردهاند.
واژههای کلیدی: پایش تغییرات، یادگیری عمیق، شبکه عصبی کانولوشن، جنگل تصادفی، شبکه عصبی مصنوعی.
مقدمه
زمین منبع اصلی تأمینکننده نیازهای انسان محسوب میشود. استفاده از زمین اثرات قابلتوجهی بر عملکرد سیستمهای اجتماعی - اقتصادی و محیطزیستی دارد. بهطور مثال استفاده نامطلوب و بدون برنامهریزی از منابع طبیعی علاوه بر اینکه خود اکوسیستم را تحدید میکند، زندگی روزمره بشر را نیز تحت شعاع خود قرار میدهد (12). افزایش جمعیت در دهههای اخیر، منجر به بروز تغییرات گستردهای در محیطزیست شده است. تغییرات رخدادِ در راستای تأمین نیازها بوده است. ازجمله این تغییرات میتوان به توسعه و گسترش بیرویه ساختوسازها اشاره کرد. توسعه و گسترش ساختوسازها که در بیشتر مواقع با از بین بردن زیستگاه حیوانات و تخریب منابع طبیعی همراه است، تهدید جدی برای محیطزیست قلمداد میگردد. در دست داشتن اطلاعات مکانی بهنگام از مناطق تغییریافته کمک شایانی به مدیریت و حفظ محیطزیست میکند. در این راستا پایش تغییرات پوشش و کاربری اراضی زمین برای بهبود کیفیت برنامهریزیهای شهری و حفظ محیطزیست، امری ضروری و حیاتی است (19). وجود تصاویر ماهوارهای که دربرگیرنده اطلاعات طیفی عوارض سطح زمین میباشند، مطالعه و بررسی تغییرات در بازههای زمانی مختلف را نسبت به روشهای میدانی آسانتر کرده است (10). بهکارگیری تصاویر ماهوارهای بهعنوان یک روش مقرونبهصرفه و سریع در شناسایی تغییرات عوارض زمین محسوب میگردد. تغییرات پوشش زمین بهطورمعمول تغییرات در اقلیم را منعکس میکنند. بنابراین، تکنیکهای تشخیص تغییرات مبتنی بر هوش مصنوعی میتوانند روشهای مؤثری را برای نظارت بر تغییرات فراهم کنند (3). بهطورکلی روشهاي كشف تغييرات به دو دسته کلی: تكنيكهاي نظارتنشده و نظارتشده تقسيم میگردند. روشهاي نظارتنشده بدون نیاز به دادههای آموزشی، فرآیند شناسایی و تمایز بین عارضهها را انجام میدهند. خروجی این روشها فقط توانایی شناسایی محل وقوع تغییرات رادارند (26). در مقابل روشهای نظارتشده علاوه بر توانایی ارائه محل تغییرات، میتوانند نوع تغییرات رخدادِ را نیز ارائه دهند (28). یکی از معروفترین و مشهورترین روش در تكنيكهاي نظارتشده رویکرد پساطبقهبندی است. رویکردهای پساطبقهبندی با استفاده از نمونههای آموزشی تصاویر چند زمانه بهطور مستقل طبقهبندی میشوند. سپس با مقایسه نقشههای طبقهبندیشده، نقشه تغییرات نهایی تولید میگردد. با توجه به اینکه نمونههای آموزشی مستقلاً از تصاویر ورودی جمعآوریشده و طبقهبندی مجزا صورت میگیرد، حساسیت نتایج به اثرات متفاوت رادیومتریکی و اتمسفری در زمان تصویربرداری بهشدت کاهش مییابند و قابلیت اطمینان بالایی نسبت به رویکرد اول دارند (22و23).
پایش تغییرات صرفاً با استفاده از ویژگیهای طیفی موجب به وجود آمدن دقتهای بالا نمیشود و نیاز داریم در کنار اطلاعات طیفی تصاویر از اطلاعات مکانی نیز استفاده کنیم. بهطور مثال از روشهایی که اطلاعات مکانی را در نظر میگیرند میتوان به ویژگیهای استخراجشده از ماتریس هم رخداد و ویژگیهای گابرو اشاره کرد. بهعنوان نمونه از این تحقیقات؛ سپهری (17) در تحقیقی به بررسی تغییرات اراضی و پوشش گیاهی دو شهر تفت و مهریز پرداختند. در این راستا از تصاویر ماهوارهی لندست-5 و لندست-8 استفادهشده است. در این پژوهش تغییرات با استفاده از شبکه عصبی مصنوعی شناسایی و مدلسازی گردید. میشرا (14)، در تحقیقی به بررسی تغییرات کاربری و پوشش اراضی حوزه آبریز در منطقهای از هیمالیا پرداخته است. ایشان در چهار دوره زمانی به پایش تغییرات رخدادِ پرداختند. تصاویر سنجندههای لندست-5 و سنتینل-2 برای اين منظور بکار گرفته شدند. طبقهبندی توسط الگوریتم بیشترین شباهت صورت گرفته و ماتریس تغییرات برای ارائه ماهیت تغییرات رخدادِ در طی این چهار دوره تولید گردید.. زیویانگ (30)، در شناسایی تغییرات رخدادِ در وهان چین، ویژگیهای موجک گابور را بکار گرفت. ایشان برای در نظر گرفتن اطلاعات همسایگی از الگوریتم میدان تصادفی مارکوف استفاده کردند. بر این اساس تصاویر تفاضلی بر اساس الگوریتم پیشنهادی تولید و نقشه تغییرات باینری توسط خوشهبندی فازی تولید گردید. الگوریتم پیشنهادی ایشان نتایج شناسایی را نسبت بهکارگیری معمول ویژگیهای مکانی مستخرج از ماتریس هم رخداد بهبود داده است.
در بررسی این تحقیقات باید به چند مسئله اشاره کرد. مسئله اول، استفاده صرف از اطلاعات طیفی تصاویر به دلیل اينكه امکان وقوع نوسانات طیفی در عوارض با رفتار طیفی مشابه وجود دارد، منجر به نتایج غیردقیق میشوند. که این مسئله توسط محققین که صرفاً از اطلاعات طیفی استفاده کردهاند نادیده گرفتهشده است. مسئله دوم، بهکارگیری اطلاعات مکانی در کنار اطلاعات طیفی که انتظار میرود نتایج شناسایی را بهبود ببخشند، دارای دو چالش میباشد (13). یک؛ استفاده همه اطلاعات در کنار هم به دلیل ایجاد همبستگی بالا، نهتنها دقت طبقهبندی را بهبود نمیدهد بلکه با کاهش دقت و ایجاد خطا همراه خواهد شد (27). دوم؛ اطلاعات مکانی مستخرج بشدت به منطقه مورد مطالعاتی وابسته هستند. يعني ممكن است يك ويژگي در يك منطقه داراي عملكرد مطلوبي باشد ولي در منطقه ديگر عملكرد ضعيفي داشته باشد. از طرف دیگر انتخاب ویژگیها وابسته به کاربر میباشد (7).
با پیشرفت سختافزارهای کامپیوتری و توسعهی هر چه بیشتر هوش مصنوعی در چند دهه اخیر، یادگیری عمیق به یک شاخه مطالعاتی جدید در اکثر زمینههای تحقیقاتی تبدیل گشته است. شبکههای یادگیری عمیق برخلاف روشهای کلاسیک استخراج ویژگی، توانایی استخراج خودکار اطلاعات مکانی سطح بالا رادارند. در این صورت نقش کاربرد در تعیین و شناسایی ویژگیهای مناسب کاسته میشود. علاوه بر این ویژگیهای تولیدی دیگر به صحنه تصاویر وابسته نخواهند بود(19). ازاینرو، یادگیری عمیق جایگزین مناسبی در بهکارگیری اطلاعات طیفی و مکانی کنار یکدیگر میباشند. در این راستا تحقیقاتی نظیر؛ لیو(11)، با استفاده از یک شبکه آموزشدیده با یک دیتاست بزرگ چارچوب جدیدی بر اساس ترکیب با یک شبکه عصبی بازگشتی برای استخراج منطقه شهری و تشخیص تغییرات پیشنهاد کردند. دقت کلی نقشههای شهری یکساله آن تقریباً 96 درصد در میان چهار شهر هدف (پکن، نیویورک، ملبورن و مونیخ)است. نکتهای که باید در نظر داشت، ساختار جدید معرفیشده از شبکه یادگیری عمیق نیازمند مجموعه تصاویر زیاد میباشد. داودت (2)، با استفاده از تصاویر سنتینل-2 با استفاده از شبکههای یادگیری عمیق اقدام به شناسایی تغییرات شهری کردند. همچنین، ایشان تأثیر استفاده از تعداد مختلفی از کانالهای طیفی را بهعنوان ورودی شبکهها مقایسه کردند. نتایج نشان داد؛ ساختار تلفیق سریع با اعمال 4 کانال طیفی نظیر باند آبی، سبز، قرمز و مادونقرمز نزدیک، بالاترین دقت را در میان تمامی حالتها به خود اختصاص داده است. چن (1)، در رویکردی با ترکیب دو ساختار از شبکههای یادگیری عمیق اقدام به شناسایی تغییرات در تصاویر باقدرت تفکیک مکانی بالا کردند. ترکیب شبکه عصبی کانولوشن با شبکه عصبی بازگشتی پیشنهادی ایشان در مقایسه با بهکارگیری صرف شبکه عصبی کانولوشن، نتایج بهتری در شناسایی تغییرات ارائه داده است.انجامشده است.
با توجه به کارایی روشهای یادگیری عمیق در تحقیقات اخیر، هدف اصلی مقالهی حاضر استفاده از روشهای یادگیری عمیق بهمنظور پایش تغییرات اراضی در شهر سهند میباشد. که در این راستا از تصاویر دو زمانه ماهوارهی لندست-8 استفادهشده است. تصاویر قبل و بعد بهصورت جداگانه وارد شبکه یادگیری عمیق پیشنهادی شده و فرایند استخراج و طبقهبندی ویژگیهای طیفی- مکانی صورت میگیرد. سپس با مقایسه تصاویر طبقهبندیشده، نقشه تغییرات حاصل میگردد. برای اثبات قابلیت شبکه پیشنهادی درزمینه پایش تغییرات از دو روش دیگر؛ شبکه عصبی مصنوعی و جنگل تصادفی نیز در این تحقیق استفادهشده است. روش اول نماینده روشهای جدید یادگیری عمیق بوده و دو روش دیگر نماینده روشهای یادگیری ماشین کلاسیک هستند (6و21). در این تحقیق به معماری شبکهای رسیدیم که به دقتهای بالاتری دستیافته است. نتایج نهایی بهدستآمده نشان میدهد که شبکه یادگیری عمیق پیشنهادی توانسته با دقت بالایی تغییرات را نسبت به دو روش دیگر شناسایی کند.
روند کلی ادامه بخشهای مقاله، به ترتيب در بخش اول به ارائه منطقه مورد مطالعاتی، دادههای مورداستفاده و نوع پوششهای موجود در منطقه پرداخته میشود. در بخش دوم، روش تحقیق، فلوچارت رویکرد پیشنهادی ارائهشده و معماری شبکه پیشنهادی شرح داده میشود. در بخش سوم، نتایج، به همراه تحلیل نتایج حاصل از ارزیابی طبقهبندی تصاویر و نقشههای تغییرات ارائهشده است. در بخش چهارم، بحث و نتیجهگیری، به بررسی کلی نتایج روشها پرداختهشده است. بخش آخر نیز به تقدیر و تشکر پرداخته است.
مواد و روشها
منطقه موردمطالعه و دادههای مورداستفاده
در این تحقیق بهمنظور بررسی عملکرد شبکه پیشنهادی در پایش تغییرات، تصاویر ماهوارهای لندست-8 از منطقه شهر سهند استفادهشده است. تصاویر این شهر از سامانه گوگل ارث انجین در زمانهای 10 جولای 2013 و 1 آگوست 2021 جمعآوریشدهاند. اکثر مطالعات تغییر کاربری/ پوشش اراضی شهری، دادههای لندست را به دلیل منحصربهفرد بودن مجموعه داده بهعنوان تنها آرشیو دیجیتال بلندمدت با وضوح مکانی متوسط و وضوح طیفی نسبتاً مناسب، مورداستفاده قراردادند (5 و24). تصاویر ماهواره لندست-8 داراي 11 باند بوده که از بين اين باندها باندهاي شماره 1 تا 4 و 8 در محدوده ديد انسان قرار داشته و بقيه باندها خارج از محدوده مرئي میباشد. باندهای 1تا7 و باند 9 دارای قدرت تفکیک مکانی 30 متر بوده و باند 8 این سنجنده، باند پانکروماتیک باقدرت تفکیک مکانی 15 متر میباشد. شهر جدید سهند با طول جغرافیایی ‘‘19/16 ‘7 46 و عرض جغرافیایی ‘‘18/41 ‘56 37، در استان آذربایجان شرقی واقعشده است. این شهر بنا به افزایش جمعیت شهر تبریز برای کنترل و مدیریت جمعیت در سال 1386 تأسیس گردید. این شهر در 20 کیلومتری جنوب غربی شهر تبریز بوده که اخیراً با احداث بزرگراه تبریز-سهند، دسترسی شهروندان دو شهر آسانتر شده و این مسئله باعث توسعه سریع شهر سهند در چند دهه اخیر گشته است. شکل1 موقعیت شهر سهند در تقسیمات کشوری را نشان میدهد.
شکل1- موقعیت شهر سهند در تقسیمات کشوری(تصویر از گوگل ارث اخذشده است)
Fig. 1- The location of Sahand city within the country's divisions (The image is from Google Earth)
شکل2- از راست به چپ ترکیب رنگی کاذب تصویر اخذشده در سال 2021 و ترکیب رنگی کاذب تصویر اخذشده در سال 2013 سنجنده لندست-8 از شهر سهند
Fig. 2- The images are from right to left, false color combinations of images taken in 2021 and 2013 Landsat-8 sensors from Sahand city, respectively
شهر سهند تغییرات زیادی داشته است که غالباً تغییرات در راستای تغییرات زمینهای بایر به کاربری شهری بوده است. این منطقه درگذشته بهصورت یک منطقه کاملاً بایری بوده که منطقهاي مناسب برای احداث شهر را فراهم کرده است. با مرور زمان کلاسهای پوششی جدید مانند ساختمان، راههای ارتباطی و پوشش گیاهی نیز به کلاس بایر افزوده شدند. شکل 2 ترکیب رنگی کاذب تصاویر جمعآوریشده از شهر سهند را نشان میدهد. در کل بر اساس نوع کلاسهای موجود در این منطقه، 4 کلاس موضوعی غالب شامل: 1- راههای ارتباطی، 2- خاک بایر، 3- پوشش گیاهی، 4- بلوکهای ساختمانی، در نظر گرفتهشده و تغییرات محتمل بین آنها موردمطالعه قرار گرفت.
روش تحقیق
در تحقیق حاضر، بهمنظور بررسی و پایش تغییرات رخدادِ در منطقه شهری شهر سهند، علا.ه بر ارائهی روش یادگیری عمیق پیشنهادی از الگو.ریتمهای شبکه عصبی مصنوعی و جنگل تصادفی برای اثبات قابليت شبكه پيشنهادي استفاده میشود. یادگیری عمیق پیشنهادی بر پايه شبکههای عصبی کانولوشن است. شبکههای عصبی کانولوشن، بر اساس تعداد لایههای تنظیمشده در ساختار خود، ویژگیها را بهصورت سلسله مراتبی از طریق اتصالات محلی و وزن مشترک استخراج میکنند. معماری این شبکهها به دلیل داشتن توانایی استخراج ویژگیهای طیفی- مکانی عمیق میتوانند بهعنوان طبقهبندی کننده یا استخراجکننده ویژگی برای تشخیص تغییرات استفاده شوند (12). شکل 3 معماري رايج اين شبکهها را نشان میدهد.
شکل3- معماری متداول شبکه عصبی کانولوشن
Fig. 3- Architecture of conventional neural networks
شکل4- فلوچارت روش پیشنهادی
Fig. 4- Flowchart of proposed method
در نگاه کلی انتظار میرود شبکههای شبکه عصبی کانولوشن به دلیل استخراج ویژگیهای طیفی- مکانی عمیق، نتایجي با دقت بالاتری از روشها کلاسیک ارائه دهند. روند روش پیشنهادی در شکل 4 ارائهشده است. بر اساس فلوچارت پیشنهادی، با توجه به اینکه تصاویر از سامانه گوگل ارث انجین جمعآوریشدهاند، پیشپردازشهای نظیر هم مرجعسازی و تصحیحات رادیومتریکی توسط خود سامانه اعمالشده است. در ابتدا قدرت تفکیک مکانی تصاویر با الگوریتم گرم اشمیت بهبود پیدا میکند. در مرحله بعدی، دادههای واقعیت زمیني جمعآوری میشوند. این دادهها به دو مجموعه دادههای آموزشی و آزمایشی تقسیم میشوند. مرحله سوم، مرحله طبقهبندی تصاویر با دادههای آموزشی است. با مقایسه تصاویر طبقهبندیشده، نقشههای تغییرات تولید میشوند. برای بهبود كيفيت نقشههاي تغییرات بهدستآمده از فیلتر اکثریت استفاده ميشود. در انتها با كمك دادههای آزمایشی ارزیابی كمي نقشهها انجام ميگيرد. معماری شبکه پیشنهادی
در بهکارگیری تصاوير لندست-8، هرچقدر بتوان قدرت تفکیک مکانی تصاویر را بالاتر برد، انتظار میرود پیکسلهای نسبتاً خالصی داشته باشیم. اين امر طبقهبندی تصاوير را نسبت به حالت اولیه بهتر میکند. درنتیجه نتايج پايش تغييرات بهبود مییابد. در این راستا، فرآیند پن شارپنینگ برای بهبود قدرت تفکیک مکانی باندها صورت گرفت. معماری مورداستفاده در تحقیق دارای سه لایه كانولوشن با تعداد فیلتر 128-64-32 ، 128 نرون در لایه پنهان، لايه حذف تصادفی با نرخ 3/0 میباشد. در شکل5 ساختار معماری شبكه پيشنهادي ارائهشده است.
شکل5- معماری شبکه عصبی کانولوشن پیشنهادی
Fig. 5- Proposed convolution neural network architecture
در ادامه توضيحاتي در مورد شبكه عصبي كانولوشن ارائهشده است.
شبكه عصبي كانولوشن:
بهطورکلی، شبکههای عصبي كانولوشن يك نوع خاص از شبکههای عصبي هستند که شامل سه لایه اساسی کانولوشن، ادغام حداکثری و کاملاً متصل هستند. در ادامه به تفکیک در مورد هر لایه و موارد مربوط به آنها توضیح داده میشود.
لايه كانولوشن (ConV):
در این لایه، چند هسته کانولوشن قابلآموزش (که فیلتر نیز نامیده میشوند) به تصویر ورودی اعمال میشوند. هدف از وزن این هستهها اتصال واحدها در یک نقشه ویژگی با لایه قبلی است. درنتیجه کانولوشن با اتصالات محلی ویژگیها، شناسایی و رفتار آنها به نقشههای ویژگی نگاشت میشوند. لايه كانولوشن از فيلترهايي استفاده میکند كه عمليات کانولوشن را در هنگام پويش ورودي نسبت به ابعادش اجرا میکند. خروجي حاصلشده از كانولوشن نقشهي ويژگي ناميده میشوند. انباشت لایههای کانولوشن مختلف، عمق شبکهها را افزایش میدهد که نقشههای استخراجشده را ساختاریتر میکند. لایههای اولیه ویژگیهاي سطح پايين برای مثال لبهها را استخراج ميكند، درحالیکه، لایههای بعدی ويژگيهاي تولیدشده بهصورت شکل، قطعات یا اشیا هستند. اگر فرض کنید که ml نشاندهنده تعداد فیلترها کانولوشن در لایه l شبکه و آرایه مربوط به n امین ورودی لایه l باشد. بردار ویژگی خروجی k ام لایه l، که با نشان داده میشود، میتواند طبق رابطه 1 محاسبه شود (9،8و24).
]1[ |
|
-1 | -1 | 1 |
0 | 1 | -1 |
0 | 1 | 1 |
که در آن ماتریس بایاس، فیلتری را نشان میدهد که نقشه ویژگی nام را در لایه قبلی (l-1) به نقشه ویژگی kام در لایه l متصل میکند و عملگر کانولوشن را نشان میدهد. شکل 6 نحوه عملکرد کرنل 3×3 کانولوشن بر روی تصویر یا ویژگی ورودی را نشان میدهد.
12 | 20 | 30 | 0 | 22 |
255 | 47 | 2 | 92 | 11 |
8 | 12 | 2 | 0 | 90 |
34 | 70 | 32 | 4 | 120 |
112 | 100 | 25 | 12 | 50 |
57 | 138 | 163 |
-188 | 81 | -49 |
145 | 51 | 34 |
شکل6- نحوه عملکرد کرنل 3×3 کانولوشن دو بعدی بر روی تصویر ورودی
Fig. 6 - 3 × 3 convolution performs on two-dimensional the image
بهطورمعمول پس از عملیات کانولوشن، یک تابع فعالساز غیرخطی بر روی هر المان از نتیجه کانولوشن اجرا میشود که طبق رابطه 2 محاسبه شود.
]2[ |
|
12 | 20 | 30 | 0 |
255 | 47 | 2 | 92 |
8 | 12 | 2 | 0 |
112 | 100 | 25 | 12 |
255 | 92 |
112 | 25 |
شکل7- نحوه عملكرد ادغام ماكزيمم
Fig7. - Max pooling layer
در ميان اين لایهها در برخي موارد از لایههايي نظر نرمالسازی بچ و حذف تصادفی نيز استفاده میشود.در ادامه توضيح مختصري از اين دو لايه ارائه ميگردد.
نرمالسازی بچ(Bath Normalization):
فعلوانفعالاتی که در لایههای اول صورت میگیرد باعث اعمال تغییرات در توزیع داده ورودی به شبکه میگردد و زمانی که عمق زیاد باشد، این تأثیرات بهشدت زیاد میشوند که در لایههای بالاتر توزیع ورودی دستخوش تغییرات زیادی خواهد شد. بهعبارتدیگر وزنها و پارامترهای قبلی همه روی ورودیای که به یکلایه در عمق X میرسد تأثیر میگذارند و این موضوع موجب بروز مشکلی میشود. نرمالسازی بچ برای حل این مشکل(بهطور خاص کاهش این تغییر توزیع) ارائهشده است. با استفاده از نرمالسازی بچ شبکه حساسیت کمتری به مقداردهی اولیه وزنها خواهد داشت و همینطور از نرخ یادگیری بهمراتب بالاتری میتوان استفاده کرد (4).
حذف تصادفی (Dropout):
حذف تصادفی یک روش تنظیم مدل، برای کاهش بیش برازش در شبکههای عصبی است. پدیده بیش برازش درواقع زمانی رخ میدهد که شبکه بهخوبی توسط دادههای آموزشی آموزش میبیند. درحالیکه در ارزیابی با دادههای آزمایشی، شبکه آموزشدیده نتایج ضعیفتری ارائه میدهد. به چنین شرایط پیشآمده، بیش برازش گفته میشود. درروش حذف تصادفی هر بار که وزنها بروز میشوند یک سری از آنها را بهصورت تصادفی از پروسه یادگیری حذف میشوند (4).
تمام متصل(FC):
نقشههای ویژگی خروجی لایه قبلی مسطح شده و برای لایههای کاملاً متصل فراهم میشوند. این لایهها برای استخراج اطلاعات سطح بالاتر با تغییر شکل نقشههای ویژگی به یک بردار n بعدی استفاده میشوند. لايه تمام متصل بر روي ورودي مسطح بهطوریکه هر ورودي بهتمامی نرونها متصل است عمل میکند. شكل 8 ساختار اين بخش را نشان ميدهد. اين بخش همان ساختار شبکههای عصبي مصنوعي معمول است كه متشكل از لايه ورودي، لایههای پنهان و لايه خروجي میباشد (9،8و24).
شکل8- ساختار بخش لايه تمام متصل
Fig.8 - The fully connected layer
بیشینه هموار(softmax):
در آخرین لایه شبکه، به نام لایه طبقهبندی، نورونها بهطور خودکار در نقشههای ویژگی خروجی C که متناظر با تعداد کلاسها هستند، جمع میشوند. سپس، با استفاده از یک تابع بیشینه هموار، خروجی لایه طبقهبندی L به خطاهای توزیع احتمال (نرمال شده)تبدیل میشود. بهطور خاص، توزیع احتمال کلاسها از طریق رابطه 3 محاسبه میشود (18).
]3[ |
|
]4[ |
|
]5[ |
|
Positive predicted class |
| |
TP | Positive actual class | |
TN | FP | Negative actual class |
صحت(precision):
وقتیکه مدل نتیجه را مثبت پیشبینی میکند، این نتیجه تا چه اندازه درست است. زمانی که ارزش FP بالا باشد، معیار صحت معیار مناسبی خواهد بود. درواقع نسبت مقداری موارد صحیح و چه بهصورت غلط، در آن کلاس طبقهبندی کرده است که طبق رابطه 6 محاسبه میشود(29).
]6[ |
|
]7[ |
|
]8[ |
|
تصاویر طبقهبندیشده حاصله از روشها | معیارهای ارزیابی | ||
| دقت کلی(درصد) | ضریب کاپا(درصد) | |
2013 | شبکه یادگیری عمیق پیشنهادی | 75/96 | 51/91 |
شبکه عصبی مصنوعی | 92/87 | 64/71 | |
جنگل تصادفی | 83/86 | 72/68 | |
2021 | شبکه یادگیری عمیق پیشنهادی | 1/97 | 79/92 |
شبکه عصبی مصنوعی | 89/94 | 02/87 | |
جنگل تصادفی | 62/90 | 06/77 |
شکل9- نقشههای موضوعی حاصل از طبقهبندی تصاویر؛ به ترتیب سطر اول مربوط به شبکه پیشنهادی، سطر دوم مربوط به شبکه عصبی مصنوعی، سطر سوم مربوط به جنگل تصادفی - ستون راست مربوط به سال 2013، ستون چپ مربوط به سال 2021
Fig. 9 Classification of pre and post images: the first row represents the results of proposed network with 3 layers, the second row represents the results of artificial neural network, and the third row represents the results of random forest - the right column represents the results of 2013 image, and the left column represents the results of 2021 image.
دليل رخ داد اين رفتار را میتوان اینگونه بيان كرد كه؛ اساس كار دو روش جنگل تصادفی و شبکه عصبی مصنوعی بر مبناي تك پيكسل میباشد. به اين نحو كه فرايند طبقهبندی بهصورت پيكسل به پيكسل انجام میگیرد و اثر پیکسلهای همسايه درروند طبقهبندی ناديده گرفته میشود. بهطور مثال؛ اگر دو پيكسل کنار هم داشته باشيم كه از يك عارضه واحد باشند ولي اختلاف درجات رقومي بالايي داشته باشند، برچسبهای متفاوت به پیکسلها داده میشود که درنهایت دقت طبقهبندی را پایین میآورد. در مقابل؛ شبكه يادگيري عميق پيشنهادي با در نظر گرفتن پنجرهای در اطراف هر پيكسل، اثر پیکسلهای كناري را درروند استخراج اطلاعات مكاني- طيفي عميق و طبقهبندی پیکسلها در نظر میگیرد. درنتیجه اثراتي نظير شباهت طيفي و نوسانات پديد آمده در تصاوير را درروند طبقهبندی كاهش میدهد.
با بررسی بصری نقشههای حاصل از طبقهبندی توسط جنگل تصادفی و شبکه عصبی مصنوعی، در نواحی که کلاس ما خاک بایر باید باشد برچسب دهی کلاس ساختمان صورت گرفته است. دلیل این امر استفاده صرف از اطلاعات طیفی تصاویر بوده و با شباهت رفتار طیفی خاک بایر روشن به رفتار طیفی ساختمان در برچسب دهی اثر گذاشته و طبقهبندی بهاشتباه صورت گرفته است. شبکه یادگیری عمیق پیشنهادی با در نظر گرفتن همسایگی پیکسلها و استخراج اطلاعات مکانی –طیفی، نسبت به دو روش دیگر بهخوبی کلاس ساختمان را از کلاس خاک بایر متمایز و تفکیک کرده است و برای هر دو زمان نتایج بهمراتب بهتری در طبقهبندی تصاویر لندست-8 ارائه داده است.
برای دستیابی به یک نقشه تغییرات دقیق، همواره باید طبقهبندی تصاویر با دقت و صحت بالایی انجام گیرد. نقشه تغییرات با مقایسه تصاویر طبقهبندیشده حاصل میگردد. در ادامه نقشههای تغییرات حاصل از شبکه یادگیری عمیق پیشنهادی، شبکه عصبی مصنوعی و جنگل تصادفی به همراه نتایج ارزیابی آنها ارائهشده است.
بررسی نقشههای تغییرات باینری
نقشههای تغییرات بر اساس مقایسه پیکسل به پیکسل تصاویر طبقهبندیشده دو زمانه تولید میشوند. برای بهبود نقشههای تغییرات تولیدشده، از فیلتر اکثریت با ابعاد پنجره 5×5 استفاده میگردد. جدول 3 نتایج حاصل از ارزیابی نقشههای تغییرات باینری حاصل از سه روش را نشان میدهد.
جدول3. ارزیابی نقشههای تغییرات باینری حاصلشده توسط سه روش پیادهسازی شده
Table 3. Accuracy evaluation of three methods for generating binary change maps
نقشه تغییرات حاصله از روشها | معیارهای ارزیابی | |||
| دقت کلی(درصد) | اف 1(درصد) | فراخوانی(درصد) | صحت(درصد) |
شبکه یادگیری عمیق پیشنهادی | 88 | 48/86 | 28/77 | 16/98 |
شبکه عصبی مصنوعی | 12/74 | 20/76 | 71/66 | 82/88 |
جنگل تصادفی | 20/75 | 67/77 | 46/69 | 88 |
همانطور كه انتظار میرفت، نقشه تغييرات حاصل از شبکه یادگیری عمیق پیشنهادی نتايج بهتري داشته باشد. شبکه پیشنهادی با دقت کلی برابر 88% ، ضریب اف 1(F1) برابر 48/86%، فراخوانی برابر 28/77% و صحت برابر 16/98% بالاترین امتیاز را در تمام چهار معیار عددی به دست آورده است. دومین جایگاه متعلق به جنگل تصادفی میباشد که بهطور متوسط 5 الی 10 درصد نتایج بهتری از شبکه عصبی مصنوعی ارائه داده است. نقشههای تغییرات بهدستآمده در شکل 10 ارائهشدهاند. کادر قرمزرنگ مشخصشده بیانگر ناحیه كانديدي است که توسط جنگل تصادفی و شبکه عصبی مصنوعی در طبقهبندی بهاشتباه برچسب غیر از خاک بایر دادهشده است. درنتیجه نقشه تغییرات باینری تولیدی توسط این دو روش از دقت مناسبی برخوردار نیست. ازآنجاییکه شبکه پیشنهادی دربرگیرنده اطلاعات طیفی-مکانی میباشد نسبت دو روش دیگر که صرفاً پیکسل را اساس آنالیز خود قرار دادهاند خطای کمتر و نتایج بهتری در شناسایی تغییرات دارد. در ناحیه عنوانشده شبکه پیشنهادی تغییرات را با انسجام بهتری و با نویز کمتر ارائه داده است.
2 |
2 |
3 |
1 |
3 |
1 |
Fig. 10- Produced binary change maps; a) Artificial neural networks b) Random forests c) Proposed deep learning networks
نقشههای تغییرات باینری فقط محل وقوع تغییرات را نشان میدهند. درنتیجه هیچ اطلاعاتی مبنی بر تغییر نوع پوشش کاربری اراضي زمین ارائه نمیدهند. در ادامه نقشههای ماهیت تغییرات که اطلاعاتی درزمینه تغییر نوع کلاسها درگذر زمان ارائه میدهند به همراه ارزیابی آنها ارائه میشود.
بررسی نقشههای ماهیت تغییرات
با در نظر داشتن چهار کلاس موضوعی پوشش گياهي، خاك باير، راه ارتباطی و ساختمان در منطقه و با بررسی تغییرات واقعی در منطقه، 10 کلاس بین 4 کلاس موضوعی در طرح شناسایی تغییرات بهصورت: راه ارتباطی-به-راه ارتباطی، راه ارتباطی-به-ساختمان، خاک بایر-به-راه ارتباطی، خاک بایر-به- خاک بایر، خاک بایر-به- پوشش گیاهی، خاک بایر-به-ساختمان، پوشش گیاهی-به-خاک بایر، پوشش گیاهی-به-پوشش گیاهی، ساختمان-به- راه ارتباطی، ساختمان-به-ساختمان در نظر گرفته شد. برای سادگی کلاسهایی که تغییرات ماهیتی نداشتهاند به کلاس بدون تغییر اختصاص دادهشده است. که درنهایت 7 کلاس موضوعی تغییر حاصل گردد. شکل 11 نقشههای ماهیت تغییرات حاصلشده را نشان میدهد. در جدول4 ، نتایج حاصل از ارزیابی نقشههای ماهیت تغییرات حاصل از سه روش ارائهشده است. ازآنجاییکه تصاوير طبقهبندیشده توسط شبكه پيشنهادي به واقعيت نزدیکتر بودند، نقشه ماهيت تغييرات حاصله نوع تغييرات واقعي رخدادِ در طي زمان را ارائه میدهد. بر اساس نتایج بهدستآمده، دقت نقشه ماهیت تغییرات حاصل از شبکه یادگیری عمیق پیشنهادی در مقایسه با نقشههای تغییرات حاصل از جنگل تصادفی و شبکه عصبی مصنوعی به ترتیب به میزان 7/%65 و 81/57% دقت بالاتري داشته است. با اختلاف فراوان شبکه یادگیری عمیق پیشنهادی نسبت به جنگل تصادفی و شبکه عصبی مصنوعی صحت بالایی در پايش تغییرات کاربری اراضي زمین داشته است.
جدول4. ارزیابی نقشههای ماهیت تغییرات حاصلشده توسط سه روش پیادهسازی شده
Table 4. Accuracy evaluation of three methods for generating from-to change maps
نقشه تغییرات حاصله از روشها | معیارهای ارزیابی | |
| دقت | ضریب کاپا |
شبکه یادگیری عمیق پیشنهادی | 97/92% | 28/%91 |
شبکه عصبی مصنوعی | 27/27% | 5/%13 |
جنگل تصادفی | 16/35% | 7/%17 |
در نقشه ماهیت تغییرات حاصل از شبکه پیشنهادی کلاس تغییر کاربری خاک بایر-به-راه ارتباطی بهدرستی شناساییشده است. کادر آبیرنگ بیانکننده بخشی از این تغییر میباشد. درحالیکه توسط دو روش دیگر به دلیل طبقهبندی نادرست کلاس ساختمان در تصویر سال 2013 بهاشتباه کلاس ساختمان-به-راه ارتباطی تشخیص دادهشده است. دلیل کمدقت بودن اين دو روش در مقايسه با شبكه پيشنهادي، عدم در نظر گرفتن اطلاعات مکانی در فرآیند طبقهبندی میباشد. اين مسئله در توليد نقشه ماهيت تغییرات حساسيت بالاتري را نشان میدهد. روشهايي كه اطلاعات مكاني-طيفي را مانند شبکه پیشنهادی درروند طبقهبندی درمیگیرد، میتوان انتظار داشت كه دقت بالاتری در شناسایی تغییرات ارائه دهد.
شکل11- نقشههای ماهیت تغییرات حاصله به ترتیب؛ الف) شبکه عصبی مصنوعی ب) جنگل تصادفی ج) شبکه یادگیری عمیق پیشنهادی
Fig. 11- Produced the from-to change maps: a) Artificial neural network b) Random forest c) Proposed deep learning network
بر اساس نقشه ماهیت تغییرات تولیدشده توسط شبکه پیشنهادی، در محدوده زمانی 10 جولای 2013 تا 1 آگوست 2021 در منطقه موردمطالعه، در حدود 10930275 مترمربع از اراضی منطقه، اراضی بدون تغییر شناسایی شدند. عمده این اراضی، مربوط به پستیوبلندیهای خاکی منطقه میباشد که دستنخورده باقیماندهاند. بهطورکلی با بررسی نقشه ماهیت تغییرات، سه نوع تغییر کلی درگذر زمان مشاهده میشود که بیشترین تغییر را اراضی خاک بایر داشته است. در حدود 554400 مترمربع از اراضی خاک بایر به راه ارتباطی تبدیلشده است. این تغییرات در راستای اسفالت راههای خاکی و همچنین احداث راه ارتباطی جدید بوده است. تبدیل اراضی خاک بایر به راههای ارتباطی در راستای محل و نقل راحتتر شهروندان شهر سهند بوده که حاکی از افزایش جمعیت شهر است. دومین تغییرات گسترده رخدادِ در حدود 306900 مترمربع از اراضی خاک بایر به پوشش گیاهی بوده است که با توجه به اینکه مناطق جنوبی شامل باغات و زمینهای کشاورزی بوده به نظر میرسد با افزایش جمعیت، افزایش نیاز به مواد غذایی باعث احیایی این مناطق طی دهههای اخیر شده است. سومین تغییرات گسترده رخدادِ در حدود 254250 مترمربع از اراضی خاک بایر به بلوکهای ساختمانی بوده است. با افزایش جمعیت شهر تبریز، مهاجرت بهسوی شهرهایی نظیر شهر سهند افزایش میباید. درنتیجه احداث ساختمانها بهمنظور اسکان مهاجران طی 8 سال صورت گرفته است.
بحث و نتیجهگیری
توسعه و گستر بیرویه مناطق شهری یکی از عوامل تحدیدکننده محیطزیست میباشد. رشد بدن برنامهریزی مشکلاتی نظیر کاهش سطح آبهای زیرزمینی، فرسایش خاک، آلودگی هوا را به دنبال خواهد داشت. با پایش تغییرات در مناطق شهری، فعلوانفعالات انسان با منابع طبیعی قابلدرکتر خواهد بود.
در این تحقیق تغییرات برای دستیابی به نقشه تغییرات رخ داده بین سالهای 2013 تا 2021 شهر سهند، از تصاویر ماهوارهای لندست-8 استفاده گردید. با توجه به ساختار منطقه موردمطالعه، کاربری غالب منطقه را زمینهای بایر تشکیل دادهاند که منطقه مناسبی برای توسعه شهری قلمداد میشود. اساس شناسایی تغییرات در این پژوهش بر مبنای رویکرد پساطبقهبندی بوده، بدین نحو که در ابتدا تصاویر بهصورت جداگانه طبقهبندیشده و با مقایسه تصاویر طبقهبندیشده، نقشه تغییرات حاصل میگردد. بر اساس این رویکرد دستیابی بهدقت بالا در کشف تغییرات منوط به طبقهبندی دقیق تصاویر میباشد. تا حتیالامکان نقشه تغییرات بهدستآمده نزدیک به واقعیت باشد. در پژوهشی مشابه رحمانی (15) با استفاده ا تصاویر ماهواره لندست به بررسی تغییر کاربری اراضی استان قم پرداختهاند، اشکالاتی وجود دارد. بهعنوان نمونه در این تحقیق از دو روش طبقهبندی حداکثر احتمال و کمترین فاصله استفادهشده است. مبنای طبقهبندی این دو روش تک پیکسل بوده و به دلیل عدم توانایی در تفکیک کلاس شهری با زمینهای نمکی و کلاس زمین بایر با زمینهای ماسه، تصاویر طبقهبندیشده دارای خطا بوده و از اعتبار نتایج کاسته میشود. سپهری (17) بررسی تغییرات کاربری/پوشش اراضی شهرهای تفت و مهریز را با استفاده از تصاویر ماهواره لندست انجام داد. در این پژوهش تغییرات با استفاده از شبکه عصبی شناسایی گردد. عمده تمرکز پژوهش بر روی بررسی تغییرات پوشش گیاهی بوده است.
برای پوشش محدودیتهای تحقیقات مشابه، در تحقیق حاضر شبکه یادگیری عمیقی پیشنهاد گردید که بهواسطه لایههای کانولوشن اطلاعات طیفی-مکانی عمیق را از تصاویر ورودی استخراج کرده و درروند طبقهبندی بکار میگیرد. وجود اطلاعات مکانی قابلیت تمایز عوارض با رفتار طیفی مشابه را فراهم میکند. دو روش دیگر جنگل تصادفی و شبکه عصبی مصنوعی نیز، در جهت اثبات قابلیت شبکه پیشنهادی، برای شناسایی تغییرات در این تحقیق استفاده شد. نتایج طبقهبندی تصاویر سالهای 2013 و 2021 نشان داد، در صورت بهکارگیری شبکه یادگیری عمیق پیشنهادی بهطور متوسط دقت کلی و ضریب کاپا در مقایسه با دو روش دیگر به ترتیب به میزان 7% و 5/18% افزایش مییابد. نقشههای تغییرات در دو فرم نقشه تغییرات باینری و نقشه ماهیت تغییرات تولید شدند. شبکه پیشنهادی بهطور متوسط 14% نسبت به دو روش دیگر دقت بهتری در پایش موقعیت تغییرات رخدادِ ارائه داده است. از طرفی نقشه ماهیت تغییرات بهدستآمده توسط شبکه پیشنهادی بهطور متوسط %56 دقت بهتری در مقایسه با نقشههای ماهیت تغییرات حاصل از دو روش دیگر ارائه داده است. درنتیجه دو روش دیگر که صرفاً اطلاعات طیفی را بکار گرفتهاند، نتایجی با دقت پایین ارائه داده و درنتیجه بررسی و آنالیز نقشههای ماهیت تغییرات تولیدی برای پی بردن به نوع تغییرات واقعی رخدادِ در منطقه مناسب نمیباشند. نتایج پایش تغییرات رخدادِ در شهر سهند با نتایج تحقیق صادقی (16) مطابقت دارد. نتایج نقشه ماهیت تغییرات بهدستآمده از شبکه یادگیری عمیق پیشنهادی، رشد مثبت در کلاسهای راه ارتباطی، پوشش گیاهی و ساختمان را نشان میدهد که با افزایش جمعیت تغییر کاربری خاک بایر به کلاسهای متناظر عنوانشده منطقی میباشد. همچنین عمده نواحی که طی 8 سال تغییری نداشتهاند مربوط به کلاس خاک بایری است. دلیل این عمر را میتوان اینگونه بیان کرد که این مناطق، پستیوبلندی زیادی داشته و مناسب برای شهرسازی نبودهاند. درنتیجه توجه چندانی برای تغییر کاربری این نواحی از سوی ارگانهای دولتی صورت نگرفته است.
یکی از چالشهای اصلی در بکار گیری شبکههای یادگیری عمیق، طراحی یک معماری مناسب برای رسیدن به خروجی مطلوب میباشد. عوامل متعددی در نحوه عملکرد شبکه تأثیرگذار هستند. بهطور مثال میتوان به تعداد لایههای بکار گفتهشده در داخل شبکه اشاره کرد. شاید بتوان یکی از کاستیهای تحقیق حاضر را ابعاد ثابت پنجره کرنل در کل لایههای کانولوشن متصور شد. طراحی یک معماری مناسب علاوه بر اینکه با آزمونوخطا حاصل میشود بهشدت به تجربه فرد متخصص وابسته است.. پیشنهاد میگردد در تحقیقات آتی دو جنبه اصلی برای بررسی کارایی شبکه یادگیری عمیق در نظر گرفته شود. جنبهی اول، اعمال ویژگیهای دیگر نظیر شاخصهای طیفی بهعنوان ورودی همراه با باندهای تصاویر به شبکه میباشد. جنبهی دوم، استفاده از ساختار شبکه عصبی عمیقتر درروند تصمیمگیری برای برچسبگذاری پیکسلها خواهد بود.
تقدیر و تشکر
اين مقاله حاصل پايان¬نامه با عنوان بر شناسايي تغييرات از تصاوير چند زمانه لندست با استفاده از پچهاي چندگانه در روشهاي يادگيري عميق در مقطع كارشناسي ارشد در سال 1400 است كه با حمايت دانشكاه صنعتی خواجهنصیرالدین طوسی اجراشده است.
منابع مورداستفاده
1. Chen H, Wu C, Du B, Zhang L, Wang L. 2020. Change Detection in Multisource VHR Images via Deep Siamese Convolutional Multiple-Layers Recurrent Neural Network. IEEE Transactions on Geoscience and Remote Sensing, 58(4): 2848-2864. doi: 10.1109/TGRS.2019.2956756.
2. Daudt RC, Le Saux B, Boulch A, Gousseau Y. 2018. Urban change detection for multispectral earth observation using convolutional neural networks. International Geoscience and Remote Sensing Symposium (IGARSS), 2018-July: 2115-2118. doi: 10.1109/IGARSS.2018.8518015.
3. Erener A. 2013. Classification method, spectral diversity, band combination and accuracy assessment evaluation for urban feature detection. International Journal of Applied Earth Observation and Geoinformation, 21(1): 397-408. doi: 10.1016/J.JAG.2011.12.008.
4. Estoque RC, Murayama Y. 2015. Classification and change detection of built-up lands from Landsat-7 ETM+ and Landsat-8 OLI/TIRS imageries: A comparative assessment of various spectral indices. Ecological Indicators, 56: 205-217. doi: 10.1016/J.ECOLIND.2015.03.037.
5. Garbin C, Zhu X, Marques O. 2020. Dropout vs. batch normalization: an empirical study of their impact to deep learning. Multimedia Tools and Applications, 79(19): 12777-12815. doi: 10.1007/s11042-019-08453-9.
6. Gislason PO, Benediktsson JA, Sveinsson JR. 2006. Random Forests for land cover classification. Pattern Recognition Letters, 27(4): 294-300. doi: 10.1016/J.PATREC.2005.08.011.
7. Ji M, Liu L, Du R, Buchroithner MF. 2019. A Comparative Study of Texture and Convolutional Neural Network Features for Detecting Collapsed Buildings After Earthquakes Using Pre- and Post-Event Satellite Imagery. Remote Sensing 2019, Vol 11, Page 1202, 11(10): 1202-1202. doi: 10.3390/RS11101202.
8. Krizhevsky A, Sutskever I, Hinton GE. 2012. ImageNet Classification with Deep Convolutional Neural Networks. In: Pereira F, Burges CJC, Bottou L, Weinberger KQ (eds). Curran Associates, Inc.
9. Li S, Song W, Fang L, Chen Y, Ghamisi P, Benediktsson JA. 2019. Deep learning for hyperspectral image classification: An overview. IEEE Transactions on Geoscience and Remote Sensing, 57(9): 6690-6709. doi: 10.1109/TGRS.2019.2907932.
10. Liu S, Marinelli D, Bruzzone L, Bovolo F. 2019. A review of change detection in multitemporal hyperspectral images: Current techniques, applications, and challenges. IEEE Geoscience and Remote Sensing Magazine, 7(2): 140-158. doi: 10.1109/MGRS.2019.2898520.
11. Lyu H, Lu H, Mou L, Li W, Wright J, Li X, Li X, Zhu XX, Wang J, Yu L, Gong P. 2018. Long-Term Annual Mapping of Four Cities on Different Continents by Applying a Deep Information Learning Method to Landsat Data. Remote Sensing 2018, Vol 10, Page 471, 10(3): 471-471. doi: 10.3390/RS10030471.
12. Ma L, Liu Y, Zhang X, Ye Y, Yin G, Johnson BA. 2019. Deep learning in remote sensing applications: A meta-analysis and review. ISPRS Journal of Photogrammetry and Remote Sensing, 152: 166-177. doi: 10.1016/J.ISPRSJPRS.2019.04.015.
13. Mhangara P, Odindi J. 2013. Potential of texture-based classification in urban landscapes using multispectral aerial photos. South African Journal of Science, 109(3-4): 1-8. doi: 10.1590/sajs.2013/1273.
14. Mishra PK, Rai A, Rai SC. 2020. Land use and land cover change detection using geospatial techniques in the Sikkim Himalaya, India. The Egyptian Journal of Remote Sensing and Space Science, 23(2): 133-143. doi: 10.1016/J.EJRS.2019.02.001.
15. Rohani N, Moradi Faraj A, Mojaradi B, Rajaee T, Jabbari E. 2021. Investigation of land use change in Qom province along with climatic parameters using satellite remote sensing technology. Journal of RS and GIS for Natural Resources, 12(4): 28-46. http://dorl.net/dor/20.1001.1.26767082.1400.12.4.2.9
16. Sadeghi V, Enayati H, Ebadi H. 2016. Improving changedetection in urban areas byselectingthe optimal spectral and spatial features based on genetic algorithm. Scientific- Research Quarterly of Geographical Data (SEPEHR), 24(96): 135-152. (In Persian). doi: 10.22131/sepehr.2016.18949.
17. Sepehri A, Jamali AA, Hasanzadeh M. 2019. Analysis and comparison of land use/land cover changes using artificial neural network (Case study: lands of Taft and Mehriz). Journal of RS and GIS for Natural Resources, 10(4): 91-105.(In Persian).
18. Sharifi O, Mokhtarzadeh M, Asghari Beirami B. 2021. A new deep learning approach for classification of hyperspectral images: feature and decision level fusion of spectral and spatial features in multiscale CNN. Geocarto International 2021 Pages 1-26. doi: 10.1080/10106049.2021.1882006.
19. Shi W, Zhang M, Zhang R, Chen S, Zhan Z. 2020. Change Detection Based on Artificial Intelligence: State-of-the-Art and Challenges. Remote Sensing 2020, Vol 12, Page 1688, 12(10): 1688-1688. doi: 10.3390/RS12101688.
20. Tewkesbury AP, Comber AJ, Tate NJ, Lamb A, Fisher PF. 2015. A critical synthesis of remotely sensed optical image change detection techniques. Remote Sensing of Environment, 160: 1-14. doi: 10.1016/J.RSE.2015.01.006.
21. Viana CM, Oliveira S, Oliveira SC, Rocha J. 2019. Land Use/Land Cover Change Detection and Urban Sprawl Analysis. Spatial Modeling in GIS and R for Earth and Environmental Sciences: 621-651. doi: 10.1016/B978-0-12-815226-3.00029-6.
22. Wang W, Li W, Zhang C, Zhang W. 2018. Improving Object-Based Land Use/Cover Classification from Medium Resolution Imagery by Markov Chain Geostatistical Post-Classification. Land 2018, Vol 7, Page 31, 7(1): 31-31. doi: 10.3390/LAND7010031.
23. Wu C, Du B, Cui X, Zhang L. 2017. A post-classification change detection method based on iterative slow feature analysis and Bayesian soft fusion. Remote Sensing of Environment, 199: 241-255. doi: 10.1016/J.RSE.2017.07.009.
24. Yamashita R, Nishio M, Do RKG, Togashi K. 2018. Convolutional neural networks: an overview and application in radiology. Insights into Imaging, 9(4): 611-629. doi: 10.1007/S13244-018-0639-9/FIGURES/15.
25. Yang L, Xian G, Klaver JM, Deal B. 2003. Urban land-cover change detection through sub-pixel imperviousness mapping using remotely sensed data. Photogrammetric Engineering and Remote Sensing, 69(9): 1003-1010. doi: 10.14358/PERS.69.9.1003.
26. Ye S, Chen D. 2015. An unsupervised urban change detection procedure by using luminance and saturation for multispectral remotely sensed images. Photogrammetric Engineering and Remote Sensing, 81(8): 637-645. doi: 10.14358/PERS.81.8.637.
27. Zhang J, Cheng T, Shi L, Wang W, Niu Z, Guo W, Ma X. 2022a. Combining spectral and texture features of UAV hyperspectral images for leaf nitrogen content monitoring in winter wheat. International Journal of Remote Sensing: 1-22. doi: 10.1080/01431161.2021.2019847.
28. Zhang P, Gong M, Zhang H, Liu J, Ban Y. 2019. Unsupervised Difference Representation Learning for Detecting Multiple Types of Changes in Multitemporal Remote Sensing Images. IEEE Transactions on Geoscience and Remote Sensing, 57(4): 2277-2289. doi: 10.1109/TGRS.2018.2872509.
29. Zhang X, He L, Qin K, Dang Q, Si H, Tang X, Jiao L. 2022b. SMD-Net: Siamese Multi-Scale Difference-Enhancement Network for Change Detection in Remote Sensing. Remote Sensing 2022, Vol 14, Page 1580, 14(7): 1580-1580. doi: 10.3390/RS14071580.
30. ZhiYong L, Liu T, Benediktsson JA, Falco N. 2021. Land Cover Change Detection Techniques: Very-High-Resolution Optical Images: A Review. IEEE Geoscience and Remote Sensing Magazine: 2-21. doi: 10.1109/MGRS.2021.3088865.
Analyzing the Efficiency of the Deep Neural Network in Detecting Urban Changes Using Bi-temporal Landsat-8 Images.
Abstract
Satellite remote sensing images are widely used to monitor the earth's surface phenomena changes at various periods. For accurate change detection, spatial features can be used as the complement information of spectral features. Hand-craft spatial features such as the co-occurrence matrix features are inefficient in detecting the changes due to the complex structure of satellite images. In the present study, a deep learning-based model is proposed as the alternative to address the problems of classical change detection methods. deep neural networks are mainly developed for images and hierarchically extracting spatial-spectral features. In this study, Landsat-8 images between 2013 and 2021 were used to evaluate the changes in Sahand city using the proposed deep network. Pre- and post-classified Landsat-8 images are produced using a deep neural network in the first stage. In the second stage, for producing the change maps, the post-classification approach is used in that change maps are produced based deference of classified images. Finally, the majority voting technique eliminates the noises in change maps. The proposed method results are compared with those obtained by two classical machine learning methods, random forest, and artificial neural networks. According to the change detection results, the proposed deep learning network improves detection accuracy by 13.88% and 12.80% compared with artificial neural networks and random forests. Compared to the random forest and artificial neural networks, the proposed network has improved the overall accuracy of the from-to-change maps by 57.81% and 65.7%, respectively. Final results demonstrate that although Random forest and artificial neural networks have been able to identify the location of changes, they perform poorly in detecting the from-to changes.
Keywords: Change detection, deep learning, convolutional neural network, random forest, artificial neural network
بررسی کارایی شبکه یادگیری عمیق در شناسایی تغییرات اراضی با استفاده از تصاویر دو زمانه لندست-8
چکیده مبسوط (حداقل 1000 کلمه)
طرح مسئله: با افزایش جمعیت، بشر در راستای تأمین نیازهای خود اقدام به بهرهبرداری از طبیعت کرده است. اینگونه فعالیتها منجر به تخریب محیطزیست گردیده است. درنتیجه پایش تغییرات برای حفاظت از طبیعت و مدیریت بهتر فعالیتهای انسانی امری ضروری است. آنالیز و بررسی تغییرات بهصورت میدانی کاری دشوار بوده و در برخی موارد به علت عدم دسترسی به اطلاعات نقشهبرداری از منطقه، عملاً غیرممکن است. علم سنجشازدور با استفاده از تصاویر چند زمانه ماهوارهای اخذشده از منطقه، امکان پایش تغییرات رخدادِ در فواصل زمانی مختلف را فراهم کرده است. ازاینرو سرعت پایش تغییرات نسبت به قبل بهبود چشمگیری داشته است. بهطورکلی روشهای شناسایی تغییرات به دو دسته؛ روشهای نظارتشده و روشهای نظارتنشده تقسیم میگردند. روشهای نظارتشده بر اساس بهکارگیری دادههای واقعیت زمینی برای آموزش الگوریتمهای طراحیشده، قابلیت بالایی در شناسایی تغییرات دارند. بررسی نتایج تحقیقات نشان داد، استفاده از ویژگیهای طیفی تصاویر امکان دستیابی بهدقت بالا در شناسایی تغییرات را فراهم نکرده است. دستیابی بهدقت بالا در شناسایی تغییرات نیازمند بهکارگیری ویژگیهای مکانی در کنار ویژگیهای طیفی است. روشهای رایج و متداول، ویژگیهای مکانی را از طریق ماتریس هم رخداد تولید کرده و درروند شناسایی تغییرات بکار میگیرند. هر یک از این ویژگیها دارای روابط منحصربهفرد بوده و بر اساس این روابط ویژگیهای مکانی از ماتریس هم رخداد استخراج میشوند. بهکارگیری تمامی ویژگیهای تولیدشده باعث افزایش نامطلوب فضای ویژگی میشود که نهتنها دقت را بهبود نمیدهد بلکه منجر به کاهش دقت نیز میگردد. از سوی دیگر تولید این ویژگیها وابسته به انتخاب نوع ویژگی توسط کاربر بوده و همواره متناظر با منطقه موردمطالعه میباشند. این امکان وجود دارد که ویژگیهای تولیدشده، از ساختار مناسبی برخوردار نباشند و نتوان در فرایند شناسایی تغییرات بکار گرفت.
هدف: براي دستیابی به نقشه ماهيت تغييرات، يكي از رایجترین رویکردها، رویکرد پساطبقهبندی بوده كه برای شناسایی تغییرات در این تحقیق اتخاذشده است. در این رویکرد برای دستیابی بهدقت بالا در شناسایی تغییرات، باید نقشههای طبقهبندیشده دقت بالایی داشته باشند. درنتیجه باید در ابتدا دقت نقشههای طبقهبندیشده را بالا برد. بهکارگیری ویژگیهای مکانی در کنار ویژگیهای طیفی امکان بهبود دقت تصاویر طبقهبندیشده را فراهم میکند. با توجه به محدودیت روشهای قبل در بهکارگیری ویژگیهای مکانی در کنار ویژگیهای طیفی تصاویر، هدف این تحقیق در راستای برآمدن بر محدودیت روشهای قبلی مبنی بر استخراج خودکار ویژگیهای مکانی از تصاویر ورودی است. تمرکز اصلی مقاله حاضر تولید خودکار ویژگیهای مکانی – طیفی عمیق از طریق شبکه عصبی کانولوشن پیشنهادی و طبقهبندی آنها به کلاسهای موردنظر میباشد. برای اثبات قابلیت شبکه پیشنهادی، خروجی تصاویر طبقهبندیشده حاصل از شبکه پیشنهادی با خروجی روشهای جنگل تصادفی و شبکه عصبی مصنوعی مقایسه گردیده است.
روش تحقیق: با توجه به اینکه تصاویر از سامانه گوگل ارث انجین تهیهشدهاند، پیشپردازشهای ضروری نظیر هم مرجع سازی توسط خود سامانه بر روی تصاویر اعمال گردیده است و نیازی به اینگونه پیشپردازش در این تحقیق نیست. با توجه به اینکه قدر تفکیک مکانی باند پانکروماتیک سنجنده لندست-8 برابر 15 متر و 8 باند طیفی دیگر قدرت تفکیک مکانی 30 متر میباشد، با استفاده از روش گرم اشمیت قدرت تفکیک مکانی 8 باندی طیفی 30 متر به 15 متر بهبود پیدا میکند. این فرایند به فرایند پن شارپنینگ معروف میباشد. از تصاویر پن شارپ شده بهصورت جداگانه دادههای واقعیت زمینی را جمعآوری میگردند. با توجه به رویکرد پساطبقهبندی اتخاذشده در این تحقیق، تصاویر در دوشاخه جداگانه وارد شبکه پیشنهادی شده و طبقهبندی بر اساس استخراج ویژگیهای مکانی عمیق توسط لایههای شبکه پیشنهادی صورت میگیرد. از دو روش جنگل تصادفی و شبکه عصبی مصنوعی برای ارزیابی روش پیشنهادی بکار گرفته شد. با مقایسه پیکسل به پیکسل نقشههای طبقهبندیشده، نقشههای تغییرات در دو حالت كلي نقشه تغييرات باينري و نقشه ماهيت تغييرات از منطقه حاصل گردیدهاند.
نتایج و بحث: با استفاده از نمونههای آزمایشی نقشههای طبقهبندیشده ارزیابی شدند. نتایج ارزیابی نشان داد معماری شبکه پيشنهادي که به ترتیب تعداد فیلترها:128-64-32 به همراه لایه نرمالسازی بچ و 128 نرون در لایه اتصال کامل، بالاترین دقت کلی و ضریب کاپا برای سالههای 2013 و 2021 را داشته است. بهطور متوسط در دو سال دقت بالاي 92 % را ارائه داده است. در مقایسه شبکه پیشنهادی با شبکه عصبی مصنوعی، دقت کلی و ضریب کاپا به ترتیب 83/8 % و87/24% در سال 2013، 21/2% و 77/5% در سال 2021 افزایش پیداکرده و در مقایسه با جنگل تصادفی دقت کلی و ضریب کاپا به ترتیب 92/9% و 79/27% در سال 2013، 48/6% و 73/15% در سال 2021 افزایش پیداکرده است. دليل رخ داد اين رفتار را میتوان اینگونه بيان كرد كه؛ اساس كار دو روش جنگل تصادفی و شبکه عصبی مصنوعی بر مبناي تك پيكسل میباشد. به اين نحو كه فرايند طبقهبندی بهصورت پيكسل به پيكسل انجام میگیرد و اثر پیکسلهای همسايه درروند طبقهبندی ناديده گرفته میشود. بهطور مثال؛ اگر دو پيكسل کنار هم داشته باشيم كه از يك عارضه واحد باشند ولي اختلاف درجات رقومي بالايي داشته باشند، برچسبهای متفاوت به پیکسلها داده میشود که درنهایت دقت طبقهبندی را پایین میآورد. در مقابل؛ شبكه يادگيري عميق پيشنهادي با در نظر گرفتن پنجرهای در اطراف هر پيكسل، اثر پیکسلهای كناري را درروند استخراج اطلاعات مكاني- طيفي عميق و طبقهبندی پیکسلها در نظر میگیرد. درنتیجه اثراتي نظير شباهت طيفي و نوسانات پديد آمده در تصاوير را درروند طبقهبندی كاهش میدهد. نقشه تغييرات باينري حاصل از شبکه یادگیری عمیق پیشنهادی با دقت کلی برابر 88% ، ضریب F1 برابر 48/86% و فراخوانی برابر 28/77% بالاترین امتیاز را در تمام چهار معیار عددی به دست آورده است. دومین جایگاه متعلق به جنگل تصادفی میباشد که بهطور متوسط 5 الی 10 درصد در میان سه معیار دقت کلی، ضریب F1 و فراخوانی نتایج بهتری از شبکه عصبی مصنوعی ارائه داده است. ارزيابي دقت نقشه ماهيت تغييرات حاصل از سه روش نشان داد، نقشه ماهیت تغییرات حاصل از شبکه یادگیری عمیق پیشنهادی در مقایسه با نقشههای تغییرات حاصل از جنگل تصادفی و شبکه عصبی مصنوعی به ترتیب به میزان 7/65% و 81/57% افزایش دقت داشته است. درنتیجه شبكه پيشنهادي عملكرد بالايي در ارائه صحيح ماهيت تغييرات داشته است. درحالیکه دو روش ديگر ناموفق در ارائه صحيح ماهيت تغييرات رخ داده بودهاند. بر اساس نقشه ماهیت تغییرات تولیدشده توسط شبکه پیشنهادی، در محدوده زمانی 10 جولای 2013 تا 1 آگوست 2021 در منطقه موردمطالعه، در حدود 10930275 مترمربع از اراضی منطقه، اراضی بدون تغییر شناسایی شدند. عمده این اراضی، مربوط به پستیوبلندیهای خاکی منطقه میباشد که دستنخورده باقیماندهاند. بهطورکلی با بررسی نقشه ماهیت تغییرات، سه نوع تغییر کلی درگذر زمان مشاهده میشود که بیشترین تغییر را اراضی خاک بایر داشته است. در حدود 554400 مترمربع از اراضی خاک بایر به راه ارتباطی تبدیلشده است. این تغییرات در راستای اسفالت راههای خاکی و همچنین احداث راه ارتباطی جدید بوده است. تبدیل اراضی خاک بایر به راههای ارتباطی در راستای محل و نقل راحتتر شهروندان شهر سهند بوده که حاکی از افزایش جمعیت شهر است. دومین تغییرات گسترده رخدادِ در حدود 306900 مترمربع از اراضی خاک بایر به پوشش گیاهی بوده است که با توجه به اینکه مناطق جنوبی شامل باغات و زمینهای کشاورزی بوده به نظر میرسد با افزایش جمعیت، افزایش نیاز به مواد غذایی باعث احیایی این مناطق طی دهههای اخیر شده است. سومین تغییرات گسترده رخ داده در حدود 254250 مترمربع از اراضی خاک بایر به بلوکهای ساختمانی بوده است. با افزایش جمعیت شهر تبریز، مهاجرت بهسوی شهرهایی نظیر شهر سهند افزایش میباید. درنتیجه احداث ساختمانها بهمنظور اسکان مهاجران طی 8 سال صورت گرفته است.
نتیجهگیری: همانطور که انتظار میرفت، استفاده صرف از اطلاعات طیفی تصاویر نتایج چندان دقیق را ارائه نخواهد داد. بهکارگیری ویژگیهای مکانی در کنار ویژگیهای طیفی، تکنیک مناسبی برای بهبود دقت نتایج طبقهبندی کلاسها با رفتار طیفی مشابه میباشد. ازاینرو در این تحقیق با توجه به قابلیت شبکههای یادگیری عمیق در استخراج خودکار ویژگیهای طيفي-مکانی، شبکه عصبی کانولوشن پیشنهادی در این تحقیق بکار گرفته شد. شبکه پیشنهادی ویژگیهای طيفي-مکانی را بهصورت خودکار استخراج کرده و در طبقهبندی شرکت میدهد. نقشههای شناسایی تغییرات در دو حالت باینری و از-به بر اساس رویکرد پساطبقهبندی تولید گشتهاند. شبکه پیشنهادی توانایی بالایی در تفکیک عوارض با رفتار طیفی مشابه داشته و دقت بالایی در طبقهبندی تصاویر نسبت به تکنیک های شبکه عصبی مصنوعی و جنگل تصادفی ارائه داده است. نتایج طبقهبندی تصاویر سالهای 2013 و 2021 نشان داد، در صورت بهکارگیری شبکه یادگیری عمیق پیشنهادی بهطور متوسط دقت کلی و ضریب کاپا در مقایسه با دو روش دیگر به ترتیب به میزان 7% و 5/18% افزایش مییابد. نقشههای تغییرات در دو فرم نقشه تغییرات باینری و نقشه ماهیت تغییرات تولید شدند. شبکه پیشنهادی بهطور متوسط 14% نسبت به دو روش دیگر دقت بهتری در پایش موقعیت تغییرات رخدادِ ارائه داده است. از طرفی نقشه ماهیت تغییرات بهدستآمده توسط شبکه پیشنهادی بهطور متوسط %56 دقت بهتری در مقایسه با نقشههای ماهیت تغییرات حاصل از دو روش دیگر ارائه داده است. نتایج نقشه ماهیت تغییرات بهدستآمده از شبکه یادگیری عمیق پیشنهادی، رشد مثبت در کلاسهای راه ارتباطی، پوشش گیاهی و ساختمان را نشان میدهد که با افزایش جمعیت تغییر کاربری خاک بایر به کلاسهای متناظر عنوانشده منطقی میباشد. همچنین عمده نواحی که طی 8 سال تغییری نداشتهاند مربوط به کلاس خاک بایری است. دلیل این عمر را میتوان اینگونه بیان کرد که این مناطق، پستیوبلندی زیادی داشته و مناسب برای شهرسازی نبودهاند. درنتیجه توجه چندانی برای تغییر کاربری این نواحی از سوی ارقان های دولتی صورت نگرفته است.
واژگان کلیدی: پایش تغییرات، طبقهبندی تصاویر، شبکه عصبی کانولوشن ، ویژگیهای مکانی(بافت)، جنگل تصادفی، شبکه عصبی مصنوعی
Analyzing the Efficiency of the Deep Neural Network in Detecting Urban Changes Using Bi-temporal Landsat-8 Images.
Abstract چکیده مبسوط (حداقل 1000 کلمه)
Statement of the Problem: With the increase of the human population, human intervention in nature to meet their needs has increased. Thus, monitoring change is crucial for conserving nature and better managing human activities. Multi-temporal remote sensing images provide low-cost but efficient tools to monitor the earth's surface changes. By using remote sensing change detection techniques, change monitoring has become faster. Generally, the change detection methods can be divided into two main groups: supervised and unsupervised methods. Supervised methods that rely on labeled samples commonly have outstanding performance in detecting changes, especially in urban areas. According to the literature, spectral features are insufficient to detect changes with high accuracy. To address this issue, spatial features are also incorporated into change detection algorithms. Extracted features from gray-level co-occurrence matrices (GLCM features) are the common spatial features widely used in remote sensing image classification. Although hand-craft features such as GLCM features can improve classification accuracy, they have limitations. First, they are scene-dependent, meaning their performance relies on the underlying scene. Second, produced hand-craft features commonly have a high dimensionality that reduces the performance of statistical classifiers due to the curse of dimensionality phenomena. As the third issue, the parameter tuning of the classical spatial feature generation method is scene-dependent, reducing the applicability of these methods. Deep learning methods are proposed in the literature to address these issues.
Purpose: Post-classification technique is one of the most common ways to obtain a from-to map of changes. Classified maps must be highly accurate in this approach to achieve high accuracy in identifying changes. By combining spatial and spectral features, it is possible to improve the accuracy of the classification. Due to the limitations of previous techniques that use spatial features and spectral information of images, this study focuses on the automatic extraction of spectral-spatial features from input images with a deep learning method. The primary purpose of this paper is to automate the production of deep spatial-spectral features and classify them into desired classes using the convolutional neural network. The output of the classified images obtained from the proposed network was compared to those obtained from the random forest and artificial neural network methods to verify the effectiveness of the proposed network.
Methodology: Because the images were obtained from the Google Earth Engine system, the necessary preprocessing, such as co-registration, has already been performed on the images. Such preprocessing is not required for this study. The panchromatic band on Landsat-8 has a spatial resolution of 15 meters, and the other eight spectral bands have a spatial resolution of 30 meters. The Gram-Schmidt method can improve the spatial resolution of the eight spectral bands to 15 meters. The next step is to collect ground truth data from pan-sharpened images. The images are entered into two separate branches of the proposed convolution neural network as part of the proposed post-classification approach of this study, and the classification is done by considering the images' joint spatial and spectral characteristics. Two classical machine learning approaches, random forest, and artificial neural network, were used to evaluate the proposed method. The final change maps are created by pixel-by-pixel comparison of the classified maps. This study investigates two modes of change: the binary change map and the from-to-change map.
Results and discussion: Classified maps are evaluated using test samples. According to the evaluation results, the proposed network, consisting of 128-64-32 filters and 128 neurons in the fully connected layer, has the highest overall accuracy and Kappa coefficient in the classification of 2013 and 2021 images. During those two years, an average of 92 percent accuracy is achieved. When comparing the proposed network to an artificial neural network, the overall accuracy and Kappa coefficient increased by 8.83 percent and 24.87 percent in 2013, respectively, by 2.21 percent and 5.77 percent in 2021. Compared to the random forest, the overall accuracy and Kappa coefficient increased by 9.92 percent and 27.79 percent in 2013, respectively, and by 6.48 percent and 15.73 percent in 2021. This behavior can be explained as follows: Random forests and artificial neural networks are based on single pixels. Using this approach, the classification process is carried out pixel by pixel, ignoring the influence of the neighbor’s pixels. When two pixels are adjacent and have a high numerical degree difference but are from the same complex, different labels are assigned to the pixels, resulting in a decreased accuracy in classification. Contrary to this, the proposed deep learning network considers the effect of adjacent pixels in the process of extracting deep spatial-spectral information and classifying pixels by taking into account a window around each pixel. Consequently, it reduces effects such as spectral similarity and fluctuations in images. The binary change map obtained from the proposed deep learning network has the highest score in all four accuracy criteria, with an overall accuracy of 88 percent, and F1 coefficient of 86.48 percent, and a recall of 77.28 percent. A random forest comes in second, with an average accuracy of 5 to 10% based on the three criteria of overall accuracy, F1 coefficient, and recall better than the artificial neural network. The accuracy evaluation of the from-to-change map obtained from the three methods revealed that the deep learning network's from-to-change map was 65.7 percent and 57.81 percent more accurate than those of the random forest and artificial neural networks. As a result, the proposed network can detect the from-to changes more accurately than the other two methods. From the from-to-change map produced by the proposed network between July 10, 2013, and August 1, 2021, approximately 10930275 square meters of the area's land were identified as unchanged. In most cases, these lands are located in the lowlands and highlands of the region, which have remained relatively untouched. It is generally possible to observe three types of changes over time based on the from-to-change map. The most significant changes have occurred in barren lands. There are about 554,400 square meters of barren land that have been turned into a road. Changes were made in conjunction with the asphalting of dirt roads as well as the construction of a new communication road. A transformation of barren land into communication routes in line with the city's location and easier transportation indicates an increase in the number of inhabitants. The second major change occurred in about 306,900 square meters from barren land to vegetation. Since the southern regions contain gardens and agricultural lands, it appears that these areas have been revitalized in recent decades as a result of the increasing population and the growing demand for food. A third major change resulted in the conversion of approximately 254,250 square meters of barren land into building blocks. The population growth in Tabriz will lead to an increase in migration to cities such as Sahand. Consequently, buildings for the accommodation of immigrants have been constructed in less than eight years.
Conclusion: As one might expect, using spectral information in images alone will not produce accurate results. In order to improve the accuracy of classification results with similar spectral behavior, spatial features can be used in conjunction with spectral features. In contrast to traditional spatial feature generation methods, which have some limitations, deep convolution neural networks are used in this study to fully explore the spatial and spectral characteristics of remote sensing images. Change detection maps in the two modes of binary and from-to are produced based on the post-classification strategy. To conclude, the proposed network has a higher ability to discriminate the different pixels with similar spectral behavior and, therefore, has higher accuracy than spectral-based random forest and neural network techniques. Comparing the classification results of 2013 and 2021 to those obtained using the two other methods, the proposed deep learning network showed a 7% improvement in overall accuracy and an 18.5% improvement in the kappa coefficient. In terms of monitoring changes in the location of an event, the proposed network provided an average accuracy of 14% greater than the other two methods. As compared to the maps of the nature of changes obtained by the other two methods, the map obtained by the proposed network showed an average improvement of 56% in accuracy. According to the map, the proposed deep learning network resulted in positive growth in communication roads, vegetation, and building classes, which is logical given that barren land is being converted into corresponding classes as the population grows. Moreover, most of the areas that have not changed in 8 years are associated with barren soils. These areas were not suitable for urban development due to their low and high altitudes. Consequently, government bodies have not paid much attention to changing their use of these areas.
Keywords: Change detection, Image classification, convolutional neural network, Spatial features (texture), Random forest, Artificial neural network