مدلسازی تصفیه پساب های صنعتی بر پایه شبکه عصبی مصنوعی و مدل آماری رگرسیون لجستیک
محورهای موضوعی : آنالیز عددی
سیدرحیم صانعی فرد
1
*
,
فاطمه قنبری
2
,
احمد جعفریان
3
1 - گروه ریاضی، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه، ایران.
2 - گروه شیمی، واحد مهاباد، دانشگاه آزاد اسلامی، مهاباد، ایران.
3 - گروه ریاضی، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه، ایران.
کلید واژه: Water pollution, statistical logistic regression, Mathematical Modeling, Neural Network, hybrid neural network,
چکیده مقاله :
با توجه به اهمیت شناسایی آلاینده های صنعتی و یافتن راهکار هایی برای مدیریت وکنترل آن در جهت حفظ بقا، سلامت انسان و محیط زیست، دسترسی به مدل هایی که بتواند با دقت بالا این مهم را پیش بینی کند نقش مهمی به لحاظ اقتصادی و زمانی دارد. در این تحقیق سه مدل مختلف برای پیش بینی فرایند حذف آلاینده ی مالاشیت سبز با ویژگی جهش زایی و سرطان زایی از پساب های صنعتی ارائه گردیده و یافته های حاصل مقایسه شدند. هدف اصلی در این پژوهش مقایسه دقت مدل های مختلف شبکه عصبی و رگرسیون لجستیک و مدل هوشمند ترکیبی شبکه عصبی مصنوعی و رگرسیون لجستیک (ANN-LR ) جهت پیش بینی درصد حذف آلاینده ی مالاشیت سبز از پسا ب های صنعتی است تا بتوان یکی از آنها را به عنوان روش بهینه انتخاب و استفاده نمود. متغیر های مستقل در هر سه مدل شبکه عصبی، رگرسیون لجستیک و مدل ترکیبی ANN و LR شامل مقداراولیه نانو کامپوزیت پلی آنیلین پوشش داده شده روی خاکستر پوسته گندم (PANI/WHA)، غلظت اولیه مالاشیت سبز، شدت اشعه ی یو وی (UV light) و زمان پرتو افشانی و متغیر وابسته در مدل شبکه عصبی درصد حذف آلاینده ی مالاشیت سبز می باشد. مقایسه ی نتایج پیش بینی، توسط مدل طراحی شده و داده های بررسی شده ثابت می کند که استفاده ازمدل ترکیبی شبکه عصبی مصنوعی و رگرسیون لجستیک روشی ارزشمند برای پیش بینی عملکرد حذف ماده سمّی مالاشیت سبز از پساب های صنعتی با بیشترین بازده وکمترین خطا می باشد.
One of the most important and fundamental factors in the life of living things is water. Therefore, water pollution is a major environmental problem and prevent water pollution and providing smart methods for water treatment is so important. Equipping engineering sciences with intelligent tools and artificial intelligence in the diagnose quality of wastewater treatments can reduce the errors of the methods. This paper presents a simple and hybrid neural network with statistical logistic regression method for modelling of the output quality of wastewater treatment. The proposed intelligent method plays an important role in the quality of wastewater treatment and can be used by artificial intelligence researchers and environmental engineers. Comparison of the predicted results by simple neural network and hybrid one showed that the efficiency of the hybrid model and it is suitable for our purpose. results of research proved that the new method has the highest efficiency with minimum errors.
[1] M. A., BEHNAJADY, N. MODIRSHAHLA and F. GHANBARY, “A kinetic model for the decolorization of C.I. Acid Yellow 23 by Fenton process,” J. of Hazar. Mate., vol.148, no. 3, pp. 98-102, 2007.
[2] N. DANESHVAR, A. R. KHATAEE and N. JAFARZADEH,”The use of artificial neural networks (ANN) for modeling of decolorization of textile dye solution containing C. I. Basic Yellow 28 by electrocoagulation process,” J. of Hazar. Mate., vol 137, no. 4,pp. 1788-1795, 2006.
[3] F. GHANBARY and A. JAFARIAN, “Polyaniline/wheat Husk Ash Nanocomposite Preparation and Modeling Its Removal Activity with an Artificial Neural Network,” Chiang Mai J. of Science, vol. 42, no. 9, pp. 1-12, 2015.
[4] J. WAN, M. HUANG, Y. MA and X.SUN, ”Prediction of effluent quality of a paper mill wastewater treatment using an adaptive network-based fuzzy inference system,” App. Soft Comp., vol. 11, no. 3, pp. 323-34, 2011.
[5] S. POMMIER, D. CHENU, M. QUINTARD and X. LEFEBVRE, “A logistic model for the prediction of the influence of water on the solid waste methanization in landfills,” Biotech. and bioeng., vol. 97, no. 6, pp. 473-482, 2007.
[6] I. MICHAEL, A. PANAGI, L. A. IOANNOU and Z. FRONTISTIS, ”Utilizing solar energy for the purification of olive mill wastewater using a pilot-scale photocatalytic reactor after coagulation-flocculation,” J. of Water res.,vol. 60, no. 7, pp. 28-40, 2014.
[7] H. HONGGUI, and Y. LI, “A fuzzy neural network approach for online fault detection in waste water treatment process,” Comp. & Elec. Eng., vol.40, no.12, pp. 2216-2226, 2014.
[8] M. S. NASR, M. A. MOUSTAFA, H. A. SEIF and G. E. KOBROSY, “Application of Artificial Neural Network (ANN) for the prediction of EL-AGAMY wastewater treatment plant performance-EGYPT,” Alex. Eng. J., vol. 51, no.25, pp. 37-43, 2012.
[9] T. R. NEELAKANTAN and G. M. BRION, “Neural network modelling of Cryptosporidium and Giardia concentrations in the Delaware River,” Water Sci. & Tech. vol. 43, no. 23, pp. 125-132, 2001.
[10] U. GOVINDARAJ and S. RAO, “Artificial neural networks in hydrologic applications,” J. of Hydro. Eng., vol. 52, no. 42, pp. 124-137, 2000.
[11] H. R. MAIER and G. C. DANDY, “Neural networks for the prediction and forecasting of water resources variables: a review of modelling issues and applications,” Env. modelling & soft., vol. 15, no. 12, pp. 101-124, 2000.
[12] J. ZURADA, “Introduction to Artificial Neural Systems,” West Publishing, 1992.
[13] S. HAYKIN, “Neural networks:a comprehensive foundation,” Prentice Hall., New Jersey, USA, 1999.
[14] Y. X. ZHANG, “Artificial neural networks based on principal component analysis input selection for clinical pattern recognition analysis,” Talanta, vol.73, no.8, pp. 68-75, 2007.
[15] F. GHANBARY, N. MODIRSHAHLA, M. KHOSRAVI and M. A. BEHNAJADY, “Synthesis of TiO2nanoparticles in different thermal conditions and modeling its photocatalytic activity with artificial neural network,” j. of Env. sciences, vol. 24, no. 21, pp. 750-756, 2012.
دسترسي در سايتِ http://jnrm.srbiau.ac.ir
سال دهم، شماره پنجاهم، مهر و آبان 1403
|
مدلسازی تصفیه پسابهای صنعتی بر پایه شبکه عصبی مصنوعی و مدل آماری رگرسیون لجستیک
سیدرحیم صانعیفرد *1، فاطمه قنبری2، احمد جعفریان1
(1) گروه ریاضی، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه، ایران
(2) گروه شیمی، واحد مهاباد، دانشگاه آزاد اسلامی، مهاباد، ایران
تاريخ ارسال مقاله: 15/12/1400 تاريخ پذيرش مقاله: 04/02/1402
چکيده
با توجه به اهمیت شناسایی آلایندههای صنعتی و یافتن راهکارهایی برای مدیریت و کنترل آن در جهت حفظ بقا، سلامت انسان و محیط زیست، دسترسی به مدلهایی که بتواند با دقت بالا این مهم را پیشبینی کند، نقش مهمی به لحاظ اقتصادی و زمانی دارد. در این تحقیق سه مدل مختلف برای پیشبینی فرایند حذف آلایندهی مالاشیت سبز با ویژگی جهشزایی و سرطانزایی از پسابهای صنعتی ارائه گردیده و یافتههای حاصل مقایسه شدند. هدف اصلی در این پژوهش مقایسه دقت مدلهای مختلف شبکه عصبی و رگرسیون لجستیک و مدل هوشمند ترکیبی شبکه عصبی مصنوعی و رگرسیون لجستیک جهت پیشبینی درصد حذف آلایندهی مالاشیت سبز از پسابهای صنعتی است تا بتوان یکی از آنها را به عنوان روش بهینه انتخاب و استفاده نمود. متغیرهای مستقل در هر سه مدل شبکه عصبی، رگرسیون لجستیک و مدل ترکیبی ANN و LR شامل مقدار اولیه نانو کامپوزیت پلی آنیلین پوشش داده شده روی خاکستر پوسته گندم، غلظت اولیه مالاشیت سبز، شدت اشعهی یو وی و زمان پرتو افشانی و متغیر وابسته در مدل شبکه عصبی درصد حذف آلایندهی مالاشیت سبز میباشد. مقایسهی نتایج پیشبینی، توسط مدل طراحی شده و دادههای بررسی شده ثابت میکند که استفاده از مدل ترکیبی شبکه عصبی مصنوعی و رگرسیون لجستیک روشی ارزشمند برای پیشبینی عملکرد حذف ماده سمی مالاشیت سبز از پسابهای صنعتی با بیشترین بازده و کمترین خطا میباشد.
واژههاي کليدي: مالاشیت سبز، شبکه عصبی مصنوعی، رگرسیون لجستیک، مدل هوشمند ترکیبی
1- مقدمه
با توجه به اهمیت آب در زندگی بشر و کمبود منابع آب در کشورمان، به منظور تهیه و تأمين آب آشاميدني سالم و بهداشتی نیازمند تصفیه آبهای آلوده و پسابهای صنعتی میباشیم. صنایع در حین انجام فعالیت به طور عمدی و یا غیرعمدی موجب ورود آلایندهها در منابع آبی میشوند. لذا حفظ محیط زیست و توجه به تامین سلامت آن، یکی از نیازهای ضروری امروز جامعه بشری است. رنگزاها، فلزات سنگین و سایرآلایندههای حاصل از پسابهای صنعتی بخش عظیمی از ترکیبات آلی هستند که باعث ایجاد آلودگی در آبهای طبیعی میگردند. بنابراین، فرایند حذف این آلایندهها از آب و پسابها امری مهم و ضروری تلقی میگردد[1]. پساب صنعت نساجی رنگهای متراکم سمی را به سیستم چرخهی آب وارد میکنند که اغلب تجدیدناپذیر و مقاوم در برابر روشهای تجزیهی بهینهی معمولی میباشند[2].
مشکلات مطرح شده باعث شده تا تلاشهای زیادی در زمینه حذف این آلایندهها صورت گرفته و روشهای مختلفی جهت حذف آلایندهها از منابع آبی ارائه گردد.. یکی از روشهای موثر در حذف آلایندهها استفاده از نانوکامپوزیت پلیآنیلین بر پایهی خاکستر سبوس گندم (PAN/WHA) میباشد. به کارگیری روشهایی برای ترکیب نانوذرات با مواد دیگر (بخصوص پلیمرها) و استفاده از آنها به صورت نانوکامپوزیتها گامی مثبت در جهت تسریع و افزایش راندمان حذف آلایندهها از پسابها به شمار میرود.
قنبری و همکارانش با استفاده از نانوکامپوزیت پلی آنیلین پوشش داده شده بر روی سبوس برنج (PANI/RHA) و مقایسه فعالیت کاتالیستی آن با نانو ذرهی نقره/تیتانیوم دی اکساید (Ag/TiO2) حذف آلاینده مالاشیت سبز (MG) را در سال 2012 مدلسازی کردند. در این فعالیت نانوکامپوزیت (PANI/RHA) تهیه شده در حذف مالاشیت سبز با نانو ذره نقره- تیتانیم دی اکساید مقایسه شد. بررسیها نشان داد که نانو ذره نقره- تیتانیم دی اکساید نسبت به PAN/RHA در حذف مالاشیت سبز از کارایی بهتری برخوردار است[3]. محققان در سال2011 کیفیت پساب خروجی کارخانه کاغذ را با استفاده از سیستم استنتاج فازی مبتنی بر شبکه تطبیقی پیشبینی نمودند[4]. پامیر و همکارانش با استفاده از مدل آماری رگرسیون لجستیک تاثیر آب در مواد زائد جامد را در محل دفن زباله در سال 2007 پیشبینی نمودند[5]. میشل و همکارانش در سال 2014 از انرژی خورشیدی برای تصفیه فاضلاب آسیاب زیتون با استفاده از یک راکتور فوتو کاتالیستی در مقیاس پایلوت پس از انعقاد و لختهسازی استفاده کردند[6] . هنگوئی و همکارانش در سال 2014 روشی برای تشخیص خرابی آنلاین در فرایند تصفیه فاضلاب با استفاده از شبکه عصبی فازی ارائه نمودهاند[7]. قنبری و همکارانش تفکیک مالاشیت سبز را در حضور نانو کامپوزیت پلی آنیلین بر پایهی خاکستر سبوس گندم (PANI/WHA) با استفاده از شبکه عصبی مصنوعی و همچنین روش تجربی در سال 2015 مدلسازی کردند. طبق این مدل تهیهی نانو کامپوزیت (PANI) آغشته شده به خاکستر سبوس گندم (WHA) و تحقیق بازده حذف مالاشیت سبز(MG) با استفاده از PAN /WHA در شرایط مختلف تحت تاثیر عوامل موثر و کارآمد مانند حجم PANI/WHA، غلظت اولیه (MG)، تراکم اشعه یو وی(UV light) و زمان پرتو افشانی، مورد مطالعه قرار گرفته شد. نتایج به دست آمده نشانگر کارایی بهتر مدل شبکه عصبی نسبت به روش تجربی میباشد. لذا استفاده از روشهای تجربی به دلیل داشتن پیچیدگیهای خاص و افزایش هزینهی بالا، باعث کاهش قابلیت اطمینان میگردند. بنابراین روشهای متعدد انجام شده برای حذف آلایندهها به دلیل گستردگی شرایط، زیاد کارآمد نبوده و به نظر میرسد تکنیکهای وابسته به دادههای تجربی و پیشرفت آنها برای پیشبینی نتیجه فرایندها باید واضح و دقیق باشند.
لذا در این پژوهش، برای مدلسازی سیستم از مدل هوشمند ترکیبی بر پایهی شبکه عصبی مصنوعی(ANN) و مدل آماری رگرسیون لجستیک (LR)، که ابزاری توانمند برای مدلسازی سیستمهای پیچیده میباشد استفاده شده است. در دهه اخیر بیش از پیش، شبکههای عصبی تاثیرات زیادی روی کاربرد مسائل صنعتی از قبیل فرایندهای غیرخطی، ردیابی و مونیتور نمودن خطا، فرایند کنترل و بهینهسازی داشتهاند. از شبکههای عصبی در مدلسازی و شبیهسازی سیستمهای غیرخطی و همچنین برای مدلسازی تصفیهخانه فاضلاب استفاده شده است[8] که پیشبینی بهتری از عملکرد فرایند، به همراه کاربردی با دقت بالا، در مهندسی زیستمحیطی ارائه میدهند[9، 10، 11]. هر چند که بایستی اذعان کنیم گر چه از ایجاد سیستمی شبیه مغز انسان از دیدگاه مهندسی خیلی دور هستیم، با این حال شبکههای عصبی در مدل ANN ساده شدهی سیستم عصبی بیولوژیکی است که اولین بار در سال 1943 میلادی توسط مک کلاث (McCulloch) و پیتز(Pitts) کشف گردید و اولین شبکه عصبی با به کارگیری چند نورون ساده تهیه شد که قدرت محاسباتی قابل توجهی داشت[11].
دهههای50 و 60 میلادی سالهای طلایی شـبکههای عصبی میباشد. در محدوهی سالهای 1958 تا 1962 روزن بلات(Rosen Blat) گروه بزرگی از شبکههای عصبی به نام پرسپترون را معرفی نمود. با وجود انعطاف مناسب ANN، ازدیاد تعداد متغیرها، تعداد نورونها و یا افزایش تعداد لایهها در شبکه عصبی مصنوعی میتوانند سبب پیچیدگی ساختار شبکه عصبی و ناپایداری آن گردند که یکی از دلائل آن افزایش تعداد وزنها نسبت به ورودیها میباشد[13]. از طرفی در مواردی متغیرها از همبستگی بالائی برخوردارند که استفاده از همهی آنها نوعی ورود اطلاعات تکراری را به همراه دارد[14]. که این موارد میتوانند از یافتن مدلهای بهینه جلوگیری کنند. لذا با توجه به اهمیت مسئله کمبود آب، در مقاله حاضر برای رفع این مشکل از مدل هیبریدی ANN- LR که یک رویکرد جدید بر پایه ساختار ترکیبی شبکههای عصبی پرسپترون چند لایه (MLP) و مدل آماری رگرسیون لجستیک میباشد، به منظور تخمین بازده حذف ماده رنگزای مالاشیت سبز در پسابهای صنعتی، جهت جلوگیری از آلودگی آبها و حفظ محیط زیست استفاده شده است. در بین فرایندهای مختلف جداسازی در تصفیه آب و پساب، فرایند استفاده از نانوکامپوزیت پلی آنیلین به دلیل راندمان بالا و هزینههای اولیه و عملیاتی پایین نسبت به سایر روشهای جداسازی از جایگاه ویژهای برخوردار است. برای بررسی فرایند حذف مالاشیت سبز، ازمقدار اولیه پلی آنیلین بر پایه خاکستر پوسته گندم، غلظت اولیه مالاشیت سبز، شدت اشعهی یو وی و زمان پرتو افشانی به عنوان اجزاء ورودی استفاده شده است. در این پژوهش ابتدا با استفاده از ANN به طور مستقیم پیشبینی حذف آلایندهی MG از پسابها بررسی شده سپس با استفاده از مدل آماری LR مورد بررسی قرار گرفته شده و در نهایت مسئله با مدل هیبریدی ANN-LR بررسی شده و در آخر توانایی دقت این مدلها جهت پیشبینی فرایند تصفیه پسابهای صنعتی مورد ارزیابی قرار میگیرند. نتایج شبیهسازی نشان دهندهی تطابق بسیار خوب بین دادههای تجربی و نتایج حاصل از روش ترکیبی (ANN) و (LR) میباشد. بر این اساس با مقایسهی خروجیهای حاصل از روش هوشمند ترکیبی، با خروجیهای واقعی بهترین روش به عنوان ابزاری توانمند جهت پیشبینی صحیح عملکرد تصفیه پسابها مورد استفاده قرار گرفته است.
2- مواد و روشها
1-2- شبکه عصبی پرسپترون چند لایه (MLP)
ساختار شبکه عصبی در مقالات پیشین به طور کامل بررسی شده است[15،2] . از پرکاربردترین شبکههای عصبی، شبکههای پرسپترون هستند، این شبکهها قادرند با انتخاب مناسب تعداد لایهها و سلولهای عصبی، یک نگاشت غیرخطی را به دقت انجام دهند. این شبکه شامل سه لایهی ورودی، پنهان و خروجی است، تعداد نورونهای موجود در لایههای ورودی و خروجی با توجه به ماهیت مسئلهی مورد بررسی، مشخص میشود، حال آنکه تعداد نورونهای موجود در لایههای پنهانی و همچنین تعداد این لایهها با نظر طراح شبکه به روش سعی و خطا در جهت کاهش مقدار خطا مشخص میگردد. در خروجی هرنورون از شبکه MLPیک تابع خطی قرار دارد و فرایند یادگیري در تمام نورونها و لایهها صورت میگیرد. در صورت کافی نبودن تعداد نورونها در لایه پنهان، شبکه قادر نخواهد بود نگاشت دقیقی بین بردارهاي ورودي و خروجی ایجاد کند. مقادیر اولیه وزنها به صورت اتفاقی در نظرگرفته شدهاند. همه وزنها و بایاسهایی که در شبکه قرار دارند در طول فرایند یادگیري قابل تغییر هستند.
این شبکه بر مبنای الگوریتم پس انتشار خطا آموزش میبیند. بدین ترتیب که خروجیهای واقعی با خروجیهای دلخواه مقایسه میشوند، و وزنها به وسیلهی الگوریتم پس انتشار، به صورت تحت نظارت تنظیم میگردند تا الگوی مناسب به وجود آید. برای الگوی ورودی p ام، مربع خطای خروجی برای تمامی سلولهای لایهی خروجی شبکه به صورت زیر میباشد[13].
که در آن خروجی دلخواه برای j امین سلول در لایه خروجی و
خروجی واقعی برای j امین سلول در لایه خروجی ، S ابعاد بردار خروجی ،
بردار خروجی واقعی و
بردار خروجی دلخواه هستند خطای کل E برای p الگو به صورت زیر در میآید.
وزنها با هدف کاهش تابع هزینه E به مقدار مینیمم به روش گرادیان نزولی تنظیم شده و روند یادگیری هنگامی متوقف میشود که مجموع کل خطا (E) برای p الگو از مقدار آستانهی تعیین شده کمتر شود یا تعداد کل دورههای تعلیم به پایان رسد .در این تحقیق از مجموعهی دادههای آماری به دست آمده، دادههای ورودی به طور تصادفی به سه مجموعه به شرح فوق تقسیم شدهاند:
الف - 70% دادهها در مجموعهی دادههای آموزشی (training Data).
ب - 10% دادهها در مجموعهی دادههای اعتبارسنجی یا دادههای ارزیابی (validation Data) در راستای بیش برازش شبکه.
ج - 20% دادهها در مجموعهی آزمایش یا تست (test Data) برای بررسی کارآیی شبکهی نهایی.
در این تحقیق تعداد مختلفی از نورونهای 5 تا40 عددی در لایه پنهان و یک نورون در لایه خارجی استفاده شدند. ماکزیمم تعداد مراحل تکرار 500 مرتبه و مقدار خطای هدف برابر تنظیم گردیده است. همچنین از میانگین مربعات خطا (MSE) و جذر میانگین مربعات خطا (RMST) به عنوان خطای عملکرد استفاده شده است. که با توجه به رابطه زیر، عملکرد شبکه ارزیابی میشود.
که در آن و
به ترتیب شاخصهای ارزیابی شده متغیر عملکرد و مقدار پیشبینی شده و N تعداد کل دادهها است.
2-2- رگرسیون
واژه رگرسیون از لحاظ لغوی در فرهنگ لغت به معنی پسروی و بازگشت است. اما از دید آمار و ریاضیات به مفهوم بازگشت به یک مقدار متوسط یا میانگین به کار میرود. بدین معنی که برخی پدیدهها به مرور زمان از نظر کمی به طرف یک مقدار متوسط میل میکنند.
در مدلهای آماری، تحلیل رگرسیون یک فرآیند آماری برای تخمین روابط بین متغیرها می باشد. تحلیل رگرسیونی فن و تکنیکی آماری برای بررسی و مدلسازی ارتباط بین متغیر وابسته و متغیر مستقل بوده و هدف آن پیشبینی متغیر وابسته با توجه به متغیرهای مستقل میباشد. مهمترین تفاوت رگرسیون و همبستگی در این است که رگرسیون ماهیت پیشبینی میزان متغیر وابسته از روی مدلی که متغیر مستقل یکی از مولفههای آن است را دارد. در حالی که هم بستگی صرفا نشاندهنده شدت رابطه متغیر های مستقل و وابسته میباشد.
رگرسیون تقریباً در هر زمینهای از جمله مهندسی، فیزیک، اقتصاد، مدیریت، علوم زیستی، بیولوژی و علوم اجتماعی برای برآورد و پیشبینی مورد نیاز است. در مباحث مربوط به رگرسيون اغلب بحث بر سر يافتن رابطهاي بين متغير پاسخ y و مجموعهاي از متغيرهاي پيشگوي xi است كه ميتوان آن را به صورت يك معادله رياضي بيان كرد.
1-2-2-مدل آماری رگرسیون لجستیک
رگرسیون لجستیک نوعی از رگرسیون است که متغیرهای مستقل میتواند هم در مقیاس کمی و هم در مقیاس اسمی باشد ولی متغیر وابسته، اسمی دو سطحی است. رگرسیون لجستیک روش آماری متعلق به گروه مدلهای آماری خطی تعمیم یافته است که با استفاده از متغیرهای مستقل، احتمال وقوع یک حادثه را مورد پیشبینی قرار میدهد. نکته اصلی در رگرسیون این است که متغیر وابسته یک متغیر دوحالته است به طوری که میتواند عدد صفر به معنی عدم وقوع و یک به معنی وقوع رویداد باشد.
این مدل رگرسیون، شبیه رگرسیون معمولی است با این تفاوت که روش تخمین ضرایب یکسان نمیباشد و به جای حداقل کردن مجذور خطاها (که در رگرسیون معمولی انجام میشود )، احتمالی که یک واقعه رخ میدهد را حداکثر مینماید. در رگرسیون لجستیک از آمارههای کای اسکوئر و والد (Wald) استفاده میشود. تحلیل مدل رگرسیون لجستیک به جز در مورد متغیر وابسته، مشابه رگرسیون خطی است. در رگرسیون لجستیک از مفهومی به نام بخت برای متغیر وابسته استفاده میشود در اصطلاح آماری بخت (Odd) به معنی احتمال رخداد یک پیشامد بر احتمال عدم رخداد آن میباشد.که این احتمال بین 0 و 1 تغییر میکند. در حالی که بخت ممکن است بیش از یک باشد. واژهی کلیدی در تحلیل رگرسیون لجستیک ساز های به نام لوجیت (Logit) است که لگاریتم طبیعی بخت میباشد.
رگرسیون لوجستیک دارای دو ویژگی میباشد. اول توزیع شرطی y|x که یک توزیع برنولی به جای یک توزیع گوسی است، زیرا متغیر وابسته دو حالته است. دوم مقادیر پیش بینی، احتمالاتی محدود بین بازه صفر و یک میباشد که به کمک تابع توزیع لوجستیک به دست میآید لذا رگرسیون لوجستیک احتمال خروجی را پیشبینی میکند.
در این پژوهش هدف رگرسیون لجستیک یافتن بهترین مدل برای تشریح روابط موجود بین مجموعهی متغیرهای مستقل شامل مقدار PANI/WHA، غلظت MG، تراکم اشعه UV و زمان پرتو افشانی و متغیر وابسته میباشد که این متغیر، یک متغیر اسمی به صورت وجود آلودگی و یا عدم وجود آلودگی در خروجی حاصل از پسابهای صنعتی میباشد.
در این تحقیق عدد یک برای حذف ماده سمی مالاشیت سبز از پسابها به میزان بیش از 70% به عنوان احتمال خروجی مطلوب و عدد صفر برای کمتر از 70% به عنوان احتمال خروجی نامطلوب در نظر گرفته شده است.
فرم کلی معادله رگرسیون لجستیک دو وجهی به صورت زیر میباشد :
که در آن :
P: احتمال وقوع (در این تحقیق احتمال وجود آلودگی )
: متغیرهای مستقل
(i=1,2,…..,n) : ضرایب تعیین شده برای مدل توسط رگرسیون میباشد.
3-2- روش پیشنهادی (ترکیب شبکه عصبی مصنوعی با رگرسیون لجستیک )
در ابتدا پارامترهای مورد نیاز آزمایشگاهی معرفی شده است (رجوع به جدول 1). سپس با اعمال رگرسیون لجستیک و تحلیل آماری پارامترهای موجود و تعیین تاثیر هر یک از آنها بر روی خروجی ارزش اهمیت دادهها مشخص شده و احتمال خروجی به ازای هر یک از قوانین (ورودیهای شبکه عصبی) مشخص شده است. روش پیشنهادی، پیشبینی دقیقتر و با خطای کمتری از آلوده بودن و یا عدم آلودگی آب خروجی حاصل از روند تصفیه پساب را ارائه میدهد.
در ادامه نتایج حاصل از رگرسیون لجستیک بر روی شبکه عصبی اعمال شده و بر روی عملکرد آموزش شبکه عصبی تاثیر بسزایی گذاشته است. نتایج حاصل از شبکه عصبی و ترکیب آن با رگرسیون لجستیک در بخش 3 مورد بحث قرار گرفته شده است.
1-3-2- مدل شبکه عصبی ترکیبی
مدل ANN استفاده شده در این تحقیق، شبکه پرسپترون چند لایه میباشد که توسط الگوریتم کاهش شیب که پس انتشار نامیده میشود، آموزش میبیند که شامل یادگیری با ناظر میباشد. در این پژوهش به منظور کاهش خطا و افزایش دقت، از مدل هیبریدی شبکه عصبی مصنوعی و مدل آماری رگرسیون لجستیک (ANN-LR) جهت پیشبینی حذف آلایندهی مالاشیت سبز از پسابهای صنعتی استفاده شده است.
در حالت کلی در ایجاد مدلهای هیبریدی دو هدف زیر را در نظر میگیریم:
هدف اول: استفاده از مدلهای آماری در انتخاب متغیرهای ورودی برای مدل شبکه عصبی
هدف دوم: استفاده از خروجی به صورت احتمال برآورد، به عنوان یک ورودی برای مدل شبکه عصبی
در صورتی که تعداد متغیرها بیش از حد زیاد باشند و یا تعداد نورونها و لایههای استفاده شده در شبکه عصبی زیاد باشند مدل شبکههای عصبی به دلیل صرف زمان زیاد برای انتخاب و پردازش متغیرها دچار مشکل میگردند، لذا با ترکیب مدلهای آماری و مدل شبکه عصبی میتوان این مشکلات را به روشهای زیر کاهش داد.
1 - استفاده از مدلهای آماری در پیش انتخاب متغیرها که باعث کاهش خطر و ریسک انتخاب بیش از ظرفیت و نیز کاهش زمان صرف شده برای انتخاب مدل میشود.
2- استفاده از خروجی یک مدل آماری به عنوان ورودی یک مدل شبکه عصبی مصنوعی به طور موثری اطلاعات را متراکم نموده و به متغیرهای پتانسیل اجازه عمل میدهد.
در شکل زیر شمای کلی مدل شبکه عصبی هیبریدی نمایش داده شده است. طبق شکل (1) فرایند مدل هیبریدی رگرسیون لجستیک و شبکه عصبی مصنوعی (ANN-LR) شامل مراحل زیر میباشد:
مرحله اول: ورودیها به همراه y، همان خروجی مورد نظر (Target) وارد مدل آماری LR میشود.
مرحله دوم: با پردازش دادهها توسط مدل LR، اطلاعات به صورت جدول شماره 2 به همراه ضرایب تخمین (B) به دست میآید.
مرحله سوم: ضرایب تخمین به همراه ورودیها وارد تابع Mnrval شده و خروجیها به صورت احتمال مطلوب یا نامطلوب مشخص میشود .
مرحله چهارم: ورودیها به همراه خروجی مدل آماری LR وارد شبکه عصبی شده و خروجی شبکه هیبریدی را(Output) را نتیجه میدهد .
بنابراین برای اجرای مدل هیبریدی ANN-LR از دادههای پردازش شده توسط LR و خروجی مدل آماری به عنوان ورودیهای شبکه عصبی طبق نمودار زیر استفاده میشود.
شکل 1 – شمای کلی مدل شبکه عصبی هیبریدی
3- نتایج عددی
پیشبینی حذف آلایندهی مالاشیت سبز از پسابهای صنعتی با استفاده از نانو کامپوزیت پلی آنیلین بر پایهی خاکستر سبوس گندم، به صورت تجربی مورد بررسی قرار گرفته است(11). این نانوکامپوزیت توسط پرتو افشانی اشعه ایکس(XRD) و اسکن میکروسکوپ الکترونی (SEM) مورد تحلیل و بررسی قرار گرفته است. میزان حذف آلاینده، به مقدار اولیه نانوکامپوزیت پلی آنیلین(PANI/WHA)، غلظت اولیه مالاشیت سبز، شدت اشعهی یو وی (UV light) و زمان پرتو افشانی بستگی دارد. مقدار اولیه نانوکامپوزیت، غلظت اولیه MG، شدت اشعهی UV و زمان پرتو افشانی به عنوان متغیرهای ورودی و درصد حذف آلایندهی MG، به عنوان متغیر خروجی در نظر گرفته شده است. متغیرهای تحقیق در جدول ( 1 ) خلاصه شدهاند.
جدول 1- متغیر های تحقیق
Range | Variable | |||
| Input Layer | |||
0.1 – 1.5 |
| |||
1 – 12 |
| |||
8.3 – 40.6 |
| |||
0 -200 |
| |||
| Output Layer | |||
0 – 100 | Y=Removal of MG (%) |
( |
|
متغیرها | B | SE | p-value | t-value |
| 6.9813
| 2.6606
| 0.0087
| 2.6239 |
| -3.0221
| 76.6987
| 0.9686
| -0.0394
|
| 0.0344
| 0.02302
| 0.1352
| 1.4937
|
| 0.0250 | 0.0079 | 0.0015 | 3.1779 |