Application of Machine Learning Methods for Modeling Steam Import Reduction aimed at Energy Resources Management
Subject Areas :Ehsan Sharifara 1 , Madjid Abbaspour 2 , Alireza saraei 3
1 - Department of Energy Systems Engineering, Faculty of Natural Resources and Environment, Science and Research Branch, Islamic Azad University, Tehran, Iran
2 - Sharif University of Technology, School of Mechanical Engineering, Tehran, Iran
3 - Department of Mechanic Engineering, South Tehran Branch, Islamic Azad University, Tehran, Iran
Keywords: Energy conservation opportunity, Energy modeling, Machine learning, Steam consumption prediction.,
Abstract :
Integrated Ethylene Oxide/Ethylene Glycol (EO/EG) plants are major energy consumers, particularly in High-Pressure Steam (HPS) usage. This study proposes a data processing and modeling framework for high-accuracy machine learning modeling to predict the HPS import of an EO/EG petrochemical plant. The study employed Python3 and analyzed raw historical data from the plant's DCS, spanning five years of operation under the same EO catalyst. Daily feed and glycol production data were used to calculate catalyst selectivity and the plant's production capacity as models’ input features, while HPS import served as the models’ output target. Various regression algorithms were evaluated to select the best model for this case study, with their hyperparameters tuned using Grid Search and Bayesian Search algorithms. Random forest regression outperformed other methods in R2, MAPE, and RMSE metrics but had the longest training time. Polynomial ridge regression was a suitable choice considering both time consumption and performance. The tuned random forest regression model revealed an approximate 291 Tonne/Day potential for HPS import savings equivalent to 16% of the plant’s average HPS import through enhanced steam import management strategies. Adopting this HPS saving measure would enable the HPS supplier to avert 38 tonnes of CO2 emissions daily equivalent to 0.37% of its nominal HPS generation capacity. Our methodology in this paper can be applied to other EO/EG plants and is currently being integrated into the plant's energy management system, enabling continuous monitoring of steam import behavior relative to catalyst and plant performance.
Ahmadi, A., Noorpoor, A. R., Kani, A. R., Saraei, A. (2021) Modeling and Economic Analysis of MED-TVC Desalination with Allam Power Plant Cycle in Kish Island. Iran. J. Chem. Chem. Eng, 40(6), 1882.
Hauke, J., Kossowski, T. (2011) Comparison of values of Pearson's and Spearman's correlation coefficients on the same sets of data. Quaestiones geographicae, Jun 24;30(2):87-93.
James, G.M., Witten, D., Hastie, T., Tibshirani, R. (2013) An Introduction to Statistical Learning, Page 181.
Mhlanga, D. (2021) Artificial Intelligence in the Industry 4.0, and Its Impact on Poverty, Innovation, Infrastructure Development, and the Sustainable Development Goals: Lessons from Emerging Economies?, Sustainability, vol. 13, no. 5788, pp. 1–16.
Moghadasi, M., Izadyar, N., Moghadasi, M., Ghadamian, H. (2021) Applying machine learning techniques to implement the technical requirements of energy management systems in accordance with ISO 50001: 2018, an industrial case study. Energy Sources, Part A: Recovery, Utilization, and Environmental Effects, Dec 20:1-8.
Moghadasi, M., Ozgoli, H.A., Farhani, F. (2021) Steam consumption prediction of a gas sweetening process with methyldiethanolamine solvent using machine learning approaches. International Journal of Energy Research, Jan;45(1):879-93.
Qian, Y.Y. , Chen, R.L., Chen, J.J., Ding, G.R. (2016) Analysis of the Production and Market of Ethylene Oxide in China. Chem. Ind., 34(2), 46-48.
Rahimpour, M. R., Shayanmehr, M., Nazari, M. (2011) Modeling and Simulation of an Industrial Ethylene Oxide (EO) Reactor Using Artificial Neural Networks (ANN). Industrial & Engineering Chemistry Research, 50(10), 6044-6052.
Sharifara, E. Abbaspour, M., Saraei, A. (2023) Analysis of the high-pressure steam import behaviour of an integrated ethylene oxide/ethylene glycol petrochemical plant under different production scenarios. Canadian Journal of Chemical Engineering. 2023,1. https://doi.org/10.1002/cjce.25143
Shell International Chemicals, Shell Research and Technology Centre Amsterdam, EO/EG Process and Site Support, EO/EG Process Design Package.
Statista. (2023) Retrieved from Statista: https://www.statista.com/statistics/1245260/ethylene-oxide-market-volume-worldwide/.
Zahedi, G. Lohi, A. Mahdi, K. A. (2011) Hybrid Modeling of Ethylene to Ethylene Oxide Heterogeneous Reactor. Fuel Processing Technology, 92(9), 1725-1732.
Zapf, F., Wallek, T. (2022) Case-study of a flowsheet simulation using deep-learning process models for multi-objective optimization of petrochemical production plants. Computers & Chemical Engineering, 162: 107823.
Zendehboudi, S., Rezaei, N., Lohi, A. (2018) Applications of hybrid models in chemical, petroleum, and energy systems: A systematic review. Applied energy, 228: 2539-2566.
Zendehboudi, S., Zahedi, G., Bahadori, A., Lohi, A., Elkamel, A., Chatzis, I. (2014) A dual approach for modelling and optimisation of industrial urea reactor: Smart technique and grey box model. The Canadian Journal of Chemical Engineering, 92.3: 469-485.
مجله تحقیقات منابع طبیعی تجدیدشونده، سال پانزدهم، شماره1بهار و تابستان1403(پیاپی چهل و یک )، ص 45-27، نوع مقاله : علمی پژوهشی/1
بهکارگیری روشهای یادگیری ماشین جهت مدلسازی کاهش واردات بخار با هدف مدیریت منابع انرژی
احسان شریفآرا1، مجید عباسپور2* و علیرضا سرائی3
1) دانشجوی دکتری رشته مهندسی سیستمهای انرژی، دانشکده منابع طبیعی و محیط زیست، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران.
2) استاد دانشگاه صنعتی شریف، دانشکده مهندسی مکانیک، تهران، ایران. *رایانامه نویسنده مسئول مکاتبات: abbpor@sharif.edu
3) استادیار گروه آموزشی مکانیک، واحد تهران جنوب، دانشگاه آزاد اسلامی، تهران، ایران.
تاریخ دریافت: 11/12/1402 تاریخ پذیرش: 31/02/1403
چکیده
واحدهای تولید اتیلناکساید، اتیلنگلایکول یکپارچه، مصرفکنندگان مهم حاملهای انرژی بهویژه بخار پرفشار هستند. در این پژوهش، چارچوب مدلسازی دقیق برای واردات بخار پرفشار در یک واحد پتروشیمی پیشنهاد گردید. بدین منظور از زبان برنامهنویسی پایتون نسخه 3 برای آنالیز دادههای خام کارکردی روزانه واحد پتروشیمی مورد مطالعه در بازه زمانی کارکرد 5 ساله تحت یک نوع کاتالیست استفاده شد. گزینشپذیری کاتالیست و ظرفیت تولید واحد بهعنوان شاخصها و واردات بخار پرفشار بهعنوان هدف، جهت مدلسازی در نظر گرفته شد. الگوریتمهای رگرسیون متفاوتی برای گزینش بهترین مدل مورد ارزیابی قرار گرفتند و فراپارامترهای آنها با استفاده از الگوریتمهای جستجوی شبکهای و بیزین تنظیم گردیدند. روش درخت تصادفی بهترین عملکرد را در شاخصهای ارزیابی نسبت به سایر روشهای رگرسیون، اما با بیشترین مدت زمان پردازش به خود اختصاص داد. با در نظر گرفتن مدت زمان پردازش و عملکرد، روش رگرسیون ریج چندجملهای، انتخاب مناسبی تشخیص داده شد. با استفاده از مدل رگرسیون درخت تصادفی تنظیمشده، میزان تقریبی 291 تن در روز صرفهجویی واردات بخار پر فشار (16 درصد میانگین واردات بخار) معادل با انتشار تقریبی روزانه 38 تن دیاکسیدکربن (37/0 درصد انتشار معادل ظرفیت اسمی تولید بخار تامینکننده) حاصل شد. روش پیشنهادی در سیستم مدیریت انرژی واحد مورد مطالعه یکپارچهسازی شده است و میتواند در دیگر واحدهای مشابه نیز بهمنظور پایش مداوم رفتار واردات بخار پرفشار بر حسب عملکرد کاتالیست و تولیدات واحد پیادهسازی شود.
واژههای کلیدی: پیشبینی مصرف بخار، فرصتهای صرفهجویی انرژی، مدلسازی انرژی، یادگیری ماشین.
مقدمه
سرعت بالای صنعتی شدن و رشد جمعیت جهانی، باعث ایجاد چالشهای اساسی در مقیاس جهانی بهویژه در بخش انرژی و آب شده است (Ahmadi et al., 2021). این چالشها همراه با کاهش قابل توجه ذخایر انرژی و افزایش قابل توجه قیمت انرژی، اکثر مدیران صنایع، بهویژه صنعت پتروشیمی را که در تولید اتیلناکساید1 و اتیلنگلیکول2 فعالیت میکنند، وادار کرده است تا بهینهسازی مصرف سرویسهای جانبی و تولید و افزایش بهرهوری انرژی را بیش از پیش مورد توجه قرار دهند. در میان فرآیندهای تولید مختلف در صنعت پتروشیمی، فرآیند تولید اتیلناکساید و اتیلنگلیکول در دسته صنایع انرژی برقرار دارند. در نتیجه، حتی بهبود جزیی در کارآیی این فرآیندها میتواند تاثیر مثبت قابل توجهی بر پایداری آنها داشته باشد.
اتیلناکساید بهعنوان یک محصول میانی مهم در صنعت پتروشیمی و سومین ماده خام شیمیایی آلی مهم در میان مشتقات اتیلن به شمار میرود. این محصول به طیف متنوعی از کالاهای با ارزش از جمله ضد یخ، مواد شوینده، مواد دارویی و پلاستیک تبدیل میشود. بر اساس دادههای سایت استاتیستا3، حجم بازار جهانی اکسیداتیلن در سال 2022 به 58/31 میلیونتن رسید و پیشبینی میشود تا پایان سال 2030 به 45/36 میلیونتن برسد (Statista, 2023). علیرغم تلاشهای متعدد برای معرفی راهحلهای صرفهجویی در مصرف انرژی در این فرآیند صنعتی، روشهای بهینهسازی پیشنهادی اغلب هنگام اجرا در فرآیندهای تولید واقعی با چالشهایی مواجه میشوند (Qian et al., 2016).
بخش قابل توجهی از اتیلناکساید به اتیلنگلیکول تبدیل میشود. در نتیجه، واحدهای اتیلناکساید/اتیلنگلایکول یکپارچه بهعنوان یکی از سودآورترین واحدها در صنعت پتروشیمی بهشمار میروند. محصول اولیه این واحدها که به نام مونواتیلنگلایکول4 شناخته میشود، در تولید الیاف پلیاستر، پلیاتیلنترفتالات5 و همچنین ضدیخ و داروهای آرایشی و بهداشتی کاربرد دارد. با این حال، این واحدها همچنین مصرفکنندگان قابل توجه انرژی بهویژه به شکل بخار پرفشار هستند. این بخار اهداف مختلفی را در سیستمهای بخار پیچیده این تاسیسات انجام میدهد. واحدهای اتیلناکساید/ اتیلنگلایکول علاوه بر این، بخار پرفشار را در سمت پوسته راکتورهای اتیلناکساید خود و بخار کمفشار را در بخش تولید اتیلنگلایکول تولید میکنند.
در سالهای اخیر، پیشرفت فناوری، مجموعهای از اصطلاحات و ایدههای جدید را معرفی کرده است. مفاهیم نوظهور مانند دادههای بزرگ6، صنعت چهارم7، هوش مصنوعی8 و شاخه خاص آن، یادگیری ماشین9 در صنایع مختلف کاربرد پیدا کردهاند. این کاربردها طیف گستردهای را نظیر پیشبینی نتایج مقاومسازی ساختمانهای تجاری تا اجرای روشهای مدلسازی جعبه سیاه و جعبه خاکستری در صنایع نفت، گاز، پتروشیمی و انرژی شامل میشوند و پذیرش و ادغام این فناوریها بهویژه در صنعت پتروشیمی روند افزایشی داشته است (Mhlanga, 2021).
Rahimpour و همکاران (2011) برای شبیهسازی دینامیکی رفتار یک راکتور با بستر ثابت که برای تولید اتیلناکساید استفاده میشود از یک مدل ناهمگن تکبعدی استفاده کردند. آنها از یک شبکه عصبی پرسپترون چندلایه10 برای تعیین غلظت بهینه اتیلندیکلراید استفاده کردند. علاوه بر این، آنها بررسی کردند که چگونه سرعت گاز ورودی بر کسر مولیاتیلناکساید در هر دو فاز گاز و جامد تاثیر میگذارد. آنها مدل خود را در یک دوره عملیاتی سه ساله با مقایسه پیشبینیهای آن با شرایط صنعتی در حالت واقعی اعتبارسنجی کردند. نتایج شبیهسازیهای مدل پویا و دادههای فرآیند تاریخی، سطح رضایتبخشی از همخوانی را در شبیهسازی با عدم دقت کمتر از 5 درصد نشان دادند.
Zahedi و همکاران (2011) یک مدل جعبه خاکستری11 پویا را برای راکتور اتیلناکساید با بستر ثابت توسعه دادند. در ابتدا آنها یک مدل کینتیک برای واکنشها را با استفاده از رویکرد شبکه عصبی مصنوعی ایجاد کردند. این مدل بر اساس دادههای عملیاتی یک راکتور اتیلناکساید معمولی با ورودیهای شامل زمان، کسر مولی C2H4، C2H4O، CO2، H2O، و O2، و خروجیهایی که نشاندهنده حاصلضرب سرعت واکنش و غیرفعال شدن کاتالیست (r*a) است، ایجاد کردند. پس از آزمایش الگوریتمهای آموزشی مختلف، Zahedi و همکاران (2011) نشان دادند الگوریتم شبکه تابع پایه شعاعی12 دقیقترین تخمین دادهها را به همراه دارد. نتایج تولیدشده توسط شبکه عصبی با دادههای پیشبینی نشده مطابقت نزدیکی داشت و توانایی آن را برای تعمیم نشان داد. آنها با استفاده از شبکه عصبی، (r*a) را برآورد کردند و مدل راکتور هیبریدی را استخراج نمودند. آنها به این نتیجه رسیدند مدل جعبه خاکستری، 437/8 برابر دقت بیشتری نسبت به مدل مکانیستیک نشان میدهد.
Zampf و Wallek (2022) از تکنیکهای یادگیری ماشین برای ایجاد مدلهای فرآیندی با استفاده از دادههای استخراجشده از یک پالایشگاه استفاده کردند. سپس این مدلها در یک فرآیند فراگیر ادغام شدند که با استفاده از روش متوالی- مدولار حل شدند. اهداف بهینهسازی بر به حداکثر رساندن حاشیه تولید و در عین حال به حداقل رساندن انتشار CO2 متمرکز بود که منجر به یک راهحل عددی بسیار پایدار برای بهینهسازی چندهدفه بعدی گردید. مطالعه آنها شامل استفاده از هر دو مدل جعبه سیاه و جعبه خاکستری بود که با رویکرد LP به خوبی تثبیت شده مقایسه شدند. Zampf و Wallek (2022) به این نتیجه رسیدند ادغام دانش مهندسی با تکنیکهای دادهمحور برای واحدهای فرآیندی، استفاده موثر از اطلاعات غیرمستقیم را ممکن میسازد و میتواند قابلیتهای پیشبینی مدلهای واحد را در مقایسه با مدلهایی که از این ترکیب استفاده نمیکنند، به طور قابلتوجهی افزایش دهد. بهعنوان یک توصیه کلی برای مدلسازی تجهیزات فرآیندهای شیمیایی، آنها از ادغام مدلهای جعبه سفید در کنار مدلهای جعبه سیاه برگرفته از روشهای یادگیری ماشین برای دستیابی به مدلهای جعبه خاکستری قوی و قابل اعتماد استفاده کردند و پیشنهاد کردند که تحقیقات بیشتر باید در حوزه توسعه و گسترش مدلهای جعبه خاکستری مبتنی بر داده بهویژه در زمینه راکتورهای شیمیایی صورت پذیرد.
Zendehboudi و همکاران (2018) یک بررسی جامع از مدلهای هیبریدی13 در زمینههای نفت، گاز، فرآیندهای شیمیایی و سیستمهای انرژی انجام دادند. تحقیقات آنها شامل تجزیه و تحلیل مدلهای فرعی، راهبردهای هیبریداسیون، طرحهای ساختاری، معیارهای غربالگری و روندهای نوظهور در مدلسازی ترکیبی با تاکید خاص بر این بخشهای صنعتی بود. آنها تاکید کردند ماهیت پیچیده فرآیندهای شیمیایی و انرژی، استفاده از ابزارهای ریاضی پیشرفته را بهدلیل پیچیدگیهای ریاضی و درک محدود این فرآیندها که شامل غیرخطی بودن، داینامیک گسترده و چندمقیاسی، بازههای زمانی طولانی، عدمقطعیتها و ابعاد بالا را ناگزیر میسازد. Zendehboudi و همکاران (2018) تاکید کردند مدلهای هیبریدی در رسیدگی به چالشهای مرتبط با فرآیندهای پیچیده موثر بودهاند. آنها همچنین نمونههایی از ترکیبهای مختلف مدلهای جعبه سیاه و جعبه سفید را ارایه کردند که برای کاهش پیچیدگی مدل طراحی شده بودند. علاوه بر این، آنها بر اهمیت مدلهای جعبه خاکستری ترکیبی که ویژگیهای تعمیمپذیری و تفسیرپذیری فیزیکی مدلهای جعبه سفید را با قابلیتهای کاهش پیچیدگی مدلهای جعبه سیاه ترکیب میکنند، تاکید کردند. آنان نشان دادند چگونه این ادغام، فرآیند مدلسازی را ساده کرده و بهبود میبخشد.
Zendehboudi و همکاران (2014) در یک مطالعه جداگانه یک مدل ریاضی را معرفی کردند و از قدرت شبکههای عصبی مصنوعی برای شبیهسازی و بهینهسازی یک واحد تولید اوره استفاده کردند. مدل ریاضی آنها تعادلهای بخار- مایع را برای سیستم NH3-CO2-H2O-(NH2)2CO در هر دو چارچوب ترمودینامیکی و واکنش یکپارچه میکند. ایشان پیشبینیهای شبکه عصبی مصنوعی را با دادههای واقعی و نتایج تولیدشده توسط مدل ریاضی مقایسه کردند و سطح رضایتبخشی از توافق بین این روشها آشکار شد. Zendehboudi و همکاران (2014) از طریق تحلیل حساسیت سیستماتیک، شرایط فرآیندی بهینه برای تولید اوره را شناسایی کردند و دریافتند که رویکرد شبکه عصبی توسعهیافته ابزار بسیار موثری برای مدلسازی تعادلهای فازی پیچیده شامل واکنشها در یک واحد تولید اوره صنعتی است.
Moghadasi و همکاران (2021) یک چارچوب جامع شامل پیشپردازش دادهها و مدلسازی برای ایجاد یک مدل یادگیری ماشینی فوقالعاده دقیق با هدف پیشبینی استفاده از بخار در فرآیند شیرینسازی گاز ابداع کردند. آنها طیف گستردهای از پیشرفتهترین الگوریتمهای رگرسیون را برای شناسایی راهحل بهینه متناسب با مطالعه موردی منحصر به فرد خود بررسی کردند. هدف نهایی آنها استفاده از این مدل بهعنوان وسیلهای برای یافتن فرصتهای بالقوه صرفهجویی در انرژی در این نوع واحدها بود. آنها برای تقویت تحقیقات خود، دادههای تاریخی از سال 2017 تا 2019 را از تصفیهخانه گاز در مجتمع گاز پارس جنوبی بهدست آوردند. Moghadasi و همکاران (2021) این دادهها را تحت یک روش پردازش داده چندمرحلهای قرار دادند که شامل تجزیه و تحلیل چندخطی و انتخاب ویژگی مبتنی بر مدل بود. در فرآیند انتخاب مدل، آنها مجموعه گستردهای از تکنیکهای رگرسیون را مورد بررسی قرار دادند. آنان مشخص کردند مدل ماشینهای تقویتکننده گرادیان14 نسبت به رقبا بهتر عمل کرده و کمترین خطای اعتبارسنجی متقاطع15 را ارایه میدهد. در یک سناریوی آزمایشی، مدل آنها به دقت قابل توجه 98 درصد ضریب تعیین16 برای پیشبینی مصرف بخار دست یافت. علاوه بر این، مدل آنها پتانسیل کاهش 2 درصد در مصرف بخار را به میزان صرفهجویی سالانه 24,000 تن شناسایی کردند.
Moghadasi و همکاران (2021) در مطالعهای جداگانه، یک چارچوب مبتنی بر دادههای نوآورانه را معرفی کردند که از مدلهای یادگیری ماشین برای ایجاد سیستمهای مدیریت انرژی کارآمد در صنایع انرژیبر، در راستای استانداردهای ISO 50001:2018 استفاده میکرد. از طریق اجرای این چارچوب سه لایه، آنها با موفقیت الزامهای استاندارد شامل موارد پیشرو را برآورده کردند: (الف) شناسایی متغیرهایی که بهطور قابل توجهی بر عملکرد انرژی تاثیر میگذارند؛ (ب) توسعه شاخصهای عملکرد انرژی و خط پایه انرژی؛ (ج) تجزیه و تحلیل عملکرد انرژی موجود؛ (د) کمیسازی فرصتهای صرفهجویی انرژی؛ (ه) تعیین اهداف انرژی؛ و (و) تدوین یک برنامه اقدام انرژی. رویکرد مدیریت انرژی مبتنی بر داده آنها در یک واحد کربنزدایی اتان در مقیاس صنعتی واقع در مجتمع گاز پارس جنوبی در ایران بهکار گرفته شد. مجموعه داده آنها شامل 52,560 رکورد از بخشهای واحد است که در طول سال 2020 جمعآوری شده است و بهعنوان دوره پایه عمل میکند. با بهکارگیری الگوریتم ماشینهای تقویتکننده گرادیان، آنان یک مدل بسیار دقیق با دقت قابل توجه 99 درصد ضریب تعیین برای پیشبینی مصرف انرژی واحد بهعنوان خط پایه انرژی ایجاد کردند. یافتههای آنها پتانسیل قابلتوجهی برای صرفهجویی در انرژی، معادل 31/10 درصد یا 63,119 تن مصرف بخار سالانه و کاهش 7,027 تن انتشار دیاکسیدکربن در سال را نشان داد. آنها تاکید کردند با بهینهسازی حالتهای عملیاتی واحد تحت بهترین شیوهها، میتوان به این نتایج مطلوب دست یافت.
همانطور که تحقیقات فوق نشان میدهند، در چند سال گذشته، تجزیه و تحلیلهای مرتبط با پیشبینی مبتنی بریادگیری ماشین توجه بسیاری را در صنعت پتروشیمی به خود جلب کرده است. با این حال، کاربرد این روشها برای پیشبینی و بهینهسازی مصرف انرژی، بهویژه در مورد واردات بخار پرفشار در واحد های پتروشیمی اتیلناکساید / اتیلنگلایکول یکپارچه مورد بررسی قرار نگرفته است. این شکاف تحقیقاتی انگیزه مطالعه حاضر است که هدف آن ارایه یک چارچوب تجزیه و تحلیل دادهها و مدلسازی جامع با استفاده از ابزارهای یادگیری ماشین و پیشبینی رفتار واردات بخار فشار بالای یک واحد پتروشیمی اتیلناکساید/ اتیلنگلایکول یکپارچه با استفاده از دادههای عملیاتی پنجساله استخراجشده از سیستم کنترل گسترده17 این واحد است. هدف بعد، استفاده از مدل تولیدشده بهعنوان مرجعی برای واردات بخار پرفشار واحد است که متعاقبا امکان ارزیابی عملکرد واردات بخار واحد را بهعنوان بخشی جداییناپذیر از سیستم مدیریت انرژی (ISO-50001) واحد مورد مطالعه فراهم میکند. این روش به نوبه خود شناسایی فرصتهای بالقوه صرفهجویی انرژی را تسهیل میکند. همچنین، این مدل قابلیت یکپارچهسازی با سیستم اینترنت اشیاء صنعتی18 واحد را دارد که منجر به هوشمند شدن آن میگردد. نتایج این تحقیق این پتانسیل را دارد که بهعنوان سنگ بنای محققان و متخصصان صنعت پتروشیمی در راستای افزایش کارآیی عملیاتی و عملکرد انرژی واحدهای پتروشیمی اتیلناکساید/ اتیلنگلایکول از طریق رویکردهای داده- محور باشد.
مواد و روشها
واحدها و شیمی فرآیند
فرآیند تولید اتیلناکساید/ اتیلنگلایکول شامل دو بخش اصلی است: بخش تولید اتیلناکساید (EO) و اتیلنگلیکول (EG). در بخش اول، اتیلن تحت اکسیداسیون مستقیم روی یک کاتالیست حاوی نقره بر پایه آلومینا قرار می گیرد که در دماهای معمولا از 220 تا 270 درجه سانتیگراد از طریق واکنش شیمیایی رابطه (1) رخ میدهد:
(1)
واکنش جانبی در رابطه (2) که غیرانتخابی و بسیار گرمازا است نیز با واکنش اصلی رابطه (1) رقابت و دیاکسیدکربن و آب تولید میکند:
(2)
سرکوب واکنش رابطه (2) با استفاده از اتیلکلراید19 انجام میشود. اتیلناکساید خود مقاومت نسبتا بالایی در برابر اکسیداسیون بیشتر از خود نشان میدهد. گرمای تولیدشده در طی واکنش با تولید بخار فشار بالا در پوسته راکتور و بخار با فشار متوسط در خنککننده محصول اولیه کنترل میشود. دیاکسیدکربن تولیدشده بهعنوان محصول جانبی در واکنش جانبی رابطه (2) از طریق یک واکنش شیمیایی با پتاسیمکربنات محلول در آب در بخش حذف CO2 از سیکل گاز حذف میشود.
اتیلناکساید تولیدشده در راکتورها با جذب در آب در بخش بازیابی اتیلناکساید از گاز محصول راکتور جدا میشود. متعاقبا، اتیلناکساید از حلال در بخش جداسازی استخراج میشود. سیستم بازیافت ترکیبات سبک20 بهمنظور حذف CO2 و ترکیبات سبک است که در جذبکننده اتیلناکساید جذب شده و سپس در استریپر اتیلناکساید خارج میشود. حذف ترکیبات سبک برای اطمینان از عملکرد طبیعی واکنش گلیکول و به حداقل رساندن خوردگی ناشی از حضور CO2 ضروری است (Shell EO/EG Process Design Package, 2023).
در بخش واکنش اتیلنگلایکول و آبزدایی، یک واکنش هیدرولیز حرارتی فاز مایع EO در حضور آب اضافی بر اساس واکنش رابطه (3) رخ میدهد:
(3) |
|
(4) |
| |||||
(5) |
|
(7) |
|
[1] Selectivity
[2] Features
[3] High Activity
[4] Target
[5] Python 3
[6] Scikit-Learn
شکل 1. فلوچارت مراحل مدلسازی
پیشپردازش دادهها
دادههای صنعتی اغلب دارای نقاط پرت1، نادرست یا ناقص هستند. هنگامی که این دادهها برای تجزیه و تحلیل یا یادگیری ماشین استفاده میشوند، میتوانند منجر به نتایج گمراهکننده شوند. برای جلوگیری از این امر، مهم است که دادهها پیش از پردازش، از نقاط پرت پاکسازی و ساختاردهی شوند. ترسیم دادههای خام میتواند در شناسایی مشکلات بالقوه، مانند نقاط پرت یاریرسان باشد. در شکل (2)، مشاهده میگردد که مجموعه داده حاوی مقادیر پرت بسیاری است که پیش از ادامه مرحله پردازش دادهها باید حذف میشدند.
پاکسازی دادههای پرت
برای حذف نقاط پرت از مجموعه داده خام، از روش محدوده بین چارکی2 برای شناسایی نقاط پرت در هر یک از زیرمجموعههای دادههای گزینشپذیری، ظرفیت تولید و واردات بخار پرفشار استفاده شد. برای روش IQR، چارک اول و سوم بهترتیب 25 و 75 درصد و آستانه 5/1 در نظر گرفته شد. سپس اتحاد شاخصهای دادههای پرت شناساییشده از هر زیرمجموعه داده از مجموعه کلی داده خام اصلی حذف گردید.
هدف این پژوهش، ایجاد بهترین مدل برای پیشبینی واردات بخار و شناسایی فرصتهای صرفهجویی در شرایط عملیاتی پایدار است. برای دستیابی به این هدف، دادههای مرتبط با ظرفیتهای تولید زیر 70 درصد نیز از مجموعه دادهها حذف گردید. این تصمیم بر اساس مستندات واحد است که بیان میکند نسبت کاهش تولید3 واحد 50 درصد ظرفیت تولید است و همچنین سابقه کارکردی واحد که نشان میدهد واحد مورد مطالعه معمولاً بالای 70 درصد ظرفیت تولید کار میکند. بنابراین، ظرفیتهای تولید روزانه کمتر بهعنوان فازهای انتقالی در نظر گرفته شد که طی آن واحد به سمت ظرفیتهای تولید بالای 70 درصد حرکت میکند. مصرف بخار پرفشار در طی این فازهای انتقالی، رفتار مصرف بخار نرمال واحد را منعکس نمیکند، بنابراین برای تمرکز بر سناریوهای پایدار، دادههای مربوط به این ظرفیتهای تولید پایینتر در مرحله پیشپردازش دادهها حذف گردید.
در مجموع 648 نقطه داده بهعنوان نقاط پرت شناسایی شد و از مجموعه دادههای خام حذف گردید. همانطور که در جدول (1) نشان داده شده است، حذف نقاط پرت بهطور قابل توجهی انحراف استاندارد را برای همه زیرمجموعههای داده کاهش داد. تعداد زیاد نقاط داده در مجموعه دادهها، این امکان را فراهم آورد تا این نقاط پرت به راحتی حذف گردد. مجموعه دادههای تمیز شده در شکل (3) نشان داده شده است.
[1] Outliers
[2] Inter Quartile Range (IQR)
[3] Turndown Ratio
شکل 2. دادههای خام واردات بخار پرفشار واحد (بالا) و تغییرات واردات بخار پرفشار (پایین)
جدول 1. توضیحات مجموعه دادههای اصلی و پاکسازی شده
| مجموعه دادههای اصلی | دادههای پاکسازی شده | ||||
گزینشپذیری | ظرفیت تولید | بخار پرفشار | گزینشپذیری | ظرفیت تولید | بخار پر فشار | |
تعداد | 00/1927 | 00/1927 | 00/1927 | 1279 | 1279 | 1279 |
میانگین | 66/0 | 67/0 | 05/1596 | 8/0 | 88/0 | 88/1774 |
انحراف معیار | 30/0 | 35/0 | 78/704 | 01/0 | 1/0 | 94/343 |
کمینه | 00/0 | 00/0 | 00/0 | 77/0 | 7/0 | 31/878 |
25% | 78/0 | 65/0 | 91/1372 | 78/0 | 78/0 | 76/1518 |
50% | 80/0 | 78/0 | 19/1764 | 8/0 | 88/0 | 81/1773 |
75% | 81/0 | 93/0 | 88/2121 | 81/0 | 98/0 | 22/2038 |
بیشینه | 20/1 | 04/1 | 56/5060 | 82/0 | 04/1 | 89/2496 |
شکل3. مجموعه دادههای پاکسازی شده واردات بخار واحد (بالا) و تغییرات واردات بخار (پایین)
آنالیز همبستگی1
پس از پاکسازی مجموعه دادهها، ضرایب همبستگی پیرسون2 و اسپیرمن3 برای درک بهتر روابط بین متغیرها محاسبه گردید. ضریب همبستگی پیرسون اندازهگیری قدرت رابطه خطی بین دو متغیر است. ضریب اسپیرمن از سوی دیگر معیاری از رابطه یکنواخت بین دو متغیر است و زمانی استفاده میشود که توزیع دادهها ضریب همبستگی پیرسون را نامطلوب یا گمراهکننده کند (Hauke & Kossowski, 2011). نتایج آنالیز همبستگی برای مجموعه داده پاک شده در جداول (2) و (3) نشان داده شده است.
[1] Correlation Analysis
[2] Pearson
[3] Spearman
جدول 2. ضرایب همبستگی پیرسون برای دادههای پاکسازیشده
پیرسون | گزینشپذیری | ظرفیت تولید | بخار پرفشار |
گزینشپذیری | 00/1 | 05/0 | 63/0 |
ظرفیت تولید | 05/0 | 00/1 | 58/0- |
بخار پرفشار | 63/0 | 58/0- | 00/1 |
جدول 3. ضرایب همبستگی اسپیرمن برای دادههای پاکسازیشده
اسپیرمن | گزینشپذیری | ظرفیت تولید | بخار پرفشار |
گزینشپذیری | 00/1 | 17/0 | 53/0 |
ظرفیت تولید | 17/0 | 00/1 | 56/0- |
بخار پرفشار | 53/0 | 56/0- | 00/1 |
همانطور که ضرایب به وضوح در جداول (2) و (3) نشان میدهد، بین بخار پرفشار و گزینشپذیری و بخار پرفشار و ظرفیت تولید همبستگی خوبی وجود دارد، اما بین پارامترهای گزینشپذیری و ظرفیت تولید همبستگی بسیار کم وجود دارد. هر دو ضرایب پیرسون و اسپیرمن برای ظرفیت تولید- بخار پرفشار، منفی و برای گزینشپذیری- بخار پرفشار مثبت بودند که نشاندهنده همبستگی معکوس بین بخار پرفشار و ظرفیت تولید و یک رابطه مستقیم بین بخار پرفشار و انتخابپذیری است.
جداسازی دادههای آموزشی- آزمایشی
سپس مجموعه دادههای پاکسازی شده به دو مجموعه تقسیم شدند: یک مجموعه آموزشی (80 درصد) و یک مجموعه آزمایشی (20 درصد). مجموعه آزمایشی برای ارزیابی خطای تعمیم مدل و انجام ارزیابی نهایی مدل برای ارزیابی عملکرد مدل بر روی دادههای جدیدی که قبلا هرگز ندیده است کنار گذاشته شد. جدول (4) توضیحات مجموعه دادهها را برای مجموعههای آموزشی و آزمایشی نشان میدهد.
جدول 4. توضیحات مجموعه دادههای آموزشی و آزمایشی
| مجموعه دادههای آموزشی | مجموعه دادههای آزمایشی | ||||
گزینشپذیری | ظرفیت تولید | بخار پرفشار | گزینشپذیری | ظرفیت تولید | بخار پرفشار | |
تعداد | 00/1023 | 00/1023 | 00/1023 | 00/256 | 00/256 | 00/256 |
میانگین | 80/0 | 88/0 | 84/1778 | 80/0 | 89/0 | 05/1759 |
STD | 01/0 | 10/0 | 79/342 | 01/0 | 10/0 | 70/348 |
کمینه | 77/0 | 70/0 | 31/878 | 77/0 | 70/0 | 78/900 |
25% | 79/0 | 78/0 | 54/1526 | 78/0 | 79/0 | 58/1489 |
50% | 80/0 | 88/0 | 41/1779 | 80/0 | 89/0 | 20/1747 |
75% | 81/0 | 98/0 | 66/2043 | 81/0 | 98/0 | 39/2024 |
بیشینه | 82/0 | 04/1 | 89/2496 | 82/0 | 04/1 | 72/2473 |
استانداردسازی
استانداردسازی یک روش پیشپردازش داده است که میتواند برای بهبود عملکرد الگوریتمهای یادگیری ماشین استفاده شود. این روش یک نوع تبدیل داده است که دادهها را به گونهای مقیاسبندی میکند که میانگین صفر و انحراف استاندارد 1 داشته باشند. این کار با کم کردن میانگین از هر نقطه داده و سپس تقسیم بر انحراف استاندارد انجام میشود. استانداردسازی میتواند به مقایسه بیشتر ویژگیهای مجموعه داده با یکدیگر کمک کند و یادگیری رابطه بین ویژگیها و متغیر هدف را برای الگوریتم آسانتر کند. استانداردسازی همچنین میتواند با سختتر کردن شرایط منجر به جلوگیری از برازش بیش از حد مدل روی دادههای آموزشی شود. بنابراین در این پژوهش، تمام خطوط لوله1 مدلسازی شامل کلاس StandardScaler میباشند که کلاسی در کتابخانه Scikit-Learn نرمافزار پایتون برای استانداردسازی ویژگیهای مجموعه دادهها قبل از مرحله پردازش دادهها است.
پردازش دادهها و آنالیز رگرسیون روی مجموعه دادههای واردات بخار پاکسازی شده
اعتبارسنجی متقاطع K لایه2
اثربخشی مدلهای یادگیری ماشین آموزش دیده و عملکرد آنها باید قبل از استقرار بهطور کامل ارزیابی شود. در این راستا، اعتبارسنجی متقاطع K لایه یک تکنیک ارزشمند است. در این تکنیک، مجموعه دادههای آموزشی بهطور تصادفی به گروههای k، به نام لایهها با اندازه تقریبا مساوی تقسیم میشوند. سپس در تقسیمهای k، یک لایه بهعنوان مجموعه اعتبارسنجی عمل میکند، درحالیکه مدل یادگیری ماشین روی لایههای k-1 باقیمانده آموزش داده میشود. سپس عملکرد مدل با میانگینگیری عملکرد آن در تمام لایهها محاسبه میشود (James et al., 2013).
با آموزش و ارزیابی مدل بر روی چندین زیرمجموعه متنوع از دادههای آموزشی، درک عمیقتری از عملکرد آن بر روی دادههای دیدهنشده بهدست میآید. این اطلاعات ارزشمند میتواند برای بهینهسازی فراپارامترهای مدل مورد استفاده قرار گیرد، در نتیجه قابلیتهای تعمیم آن را افزایش داده و آن را قادر میسازد تا با در نظر گرفتن مبادله بایاس- واریانس، بهطور موثر بر روی دادههای دیده نشده قبلی عمل کند. در این مطالعه از اعتبارسنجی متقاطع با تعداد لایه 5 برای ارزیابی عملکرد خطوط لوله مدلسازی در تقسیمبندیهای مختلف دادههای آموزشی استفاده گردید.
روشهای یادگیری ماشین و تنظیم فراپارامترها
برای یافتن بهترین روش یادگیری ماشین برای مدلسازی دادههای پاکسازی شده، روشهای یادگیری ماشین زیر در نظر گرفته شد. رگرسیون حداقل مربعات معمولی خطی3، رگرسیون چندجملهای ریج4، رگرسیون بردار پشتیبان5، رگرسیون تقویتکننده گرادیان6 و رگرسیون جنگل تصادفی7.
تمامی روشهای یادگیری ماشین ذکر شده به جز رگرسیون خطی حداقل مربعات معمولی دارای فراپارامترهایی هستند که باید برای بهینهسازی مدل و دستیابی به بهترین نتایج تنظیم شوند. فراپارامترها پارامترهای مدل یادگیری ماشین هستند که نمیتوان از دادهها یاد گرفت. آنها باید به صورت دستی یا با استفاده از روشهای مختلف از جمله جستجوی شبکهای8 یا بیزین9 تنظیم شوند.
برای تنظیم فراپارامترهای خطوط لوله مدلسازی، روش جستجوی شبکهای برای روش رگرسیون چندجملهای ریج انتخاب گردید، زیرا یک روش نسبتا ساده با تنها دو فراپارامتر است. روش جستجوی بیزین برای سایر روشهای یادگیری ماشین انتخاب شد، زیرا آنها مدلهای پیچیدهتری با تعداد فراپارامترهای بیشتری هستند. از روشهای تنظیم فراپارامتر و اعتبارسنجی متقابل برای یافتن بهترین مقادیر فراپارامترها با استفاده از کلاسهای GridSearchCV و BayesSearchCV در کتابخانه Scikit-Learn استفاده گردید. فضاهای جستجوی فراپارامتر و مقادیر بهینه برای روشهای یادگیری ماشینی فوق به تفصیل در بخش نتایج و بحث مورد اشاره قرار گرفتهاند.
جهت پایبندی به API امتیازدهی استانداردشده معرفی شده در Scikit-learn، هر دو الگوریتم جستجو از پارامتر امتیازدهی میانگین مربعات خطای منفی10 استفاده میکنند. اما حتی برای معیارهایی مانند MSE که باید به حداقل برسد، این مدلها برای به حداکثر رساندن معیارهای عملکرد طراحی شدهاند. در نتیجه، از آنجایی که به حداقل رساندن MSE معادل به حداکثر رساندن MSE منفی است، مقادیر MSE منفی میشوند.
خطوط لوله پس از تنظیم، با کل مجموعه داده آموزشی، آموزش داده شدند. سپس مدلهای بهدست آمده روی مجموعه دادههای آزمایشی با استفاده از معیارهای مناسب، ارزیابی شدند. این معیارهای ارزیابی با جزییات بیشتری در زیربخش ارزیابی مدلها مورد بحث قرار گرفتند.
ارزیابی دادهها
ارزیابی دادهها مرحله نهایی یادگیری ماشینی است که در آن عملکرد یک مدل آموزشدیده بر روی دادههای دیدهنشده ارزیابی میشود. این کار برای تعیین میزان تعمیم مدل به دادههای جدید انجام میشود. معیارهای مختلفی را میتوان برای ارزیابی عملکرد یک مدل یادگیری ماشین، بسته به نوع مشکلی که در تلاش برای حل آن است، استفاده کرد. علاوه بر مبادله بایاس/واریانس، که با استفاده از اعتبارسنجی متقاطع در مرحله مدلسازی در مجموعه داده آموزشی به آن پرداخته شد، مدلهای آموزشدیده نهایی نیز با استفاده از پارامترهای ضریب تعیین11، ریشه میانگین مجذور خطا12 و میانگین درصد خطای مطلق13 ارزیابی شدند.
نتایج
نتایج پردازش دادهها
در شکل (4) فضای جستجوی شبکهای درجه چندجملهای و مقدار آلفا در قالب یک نقشه حرارتی از میانگین نمرات آزمون برای روش رگرسیون چندجملهای ریج نشان داده شده است که در آن رنگهای روشنتر نشاندهنده میانگین نمرات آزمون بالاتر و رنگهای تیرهتر نشاندهنده میانگین نمرات آزمون پایینتر است. این نقشه حرارتی بهطور موثر مناطقی از فضای جستجوی شبکه را برجسته میکند که عملکرد برتر را برای روش رگرسیون چندجملهای ریج نشان میدهند. مقادیر فراپارامترهای بهینه شناسایی شده با استفاده از این رویکرد برای تولید بالاترین میانگین نمرات آزمون در جدول (5) نشان داده شدهاند که نشاندهنده اثربخشی آنها در افزایش عملکرد پیشبینی مدل رگرسیون چندجملهای ریج است.
شکلهای (5)، (6) و (7) بهبود تدریجی میانگین نمرات آزمون را در هر تکرار از الگوریتم جستجوی بیزین نشان میدهند و کارآیی الگوریتم را در دستیابی به فراپارامترهای بهینه در فضای جستجوی مشخص شده برای همه روشهای رگرسیون بهکار گرفته شده برجسته میکنند. الگوریتم جستجوی بیزین به خوبی در حداکثر تکرارهای مجاز 100 برای همه مدلها به همگرایی دست یافت. فراپارامترهای بهینه شناسایی شده در فضاهای جستجوی مدلها با استفاده از الگوریتم جستجوی بیزین در جداول (6)، (7) و (8) آورده شدهاند.
شکل 4. نقشه حرارتی میانگین امتیاز آزمون14 برای روش رگرسیون چندجملهای ریج
جدول 5. فضای جستجوی فراپارامترها و مقادیر تنظیم شده برای روش رگرسیون چندجملهای ریج
فراپارامتر | فضای جستجو | مقدار تنظیمشده |
درجه چندجملهای | 1-10 | 5 |
آلفا | 0-1 | 1/0 |
[1] Pipeline
[2] K-Fold Cross Validation
[3] Ordinary Least Squares Linear Regression
[4] Polynomial Ridge Regression
[5] Support Vector Regression
[6] Gradient Boosting Regression
[7] Random Forest Regression
[8] Grid Search
[9] Bayesian Search
[10] MSE
[11] Coefficient of Determination (R2)
[12] Root Mean Squared Error (RMSE)
[13] Mean Absolute Percentage Error (MAPE)
[14] Mean Test Score
شکل 5. تکامل میانگین امتیاز آزمون طی فرآیند بهینهسازی فراپارامترهای SVR
شکل 6. تکامل میانگین امتیاز آزمون طی فرآیند بهینهسازی فراپارامترهای رگرسیون تقویتکننده گرادیان
شکل 7. تکامل میانگین امتیاز آزمون طی فرآیند بهینهسازی فراپارامترهای رگرسیون جنگل تصادفی
جدول 6. فضای جستجوی فراپارامترها و مقادیر تنظیمشده برای روش رگرسیون بردار پشتیبان
فراپارامتر | فضای جستجو | مقدار تنظیمشده |
C | 01/0-600 | 76/418 |
اپسیلون | 005/0-1 | 95/0 |
کرنل | Linear, Poly, RBF, Sigmoid | RBF |
گاما | Scale, Auto | Scale |
جدول 7. فضای جستجوی فراپارامترها و مقادیر تنظیم شده برای روش رگرسیون تقویتکننده گرادیان
فراپارامتر | فضای جستجو | مقدار تنظیمشده |
تعداد تخمینگرها | 10-500 | 321 |
نرخ یادگیری | 01/0-1 | 0107/0 |
عمق بیشینه | 2-20 | 6 |
کمینه جداسازی نمونهها | 2-20 | 10 |
جدول8. فضای جستجوی فراپارامترها و مقادیر تنظیمشده برای روش رگرسیون جنگل تصادفی
فراپارامتر | فضای جستجو | مقدار تنظیمشده |
تعداد تخمینگرها | 10-1000 | 920 |
بیشینه عمق | 1-20 | 17 |
کمینه جداسازی نمونهها | 2-20 | 2 |
کمینه نمونه برگ | 1-20 | 5 |
بیشینه تعداد ویژگیها | Sqrt, Log2, None | Log2 |
بوت استرپینگ1 | True, False | False |
[1] Bootstrapping
همانطور که در شکل (8) و جدول (9) نشان داده شده است، روشهای مدلسازی مجموعهای1، مانند رگرسیون جنگل تصادفی و رگرسیون تقویتکننده گرادیان، در هر سه معیار عملکرد (R2، RMSE و MAPE) از سایر تکنیکها بهتر عمل کردند. در بین مدلهای رگرسیونی، مدل رگرسیون جنگل تصادفی بهترین و مدل رگرسیون خطی حداقل مربعات معمولی بدترین عملکرد را داشتند. عملکرد مدلهای رگرسیون چندجملهای ریج و رگرسیون بردارپشتیبان درجهای از شباهت را نشان دادند. مقایسه عملکرد بهترین و بدترین مدلهای یادگیری ماشینی در شکل (9) با استفاده از 50 نقطه نمونه تصادفی از مجموعه دادههای آزمایشی نشان داده شده است.
همانطور که در شکل (8) و جدول (9) نشان داده شده است، رگرسیون جنگل تصادفی بهعنوان روش با بهترین عملکرد در بین روشهای رگرسیون در نظر گرفته شده، ظاهر شد و بهترین امتیازها را در هر سه معیار عملکرد بهدست آورد. با این حال، همانطور که در شکل (10) و جدول (9) نشان داده شده است، همچنین طولانیترین زمان آموزش را نیز به خود اختصاص داد و به دنبال آن رگرسیون تقویتکننده گرادیان، تکنیک مدلسازی مجموعهای دیگر بهترین عملکرد و بالاترین زمان آموزش را داشت. در مقابل، مدلهای رگرسیون چندجملهای ریج و رگرسیون خطی حداقل مربعات معمولی زمانهای آموزش بسیار سریعتری را در مقایسه با مدلهای مجموعهای و مدل رگرسیون بردارپشتیبان نشان دادند. با این وجود، رگرسیون خطی حداقل مربعات معمولی بدترین عملکرد را نیز در سه معیار نشان داد. برعکس، رگرسیون چندجملهای ریج عملکرد قابل قبولی را نشان داد که قابل مقایسه با تکنیکهای مدلسازی مجموعهای و کاملا مشابه با مدل رگرسیون بردارپشتیبان بود. بنابراین در سناریوهایی که مدت زمان اجرا یک محدودیت حیاتی محسوب میشود، روش رگرسیون چندجملهای ریج میتواند جایگزین مناسبی برای رگرسیون جنگل تصادفی در نظر گرفته شود.
ارزیابی فرصتهای صرفهجویی انرژی
برای شناسایی فرصتهای صرفهجویی در مصرف انرژی در مجموعه دادههای واردات بخار پرفشار، از مدل رگرسیون جنگل تصادفی تنظیمشده استفاده شد، زیرا بالاترین کارآیی را در بین پنج مدل رگرسیون ارزیابیشده نشان داد. سپس تفاوت بین هر مقدار واردات بخار پرفشار و مقدار پیشبینیشده آن توسط مدل رگرسیون جنگل تصادفی محاسبه گردید. سپس، مقادیر واردات بخار پرفشار با درصد تغییری بیش از 5 درصد از مقادیر پیشبینیشده آنها استخراج شد و بهعنوان مقادیر واردات بخار پرفشار غیرکارآمد طبقهبندی گردید. بهطور مشابه، آنهایی که درصد تغییر کمتر از 5- درصد از مقادیر پیشبینیشده را داشتند، بهعنوان مقادیر واردات بخار پرفشار کارآمد استخراج شدند. سپس میانگین تفاوتهای واردات بخار پرفشار برای مجموعه دادههای وارداتی بخار پرفشار غیرکارآمد و کارآمد به مقدار 11/151 و 11/140- تن در روز محاسبه گردید. با جمع کردن مقدار مطلق این دو میانگین، فرصت صرفهجویی در واردات بخار پر فشار برابر با 22/291 تن در روز معادل 16 درصد از میانگین واردات بخار پرفشار واحد با توجه به توضیحات داده پاکسازیشده (جدول 1) محاسبه شد. اگر این فرصت صرفهجویی در بخار پرفشار محقق شود، منجر به جلوگیری از انتشار تقریبا 38 تن CO2 در روز توسط تامینکننده بخار پرفشار معادل 37/0 درصد از ظرفیت اسمی تولید بخار پرفشار تامینکننده خواهد شد. این صرفهجویی را میتوان با مدیریت بهتر واردات بخار واحد مورد مطالعه و نزدیک کردن مقادیر واقعی واردات بخار پرفشار به مقادیر کارآمد بهدست آورد. مقدار 5 درصد بهعنوان حد پذیرش تغییر درصد قابل قبول انتخاب گردید تا محدودیتهای کلی مدلهای یادگیری ماشین در نظر گرفته شود.
[1] Ensemble Modeling Methods
شکل 8. نتایج پارامترهای ارزیابی برای مدلهای رگرسیون یادگیری ماشین
جدول 9. مقایسه نتایج پارامترهای ارزیابی برای مدلهای رگرسیون یادگیری ماشین
مدت زمان پردازش (ثانیه) | MAPE | RMSE | R2 | مدل رگرسیون یادگیری ماشین |
300 | 54/5 | 12/121 | 88/0 | جنگل تصادفی |
208 | 85/5 | 52/130 | 86/0 | تقویتکننده گرادیان |
162 | 55/6 | 89/145 | 82/0 | بردارپشتیبان |
2 | 67/6 | 62/145 | 82/0 | چندجملهای ریج |
1/0 | 77/7 | 44/167 | 77/0 | حداقل مربعات معمولی خطی |
شکل 9. مقایسه عملکرد بهترین و بدترین مدل یادگیری ماشین با مقادیر واقعی در یک نمونه شامل50 نقطه داده
شکل 10. مدت زمان پردازش دادهها برای روشهای یادگیری ماشین
بحث و نتیجهگیری
با توجه به سوابق تحقیقاتی بررسی شده در این پژوهش و شناسایی خلاء تحقیقاتی در حوزه مدلسازی کاهش واردات بخار در واحدهای پتروشیمی و بهطور خاص واحدهای تولید اتیلناکساید/اتیلنگلایکول، یک چارچوب جدید پردازش داده و مدلسازی با دقت بالا برای پیشبینی مبتنی بر یادگیری ماشین واردات بخار پرفشار در یک واحد پتروشیمی EO/EG ارایه گردید. هدف این چارچوب، دستیابی به پیشبینیهای با دقت بالا با استفاده از روش یادگیری ماشین بود. مجموعه دادههای تاریخی خام، شامل پنج سال داده عملیاتی روزانه واحد تحت یک کاتالیست EO با فعالیت بالا، از سیستم کنترل گسترده واحد1 بازیابی شد. این مجموعه دادهها شامل تولید روزانه گلیکول، واردات روزانه اکسیژن و اتیلن و واردات روزانه بخار پرفشار بود. با استفاده از نرمافزار پایتون 3، مجموعه داده جدیدی ساخته شد که شامل ظرفیت تولید روزانه واحد محاسبه شده از تولید روزانه گلیکول و گزینشپذیری کاتالیست روزانه محاسبه شده از واردات روزانه اکسیژن و اتیلن بهعنوان متغیرهای ویژگی و همچنین واردات روزانه بخار پرفشار بهعنوان متغیر هدف بود. سپس مجموعه دادهها تحت یک مرحله پیشپردازش جامع قرار گرفت تا از کیفیت و ثبات مجموعه دادهها پیش از ورود به مرحله پردازش اطمینان حاصل شود.
در مرحله پردازش دادهها، روشهای رگرسیون مختلفی از جمله رگرسیون جنگل تصادفی، رگرسیون تقویتکننده گرادیان، رگرسیون بردارپشتیبان، رگرسیون چندجملهای ریج و حداقل مربعات معمولی خطی برای انتخاب بهترین مدل در نظر گرفته شد و فراپارامترهای آنها با استفاده از الگوریتمهای جستجوی شبکهای و بیزین با کمک کتابخانههای ماژول سایکیت لرن تنظیم گردید. نتایج ارزیابی دادهها نشان داد روش رگرسیون جنگل تصادفی در سه معیار عملکرد R2، MAPE و RMSE بهتر از سایر روشها عمل میکند. با این حال، مدل رگرسیون جنگل تصادفی طولانیترین زمان را برای آموزش به خود اختصاص داد. از سوی دیگر، رگرسیون چندجملهای ریج عملکرد قابل قبولی، قابل مقایسه با تکنیکهای مدلسازی مجموعه ای و کاملا مشابه رگرسیون بردارپشتیبان نشان داد. بنابراین، رگرسیون چندجملهای ریج میتواند جایگزین مناسبی برای رگرسیون جنگل تصادفی در پروژههایی باشد که مدت زمان پردازش یک محدودیت حیاتی است. همچنین، با بهکارگیری مدل رگرسیون جنگل تصادفی بهینه شده، فرصت تقریبی 291 تن در روز صرفهجویی در واردات بخار پرفشار معادل 16 درصد از میانگین واردات بخار پرفشار واحد از طریق راهبردهای مدیریت واردات بخار پیشرفته شناسایی گردید. دستیابی به این فرصت صرفهجویی در بخار پرفشار منجر به جلوگیری از انتشار تقریبا 38 تن CO2 در روز توسط تامینکننده بخار پرفشار میشود که معادل 37/0 درصد از ظرفیت اسمی تولید بخار پرفشار است.
در حال حاضر روش مدلسازی پیشنهاد شده در این پژوهش در حال یکپارچهسازی در چارچوب سیستم مدیریت انرژی2 واحد مورد مطالعه میباشد تا واردات بخار پرفشار کارآمد روزانه واحد بر اساس گزینشپذیری و ظرفیت تولید روزانه واحد مورد مطالعه بهطور دقیق محاسبه گردیده و با مقدار بخار پرفشار واقعی روزانه مقایسه و درصد تغییر از مقدار کارآمد محاسبه گردد. با نظارت بر درصد تغییرات روزانه، افزایش میزان واردات بخار پرفشار قابل تشخیص بوده و امکان اجرای سریع اقدامات اصلاحی در سیستم بخار برای کاهش واردات بخار و نزدیکتر کردن آن به مقدار کارآمد، مسیر خواهد گردید.
بهعنوان بخشی از تلاشهای تحقیقاتی آینده، ادغام این چارچوب مدلسازی در سیستم اینترنت اشیاء صنعتی3 واحد بهطور کامل مورد بررسی قرار خواهد گرفت تا قابلیتهای شناختی و هوشمند، بهویژه با استفاده از روش رگرسیون چندجملهای ریج بهدلیل مزیت آن در کاهش قابل توجه زمان پردازش با حفظ کارآیی قابل قبول، به آن داده شود.
منابع
Ahmadi, A., Noorpoor, A.R., Kani, A.R. and Saraei, A. (2021) Modeling and Economic analysis of MED-TVC desalination with Allam Power Plant Cycle in Kish Island. Iran. Iranian Journal of Chemistry and Chemical Engineering, 40(6): 1882.
Hauke, J. and Kossowski, T. (2011) Comparison of values of Pearson's and Spearman's correlation coefficients on the same sets of data. Quaestiones Geographical, 30(2): 87-93.
James, G.M., Witten, D., Hastie, T. and Tibshirani, R. (2013) An Introduction to Statistical Learning, Springer, p. 181.
Mhlanga, D. (2021) Artificial intelligence in the industry 4.0, and its impact on poverty, innovation, infrastructure development, and the sustainable development goals: Lessons from emerging economies. Sustainability, 13(5788): 1-16.
Moghadasi, M., Izadyar, N., Moghadasi, M. and Ghadamian, H. (2021) Applying machine learning techniques to implement the technical requirements of energy management systems in accordance with ISO 50001: 2018, an industrial case study. Energy Sources, Part A: Recovery, Utilization, and Environmental Effects, Dec 20, pp.1-8.
Moghadasi, M., Ozgoli, H.A. and Farhani, F. (2021) Steam consumption prediction of a gas sweetening process with methyldiethanolamine solvent using machine learning approaches. International Journal of Energy Research, 45(1): 879-93.
Qian, Y.Y., Chen, R.L., Chen, J.J. and Ding, G.R. (2016) Analysis of the production and market of Ethylene Oxide in China. Chemical Industry, 34(2): 46-48.
Rahimpour, M.R., Shayanmehr, M. and Nazari, M. (2011) Modeling and simulation of an industrial Ethylene Oxide (EO) reactor using Artificial Neural Networks (ANN). Industrial and Engineering Chemistry Research, 50(10): 6044-6052.
Sharifara, E., Abbaspour, M. and Saraei, A. (2024) Analysis of the high‐pressure steam import behavior of an integrated ethylene oxide/ethylene glycol petrochemical plant under different production scenarios. The Canadian Journal of Chemical Engineering, 102(4): 1538-1557.
Shell International Chemicals, Shell Research and Technology Centre Amsterdam, EO/EG Process and Site Support. (2023) Shell EO/EG Process Design Package.
Statista. (2023) Retrieved from https://www.statista.com/statistics/1245260/ethylene-oxide-market-volume-worldwide/
Zahedi, G., Lohi, A. and Mahdi, K.A. (2011) Hybrid modeling of Ethylene-to-Ethylene Oxide heterogeneous reactor. Fuel Processing Technology, 92(9): 1725-1732.
Zapf, F. and Wallek, T. (2022) Case-study of a flowsheet simulation using deep-learning process models for multi-objective optimization of petrochemical production plants. Computers and Chemical Engineering, 162: 107823.
Zendehboudi, S., Rezaei, N. and Lohi, A. (2018) Applications of hybrid models in chemical, petroleum, and energy systems: A systematic review. Applied Energy, 228: 2539-2566.
Zendehboudi, S., Zahedi, G., Bahadori, A., Lohi, A., Elkamel, A. and Chatzis, I. (2014) A dual approach for modelling and optimisation of industrial urea reactor: Smart technique and grey box model. The Canadian Journal of Chemical Engineering, 92(3): 469-485.
[1] DCS
[2] ISO-50001
[3] Industrial Internet of Things
Application of Machine Learning Methods for Modeling Steam Import Reduction aimed at Energy Resources Managment
Ehsan Sharifara1, Madjid Abbaspour2* and Alireza Saraei3
1) Ph.D. Candidate in Energy Systems Engineering, Faculty of Natural Resources and Environment, Science and Research Branch, Islamic Azad University, Tehran, Iran.
2) Professor at School of Mechanical Engineering, Sharif University of Technology, Tehran, Iran. *Corresponding Author Email Address: abbpor@sharif.edu
3) Assistant Professor at Department of Mechanical Engineering, Islamic Azad University, South Tehran Branch, Tehran, Iran.
Date of Submission: 2024/03/01 Date of Acceptance: 2024/05/20
Abstract
Integrated Ethylene Oxide/Ethylene Glycol (EO/EG) plants are major energy consumers, particularly in High-Pressure Steam (HPS) usage. This study proposes a data processing and modeling framework for high-accuracy machine learning modeling to predict the HPS import of an EO/EG petrochemical plant. The study employed Python3 and analyzed raw historical data from the plant's DCS, spanning five years of operation under the same EO catalyst. Daily feed and glycol production data were used to calculate catalyst selectivity and the plant's production capacity as models’ input features, while HPS import served as the models’ output target. Various regression algorithms were evaluated to select the best model for this case study, with their hyperparameters tuned using Grid Search and Bayesian Search algorithms. Random forest regression outperformed other methods in R2, MAPE, and RMSE metrics but had the longest training time. Polynomial ridge regression was a suitable choice considering both time consumption and performance. The tuned random forest regression model revealed an approximate 291 Tonne/Day potential for HPS import savings equivalent to 16% of the plant’s average HPS import through enhanced steam import management strategies. Adopting this HPS saving measure would enable the HPS supplier to avert 38 tonnes of CO2 emissions daily equivalent to 0.37% of its nominal HPS generation capacity. Our methodology in this paper can be applied to other EO/EG plants and is currently being integrated into the plant's energy management system, enabling continuous monitoring of steam import behavior relative to catalyst and plant performance.
Keywords: Energy conservation opportunity, Energy modeling, Machine learning, Steam consumption prediction.