بکارگیری دانش مدیریت پروژه و الگوریتم هیبریدی در پیشبینی زمان و هزینه تکمیل پروژههای سدسازی
الموضوعات :رضا بخشی 1 , سینا فرد مرادی نیا 2 , رسول جانی 3 , رامین وفائی پور سرخابی 4
1 - گروه مهندسي عمران، واحد تبريز، دانشگاه آزاد اسلامي، تبریز، ايران
2 - گروه مهندسي عمران، واحد تبريز، دانشگاه آزاد اسلامي، تبریز، ايران
3 - گروه مهندسي عمران، واحد تبريز، دانشگاه آزاد اسلامي، تبریز، ايران
4 - گروه مهندسي عمران، واحد تبريز، دانشگاه آزاد اسلامي، تبریز، ايران
الکلمات المفتاحية: الگوریتم هیبریدی, ارزش کسب شده, پیش¬بینی هزینه, سد سازی ,
ملخص المقالة :
مقدمه: یکی از وظایف مدیر پروژه، کنترل پروژه با استفاده از دو فاکتور زمان و هزینه میباشد. این دو اهرم از مهمترین کلیدهای کنترلی پروژه به منظور استفاده بهینه از منابع میباشد.
روش: در این تحقیق روش جدیدی با بکارگیری ارزش کسب شده و الگوریتمهای هیبریدی برای پیشبینی زمان و هزینه تکمیل پروژههای سد سازی توسعه داده شد. برای این منظور گزارشات مالی و زمانبندی پنج سد A، B، C، D و E گردآوری شدند. ارزش کسب شده، پیشرفت واقعی، برنامه کسب شده و هزینه واقعی برای هر ماه از گزارشات این سدها استخراج شد. سپس از پارامترهای چهار سد (A تا D) به عنوان ورودی در توسعه مدلهایی برای پیشبینی زمان با استفاده از الگوریتم حداقل مربعات ماشین بردار پشتیبان (LSSVM) و تلفیق شده با الگوریتمهای بهینهسازی ازدحام ذرات (PSO) و ژنتیک (GA) استفاده گردید.
یافته ها: مقایسه نتایج حاصل از این مدلهای در مرحله آموزش نشان داد که الگوریتم LSSVM-PSO از دقت بالاتری برخوردار است. در ادامه برای توسعه مدل پیشبینیکننده هزینه با استفاده از الگوریتمهای هیبریدی علاوه بر پارامترهای ورودی استفاده شده در مرحله، زمان پیشبینی شده توسط مدلها نیز به عنوان ورودی الگوریتمها تعریف شد. مقایسه نتایج این مرحله نیز نشان داد که الگوریتم LSSVM-PSO از دقت بالاتری نسبت به سایر مدلها برخوردار است. در ادامه برای اعتبارسنجی مدلهای توسعه داده شده، این مدلها برای پیشبینی زمان و هزینه در پروژه ساخت سد E استفاده شد. نتایج نشان داد که الگوریتم LSSVM-PSO نسبت به سایر الگوریتمهای هیبریدی از دقت بالاتری در تخمین زمان اتمام پروژه برخوردار است که نشان دهنده قابلیت تعمیم بالای این مدل برای پیشبینی زمان سایر پروژههای ساخت سد است. این در حالی است که برخلاف انتظار این مدل از دقت کمتری در پیشبینی هزینه اتمام پروژه ساخت سد E نسبت به مدل MLP-PSO برخوردار است که نشان میدهد پیشبینی هزینه از پیچیدگی بالاتری برخوردار است و بکارگیری مدلها در این مسئله بایستی با احتیاط بیشتری صورت گیرد. برای ارزیابی بیشتر نتایج مدلهای هیبریدی از روش احتمالاتی فیلتر کالمن نیز برای پیشبینی زمان و هزینه پروژه استفاده شد که نتایج آن حاکی از دقت بالاتر مدلهای حاصل از الگوریتمهای هیبریدی است.
نتیجه گیری: مدل LSSVM-PSO میتواند با دقت بالاتری نسبت به روشهای مرسوم به پیشبینی زمان و هزینه پروژه بپردازد.
1. Gowan, J. A., Mathieu, R. G., & Hey, M. B. 2006. Earned value management in a data warehouse project. Information management & computer security, 14(1), 37-50.
2. Attalla, M., & Hegazy, T. (2003). Predicting cost deviation in reconstruction projects: Artificial neural networks versus regression. Journal of construction engineering and management, 129(4), 405-411.
3. Kim, G. H., An, S. H., & Kang, K. I. 2004. Comparison of construction cost estimating models based on regression analysis, neural networks, and case-based reasoning. Building and environment, 39(10), 1235-1242.
4. Wilmot, C. G., & Mei, B. 2005. Neural network modeling of highway construction costs. Journal of construction engineering and management, 131(7), 765-771.
5. Kim, B. C., & Reinschmidt, K. F. 2010. Probabilistic forecasting of project duration using Kalman filter and the earned value method. Journal of Construction Engineering and Management, 136(8), 834-843.
6. Sonmez R. 2011. Range estimation of construction costs using neural networks with bootstrap prediction intervals. Expert Syst Appl.; 38(8):9913–7.
7. Wang Y-R, Yu C-Y, Chan H-H. 2012. Predicting construction cost and schedule success using artificial neural networks ensemble and support vector machines classification models. Int J Proj Manag.30(4):470–8.
8. Cheng M-Y, Hoang N-D, Roy AF V, Wu Y-W. 2012. A novel time-depended evolutionary fuzzy SVM inference model for estimating construction project at completion. Eng Appl Artif Intell. 25(4):744–52.
9. Wauters M, Vanhoucke M. 2014. Support vector machine regression for project control forecasting. Autom Constr.47:92–106.
10. Kim B-C. 2015. Integrating risk assessment and actual performance for probabilistic project cost forecasting: a second moment Bayesian model.IEEE Trans Eng Manag. 62(2):158–70.
11. Mortaji STH, Noorossana R, Bagherpour M. 2015. Project completion time and cost prediction using change point analysis. J Manag Eng. 31(5):4014086.
12. Akhbari M. 2018. Project time and cost forecasting using monte carlo simulation and artificial neural networks. Int J Ind Eng Prod Res. 29(2):231–9.
13. Jiang Q. 2019. Estimation of construction project building cost by back-propagation neural network. J Eng Des Technol.
14. Najafi S, Moosavirad SH, Ariafar S. 2019. Predicting the project time and costs using EVM based on gray numbers. Eng Constr Archit Manag.
15. Soltan S, Ashrafi M. 2020. Predicting project duration and cost, and selecting the best action plan using statistical methods for earned value management. J Proj Manag. 5(3):157–66.
16. Khalaf TZ, Çağlar H, Çağlar A, Hanoon AN. 2020. Particle swarm optimization based approach for estimation of costs and duration of construction projects. Civ Eng J.6(2):384–401.
17. Asadabadi MR, Zwikael O. 2021. Integrating risk into estimations of project activities’ time and cost: A stratified approach. Eur J Oper Res. 291(2):482–90.
18. Bakhshi R, Moradinia SF, Jani R, Poor RV. 2022. Presenting a Hybrid Scheme of Machine Learning Combined with Metaheuristic Optimizers for Predicting Final Cost and Time of Project. KSCE J Civ Eng.1–16.
19. Anemangely M, Ramezanzadeh A, Tokhmechi B, Molaghab A, Mohammadian A. 2018. Drilling rate prediction from petrophysical logs and mud logging data using an optimized multilayer perceptron neural network. J Geophys Eng.15(4):1146–59.
20. Mehrad M, Bajolvand M, Ramezanzadeh A, Neycharan JG. 2020. Developing a new rigorous drilling rate prediction model using a machine learning technique. J Pet Sci Eng.192:107338.
21. Sabah M, Mehrad M, Ashrafi SB, Wood DA, Fathi S. 2021. Hybrid machine learning algorithms to enhance lost-circulation prediction and management in the Marun oil field. J Pet Sci Eng.198:108125.
22. Kennedy J, Eberhart R. 1995. Particle swarm optimization. In: Proceedings of ICNN’95-international conference on neural networks. IEEE. p. 1942–8.
23. Czarnigowska A. 2008. Earned value method as a tool for project control. Bud i Archit.3(2):15–32.
24. Lipke W. 2014. Introduction to earned schedule. PM World J.3(11):8–9.
25. Kim B-C, Reinschmidt KF. 2011. Combination of project cost forecasts in earned value management. J Constr Eng Manag. 137(11):958–66.
26. Wang, H. and Hu, D., 2005. October. Comparison of SVM and LS-SVM for regression. In 2005 International conference on neural networks and brain (Vol. 1, pp. 279-283). IEEE.
27. Welch G, Bishop G. 1995. An introduction to the Kalman filter.
28. Suykens JAK, Vandewalle J. 1999. Least squares support vector machine classifiers. Neural Process Lett. 9(3):293–300.
29. Vapnik V. 2013. The nature of statistical learning theory. Springer science & business media.
30. Duan K, Keerthi SS, Poo AN. 2003. Evaluation of simple performance measures for tuning SVM hyperparameters. Neurocomputing. 51: 41–59.
31. Couceiro, M., Ghamisi, P., Couceiro, M. and Ghamisi, P., 2016. Particle swarm optimization. Fractional order darwinian particle swarm optimization: Applications and evaluation of an evolutionary algorithm, pp.1-10.
32. Coello CAC, Lamont GB, Van Veldhuizen DA. 2007. Evolutionary algorithms for solving multi-objective problems. Vol. 5. Springer.
33. Clerc M. 2010. Particle swarm optimization. Vol. 93. John Wiley & Sons.
Water Resources Engineering Journal Summer 2024. Vol 17. Issue 61
Research Paper | |
Applying project management knowledge and hybrid algorithm in predicting the time and cost of completing dam projects | |
Reza Bakhshi1, Sina Fard Moradinia*1,2, Rasool Jani1,2, Ramin Vafaei Poor Sorkhabi1,2 1. Department of Civil Engineering, Tabriz Branch, Islamic Azad University, Tabriz, Iran 2. Robotics and Soft Technologies Research Center, Tabriz Branch, Islamic Azad University, Tabriz, Iran | |
Received: 2022/12/10 Revised: 2023/01/16 Accepted: 2024/01/06 | Abstract Introduction: Precisely predicting the time and cost of completing projects is vital because the lack of a proper estimation will be accompanied by an irrational upsurge in the exact execution costs compared to the set budget. Using the earned value method (EVM) to predict the time and cost of projects is prevalent. However, using this method alone highlights good accuracy in predicting time and cost of projects. Consequently, models based on EVM were developed. Methods: The present article was developed using the EVM method and hybrid algorithms to predict the time and cost of completing projects. To attain this goal, the data from four dams, A, B, C, and D, were used to build models, and the data of the under-construction dam E were used to validate the models resulting from the modeling stage. To this end, the parameters earned schedule (Month), earned value ($), actual progress (%), and actual cost (%) are used as inputs for predicting time and for predicting cost, as well as these parameters, time is also defined as input of hybrid algorithms. Findings: Comparing the consequences of the hybrid algorithms in the training and test stage designates the high accuracy of the LSSVM-PSO model compared to the LSSVM-GA. The low variance in the error values of these two stages for this model suggests its high generalization ability on unseen data. The use of these hybrid models in forecasting the time for the E dam gave a prior warning for the delay in the completion of the project in the first month. Likewise, in cost predicting, the LSSVM-PSO and LSSVM-GA models issued an early warning in the seventh and ninth months, respectively, for the non-conformity of the project cost with the planned cost. This is while the Kalman filter stated the primary warning to predict the project's completion time in the seventh month, and this model gave no warning regarding the planned cost. Comparing these results with the periodical reports of the E dam construction project designates the excellent performance of hybrid models, particularly the LSSVM-PSO model.
|
Use your device to scan and read the article online
| |
Keywords: Hybrid algorithm, EDAC, Kalman filter, Cost prediction, Dam construction | |
Citation: Reza Bakhshi, Sina Fard Moradinia, Rasool Jani, Ramin Vafaei Poor Sorkhabi. Applying project management knowledge and hybrid algorithm in predicting the time and cost of completing dam projects. Water Resources Engineering Journal. 2024; 17 (61): 65- 85. | |
Corresponding author: Sina Fard Moradinia Address: 1. Department of Civil Engineering, Tabriz Branch, Islamic Azad University, Tabriz, Iran. 2. Robotics and Soft Technologies Research Center, Tabriz Branch, Islamic Azad University, Tabriz, Iran Tell: +989143142619, https://orcid.org/0000-0003-3539-7311 Email: fardmoradinia@iaut.ac.ir |
Extended Abstract
Introduction
It is hard to complete a project on time with a planned cost. Project monitoring and control include project progress processes so that potential problems are recognized over time and, if indispensable, operations are considered to resolve them. To this end, it is essential to frequently measure and evaluate the project performance and determine its variance from the planned baseline. The primary prediction before the start of the project is considered the basic plan for completing the project in the indicated time and budget. From the time the project starts, the project performance is assessed in line with time and cost compared to the initial plan. The challenges in construction projects have obliged project managers to use techniques and models to control and predict their cost and time. According to this forecast, the project manager determines that the project needs minor alteration or significant adjustment and problem-solving. Though, advanced techniques are not used for this aim. This leads to not correctly forecasting the cost and completion time of the projects and, as a result, inappropriate control of the project. Consequently, numerous researchers have used statistical analysis methods such as multiple regression, methods based on probabilities such as Monte Carlo simulation, and methods based on artificial intelligence.
Materials and Methods
To carry out this study, information on four dam projects' timing and costs built in different regions of Iran was collected. Because of the confidentiality of their information, these dams were named A, B, C, and D. These dams have a total of 383 data points that were considered for the training of intelligent hybrid models and 306 data points (80% of the total data) were considered for the training stage and 77 data points (20% of the total data) for the hybrids model test. Data from another dam (dam E) will also validate the models. Fifteen months have passed since the construction of the E dam began, and the progress report for the fifteenth month has been submitted. Consequently, there are 15 data points available for this dam. Based on the plan and preliminary design presented, the complete construction of this dam will take about 31 months and cost about 590,146.82 dollars. Accompanied by LSSVM-GA and LSSVM-COA hybrid models, the Kalman filter will also be used to forecast the completion time and cost of the E project. To apply these models, it is essential to calculate the obtained value indices for the collected data.
Findings
Cumulative distribution functions (CDFs) have been used in the article to designate the input and output data (time and cost forecast). CFD for Earned Schedule (ES) is about 22% for ES < 6.6 and about 53% for 6.6 < ES < 37.8, 28% for EV < 209323, and about 56% for 209323 < EV < 14020973 and for the rest of the data this value, EV > 14020973 is about 16%. The CFD value for Time (t) as t < 14 is about 14%, and for 14 < t < 85, it is about 54%, and for the rest of the data, this value for t > 85 is about 32%. The value of CFD for Cost Ratio (CR) as CR < 0.039 is about 18%, and for 0.039 < CR < 0.666, it is about 65%, and for the rest of the data, this value of ES > 0.666 is about 17%. Regarding this analysis, CFDs are usually distributed for four variables ES, EV, t, and CR.
The CFD value for Actual Progress (AP) in the form of AP < 0.0027 is about 33%, and for 0.0027 < AP% < 0.037, it is about 60%, and for the rest of the data, this value AP > 0.037 is about 7%. The value of CFD for Actual Cost (AC) as AC < 0.0015 is about 35%, and for 0.0015 < AC < 0.058, it is about 79%, and for the rest of the data, this value AC > 0.058 is about 4%. According to this analysis, CFDs are not generally distributed for these two parameters.
Discussion
To do modeling, first, the type of kernel function must be determined for the LSSVM algorithm. Applying simple LSSVM with diverse kernel functions based on the RMSE criterion disclosed that LSSVM with RBF kernel function has higher accuracy in estimating cost ratio and EDAC than other kernel functions. On the other hand, it can be understood that the error of models with RBF and MLP kernel functions is meaningfully less than models with Polynomial and Linear kernel functions. This shows that there is a complex nonlinear relationship between inputs and outputs.
By setting the controllable parameters of PSO and GA optimization algorithms and applying hybrid LSSVM with these algorithms on the training data, it was shown that both optimization algorithms converged to the solution in less than 50 iterations. The cross-diagram evaluation of LSSVM-PSO and LSSVM-GA algorithms revealed that both models have high performance in the training and testing stages. The results attained by applying these algorithms to the validation data also have good accuracy. However, the dispersion of data points in this stage is more than in the training and test stages. Comparing the RMSE values for LSSVM-PSO and LSSVM-GA algorithms in estimating the completion time of projects by stages designates that the error of LSSVM-PSO in all three stages of training, testing, and validation is lower than LSSVM-GA. Furthermore, the slight difference between the error values in this model's two training and testing stages compared to LSSVM-GA shows the ability to generalize this model to other projects or unseen data. The higher accuracy of the LSSVM-PSO model compared to LSSVM-GA in the validation stage approves this claim.
The predicted EDAC profile based on LSSVM-PSO and LSSVM-GA hybrid models for the validation data (E dam project) indicated that the lower limit values predicted by both algorithms are more than planned. This shows that the project did not proceed according to the plan in the first month. Examining the reports of this project has also designated the same. Both algorithms mutually cover the project's completion time of 52 to 62 months from its initiation. Indeed, the output value of LSSVM-PSO and LSSVM-GA models show the project completion time as 57 and 59 months, respectively.
Scrutinizing the distribution of data points in the cross diagram of the actual and predicted cost ratio values of LSSVM-PSO and LSSVM-GA hybrid models for training, testing, and validation stages revealed that both models perform well in target parameter prediction. However, the LSSVM-GA model performed better in the test phase. The comparison of the error values of these models by stages shows that the LSSVM-PSO model has a better performance than the other model. The slight variance between the error values of the training and testing stages in the LSSVM-PSO model compared to the LSSVM-GA model is indicative of the ability to generalize the model to other projects, and the excellent performance of this model in the validation stage confirms this statement.
The projected cost profile for the E dam construction project based on EDAC was calculated with the help of LSSVM-PSO and LSSVM-GA models. Regarding the lower error of the LSSVM-PSO model compared to the LSSVM-GA model in these two stages, the range of changes between the lower and upper limits is smaller. Based on these calculations, the LSSVM-PSO model has issued an initial warning in the seventh month for the project cost to be far from the planned cost. This is while the results of the LSSVM-GA model issued this initial warning in the ninth month. The continuance of the forecasting process likewise reveals that the tools used by the project manager could not issue this initial warning to revise the operational plan. According to the construction reports review of this dam, the managers have confirmed the increase in the costs of the termination of the operation in the 13th month since the beginning of the project.
The probability profile of EDAC and the cost obtained from the Kalman model for project E disclosed that regarding this model's output, the project's completion time up to the fifth month from the start time was according to the plan. Nonetheless, over time, the predicted completion time is significantly different from the planned time for the project, so in the seventh month, the model issues an initial warning for taking more time to complete the project than the planned time. The output of the Kalman model for the cost of completing the project is in line with the planned cost, but from the tenth month onwards, the cost projected by the model gradually deviates from the planned cost. This model has not issued any warning for irretrievable deviation of the project completion cost from the planned cost.
Conclusion
The current study used LSSVM-PSO and LSSVM-GA hybrid algorithms to predict project completion time and cost. The data from four built dams were used to develop these models. These data were divided into training data (80% of the total data) and test data (20% of the total data). The data of another dam, whose progress report was submitted until the 15th month, was used to validate the developed models. Next, the Kalman filter was used for the validation data to evaluate the hybrid models in time and cost prediction.
Using hybrid algorithms revealed that they have good accuracy in the model training and testing phase to predict the time and cost of completing the projects. Likewise, the low difference between the LSSVM-PSO model in these two stages indicated the high generalizability of this model compared to the LSSVM-GA model, which was confirmed by the excellent performance of this model in the validation stage. Regarding the results of applying these two models on the E dam for EDAC, it was found that the LSSVM-PSO and LSSVM-GA models predicted the impossibility of completing the project within the planned period by announcing the early warning in the first month. This finding is in line with the periodic reports recorded for this project. The result of applying these two models for cost prediction also disclosed the better performance of the LSSVM-PSO model in the training and test stages. The low error variance between the training and test stages also showed the high generalization capability of this model compared to the LSSVM-GA model on unseen data. Applying these models to the E dam data strongly confirmed this claim. The early warning for the deviation of the project completion cost from the planned cost for the E dam in the LSSVM-PSO and LSSVM-GA models was issued in the seventh and ninth months, respectively. Based on the output of the LSSVM-PSO and LSSVM-GA model, the completion time of the E dam project is predicted to be 57 and 59 months, respectively, and the completion cost is 1014000 and 1054000 dollars, respectively. In the meantime, the result of applying the Kalman filter in the time prediction on the validation data announces the initial warning for schedule delay in the seventh month. However, it does not announce a warning for increasing the project cost more than the planned program's cost. The Kalman model predicts the completion time and cost of the E dam project in the 15th month as 52 months and 623 thousand dollars, respectively.
Comparing the hybrid models with the Kalman model discloses that the hybrid models have more acceptable results with the periodic reports provided for the E project due to the training based on several dams' data. Unquestionably, it should be noted that regarding the delays that were used in several projects in the training phase of hybrid models, the resulting models are very conservative. This is while the Kalman model was developed only based on the project's limited data and past trends. Consequently, using hybrid models, particularly LSSVM-PSO, is exceedingly recommended to predict the time and cost of project completion.
Ethical Considerations compliance with ethical guidelines
The cooperation of the participants in the present study was voluntary and accompanied by their consent.
Funding
No funding.
Conflicts of interest
The authors declared no conflict of interest.
مقاله پژوهشی | |
بکارگیری دانش مدیریت پروژه و الگوریتم هیبریدی در پیشبینی زمان و هزینه تکمیل پروژههای سدسازی | |
رضا بخشی1، سینا فرد مرادی نیا1و2*، رسول جانی1و2 ، رامین وفائیپور سرخابی1و2 1-گروه مهندسي عمران، واحد تبريز، دانشگاه آزاد اسلامي، تبریز، ايران 2- مرکز تحقیقات رباتیک و فناوریهای نرم، واحد تبریز ، دانشگاه آزاد اسلامي، تبريز، ايران | |
تاریخ دریافت: 19/09/1401 تاریخ داوری: 26/10/1401 تاریخ پذیرش: 16/10/1402 | چکیده روش: در این تحقیق روش جدیدی با بکارگیری ارزش کسب شده و الگوریتمهای هیبریدی برای پیشبینی زمان و هزینه تکمیل پروژههای سد سازی توسعه داده شد. برای این منظور گزارشات مالی و زمانبندی پنج سد A، B، C، D و E گردآوری شدند. ارزش کسب شده، پیشرفت واقعی، برنامه کسب شده و هزینه واقعی برای هر ماه از گزارشات این سدها استخراج شد. سپس از پارامترهای چهار سد (A تا D) به عنوان ورودی در توسعه مدلهایی برای پیشبینی زمان با استفاده از الگوریتم حداقل مربعات ماشین بردار پشتیبان (LSSVM) و تلفیق شده با الگوریتمهای بهینهسازی ازدحام ذرات (PSO) و ژنتیک (GA) استفاده گردید. یافتهها: مقایسه نتایج حاصل از این مدلهای در مرحله آموزش نشان داد که الگوریتم LSSVM-PSO از دقت بالاتری برخوردار است. در ادامه برای توسعه مدل پیشبینیکننده هزینه با استفاده از الگوریتمهای هیبریدی علاوه بر پارامترهای ورودی استفاده شده در مرحله، زمان پیشبینی شده توسط مدلها نیز به عنوان ورودی الگوریتمها تعریف شد. مقایسه نتایج این مرحله نیز نشان داد که الگوریتم LSSVM-PSO از دقت بالاتری نسبت به سایر مدلها برخوردار است. در ادامه برای اعتبارسنجی مدلهای توسعه داده شده، این مدلها برای پیشبینی زمان و هزینه در پروژه ساخت سد E استفاده شد. نتایج نشان داد که الگوریتم LSSVM-PSO نسبت به سایر الگوریتمهای هیبریدی از دقت بالاتری در تخمین زمان اتمام پروژه برخوردار است که نشان دهنده قابلیت تعمیم بالای این مدل برای پیشبینی زمان سایر پروژههای ساخت سد است. این در حالی است که برخلاف انتظار این مدل از دقت کمتری در پیشبینی هزینه اتمام پروژه ساخت سد E نسبت به مدل MLP-PSO برخوردار است که نشان میدهد پیشبینی هزینه از پیچیدگی بالاتری برخوردار است و بکارگیری مدلها در این مسئله بایستی با احتیاط بیشتری صورت گیرد. برای ارزیابی بیشتر نتایج مدلهای هیبریدی از روش احتمالاتی فیلتر کالمن نیز برای پیشبینی زمان و هزینه پروژه استفاده شد که نتایج آن حاکی از دقت بالاتر مدلهای حاصل از الگوریتمهای هیبریدی است. نتیجهگیری: مدل LSSVM-PSO میتواند با دقت بالاتری نسبت به روشهای مرسوم به پیشبینی زمان و هزینه پروژه بپردازد.
|
از دستگاه خود برای اسکن و خواندن مقاله به صورت آنلاین استفاده کنید
DOI: | |
واژههای کلیدی: الگوریتم هیبریدی، ارزش کسب شده، پیشبینی هزینه، سد سازی | |
* نویسنده مسئول: سینا فرد مرادی نیا نشانی: 1- گروه مهندسی عمران، واحد تبریز، دانشگاه آزاد اسلامی تبریز، ایران. 2- مرکز تحقیقات رباتیک و فناوریهای نرم، واحد تبریز ، دانشگاه آزاد اسلامي، تبريز، ايران تلفن: 09143142619 پست الکترونیکی: fardmoradinia@iaut.ac.ir |
مقدمه
تکمیل یک پروژه در زمانبندی مناسب با هزینه برنامهریزی شده بسیار دشوار است و این امر مستلزم استفاده از مدلهای پیشبینیکننده دقیق و بروزرسانی زمانبندی با پیشرفت پروژه است. وجود هر گونه خطا در پیشبینی اولیه زمان تکمیل پروژه میتواند بودجه انجام پروژه را تحت شعاع قرار دهد. برای این منظور لازم است عملکرد پروژه به صورت منظم اندازهگیری و مورد ارزیابی قرار گیرد و واریانس آن از خط مبنای برنامهریزی شده مشخص گردد. پیشبینی اولیه قبل از آغاز پروژه به عنوان طرح مبنا برای تکمیل پروژه در زمان و بودجه مشخص لحاظ میشود و از زمان شروع پروژه، عملکرد پروژه به لحاظ زمانی و هزینه نسبت به طرح اولیه مورد ارزیابی قرار میگیرد. چالشهای موجود در پروژههای ساخت و ساز، مدیران پروژهها را مجبور به استفاده از تکنیکها و مدلهایی برای کنترل و پیشبینی هزینه و زمان آنها نموده است. براساس این پیشبینی، مدیر پروژه تعیین میکند که پروژه نیاز به اصلاح جزئی دارد یا نیاز به اصلاح اساسی و حل مشکلات دارد [1]. محققان بسیاری به استفاده از روشهای تجزیه و تحلیل آماری نظیر رگرسیون چندگانه، روشهای مبتنیبر احتمالات مانند شبیهسازی مونت کارلو و روشهای هوش مصنوعی روی آوردهاند. تداوم در این پژوهشها و ارائه مدلهای جدید نشان میدهد که هنوز به یک مدل جامع و با دقت مناسب که برای کارفرما و پیمانکار رضایت بخش باشد حاصل نشده است. در جدول 1 به برخی از تحقیقات انجام گرفته اشاره شده است.
جدول 1- مطالعات انجام شده برای پیشبینی زمان و هزینه پروژه
نوع پیشبیني | شاخص های پیشبیني | روش مورد استفاده | محققین |
هزینه ساختمان | متغیرهای محیطی | شبکههای عصبی و رگرسیون | آتالا و هگز [2] |
هزینه ساختمان | ویژگیهای ساختمان | روش رگرسیونی، شبکههای عصبی و استنتاج مبتنیبر مورد | کیم و همکاران [3] |
هزینه اتوبان | مختصات برنامه اولیه پروژه | شبکههای عصبی | ویلموت و می[4] |
زمان پروژه با دادههای مصنوعی | شاخصهای ارزش کسب شده | فیلتر کالمن و روش بیزین | کیم و رینشمیت [5] |
هزینه ساختمان | متغیرهای مربوط به ساختمان، مکان و شرایط ساخت وساز | شبکههای عصبی | سونمز [6] |
احتمال موفقیت هزینه و زمان ساختمان | 64 متغیر مربوط به وضعیت ابتدایی پروژه | ماشین بردار پشتیبان و شبکه عصبی | وانگ و همکاران [7] |
هزینه ساختمان | شاخصهای ارزش کسب شده | ماشین بردار پشتیبان، منطق فازی و الگوریتم ژنتیک | چنگ و همکاران [8] |
زمان و هزینه | شاخصهای ارزش کسب شده | روش رگرسیون بردار پشتیبان | واترز و وانگوک [9] |
هزینه پروژه | شاخصهای ارزش کسب شده | روش بیزین | کیم [10] |
زمان و هزینه پروژه | شاخصهای ارزش کسب شده | تحلیل نقطه تغییر | مرتاجی و همکاران [11] |
زمان و هزینه پروژه با دادههای مصنوعی | شاخصهای ارزش کسب شده | شبیهسازی مونت کارلو و شبکه عصبی | اخباری [12] |
هزینه پروژه | 6 متغیر از وضعیت ابتدایی پروژه | شبکه عصبی پسرو به همراه انتخاب ویژگی | جیانگ [13] |
زمان و هزینه پروژه | شاخصهای ارزش کسب شده | اعداد خاکستری | نجفی و همکاران [14] |
زمان و هزینه پروژه | شاخصهای ارزش کسب شده | روشهای آماری | سلطان و اشرفی [15] |
زمان و هزینه پروژه | 8 متغیر مربوط به وضعیت ابتدایی پروژه | الگوریتم بهینهسازی ازدحام ذرات | خلف و همکاران [16] |
کاهش ریسک تخمین زمان و هزینه پروژه | بکارگیری مفهوم طبقهبند | تصمیمگیری چند معیاره | اسدآبادی و زویکیل [17] |
زمان و هزینه پروژه | شاخصهای ارزش کسب شده | شبکه عصبی پرسپترون چند لایه هیبریدی با الگوریتمهای بهینهسازی ابتکاری | بخشی و همکاران [18] |
ارزیابی مطالعات پیشین نشان میدهد که در پژوهشهای اندکی به پیشبینی همزمان زمان و هزینه اتمام پروژه پرداخته شده است. علاوه بر این مقایسه روشهای آماری و هوش مصنوعی در پیشبینی زمان و هزینه پروژهها، حاکی از دقت بالای مدلهای هوشمند است. از میان روشهای هوشمند، شبکه عصبی و ماشین بردار پشتیبان بیشتر مورد استفاده قرار گرفته است. هیبرید این الگوریتمها با الگوریتمهای بهینهسازی فراابتکاری در سایر مطالعات نشان داده است که استفاده از الگوریتمهای فرابتکاری به عنوان الگوریتمهای آموزش دهنده موجب بهبود دقت مدلهای نهایی میگردد [19- 20- 21]. بخشی و همکاران [18] از مدلهای هیبریدی شبکه عصبی پرسپترون چند لایه با الگوریتم ژنتیک و ازدحام ذرات برای پیشبینی زمان و هزینه پروژه استفاده کردند و نشان دادند که هیبرید الگوریتمهای پیشبینی کننده و بهینهساز میتواند عملکرد آنها را در فرآیند پیشبینی بهبود ببخشد. براین اساس، در این مطالعه از هیبرید حداقل مربعات ماشین بردار پشتیبان (LSSVM1) با الگوریتمهای بهینهسازی ازدحام ذرات (PSO2) و ژنتیک (GA3) برای پیشبینی زمان و هزینه پروژههای سدسازی با بکارگیری شاخصهای ارزش کسب شده استفاده خواهد شد که براساس دانش ما تاکنون برای پیشبینی زمان و هزینه پروژه بکار نرفته است. بنابراین میتوان گفت نوآوری تحقیق در استفاده از مدل هیبریدی LSSVM-PSO و LSSVM-GA در پیشبینی زمان و هزینه پروژه است [22].
روش انجام مطالعه
به منظور انجام این مطالعه اطلاعات مربوط به زمانبندی و هزینههای انجام پروژههای چهار سد ساخته شده در نواحی مختلف ایران گردآوری شد که به دلیل محرمانه بودن اطلاعات آنها، این سدها A, B, C و D نامگذاری شدند. این سدها در مجموع دارای 383 نقطه داده هستند که برای آموزش مدلهای هیبریدی هوشمند در نظر گرفته شدند و از این تعداد 306 نقطه داده (80% کل داده) برای مرحله آموزش و 77 نقطه داده (20% کل داده) برای آزمون مدلهای هیبریدی لحاظ شدند. از دادههای سد دیگر (یعنی سد E) نیز برای اعتبارسنجی مدلها استفاده خواهد شد. از شروع عملیات احداث سد E پانزده ماه میگذرد و گزارش پیشرفت ماه پانزدهم آن ارائه شده است؛ بنابراین تعداد 15 نقطه داده برای این سد موجود است. براساس برنامه و طرح اولیه ارائه شده احداث کامل این سد حدود ٣١ ماه زمان و در حدود 82/590146 دلار هزینه دربر خواهد داشت. در این مطالعه برای اعتبارسنجی نتایج مدلهای هیبریدی، از فیلتر کالمن نیز برای پیشبینی زمان و هزینه تکمیل پروژه E بهره برده خواهد شد. در ادامه به تشریح آمادهسازی دادهها و الگوریتمهای هیبریدی مورد استفاده در این مطالعه، مطابق با روش انجام کار نشان داده شده شکل 1، پرداخته خواهد شد.
شکل 1- فرآیند انجام مطالعه.
آمادهسازی دادهها
برای مدلسازی زمان اتمام پروژه از ورودیهای ارزش کسب شده (EVM)، پیشرفت واقعی، برنامهریزی کسب شده (ESM) و هزینه واقعی استفاده خواهد شد. بنابراین برای اطلاعات گردآوردی شده از عملیات ساخت پروژههای سد، بصورت ماهانه این دادهها استخراج شدند. پیشرفت و هزینه واقعی مورد استفاده در این مطالعه بصورت درصدی از زمان و هزینه برنامهریزی شده اولیه در نظر گرفته شده است.
روش زمانبندی کسب شده روی سه متغیر عملکردی پایه- ارزش کسب شده (EV)، هزینه واقعی (AC) و ارزش برنامهریزی شده (PV)، به منظور ارزیابی اینکه پروژه کجاست و کجا قرار بوده باشد- تکیه دارد. با استفاده از این متغیرها کارایی یک پروژه از نظر شاخص عملکرد زمانبندی (SPI=EV/PV) و شاخص عملکرد هزینه
(CPI= EV/AC) اندازهگیری میشود. پیشبینی ارزش کسب شده براساس این اصل بنیادی است که عملکرد گذشته، بهترین شاخص در دسترس برای قضاوت در مورد عملکرد آینده پروژه است. برای نمونه، زمانی که کارایی آینده مشابه کارایی گذشته در نظر گرفته شود، تخمین در زمان تکمیل t (EAC(t)) با مشخص بودن بودجه در زمان اتمام (BAC) و کارایی هزینه گزارش شده در زمان t، به صورت رابطه ذیل محاسبه میشود [23 – 24 -25]:
(1) |
|
(2) |
|
(3) |
|
(4) |
|
(5) |
|
(6) |
|
(7) |
Subject to: |
(8) |
|
| (9) | |||||||
| (10) | |||||||
| (11) | |||||||
| (12) |
| (13) |
| (14) |
| (17) |
| (18) |
|
شاخص آماری | ویژگیهای ورودی | ویژگی هدف | |||
برنامه کسب شده | ارزش کسب شده | پیشرفت واقعی | هزینه واقعی | زمان | |
علائم | ES | EV | AP | AC | T |
واحد | ماه | دلار | درصد | درصد | ماه |
میانگین | 28/24 | 49/5 میلیون | 01/0 | 01/0 | 42/63 |
انحراف استاندارد | 64/21 | 54/8 میلیون | 02/0 | 02/0 | 59/44 |
کمینه | 03/0 | 0 | 0 | 0 | 00/1 |
بیشینه | 29/81 | 10/32 میلیون | 16/0 | 30/0 | 00/167 |
چولگی | 9850/0 | 6030/1 | 6862/3 | 1234/7 | 5270/0 |
کشیدگی | 2115/0- | 2731/1 | 6504/17 | 2844/74 | 7879/0- |
جدول 3- توصیف آماری متغیرهای ورودی برای پیش بینی هزینه.
شاخص آماری |
| ویژگیهای ورودی | ویژگی هدف | |||||
برنامه کسب شده | ارزش کسب شده | پیشرفت واقعی | هزینه واقعی | زمان | نسبت هزینه | |||
علائم | ES | EV | AP | AC | T | CR | ||
واحد | ماه | دلار | درصد | درصد | ماه | - | ||
میانگین | 28/24 | 49/5 میلیون | 01/0 | 01/0 | 42/63 | 34/0 | ||
انحراف استاندارد | 64/21 | 54/8 میلیون | 02/0 | 02/0 | 59/44 | 34/0 | ||
کمینه | 03/0 | 0 | 0 | 0 | 00/1 | 0 | ||
بیشینه | 29/81 | 10/32 میلیون | 16/0 | 30/0 | 00/167 | 40/1 | ||
چولگی | 9850/0 | 6030/1 | 6862/3 | 1234/7 | 5270/0 | 2100/1 | ||
کشیدگی | 2115/0- | 2731/1 | 6504/17 | 2844/74 | 7879/0- | 7900/0 |
به منظور توصیف دادههای ورودی و خروجی (پیشبینی زمان و هزینه) در مقاله از توابع توزیع تجمعی استفاده شده است. در شکل 3 نمودار توزیع 398 مجموعه داده ورودی و خروجی استفاده شده در این مقاله نشان داده شده است. مقدار تابع توزیع تجمعی با استفاده از رابطه (20) محاسبه شد.
|
شکل 3- تابع توزیع تجمعی متغیرهای ورودی و مقادیر خروجی برای پیش بینی هزینه و زمان: برنامه کسب شده، ارزش کسب شده، پیشرفت واقعی، هزینع واقعی، زمان و نسبت هزینه (خط آبی) و برای توزیعهای طبیعی که با میانگین صفر و انحراف معیار یک تعریف میشوند (خط قرمز).
برای انجام مدلسازی لازم است ابتدای کار، نوع تابع کرنل مشخص گردد. بدین منظور الگوریتم LSSVM با توابع کرنل مختلف به صورت جداگانه برای ساخت مدل با استفاده از دادههای مدلسازی بکار برده شد. در شکل 4 عملکرد LSSVM ساده با توابع کرنل مختلف براساس معیار RMSE نشان داده شده است. همانطور که در این شکل مشاهده میشود LSSVM با تابع کرنل RBF نسبت به سایر توابع کرنل از دقت بالاتری در تخمین cost ratio و EDAC برخوردار است. از طرفی مشاهده میشود که خطای مدلهایی با توابع کرنل RBF و MLP نسبت به مدلهایی با توابع کرنل Polynomial و Linear بصورت چشمگیری کمتر است. این امر نشان میدهد که رابطه غیرخطی پیچیدهای بین ورودیهای و خروجیهای وجود دارد.
شکل 4- مقایسه عملکرد LSSVM ساده با توابع کرنل مختلف در تخمین EDAC و Cost ratio براساس RMSE
با توجه به مشخص شدن نوع تابع کرنل در الگوریتم LSSVM، الگوریتم PSO و GA بایستی مقادیر بهینه و را، با هدف کمینهسازی خطای بین مقادیر پیشبینی و واقعی، مشخص نمایند. بنابراین تعداد متغیرهای تصمیم در این الگوریتمهای بهینهسازی برابر دو خواهد بود. پارامتر برای افزایش عملکرد مدل روی دادههای آموزش و کاهش پیچیدگی مدل استفاده میشود. مقدار بالا برای این پارامتر نشان دهنده little regularization است که منجر به حصول یک مدل غیرخطیتر خواهد شد. پارامتر روی تعداد همسایگیها در مدل تأثیر میگذارد؛ بنابراین، مقدار بالای این پارامتر به معنی همسایههای بیشتر در مدل است از اینرو یک مدل غیرخطیتر بدست خواهد آمد. بنابراین عملکرد و رفتار مدل بسیار وابسته به مقادیر این پارامترها است.
برای تنظیم پارامترهای قابل کنترل در الگوریتم PSO و GA از روش آزمون و خطا استفاده شد. در جدول 4 نتایج تحلیل حساسیت روی پارامترهای قابل تنظیم این الگوریتمها نشان داده شده است. تعداد تکرارهای الگوریتمها برابر 200 در نظر گرفته شد؛ هرچند بررسیها نشان داد که در تکرارهای کمتر الگوریتمها به جواب بهینه همگرا میشوند.
در شکل 5 روند کاهش خطا در تکرارهای مختلف این الگوریتمها برای تخمین زمان اتمام پروژه در مرحله آموزش نشان داده شده است. همانطور که در این شکل مشاهده میشود هر دو الگوریتم در تعداد تکرارهای کمتر از 50 به جواب همگرا شده است. نمودارهای متقاطع مقادیر پیشبینیشده و واقعی برای مراحل آموزش، آزمون و اعتبارسنجی در تخمین زمان اتمام پروژه برای مدلهای LSSVM-PSO و LSSVM-GA در شکل 6 نشان داده شده است. همانطور که در این شکل مشاهده میشود هر دو مدل در مراحل آموزش و آزمون از عملکرد بالایی برخوردار بودهاند. به نظر میرسد نتایج حاصل از اعمال این الگوریتمها روی دادههای اعتبارسنجی نیز از دقت خوبی برخوردار باشد هرچند پراکندگی نقاط داده در این مرحله نسبت به مراحل آموزش و آزمون بیشتر است. مقایسه مقادیر کمی معیارهای ارزیابی برای الگوریتمهای LSSVM-PSO و LSSVM-GA در تخمین زمان اتمام پروژهها به تفکیک دیتاستها در جدول 5 ارائه شده است. همانطور که در این جدول مشاهده میشود خطای LSSVM-PSO در هر سه مرحله آموزش، آزمون و اعتبارسنجی نسبت به LSSVM-GA کمتر است. علاوهبراین، اختلاف کم مقادیر خطا در دو مرحله آموزش و آزمون این مدل نسبت به LSSVM-GA، نشان دهنده قابلیت تعمیم این مدل بر روی سایر پروژهها یا دادههای دیده نشده است. دقت بالاتر مدل LSSVM-PSO نسبت به LSSVM-GA در مرحله اعتبارسنجی تأیید کننده این ادعا است.
جدول 4- مقادیر پارامترهای کنترلی الگوریتمهای بهینهسازی GA و PSO برای تخمین زمان و هزینه پروژهها
الگوریتم بهینهسازی | پارامترها | مقادیر پارامترهای قابل کنترل الگوریتمهای بهینهسازی به تفکیک الگوریتم |
LSSVM | ||
الگوریتم ازدحام ذرات (PSO) | اندازه ازدحام | 100 |
ضریب یادگیری فردی | 05/2 | |
ضریب یادگیری جمعی | 05/2 | |
ضریب اططکاک | 97/0 | |
الگوریتم ژنتیک (GA) | جمعیت | 110 |
روش انتخاب | چرخ رولت | |
تقاطع | یکنواخت (p = 1) | |
جهش | یکنواخت (p=0.07) | |
نرخ جهش | 10/0 | |
فشار انتخاب | 2 |
|
شکل 5- نمودار تغییرات خطا در تکرارهای مختلف برای الگوریتمهای LSSVM-PSO و LSSVM-GA |
|
|
(الف) LSSVM-GA | (ب) LSSVM-PSO |
شکل 6- نمودارهای متقاطع مقادیر پیشبینیشده و واقعی در تخمین زمان اتمام پروژه برای الگوریتمهای LSSVM-PSO، LSSVM-GA، در مرحله آموزش |
جدول 5- نتایج ارزیابی مدلهای LSSVM-PSO، LSSVM-GA در مرحله آموزش براساس معیارهای مختلف در تخمین زمان اتمام پروژهها
نام مدل | APD (%) | AAPD (%) | SD | RMSE | R-square |
LSSVM-PSO | 1856/18- | 2878/20 | 6438/3 | 6614/3 | 9985/0 |
LSSVM-GA | 0301/16- | 1331/19 | 9249/3 | 9203/3 | 9971/0 |
نتایج بکارگیری مدلهای آموزش دیده برای پیشبینی زمان اتمام پروژه بر روی دادههای آزمون در شکل 7 نشان داده شده است. همانطور که در این شکل مشاهده میشود نقاط داده در مدلهای هیبریدی مربوط به الگوریتم LSSVM-PSO از پراکندگی کمتری نسبت به LSSVM-GAبرخوردار هست و تمامی آنها نزدیک به خط برازش شده قرار دارند؛ بررسی دقیقتر نتایج مدلها بصورت کمی در جدول 6 نشان میدهد در مرحله آزمون نیز مدلهای هیبری LSSVM-PSO نسبت به نوع متناظرش LSSVM-GA از دقت بالاتری برخوردار بودند. این امر نشان میدهد الگوریتم LSSVM-PSO از توانایی بالاتری در مدلسازی مسائل غیرخطی و پیچیده دارا است. الگوریتم هیبریدی LSSVM-PSO نسبت به LSSVM-GA در این مرحله نیز از دقت بالاتری برخورد است که حکایت از قابلیت تعمیم بالای این مدلدارد.
|
|
(الف) LSSVM-GA | (ب) LSSVM-PSO |
شکل 7- نمودارهای متقاطع مقادیر پیشبینیشده و واقعی در تخمین زمان اتمام پروژه برای الگوریتمهای LSSVM-PSO، LSSVM-GA در مرحله آزمون
جدول 6- نتایج ارزیابی مدلهای LSSVM-PSO، LSSVM-GA در مرحله آزمون براساس معیارهای مختلف در تخمین زمان اتمام پروژهها
نام مدل | APD (%) | AAPD (%) | SD | RMSE | R-square |
LSSVM-PSO | 8609/22- | 2133/26 | 2436/5 | 2114/5 | 9980/0 |
LSSVM-GA | 9473/12- | 9228/19 | 7856/5 | 9003/5 | 9934/0 |
در شکل 8 نمودارهای متقاطع زمان پیشبینی شده برای اتمام پروژه با زمان واقعی برای اتمام آن برای دادههای اعتبارسنجی (سد E) نشان داده شده است. همانزور که در این شکل مشاهده میشود همه مدلها از ضریب تعیین بالایی در پیشبینی زمان اتمام پروژه برای دادههای اعتبارسنجی برخوردارند. ارزیابی خطای مدلهای بکار برده شده بصورت کمی در جدول 7 ارائه شده است. همانطور که در این جدول مشاهده میشود مدل هیبریدی LSSVM-PSO نسبت به مدلهیبریدی LSSVM-GA از خطای کمتری برخوردار هست که نشان دهنده قابلیت تعمیم بالاتر این مدل دارد.
|
|
(الف) LSSVM-GA | (ب) LSSVM-PSO |
شکل 8- نمودارهای متقاطع مقادیر پیشبینیشده و واقعی در تخمین زمان اتمام پروژه برای الگوریتمهای LSSVM-PSO، LSSVM-GA در مرحله اعتبارسنجی |
جدول 7- نتایج ارزیابی مدلهای LSSVM-PSO، LSSVM-GA در مرحله اعتبارسنجی براساس معیارهای مختلف در تخمین زمان اتمام پروژهها
نام مدل | APD (%) | AAPD (%) | SD | RMSE | R-square |
LSSVM-PSO | 4288/4 | 0904/5 | 9636/1 | 9382/2 | 9210/0 |
LSSVM-GA | 9846/6- | 9846/6 | 6494/1 | 7237/3 | 9068/0 |
در شکل 9 پروفایل EDAC پیشبینیشده براساس مدلهای هیبریدی LSSVM-PSO، LSSVM-GA برای دادههای اعتبارسنجی (پروژه سد E) نشان داده شده است. در این شکل بازه تغییرات EDAC بین مرز پایین (LB) و بالا (UB) براساس خطایی که هر دو مدل در مرحله آموزش و آزمون مدل داشتهاند در نظر گرفته شده است. همانطور که در این شکل مشاهده میشود مقادیر LB پیشبینی شده با همه مدلها بیشتر از برنامهریزی شده میباشد. این امر نشان میدهد که پروژه در ماه اول طبق برنامه پیشنرفته است. مقدار خروجی مدلهای LSSVM-PSO، LSSVM-GA و به ترتیب زمان خاتمه پروژه را برابر 57 و 59 ماه نشان میدهند.
تغییرات خطا در تکرارهای مختلف الگوریتمهای LSSVM-PSO، LSSVM-GA در پیشبینی نسبت هزینه برای مرحله آموزش در شکل 10 نشان داده شده است. همانطور که در این شکل مشاهده میشود الگوریتمهای بهینهسازی برای الگوریتم LSSVM تقریبا در تکرار حدود 120 با مقدار خطای کمتری نسبت به الگوریتم های مشابه همگرا میشوند. نمودارهای متقاطع مقادیر واقعی و پیشبینیشده نسبت هزینه برای مدلهای هیبریدی بکار برده شده در مرحله آموزش در شکل 11 نشان داده شده است. بررسی پراکندگی نقاط داده در همه این مدلها نشان از عملکرد خوب مدلهای هیبریدی LSSVM در پیشبینی پارامتر هدف دارد.
شکل 10- نمودار تغییرات خطا در تکرارهای مختلف برای الگوریتمهای LSSVM-PSO و LSSVM-GA
|
|
(الف) LSSVM-GA | (ب) LSSVM-PSO |
شکل 11- نمودارهای متقاطع مقادیر پیشبینیشده و واقعی در تخمین هزینه اتمام پروژه برای الگوریتمهای LSSVM-PSO، LSSVM-GA در مرحله آموزش |
جدول 8- نتایج ارزیابی مدلهای LSSVM-PSO، LSSVM-GA در مرحله آموزش براساس معیارهای مختلف در تخمین هزینه اتمام پروژهها
نام مدل | APD (%) | AAPD (%) | SD | RMSE | R-square |
LSSVM-PSO | 9784/89- | 2497/103 | 0830/0 | 0829/0 | 9985/0 |
LSSVM-GA | 3230/142- | 0580/151 | 0829/0 | 0833/0 | 9971/0 |
در شکل 12Error! Reference source not found. نمودارهای متقاطع مقادیر واقعی و پیشبینی شده نسبت هزینه با استفاده از مدلهای هیبریدی برای دادههای آزمون نشان داده شده است. همانطور که در این شکل مشاهده میشود مدل LSSVM-GA در نسبتهای هزینه پایین مقادیر را بیش برآورد و در مقادیر بالاتر نسبت هزینه، مقادیر را کم برآورد نموده است درحالی که در مدل LSSVM-PSO این مسئله چندان محسوس نیست. مقایسه کمی مدلها براساس معیارهای خطای ارائه شده در جدول 9 نشان میدهد که مدل LSSVM-PSO از دقت بالاتر و خطای کمتر در مقایسه با الگوریتم LSSVM-GA در این مرحله برخوردار بوده است.
|
|
(الف) LSSVM-GA | (ب) LSSVM-PSO |
شکل 12- نمودارهای متقاطع مقادیر پیشبینیشده و واقعی در تخمین هزینه اتمام پروژه برای الگوریتمهای LSSVM-PSO، LSSVM-GA در مرحله آزمون |
جدول 9- نتایج ارزیابی مدلهای LSSVM-PSO، LSSVM-GA در مرحله آزمون براساس معیارهای مختلف در تخمین هزینه اتمام پروژهها
نام مدل | APD (%) | AAPD (%) | SD | RMSE | R-square |
LSSVM-PSO | 3000/133- | 4061/146 | 0824/0 | 0832/0 | 9617/0 |
LSSVM-GA | 6460/794- | 1135/810 | 1261/0 | 1285/0 | 9699/0 |
مقایسه نمودارهای متقاطع مقادیر واقعی و پیشبینی نسبت هزینه با مدلهای آموزش دیده بر روی دادههای سد E در شکل 13 نشان داده شده است. همانطور که در این شکل مشاهده میشود مدل LSSVM-GA در مقادیر پایین و بالای نسبت هزینه، بترتیب مقادیر را بصورت محسوسی بیشبرآورد و کم برآورد نمودهاند. وجود این مسئله برای مدل LSSVM-PSO نیز بصورت کمرنگتری قابل تشخیص است. خطای مدلها در مرحله اعتبارسنجی در جدول 10 نشان داده شده است.
|
|
(الف) LSSVM-GA | (ب) LSSVM-PSO |
شکل 13- نمودارهای متقاطع مقادیر پیشبینیشده و واقعی در تخمین هزینه اتمام پروژه برای الگوریتمهای LSSVM-PSO، LSSVM-GA در مرحله اعتبارسنجی |
جدول 10- نتایج ارزیابی مدلهای LSSVM-PSO، LSSVM-GA در مرحله اعتبارسنجی براساس معیارهای مختلف در تخمین هزینه اتمام پروژهها
نام مدل | APD (%) | AAPD (%) | SD | RMSE | R-square |
LSSVM-PSO | 0040/26- | 0040/26 | 1047/0 | 1040/0 | 9877/0 |
LSSVM-GA | 5641/33- | 5642/33 | 1247/0 | 1288/0 | 9843/0 |
پروفایل هزینه پیشبینی شده برای پروژه ساخت سد E برمبنای EDAC و با کمک چهار مدل LSSVM-PSO، LSSVM-GA در شکل 14 نشان داده شده است. در این شکل نیز محدود احتمالی هزینه پیشبینی شده با استفاده از خطای مدلها در مرحله آموزش و آزمون محاسبه شده است. همانطور که در این شکل مشاهده میشود مدلهای LSSVM-PSO، LSSVM-GA بترتیب در ماههای هفتم، هشتم هشدار اولیه را برای فاصله گرفتن هزینه پروژه از هزینه برنامهریزی شده را صادر کردهاند. مدل LSSVM-PSO هشدار اولیه سریعتری را برای بازبینی هزینه کردها ارائه داده است. ادامه روند پیشبینی نیز گویای این مطلب است که ابزارهای مورد استفاده توسط مدیر پروژه نتوانسته است این هشدار اولیه را صادر نماید تا در برنامه عملیاتی تجدید نظرگردد. براساس بررسی گزارشهای ساخت این سد، مدیران در ماه 13ام از زمان آغاز پروژه نیز افزایش هزینههای خاتمه عملیات را تأیید کردهاند.
|
|
(الف) LSSVM-GA | (ب) LSSVM-PSO |
شکل 14- پروفایل تخمین هزینه برمبنای EDAC و با استفاده از مدلهای هیبریدی برای پروژه ساخت سد E
در ادامه فیلتر کالمن روی دادههای اعتبارسنجی (یعنی سد E) اعمال شد. در شکل 15 نمودار احتمال موفقیت حاصل از فیلتر کالمن بترتیب برای پیشبینی زمان و هزینه نشان داده شده است. در این شکل منحنیهای احتمالاتی original و posterior احتمال موفقیت پروژه در زمان و هزینه مشخص را نشان میدهند. این نمودارها میتواند پاسخگوی سوالاتی نظیر احتمال موفقیت اتمام پروژه در یک زمان مشخص و با هزینه در نظر گرفته شده با سطح اطمینان 90% باشد. همانطور که در این شکل مشخص است انجام این پروژه با زمان و هزینه برنامهریزی شده برای این پروژه که به ترتیب 31 ماه و 590146.82 دلار میباشد براساس خروجی مدل فیلتر کالمن با احتمال موفقیت 50% همراه است. این در حالی است که احتمال اتمام پروژه با هزینه برنامهریزی شده حدود 40% است.
|
شکل 15- نمودار احتمال موفقیت برای پیش بینی زمان و هزینه با استفاده از فیلتر کالمن |
در شکل 16 پروفایل احتمالی EDAC و هزینه حاصل از مدل کالمن برای پروژه E نشان داده شده است. بازه LB و UB در این شکل با سطح اطمینان 90% مشخص شده است. براساس خروجی این مدل زمان اتمام پروژه تا ماه پنجم از زمان شروع مطابقبر برنامهریزی انجام شده بوده است. اما با گذشت زمان، زمان خاتمه پیشبینی شده از زمان برنامهریزی شده برای اتمام پروژه به صورت چشمگیری فاصله میگیرد بگونهای که مدل در ماه هفتم هشدار اولیه را برای بیشتر زمان بردن انجام پروژه از زمان برنامهریزی شده را صادر میکند. خروجی مدل کالمن برای هزینه اتمام پروژه مطابقت خوبی با هزینه برنامهریزی دارد؛ اما از ماه دهم به بعد هزینه پیشبینی شده توسط مدل به صورت آرامی از هزینه برنامهریزی شده فاصله میگیرد. این مدل هیچگونه هشداری را برای فاصله گرفتن غیرقابل جبران هزینه اتمام پروژه از هزینه برنامهریزی شده را صادر نکرده است.
شکل 16- پروفایل احتمالی EDAC برای پیش بینی زمان و هزینه با استفاده از فیلتر کالمن
شکل 17 به منظور تعیین احتمال موفقیت در پروفایل هزینه و زمان با روش فیلتر کالمن مورد استفاده قرار میگیرد. با استفاده از این منحنی میتوان درصد احتمال موفقیت پروژه در مدت زمان برنامهریزی شده به هنگام اعلام هشدار اولیه را پیشبینی کرد. برای نمونه نتایج حاصله از این منحنی در ماه هفتم نشان میدهد که احتمال موفقیت به منظور دستیابی به مدت زمان برنامهریزی شده برای این پروژه، 15% میباشد. به هنگام اعلام هشدار اولیه در تاخیر برنامه زمانبندی، تدابیر لازم را برای جبران آن و تجدید برنامهریزی انجام شده در نظر گرفت.
شکل 17- احتمال موفقیت در پروفایل زمان و هزینه با استفاده از فیلتر کالمن
نتیجهگیری
در این مطالعه الگوریتمهای هیبریدی LSSVM-PSO و LSSVM-GA با کمک از مفاهیم ارزش زمانی برای پیشبینی زمان خاتمه و هزینه انجام پروژهها استفاده شد. برای توسعه این مدلها از دادههای چهار سد ساخته شده استفاده شد. این دادهها به دو گروه دادههای آموزش (80% کل دادهها) و آزمون (20% از کل دادهها) تفکیک شدند. برای اعتبارسنجی مدلهای توسعه داده شده نیز از دادههای سد دیگری که تا ماه 15 گزارش پیشرفت آن ارائه شده بود استفاده گردید. در ادامه فیلتر کالمن نیز برای ارزیابی مدلهای هیبریدی در پیشبینی زمان و هزینه، بر روی دادههای اعتبارسنجی اعمال شد.
نتایج بکارگیری الگوریتمهای هیبریدی نشان داد که مدلهای حاصل از دقت خوبی در مراحل آموزش و آزمون برای پیشبینی زمان اتمام پروژهها برخوردار هستند. اختلاف کمتر خطای مدل LSSVM-PSO نسبت به مدل دیگر در پیشبینی زمان اتمام پروژه در این دو مرحله حاکی از قابلیت تعمیم بالای این مدل دارد؛ که این امر با عملکرد خوب این مدل در مرحله اعتبارسنجی مورد تأیید قرار گرفت. بکارگیری تمامی مدلهای آموزش دیده روی دادههای اعتبارسنجی نیز نشان داد که براساس پیشرفت حاصل شده در ماه اول، مدت زمان انجام پروژه بسیار بیشتر از برنامه زمانبندی اولیه خواهد بود و هشدار اولیه توسط تمامی مدلهای هیبریدی در ماه اول فعال شد. این در حالی است که هشدار اولیه براساس پیشبینی فیلتر کالمن، در ماه هفتم فعال میشود. مدت زمان اتمام پروژه ساخت سد E برای مدلهای هیبریدی LSSVM-PSO و LSSVM-GA بترتیب برابر با 57 و 59 است. این در حالی است که نتیجه اعمال فیلتر کالمن در پیشبینی زمان برروی دادههای اعتبارسنجی، هشدار اولیه برای تأخیر در برنامهزمانبندی را در ماه هفتم اعلام میکند. لازم به ذکر است که این مدل زمان اتمام پروژه را برابر 52 ماه پیشبینی میکند. براساس ارزیابیهای انجام شده توسط مدیران پروژه، زمان اتمام پروژه حدود 55 ماه خواهد بود که نتایج مدلهای هیبریدی نسبت به مدل کالمن به واقعیت نزدیکتر بوده است.
آموزش الگوریتمهای هیبریدی برای پیشبینی نسبت هزینه پروژهها در مراحل آموزش و آزمون نیز نشان داد که الگوریتم LSSVM-PSO از دقت بالاتری برخوردار است. همچنین مدل LSSVM-GA در مقادیر پایین و بالای نسبت هزینه بطور چشمگیری، بترتیب، مقادیر را بیش برآورد و کم برآورد مینمایند. هر چند این مسئله در نتایج مدل LSSVM-PSO نیز مشاهده گردید؛ ولی نسبت به مدل دیگر از شدت کمتری برخوردار است. با توجه به دقت پایینتر مدلها در پیشبینی هزینهها نسبت به پیشبینی زمان، میتوان گفت بکارگیری مدلهای هیبریدی در پیشبینی هزینه پروژهها نیازمند احتیاط بیشتری است. این مسئله میتواند ناشی از متأثر بودن هزینههای پروژه به عوامل مختلفی باشد که در ورودیهای مدلها بکار نرفته است. هشدار اولیه برای فاصله گرفتن هزینه عملیات ساخت سد از هزینه برنامهریزی شده برای مدلهای LSSVM-PSO و LSSVM-GA بترتیب در ماههای هفتم و هشتم صادر شده است. این در حالی است که نتیجه اعمال فیلتر کالمن در پیشبینی هزینه برروی دادههای اعتبارسنجی، هیچگونه هشدار اولیهای برای فاصله گرفتن هزینه کردها از هزینههای برنامهریزی شده اعلام نمیکند.
مقایسه مدلهای هیبریدی با مدل کالمن نشان میدهد که مدلهای هیبریدی با توجه به آموزشی که براساس دادههای چند سد ساخته شده داشتند نتایج قابل قبولتری با گزارشات دورهای ارائه شده برای انجام پروژه E دارند. البته لازم به ذکر است که با توجه به تأخیرهایی که در چند پروژه استفاده شده در مرحله آموزش مدلهای هیبریدی وجود داشت مدلهای حاصل بسیار محافظهکارانه عمل میکنند. این درحالی است که مدل کالمن تنها براساس دادههای محدود خود پروژه و براساس روند گذشته آن توسعه داده شده است. بنابراین استفاده از مدلهای هیبریدی بویژه LSSVM-PSO برای پیشبینی زمان اتمام پروژه به شدت توصیه میشود.
پیشنهادها
با توجه به دقت و قابلیت تعمیم بالای الگوریتمهای یادگیری عمیق در پیشبینی، پیشنهاد میشود در مطالعات آتی از این الگوریتمها بهره گرفته شود. البته لازم به ذکر است که بکارگیری این الگوریتمها نیازمند حجم داده بیشتری است.
ملاحظات اخلاقی پیروی از اصول اخلاق پژوهش
همکاری مشارکتکنندگان در تحقیق حاضر به صورت داوطلبانه و با رضایت آنان بوده است.
حامی مالی
هزینه تحقیق حاضر توسط نویسندگان مقاله تامین شده است.
مشارکت نویسندگان
طراحی و ایدهپردازی: سینا فرد مرادی نیا؛ رضا بخشی
روششناسی و تحلیل دادهها: سینا فرد مرادی نیا؛ رضا بخشی; رسول جانی، رامین وفایی پور
نظارت و نگارش نهایی: سینا فرد مرادی نیا؛ رضا بخشی. رسول جانی، رامین وفایی پور سرخابی
تعارض منافع
بنابر اظهار نویسندگان، مقاله حاضر فاقد هرگونه تعارض منافع بوده است.
1. Gowan, J. A., Mathieu, R. G., & Hey, M. B. 2006. Earned value management in a data warehouse project. Information management & computer security, 14(1), 37-50.
2. Attalla, M., & Hegazy, T. (2003). Predicting cost deviation in reconstruction projects: Artificial neural networks versus regression. Journal of construction engineering and management, 129(4), 405-411.
3. Kim, G. H., An, S. H., & Kang, K. I. 2004. Comparison of construction cost estimating models based on regression analysis, neural networks, and case-based reasoning. Building and environment, 39(10), 1235-1242.
4. Wilmot, C. G., & Mei, B. 2005. Neural network modeling of highway construction costs. Journal of construction engineering and management, 131(7), 765-771.
5. Kim, B. C., & Reinschmidt, K. F. 2010. Probabilistic forecasting of project duration using Kalman filter and the earned value method. Journal of Construction Engineering and Management, 136(8), 834-843.
6. Sonmez R. 2011. Range estimation of construction costs using neural networks with bootstrap prediction intervals. Expert Syst Appl.; 38(8):9913–7.
7. Wang Y-R, Yu C-Y, Chan H-H. 2012. Predicting construction cost and schedule success using artificial neural networks ensemble and support vector machines classification models. Int J Proj Manag.30(4):470–8.
8. Cheng M-Y, Hoang N-D, Roy AF V, Wu Y-W. 2012. A novel time-depended evolutionary fuzzy SVM inference model for estimating construction project at completion. Eng Appl Artif Intell. 25(4):744–52.
9. Wauters M, Vanhoucke M. 2014. Support vector machine regression for project control forecasting. Autom Constr.47:92–106.
10. Kim B-C. 2015. Integrating risk assessment and actual performance for probabilistic project cost forecasting: a second moment Bayesian model.IEEE Trans Eng Manag. 62(2):158–70.
11. Mortaji STH, Noorossana R, Bagherpour M. 2015. Project completion time and cost prediction using change point analysis. J Manag Eng. 31(5):4014086.
12. Akhbari M. 2018. Project time and cost forecasting using monte carlo simulation and artificial neural networks. Int J Ind Eng Prod Res. 29(2):231–9.
13. Jiang Q. 2019. Estimation of construction project building cost by back-propagation neural network. J Eng Des Technol.
14. Najafi S, Moosavirad SH, Ariafar S. 2019. Predicting the project time and costs using EVM based on gray numbers. Eng Constr Archit Manag.
15. Soltan S, Ashrafi M. 2020. Predicting project duration and cost, and selecting the best action plan using statistical methods for earned value management. J Proj Manag. 5(3):157–66.
16. Khalaf TZ, Çağlar H, Çağlar A, Hanoon AN. 2020. Particle swarm optimization based approach for estimation of costs and duration of construction projects. Civ Eng J.6(2):384–401.
17. Asadabadi MR, Zwikael O. 2021. Integrating risk into estimations of project activities’ time and cost: A stratified approach. Eur J Oper Res. 291(2):482–90.
18. Bakhshi R, Moradinia SF, Jani R, Poor RV. 2022. Presenting a Hybrid Scheme of Machine Learning Combined with Metaheuristic Optimizers for Predicting Final Cost and Time of Project. KSCE J Civ Eng.1–16.
19. Anemangely M, Ramezanzadeh A, Tokhmechi B, Molaghab A, Mohammadian A. 2018. Drilling rate prediction from petrophysical logs and mud logging data using an optimized multilayer perceptron neural network. J Geophys Eng.15(4):1146–59.
20. Mehrad M, Bajolvand M, Ramezanzadeh A, Neycharan JG. 2020. Developing a new rigorous drilling rate prediction model using a machine learning technique. J Pet Sci Eng.192:107338.
21. Sabah M, Mehrad M, Ashrafi SB, Wood DA, Fathi S. 2021. Hybrid machine learning algorithms to enhance lost-circulation prediction and management in the Marun oil field. J Pet Sci Eng.198:108125.
22. Kennedy J, Eberhart R. 1995. Particle swarm optimization. In: Proceedings of ICNN’95-international conference on neural networks. IEEE. p. 1942–8.
23. Czarnigowska A. 2008. Earned value method as a tool for project control. Bud i Archit.3(2):15–32.
24. Lipke W. 2014. Introduction to earned schedule. PM World J.3(11):8–9.
25. Kim B-C, Reinschmidt KF. 2011. Combination of project cost forecasts in earned value management. J Constr Eng Manag. 137(11):958–66.
26. Wang, H. and Hu, D., 2005. October. Comparison of SVM and LS-SVM for regression. In 2005 International conference on neural networks and brain (Vol. 1, pp. 279-283). IEEE.
27. Welch G, Bishop G. 1995. An introduction to the Kalman filter.
28. Suykens JAK, Vandewalle J. 1999. Least squares support vector machine classifiers. Neural Process Lett. 9(3):293–300.
29. Vapnik V. 2013. The nature of statistical learning theory. Springer science & business media.
30. Duan K, Keerthi SS, Poo AN. 2003. Evaluation of simple performance measures for tuning SVM hyperparameters. Neurocomputing. 51: 41–59.
31. Couceiro, M., Ghamisi, P., Couceiro, M. and Ghamisi, P., 2016. Particle swarm optimization. Fractional order darwinian particle swarm optimization: Applications and evaluation of an evolutionary algorithm, pp.1-10.
32. Coello CAC, Lamont GB, Van Veldhuizen DA. 2007. Evolutionary algorithms for solving multi-objective problems. Vol. 5. Springer.
33. Clerc M. 2010. Particle swarm optimization. Vol. 93. John Wiley & Sons.