برآورد حداکثر درستنمایی پارامترهای توزیع نمایی-پواسون تحت سانسور فاصله ای پیش رونده نوع I با الگوریتم های نیوتن-رافسون، EM و SEM
الموضوعات : Statistics
احمد محمدی
1
,
علی شادرخ
2
,
مسعود یارمحمدی
3
1 - گروه آمار، دانشگاه پیام نور، تهران، ایران
2 - گروه آمار، دانشگاه پیام نور، تهران، ایران
3 - گروه آمار، دانشگاه پیام نور، تهران، ایران
الکلمات المفتاحية: برآورد حداکثر درستنمایی, میانگین مربع خطا , روش نیوتن-رافسون, الگوریتم EM, شبیه سازی مونت کارلو,
ملخص المقالة :
توزیع نمایی-پواسون با استفاده از ترکیب توزیع نمایی با توزیع پواسون بریده شده در صفر به عنوان مدلی برای داده های طول عمر با نرخ شکست کاهشی، تولید می شود. این مقاله به مسئله برآورد کردن پارامترهای نامعلوم توزیع نمایی-پواسون به عنوان یک مدل برای طول عمر می پردازد که نمونه ها تحت سانسور فاصله ای پیش رونده نوع I مشاهده شده اند. ما از الگوریتم های نیوتن-رافسون، بیشینه سازی کلاسیک مقادیر مورد انتظار (EM) و بیشینه سازی تصادفی مقادیر مورد انتظار (SEM) برای یافتن برآوردهای حداکثر درستنمایی (MLE) پارامترهای نامعلوم استفاده می کنیم. عملکرد برآوردگرهای SEM پیشنهادی با استفاده از یک شبیه سازی مونت کارلو نشان داده شده است و نیز روی یک مجموعه داده واقعی استفاده شده است. شبیه سازی نشان داد که عملکرد الگوریتم SEM بر مبنای میانگین مربع خطا (MSE) کاملاً رضایت بخش است و با افزایش اندازه نمونه، کارایی برآوردگرها نیز افزایش می یابد .
[1]حجازی، ر. ، قنبری، ی. (1390). مقدمه¬ای بر حسابداری مدیریت زیستمحیطی، پژوهش حسابداری و حسابرسی، دوره 1، شماره 2، صص 129-150.
[2] قنبری قلعه رودخانی، م. ، وطن پرست، م. ، آزادی، ک. (1400). عملکرد مسئولیت اجتماعی و افشا اطلاعات زیستمحیطی: آزمون نظریه توسعه پایدار با استفاده از منطق فازی، فصلنامه علمی و پژوهشی دانش حسابداری و حسابرسی مدیریت، سال دهم، شماره 40، صص 89-105.
[3] دهدار، ف. ، احمدیان، ع. (1396). گزارشگری حسابداری زیستمحیطی، حسابدار، شماره 304-303، صص 36-41.
[4] بنی¬مهد، ب. ، طالب¬نیا، ق. ، ازوجی، ح. (1388). بررسی رابطه¬ی بین عملکرد زیستمحیطی و عملکرد مالی، پژوهشنامه حسابداری مالی و حسابرسی، دوره 1، شماره 3، صص 149-174.
[5] حاجیان¬نژاد، ا. ، پورحیدری، ا. ، بهار مقدم، م. (1394). تدوین چارچوبی برای گزارشگری غیرمالی شرکتها برمبنای چارچوب مفهومی حسابداری. فصلنامه دانش حسابداری مالی، سال دوم شماره 2 پیاپی 5، صص 7-31.
[6] Hull, J. C., Predescu, M., White, A. (2005). Bond prices, default probabilities and risk premiums. Journal of Accounting Research, 40(1), 135-172.
[7] Azizul Islam, M. (2009). Social and environmental reporting practices organizations operating in or sourcing products from, a developing country: Evidence from Bangladesh, A Thesis Submitted in Fulfilment of the Requirements for the Degree of Doctor of Philosophy, University of Dhaka.
[8] Shearer, T. (2002). Ethics and Accountability: from the for-itself to the for-the-other, Accounting, Organizations and Society, 27(6), 541-575.
[9] Gray, R. (2006), Social Environmental and Sustainability Reporting and Organizational Value Creation. Whose Value? Whose Creation?, Accounting Auditing & Accountability Journal,19(6), 793-819.
[10]نورالدین، م. ، پورزمانی، ز. (1400). افشای اطلاعات زیستمحیطی در گزارشگری مالی، فصلنامه تحقیقات حسابداری و حسابرسی، گواهی پذیرش مقاله در شماره 55 پاییز 1401.
[11] Jenkins, H., Yakovleva, N. (2008). Corporate social responsibility in the mining industry: Exploring trends in social and environmental disclosure. Journal of Cleaner Production. 14(3-4), 271-284.
[12] Guthrie. J. E., Parker, L. D. (1990). Corporate social disclosure practice: A comparative international analysis. Advances in Public Interest accounting, 3(1-3), 159-175.
[13] مران¬جوری، م. ، علیخانی، ر. (۱۳۹۰). تحقیق حساب دهی اجتماعی و محیطی، مجله دانش و پژوهش حسابداری، شماره 24، صص 24- 29.
[14] O'Donovan, G., (2002). Environmental Disclosures in the Annual Report: Extending the Applicability and Predictive Power of Legitimacy Theory. Accounting, Auditing & Accountability Journal. 15(3), 344- 371.
[15] Jamil, C. Z. M., Alwiand, K., Mohammed, R. (2003). Corporate social responsibility disclosure in the annual reports of Malaysia companies: A longitudinal study. Analysis, 10(1), 139-159.
[16] Gray, R., Javad, M., Power, D. M., Sinclair C. D. (2001). Social and Environmental Disclosure and Corporate Characteristics: A Research Note and Extension. Journal of Business Finance and Accounting, 28(3-4): 327-356.
[17] Mathuva, D. M., Kiweu, M. K. (2016). Cooperative social and environmental disclosure and financial performance of savings and credit cooperatives in Kenya. Advances in accounting, incorporating. Advances in International Accounting, 35, 197–206.
[18] Cormier, D., Ledoux, M. J., Magnan, M. (2011). The Informational Contribution of Social and Environmental Disclosures for Investors. Management Decision, 49(8), 1276-1304.
[19] Nooreddin, M., Poorzamani, Z. (2021). A Model for Environmental Management Information Disclosure Requirement in Financial Reporting, International Journal of Finance and Managerial Accounting, 6, 20, 67-82.
[20] عزلتی، ف. ، نوری¬فرد، ی. ، امام¬وردی، ق. ، دارابی، ر. ، حاجیها، ز. (1400). نقش سازوکارهای نظارتی بر افشای داوطلبانه اطلاعات غیرمالی، فصلنامه علمی و پژوهشی دانش حسابداری و حسابرسی مدیریت، سال دهم، شماره 40، صص 59-70.
[21] فیضی، م. ، پورآقاجان، ع. ، نسل موسوی، س. ح. (1400). نقش قدرت شرکت در ارتباط افشای داوطلبانه اطلاعات غیرمالی و عملکرد پایداری، فصلنامه علمی و پژوهشی دانش حسابداری و حسابرسی مدیریت، سال دهم، شماره 40، صص 39-57.
[22] جامعی، ر. ، نجفی، ق. (1398). بررسی رابطه بین افشای مسئولیت اجتماعی شرکت و حق¬الزحمه حسابرسی. دانش حسابداری مالی، دوره 6 شماره 1، صص137-161.
[23] فخاری، ح. ، ملکیان، ا. ، جفایی رهنی، م. (1396). تبیین و رتبه¬بندی موالفه¬ها و شاخص¬های گزارشگری زیست¬محیطی، اجتماعی و راهبری شرکتی به روش تحلیل سلسله مراتبی در شرکت¬های پذیرفتهشده در بورس اوراق بهادار. حسابداری ارزشی و رفتاری، سال 2، شماره 4، صص 153-187.
[24] Saaty, T. L. (1980). The analytic hierarchy. New York: McGraw-Hill.
[25] Rezaei, J. (2015). Best- worst multi criteria decision making methods. OMEGA, 53, 49–57.
[26] سلطانیفر، م.، زرگر، س. م. (1400). ارزیابی و رتبهبندی ریسکهای امنیتی رایانش ابری بر اساس یک رویکرد ترکیبی مبتنی بر مقایسههای زوجی، پژوهشنامه پردازش و مديريت اطلاعات، ۳۷(۱)، ۵۸-۲۷.
[27] Rezaei, J. (2016). Best-worst multi-criteria decision-making method: Some properties and a linear model, Omega, 64, 126-30.
[28] Rezaei, J. (2020). A Concentration Ratio for Nonlinear Best Worst Method, International Journal of Information Technology & Decision Making, 19, DOI: 10.1142/S0219622020500170.
[29] Mohammadi, M., & Rezaei, J. (2020). Bayesian Best-Worst Method: A Probabilistic Group Decision Making Model, Omega, 96, 102075.
[30] Liang, F., Brunelli, M., Rezaei, J. (2020). Consistency issues in the Best Worst Method: Measurements and thresholds, Omega, 96, 102175.
[31] Liang, F., Brunelli, M., Rezaei, J. (2022). Best-Worst Tradeoff Method, Information Sciences, 610, 957-976.
[32] Liang, Y., Ju, Y., Tu, Y., & Rezaei, J. (2022). Nonadditive best-worst method: Incorporating criteria interaction using the Choquet integral. Journal of the Operational Research Society, https://doi.org/10.1080/01605682.2022.2096504.
[33] Khaira, A., Dwivedi, R. K. (2018). A State of the Art Review of Analytical Hierarchy Process, Materials Today: Proceedings, 5(2-1), 4029-4035.
[34] Abastante, F., Corrente, S., Greco, S., Ishizaka, A., Lami, I.M. (2019). A new parsimonious AHP methodology: assigning priorities to many objects by comparing pairwise few reference objects. Expert Systems With Applications, doi:https://doi.org/10.1016/j.eswa.2019.02.036.
[35] Tavana, M., Soltanifar, M., Santos-Arteaga, F. J. (2021). Analytical hierarchy process: revolution and evolution, Annals of Operations Research, https://doi. org/10. 1007/s10479-021-04432-2.
دسترسي در سايتِ http://jnrm.srbiau.ac.ir
سال یازدهم، شماره پنجاه و هفتم، آذر و دی 1404
|
برآورد حداکثر درستنمایی پارامترهای توزیع نمایی-پواسون تحت سانسور فاصلهای پیشرونده نوع I با الگوریتمهای نیوتن-رافسون، EM و SEM
احمد محمدی1، علی شادرخ2*1، مسعود یارمحمدی3
(1و2و3) گروه آمار، دانشگاه پیام نور، تهران، ایران
تاريخ ارسال مقاله: 24/02/1402 تاريخ پذيرش مقاله: 05/08/1403
چکيده
توزیع نمایی-پواسون با استفاده از ترکیب توزیع نمایی با توزیع پواسون بریده شده در صفر به عنوان مدلی برای دادههای طول عمر با نرخ شکست کاهشی، تولید میشود. این مقاله به مسئله برآورد کردن پارامترهای نامعلوم توزیع نمایی-پواسون به عنوان یک مدل برای طول عمر میپردازد که نمونهها تحت سانسور فاصلهای پیش رونده نوع I مشاهده شدهاند. ما از الگوریتمهای نیوتن-رافسون، بیشینهسازی کلاسیک مقادیر مورد انتظار (EM) و بیشینهسازی تصادفی مقادیر مورد انتظار (SEM) برای یافتن برآوردهای حداکثر درستنمایی (MLE) پارامترهای نامعلوم استفاده میکنیم. عملکرد برآوردگرهایSEM پیشنهادی با استفاده از یک شبیهسازی مونت کارلو نشان داده شده است و نیز روی یک مجموعه داده واقعی استفاده شده است. شبیهسازی نشان داد که عملکرد الگوریتمSEM بر مبنای میانگین مربع خطا (MSE) کاملاً رضایتبخش است و با افزایش اندازه نمونه، کارایی برآوردگرها نیز افزایش مییابد.
واژههاي کليدي: برآورد حداکثر درستنمایی، میانگین مربع خطا، روش نیوتن-رافسون، الگوریتم EM، شبیهسازی مونت کارلو.
1. مقدمه
آزمایشهای بقاء و قابلیت اطمینان روشهای مؤثری برای ارزیابی طول عمر محصول در شرایط عملیاتی مشخص شده هستند. چنین آزمایشاتی در کل بر روی واحدهای یکسان قبل از عرضه محصول، انجام میشوند و زمانهای خرابی مشاهده شده ثبت میشوند و به منظور ارزیابی و پیشبینی ویژگیهای محصول مورد بررسی قرار میگیرند. با توجه به محدودیتهای زمانی، هزینههای مالی، یا خرابی سهوی، چنین آزمایشاتی قبل از اینکه همه اجزای آزمایش شده در طول عمر خراب شوند، قطع میشوند. در چنین شرایطی از تکنیکهای سانسور کلاسیک استفاده میشود. سانسور نوع I و نوع II دو روش متدوال هستند که در آنها آزمایش به ترتیب پس از مدتی که از قبل تعیین شده و یا پس از مشاهده تعداد از قبل مشخص شده، خرابیها متوقف میشود در نتیجه دادههای جمعآوری شده اصطلاحاً ناقص هستند. با این حال، هیچ یک از این سیستمهای سانسور یاد شده، به پژوهشگر اجازه نمیدهد تا قبل از پایان آزمایش، واحدی زنده را از آزمایش حذف کند. علاوه بر این در بسیاری از سناریوهای دنیای واقعی، برای مثال در تحقیقات پزشکی و بالینی، آزمایشکنندگان قادر به نظارت مستمر بر آزمونها نیستند. در چنین حالاتی از روش سانسور فاصلهای استفاده میشود که در آن، دادههای طول عمر یا زمانهای خرابی اغلب در فواصل زمانی از قبل مشخص شده، ثبت میشوند. این سانسور نیز اجازه حذف واحدهای بین آزمایش را نمیدهد. مفهوم سانسور پیشرونده، که شامل حذف واحدهای تحت آزمایش است، اخیراً مطرح و مورد توجه واقع شده است. آگاروالا با ترکیب مفاهیم سانسور پیشرونده، سانسور نوعI و سانسور فاصلهای، پیشگام سانسور فاصلهای پیشرونده نوعI شد[2] . این سانسور به صورت زیر مدلبندی آماری میشود.
فرض کنید در زمان یک نمونه تصادفی از
واحد تحت آزمایش بقاء قرار میگیرند و برای
در زمان بازرسی
تعداد کل خرابیهای مشاهده شده در بازه زمانی
برابر
باشد. در این صورت تعداد واحدهای سالم (یا زنده) در زمان بازرسی
که با
نشان خواهیم داد، یک متغیر تصادفی است. بعلاوه فرض کنید تعداد کل واحدهای حدف شده از آزمایش در زمان بازرسی
برابر
باشد بنابراین
. برای تعیین
ها
میتوانیم نسبت معین شده از قبل مانند
از واحدهای سالم در زمان بازرسی
را
بگیریم؛ یعنی
و یا کمترین مقدار بین تعداد مشخص شده از قبل و
را میتوانیم به عنوان
در نظر بگیریم. روشن است
؛ یعنی در زمان
همه واحدهای سالم از آزمایش حذف و آزمایش تمام میشود. دادههای حاصل از این نوع سانسور را میتوان به صورت
نشان داد.
بسیاری از مجموعه دادههای طول عمر از نظر آماری با استفاده از سانسور فاصلهای پیش رونده نوع I تجزیه و تحلیل شدهاند. به عنوان نمونه میتوانیم به دادههای مطالعه112 بیمار مبتلا به میلوم سلول پلاسما در [5]، مجموعه دادههای مطالعه HMO-HIV، در [18] و دادههای زمان بقاء از عمل جراحی گروهی متشکل از 374 بیمار در [13] اشاره کنیم. بعلاوه برای خانواده توزیعهای وایبل نمایی شده در [3]، برای توزیع وایبل در [12]، برای توزیع رایلی تعمیمیافته در [11[، برای توزیع گاما در [21]، برای توزیع نمایی تعمیمیافته در [6] و [14[، برای توزیع وایبل و توزیعهای نمایی تعمیمیافته در [15]، برای توزیع لاگ-نرمال در [16]، و برای توزیع بور12 در [1] روشهای استنتاج آماری تحت این سانسور مطالعه شده است. این مقاله توزیع نمایی-پواسون (Exponnential-Poisson) را تحت سانسور فاصلهای پیش رونده نوعI مورد بحث قرار میدهد. توزیع نمایی-پواسون(EP) به صورتی که در ادامه آمده است با ترکیب توزیع نمایی با توزیع پواسون بریده شده در صفر به عنوان مدلی برای دادههای طول عمر با نرخ شکست کاهشی، در سال 2007 توسط جوشکون کوش معرفی شد [10].
فرض کنید یک نمونه تصادفی از توزیع نمایی با پارامتر
با تابع چگالی احتمال
باشد و
یک متغیر تصادفی با توزیع پواسن بریده شده در صفر با پارامتر
باشد؛ یعنی
. قرار دهید
که در آن
و
مستقل از همند. در این صورت داریم
و تابع چگالی احتمال و تابع توزیع تجمعی کناری (حاشیهای)
به ترتیب به صورت زیر است.
(1)
(2)
تعریف1. یک متغیر تصادفی با تابع چگالی احتمال (1) و تابع توزیع تجمعی (2) را دارای توزیع نمایی-پواسون مینامیم و با نشان میدهیم که در آن پارامترهای
و
به ترتیب پارامتر مقیاس و پارامتر شکل توزیع هستند.
در اینجا باید به خوانندگان این مقاله خاطر نشان کرد که توزیع دیگری برای طول عمر، موسوم به توزیع پواسن-نمایی (Poisson-Exponential) در سال 2011 توسط کانچو و همکارانش با تعریف ارایه شده است [4] که مورد بحث این مقاله نیست. توزیع نمایی-پواسون کاربرد گستردهای در اقتصاد، پزشکی، تجارت و علوم مالیه یا اکچواری پیدا کرده است. احتمال مشاهده مقدار صفر در توزیعهایی مانند گاما، وایبل و لاگ-نرمال که اغلب در آزمایشهای طول عمر یا بقاء استفاده میشوند، صفر است اما در توزیع EP برای هر
و
مشاهده مقدار صفر، احتمال غیر صفر دارد؛ یعنی
. این خاصیت اجازه میدهد تا این توزیع به یک گزینه مناسب برای استفاده در مسائلی تبدیل شود که شامل مقادیر صفر است؛ مثلا در مطالعات محیطی وقوع مقادیر صفر در طول مطالعه بارش، به ویژه در فصول خشک معمول است. چنین رفتاری در مطالعات قابلیت اطمینان نیز یافت میشود که خرابیهای آنی ممکن است به دلیل کیفیت پایینتر یا مشکلات در طول ساخت قطعات رخ دهد. برای شرح جزئیات این توزیع و خواص آن خواننده را به [10] ارجاع میدهیم. این مقاله با فرض اینکه که دادهها با استفاده از سانسور فاصلهای پیشرونده نوع I جمعآوری شدهاند، بر مساله روشهای برآورد پارامترهای ناشناخته توزیع EP میپردازد. بخش 2 به روش برآورد حداکثر درستنمایی (MLE) و مشکلات پیش رو میپردازد. بخش3 روش نیوتن رافسون را مورد بحث قرار میدهد. در بخش 4 برآوردگرها را با استفاده از روش مشهور بیشینهسازی مقادیر مورد انتظار (EM) و بیشینهسازی تصادفی مقادیر مورد انتظار (SEM) به دست میآوریم. در بخش 5 تجزیه و تحلیل بر مبنای یک مجموعه داده واقعی و شبیهسازی شده انجام و نتایج در بخش 6 ذکر شده است.
2. برآورد حداکثر درستنمایی
هدف این بخش یافتن برآوردگرهای حداکثر درستنمایی (MLE) برای پارامترهای نامعلوم توزیع EP است، هنگامی که دادهها با سانسور فاصلهای پیشرونده نوع I مشاهده میشوند. فرض کنید n واحد که طول عمر آنها توزیع دارند در زمان
، برای آزمایش بقاء استفاده میشوند. بعلاوه با قراردادهای بخش 1 فرض کنید
مشاهدات ما تحت سانسور فاصلهای پیشرونده نوع Iدر زمانهای از پیش تعیین شده
باشند. در این صورت مشاهدات، دارای تابع درستنمایی (3) خواهند بود که در آن
تابع توزیع تجمعی (2) است.
(3)
با استفاده از ، برآوردهای حداکثر درستنمایی
، جواب معادلات (4) و (5) زیر است.
(4)
(5)
با این حال، از آنجایی که معادلات بالا جواب با فرم بسته ندارند، روشهای عددی باید اعمال شود. روش نیوتن-رافسون(NR) رایجترین رویکردی است که در حال حاضر مورد استفاده قرار میگیرد. عیب اصلی این تکنیک این است که به مشتق دوم برای هر تکرار نیاز دارد که به دلیل ساختار پیچیده تابع درستنمایی میتواند محاسباتی سخت و خستهکننده داشته باشد.
3. نیوتن-رافسون
با روش نیوتن-رافسون (NR) میتوانیم مقدار برآورد حداکثر درستنمایی پارامترهای نامعلوم را به طور تقریبی پیدا کنیم. فرض کنید . اگر
را به عنوان یک تخمین اولیه در این روش در نظر بگیریم، برآورد مرحله بعد عبارت است از
که در آن
و نیز و
که در معادلات (4) و (5) آمدهاند. علاوه بر آنها
که مشتقهای جزیی در آن بهصورت (6) و (7) و (8) است که در زیر به دست میآیند. برای تکرار بعدی، به جای
قرار میگیرد و این چرخه ادامه پیدا میکند تا
یعنی جوابهای تقریبی معادلات (4) و (5) به دست آید.
(6)
(7)
(8)
4. الگوریتمهای بیشینهسازی مقادیر مورد انتظار
1.4. الگوریتم EM
دمپستر و همکاران در سال 1977 تکنیک بیشینهسازی مقادیر مورد انتظار شرطی (الگوریتم EM) را برای پیدا کردن برآورد حداکثر درستنمایی پارامترهای نامعلوم ارائه کردند[8]. از این روش وقتی استفاده میشود که با مشاهدات ناقص (دادههای گم شده) کار میکنیم مثل دادههای سانسور فاصلهای که ناقص ثبت شدهاند. الگوریتم EM شامل دو مرحله است؛ مرحله Eیا پیدا کردن مقادیر مورد انتظار (Eexpectation) و مرحله M یا بیشینهسازی (Maximization). مرحله E در هر تکرار، دادههای گم شده را با مقادیر مورد انتظار شرطی (توسط مشاهدات ثبت شده و پارامترهای برآورد شده تکرار قبل) در تابع درستنمایی مشاهدات کامل جایگزین میکند و مرحله M، شامل پیدا کردن برآوردهای حداکثر درستنمایی پارامترها از روی لگاریتم تابع درستنمایی حاصل از محاسبات مرحله E. در واقع برآوردهای الگوریتم EM به شکل برآوردهای حداکثر درستنمایی پارامترهای دادههای کامل است با این تفاوت که به جای مقدارهای ثبت نشده یا ناقص ثبت شده، از مقدار برآورد شده آنها در تکرار قبل استفاده میکنیم.
فرض کنید فرض کنید n واحد که طول عمر آنها توزیع دارند در زمان
، برای آزمایش بقاء استفاده میشوند. بعلاوه با قراردادهای بخش 1 فرض کنید
مشاهدات ما تحت سانسور فاصلهای پیشرونده نوع Iدر بازه زمانهای از پیش تعیین شده
باشند. یادآوری میشود که در این سانسور به جای زمان دقیق خرابیها،
ها که تعداد خرابیها در بازه زمانی
هستند، ثبت میشود و بنابراین دادههای جمعآوری شده به نوعی ناقص هستند. حال فرض کنید برای
و
طول عمر دقیق کل خرابیهای مشاهده شده را با
ها نشان دهیم همچنین
ها برای
و
طول عمر دقیق کل واحدهای سانسور شده باشند. بنابراین دادههای کامل را میتوان ترکیبی از
های ناقص ثبت شده و
های ثبت نشده در نظر گرفت. با استفاده از (2)، لگاریتم تابع درستنمایی برای نمونه کامل را به شکل زیر داریم.
با مساوی صفر قرار دادن معادلات حاصل از مشتقات جزیی نسبت به
و
به ترتیب روابط (9) و (10) زیر نتیجه میشوند.
(9)
(10)
بنابراین در مرحله E ابتدا مقادیر مورد انتظار شرطی زیر برای تخمین مقادیر به اصطلاح گم شده محاسبه
میشوند.
حال اگر را به عنوان یک تخمین اولیه برای مقدار واقعی
در نظر بگیریم، برآورد
در تکرار
الگوریتم EM را با
نشان دهیم، مرحله M با استفاده از روابط (9) و (10) برآورد پارامترها در تکرار
به صورت (11) و (12) زیر خواهد بود.
زمانی که برای یک مقدار خیلی کوچک و مثبت
صدق کند، همگرایی مطلوب وجود دارد و این الگوریتم میتواند خاتمه یابد.
ملاحظه میشود که مقادیر مورد انتظار بالا، فرم بسته ندارند و روشهای عددی لازم است اما به هر حال با نرمافزارهایی مانند R قابل محاسبه هستند. در زیربخش بعد به عنوان راه حل دیگر، الگوریتم بیشینهسازی تصادفی مقادیر مورد انتظار (SEM) را استفاده میکنیم.
(11)
(12)
2.4. الگوریتم SEM
در اجرای مرحله E الگوریتم EM ممکن است محاسبات پیچیده و غیرقابل حل دستی وجود داشته باشد.
روشهای مختلفی از طرف پژوهشگران برای کم کردن هزینههای محاسباتی موجود پیشنهاد شده است. به عنوان نمونه میتوانیم به استفاده از روش انتگرالگیری مونت کارلو در [19] اشاره کنیم. با این وجود، اغلب در مرحله M، مساله بیشینهکردن همچنان پیچیده و زمان بر باقی میماند [20]. در [9] خواص مجانبی برآوردهای حاصل از الگوریتم SEM با ایده جایگزینی مرحله E با یک مرحله تصادفی (Stochastic) و اجرای آن از طریق شبیهسازی ارایه شد. در این الگوریتم به جای ماکزیمم کردن امید ریاضی شرطی لگاریتم تابع درستنمایی مشاهدات کامل، ابتدا دادههای گم شده را از توزیع شرطی دادههای گم شده (به شرط مشاهدات ثبت شده و پارامترهای برآورد شده تکرار قبل) تولید میکنیم سپس مرحله M اجرا میشود. نشان داده شده است که روشSEM از نظر بار محاسباتی از روش EM مناسبتر است [22] و [23]. در اینجا از این ایده استفاده خواهیم کرد.
ابتدا فرض کنید تعداد مقدار مستقل
را برای
و
از توزیع شرطی زیر داریم.
بعلاوه تعداد مقدار مستقل
را برای
و
از توزیع شرطی زیر داریم.
حال با استفاده از روابط (9) و (10) برآورد MLE پارامترها در تکرار در روش SEMاز روابط (13) و (14) به دست خواهد آمد. ما در بخش 1.5 ابتدا با استفاده از 10000 بار شبیهسازی مقادیر گم شده از
توزیعهای شرطی بالا، مقادیر مورد انتظار را با روش میانگینگیری مونت کارلو حساب و سپس برآورد پارامترها را به دست آوردهایم. در ضمن این چرخه را 100 بار تکرار کردهایم و میانگین برآوردها را گزارش کردهایم.
اگر برآورد پارامترها را بعد از خاتمه یافتن الگوریتمها با نشان دهیم، ماتریس اطلاع فیشر مشاهده شده را به صورت زیر میتوان به دست آورد که درایههای آن با روابط (6) تا (8) که در بخش 3 داده شده است، محاسبه میشوند.
فاصلههای اطمینان تقریبی برای
و
به ترتیب
و
خواهند بود که منظور از
، صدک
توزیع نرمال استاندارد است.
(13)
(14)
5. تحلیل دادههای شبیهسازی و واقعی
1.5. شبیهسازی
هدف این بخش بررسی عملکرد برآوردگرهای پیشنهادی از طریق یک مطالعه شبیهسازی است. ابتدا برایm و n معلوم، زمانهای بازرسی از پیش تعیین شده و
های از پیش تعیین شده، دادههای
را تحت سانسور فاصلهای نوع I با استفاده از الگوریتمی که در [2] پیشنهاد شده است، به شرح زیر تولید میکنیم.
بر طبق این الگوریتم ابتدا را تولید میکنیم. سپس
تولید میشود. بعلاوه با
ها
ها برای
از توزیع دو جملهای زیر تولید میشوند.
در شبیهسازی، برای تعداد واحدهای تحت آزمایش مقادیر و زمانهای
را در نظر گرفتیم. همچنین سه طرح زیر را برای سانسور استفاده کردیم.
توجه کنید که طرح همان سانسور فاصلهای معمولی نوعI است. با استفاده از این مقادیر بالا و توزیعهای EP(0.5,2.5) و EP(2,1)، دادههای مورد نیاز را تولید کردیم. میانگین برآوردهای حداکثر درستنمایی پارامترها و مقادیر میانگین مربعات خطای (MSE) آنها بهدست آمده بر اساس 100 تکرار با استفاده از الگوریتمهایNR ،EM وSEM در جدول (1) و جدول (2) به ترتیب برای هر دو توزیع گزارش شده است.
جدول(1) برآوردهای MLE برای پارامترهای توزیع EP(0.5 , 2.5) از سه الگوریتم با 100 تکرار
| الگوریتم | SEM | EM | NR | |||||||||||||||
| n | 20 | 30 | 50 | 100 | 150 | 200 | 20 | 30 | 50 | 100 | 150 | 200 | 20 | 30 | 50 | 100 | 150 | 200 |
طرح
|
| 0.5179 | 0.5127 | 0.5167 | 0.4888 | 0.4931 | 0.4954 | 0.8395 | 0.6997 | 0.7974 | 0.5555 | 0.7009 | 0.6309 | 2.0787 | 1.2514 | 1.0459 | 0.9235 | 0.9064 | 0.8832 |
| 0.0629 | 0.0555 | 0.0573 | 0.0006 | 0.0014 | 0.0003 | 0.9813 | 0.5128 | 0.6833 | 0.1573 | 0.3743 | 0.2571 | 0.8513 | 0.0611 | 0.0324 | 0.3935 | 0.7058 | 0.0678 | |
| 2.6906 | 2.5658 | 2.4847 | 2.553 | 2.4802 | 2.5075 | 2.5379 | 2.4718 | 2.3423 | 2.5187 | 2.3621 | 2.4478 | 3.0129 | 2.8877 | 2.7774 | 2.7297 | 2.6565 | 2.6191 | |
| 0.834 | 0.2694 | 0.151 | 0.0897 | 0.0495 | 0.0374 | 1.1434 | 0.4359 | 0.3967 | 0.1607 | 0.1983 | 0.1451 | 10.08 | 5.2579 | 1.4416 | 4.3872 | 7.7222 | 7.7135 | |
طرح
|
| 0.5637 | 0.4906 | 0.4945 | 0.4848 | 0.4928 | 0.4924 | 0.8632 | 0.8252 | 0.7415 | 0.7312 | 0.5913 | 0.6074 | 0.8262 | 0.81 | 0.8223 | 0.8056 | 0.8055 | 0.8096 |
| 0.1816 | 0.0046 | 0.002 | 0.0009 | 0.0005 | 0.0003 | 0.9317 | 0.7732 | 0.6126 | 0.515 | 0.2012 | 0.1978 | 7.3298 | 2.4317 | 0.0086 | 0.6628 | 1.7693 | 12.689 | |
| 2.5552 | 2.544 | 2.583 | 2.5066 | 2.506 | 2.5012 | 2.4328 | 2.3778 | 2.464 | 2.3757 | 2.5051 | 2.4952 | 2.6785 | 2.683 | 2.6695 | 2.6621 | 2.6437 | 2.6275 | |
| 0.6085 | 0.2647 | 0.214 | 0.0683 | 0.0617 | 0.0513 | 0.9754 | 0.5834 | 0.4663 | 0.3018 | 0.1768 | 0.1513 | 0.2125 | 13.773 | 12.546 | 0.5896 | 1.5333 | 0.3366 | |
طرح
|
| 0.6001 | 0.5989 | 0.4877 | 0.4871 | 0.4918 | 0.4991 | 0.849 | 1.0981 | 0.6703 | 0.7397 | 0.6319 | 0.5678 | 0.7641 | 0.7854 | 0.7728 | 0.7636 | 0.7639 | 0.7544 |
| 0.2803 | 0.2499 | 0.0012 | 0.0005 | 0.0003 | 0.0002 | 1.092 | 1.3513 | 0.4407 | 0.5285 | 0.2597 | 0.121 | 12.916 | 2.5614 | 0.0468 | 0.8437 | 0.309 | 0.315 | |
| 2.5304 | 2.5371 | 2.4851 | 2.4982 | 2.5296 | 2.5074 | 2.4338 | 2.2784 | 2.396 | 2.3613 | 2.4501 | 2.4604 | 2.6629 | 2.6471 | 2.6405 | 2.6332 | 2.621 | 2.6149 | |
| 0.4267 | 0.3517 | 0.1666 | 0.0752 | 0.0427 | 0.038 | 0.7422 | 0.7607 | 0.3565 | 0.2821 | 0.155 | 0.0956 | 12.325 | 0.0103 | 6.3219 | 8.656 | 1.8806 | 5.561 | |
| الگوریتم | SEM | EM | NR | |||||||||||||||
| n | 20 | 30 | 50 | 100 | 150 | 200 | 20 | 30 | 50 | 100 | 150 | 200 | 20 | 30 | 50 | 100 | 150 | 200 |
طرح
|
| 1.8106 | 1.9215 | 1.9835 | 2.0132 | 2.0169 | 2.0141 | 1.5564 | 1.7435 | 1.7833 | 1.811 | 1.828 | 1.8853 | 1.5677 | 2.1743 | 2.2905 | 2.2168 | 2.0856 | 2.0142 |
| 0.3551 | 0.169 | 0.0834 | 0.0251 | 0.0095 | 0.0079 | 1.4338 | 1.2677 | 0.4472 | 0.3446 | 0.2545 | 0.1736 | 2.4551 | 0.4235 | 2.6584 | 7.7856 | 1.4356 | 0.6324 | |
| 1.1255 | 1.0688 | 1.0317 | 1.0011 | 0.9907 | 0.9865 | 1.2884 | 1.1853 | 1.1265 | 1.1014 | 1.0756 | 1.0408 | 1.7261 | 1.5776 | 1.4859 | 1.4324 | 1.3954 | 1.3608 | |
| 0.1738 | 0.1245 | 0.043 | 0.0143 | 0.0053 | 0.0044 | 0.4093 | 0.2649 | 0.1169 | 0.1105 | 0.0618 | 0.0303 | 0.9809 | 2.1193 | 11.139 | 0.2507 | 1.5681 | 0.1182 | |
طرح
|
| 1.9307 | 1.9586 | 2.0308 | 1.9936 | 2.0281 | 2.002 | 1.7699 | 1.7516 | 1.7913 | 1.8357 | 1.8973 | 1.8784 | 2.6177 | 2.7228 | 2.7294 | 2.7525 | 2.6377 | 2.5575 |
| 0.1989 | 0.196 | 0.0291 | 0.0189 | 0.0129 | 0.0093 | 1.2597 | 1.0446 | 0.3735 | 0.2448 | 0.1806 | 0.175 | 0.149 | 0.0001 | 0.6559 | 1.3266 | 0.0065 | 0.1357 | |
| 1.0569 | 1.0531 | 1.0036 | 0.9731 | 0.9998 | 0.9772 | 1.1901 | 1.1931 | 1.1235 | 1.0527 | 1.061 | 1.0349 | 1.3993 | 1.434 | 1.438 | 1.4197 | 1.4105 | 1.3938 | |
| 0.1359 | 0.1218 | 0.0161 | 0.0116 | 0.0069 | 0.0057 | 0.3492 | 0.3214 | 0.1277 | 0.0886 | 0.0502 | 0.0477 | 12.575 | 8.4211 | 1.1836 | 1.3706 | 0.4117 | 0.6881 | |
طرح
|
| 1.9138 | 1.9686 | 1.9776 | 2.0162 | 2.025 | 2.0334 | 1.793 | 1.9248 | 1.7016 | 1.8172 | 1.8136 | 1.9303 | 2.965 | 3.0505 | 3.0197 | 2.9586 | 2.9141 | 2.8663 |
| 0.2723 | 0.1668 | 0.0406 | 0.0139 | 0.0121 | 0.0093 | 1.2394 | 0.6003 | 0.4645 | 0.2814 | 0.2858 | 0.1403 | 15.366 | 0.9574 | 0.4108 | 2.6016 | 0.6358 | 16.606 | |
| 1.098 | 1.0756 | 1.0061 | 0.9894 | 0.9939 | 1.0032 | 1.1871 | 1.1217 | 1.1503 | 1.0831 | 1.0916 | 1.0498 | 1.4026 | 1.4013 | 1.4011 | 1.3934 | 1.3846 | 1.3729 | |
| 0.1321 | 0.0802 | 0.0323 | 0.0081 | 0.0066 | 0.005 | 0.2417 | 0.1631 | 0.1878 | 0.0798 | 0.0772 | 0.0366 | 2.1271 | 3.6771 | 1.1819 | 0.0082 | 3.2348 | 0.4609 | |
الگوریتم | SEM | EM | NR |
ها | 0.511561 | 0.730028 | 0.920694 |
ها | 0.050017 | 0.555044 | 2.444167 |
ها | 2.531422 | 2.428400 | 2.692622 |
ها | 0.211133 | 0.418178 | 5.574900 |
الگوریتم | SEM | EM | NR |
ها | 1.979900 | 1.806233 | 2.563383 |
ها | 0.090561 | 0.567294 | 3.013444 |
ها | 1.024122 | 1.119828 | 1.434967 |
ها | 0.051533 | 0.153594 | 2.862017 |
بازه زمانی درمان (برحسب ماه) | تعداد بیماران تحت درمان |
|
|
| 112 | 18 | 1 |
| 93 | 16 | 1 |
| 76 | 18 | 3 |
| 55 | 10 | 0 |
| 45 | 11 | 0 |
| 34 | 8 | 1 |
| 25 | 13 | 2 |
| 10 | 4 | 3 |
| 3 | 1 | 2 |
| 0 | 0 | 0 |
الگوریتم | SEM | EM | NR |
| 0.83657 | 0.83664 | 0.89872 |
| 0.03512 | 0.03511 | 0.034314 |
[1] *. عهدهدار مکاتبات: Email: a.shadrokh@pnu.ac.ir
