Efficiency of stochastic logistics model in predicting the population infected with HIV in Iran
Subject Areas : StatisticsRamzan Rezaeyan 1 , seyyed Saleh Mohseni 2 , Samira Ala 3 , sahebeh Aghababaeipour 4
1 - Assistant Professor in Department of mathematics and statistics, Islamic Azad University, Nour Branch
2 - Assistant Professor in Electrical Eng. Dept., Islamic Azad University, Nour Branch
3 - Department of Mathematics, Islamic Azad University, Nour Branch, Nour, Iran
4 - Islamic Azad University, Nour Branch
Keywords: پیش بینی, ویروس ایدز, مدل لجستیک تصادفی, انتگرال ایتو,
Abstract :
The study of population growth and population forecasting is a major problem in biology. Since the growth rate is not completely known over time and depends on environmental factors that are completely random, then all biological populations (virus, humans, bacteria, etc.) have some kind of random behavior or noise. It is generally referred to as a random process. The purpose of this article is to predict the number of people living with HIV in Iran based on a random logistics model and compare it with a non-random (definitive) model. For a case study to predict the number of AIDS patients in Iran, we considered the population of patients during the years 1384 to 1394 and with the help of MATLAB program we simulated the number of patients for the coming years. Comparison of the obtained results with real values and the results of other models, shows the high accuracy and efficiency of the model.
کارائی مدل لجستیک تصادفی در
پیش بینی جمعیت مبتلا به ویروس ایدز در ایران
چکیده:
مطالعه رشد جمعیت و پیش بینی جمعیت یک مشکل اصلی در زیست شناسی است. از آنجائیکه نرخ رشد نسبت به زمان کاملا مشخص و معلوم نیست و به عوامل محیطی که کاملا تصادفی می باشند، بستگی دارد پس همه جمعیتهای زیستی(ویروس، انسان، باکتری و ...) نوعی رفتار تصادفی یا نویزی دارند..چنین نویزهایی به طور کلی به عنوان یک فرآیند تصادفی معرفی می شود. هدف این مقاله پیش بینی تعداد افراد مبتلا به ویروس ایدز در ایران بر اساس مدل لجستیک تصادفی و مقایسه آن با مدل غیرتصادفی(قطعی) می باشد. برای مطالعه موردی هم برای پیش بینی تعداد بیماران مبتلا به ویروس ایدز در ایران، جمعیت مبتلایان را طی سالهای 1384 تا 1394 مد نظر قرار دادیم و به کمک برنامه متلب تعداد بیماران را برای سالهای آتی شیبه سازی نمودیم. مقایسه نتایج بدست امده با مقادیر واقعی و نتایج حاصل از مدلهای دیگر، نشان از دقت و کارائی بالای مدل لجستیک تصادفی می باشد
لغات کلیدی: مدل لجستیک تصادفی، پیش بینی، انتگرال ایتو، ویروس ایدز.
1. مقدمه
مدل بندی رشد جمعیت موضوع مهمی در جهان واقعی است. یکی از این جمعیت ها ی خاص، جمعیت مبتلا به ویروس ایدز می باشد. پژوهش های ژنتیکی نشان می دهند که ویروس اچ ای وی در اصل در اوایل قرن بیستم میلادی در غرب آفریقا جهش یافته و پدیدار شده است و بسرعت در دیگر نقاط جهان پخش گردیده و خیلی از کشورها در حال حاضر درگیر مشکلات مربوط به انتشار ویروس در بین افراد بوده و در صدد برنامه ریزی برای پیشگیری از انتشار آن و درمان افراد مبتلا به آن می باشند. برای رسیدن به این هدف باید آمار دقیقی از بیماران مبتلا به این ویروس و هم چنین پیش بینی دقیقی از تعداد آنها در سال های آتی داشته باشیم.
اصولا پیش بینی عنصر کلیدی برای تصمیم گیریهای مدیریتی است چراکه پیش بینی ، برآورد پیشامدهای آینده است و هدف از پیش بینی کاهش ریسک در یک تصمیم گیری است. لذا قادر به حذف کامل ریسک در پیش بینی نیستیم و در یک تصمیم صحیح که مجموعی از تصمیم گیری بر اساس صحت پیش بینی و خطای ناشی از آن می باشد، باید بتوانیم برآورد دقیقتری بر اساس اطلاعات موجود داشته باشیم تا بتوانیم تصمیم صحیح تری بگیریم.
در این زمینه در اکثر کشورها مطالعات زیادی صورت گرفته و به نتایجی هم دست یافتند که در این مطالعات، مدل هائی هم ارائه کردند که تقریبا تمام این مدل ها بر اساس مدل های ریاضی و آمار می باشد. ریاضیات و آمار نقش مهمی در مدل بندی پدیده های طبیعی و غیر طبیعی دارند. مدل های حاصل معمولاً به فرم های قطعی(غیرتصادفی)، تصادفی و مدل های تصادفی پیوسته مختلط می باشند.
تقریبا تا سال 1950 میلادی به دلیل نبود کامپیوترهای توانمند و روش های عددی مناسب از عامل های تصادفی در این مدل ها صرف نظر می کردند که بعد از رفع این مشکلات عامل های تصادفی را هم به این مدل ها اضافه نمودند. در نهایت مدل های غیر تصادفی به تصادفی تبدیل گشته و اکثر این مدل ها به معادلات دیفرانسیل تصادفی منجر گردیده است.
شببیه سازی عددی معادلات دیفرانسیل تصادفی معمولی برای مدلهای زیست ریاضی توسط کارلتی و همکارانش بیان گردید[1]. آنها اثرات جایگشت نویز سفید و رنگی را در مدلهای مربوط به رشد جمعیت در نظر گرفتند و به روش عددی مدل تصادفی مربوطه را شبیه سازی کردند. آندریاس در سال 2005 مدل نرخ رشد جمعیت را بصورت نمائی در نظر گرفت[2]. سپس خدابین، مالک نژاد و همکاران مدل تصادفی رشد جمعیت نمائی را به روش تحلیلی و عددی شبیه سازی نمودند[3]. ماتیسا و همکاران مدل رشد جمعیت لجستیک تصادفی را برای نرخ زاد و مرگ در نظر گرفته و جواب تحلیلی مدل مربوطه را بدست آوردند[4]. رضائیان و جعفری یک فاصله اطمینان برای مدل رشد جمعیت نمایی تصادفی با نویز مخلوط را ارائه کرده اند[5].
آنچه که در مدل معادله دیفرانسیل لجستیک تصادفی مهم است، برآورد پارامترهای مدل می باشد. در سال 2009 میلادی رحمان و همکارانش به برآورد پارامترهای مدل لجستیک تصادفی پرداختند[9].
در این مقاله قصد داریم با مدل لجستیک تصادفی که زنگ و همکارانش در [10] برای انتشار ویروس در 2017 در نظر گرفتند، بر اساس جمعیت افراد مبتلا به ویروس ایدز در ایران طی سال های 1384 تا 1394، تعداد مبتلایان به این ویروس را برآورد و تعداد افراد مبتلا به این ویروس را در سالهای بعد پیشبینی نماییم.
برای این منظور مقاله را به چهار بخش تقسیم می نماییم: در بخش اول مفاهیم اولیه ارایه می شود در بخش بعد حسابان تصادفی را شرح خواهیم داد. سپس به شبیه سازی عددی می پردازیم و در نهایت نتیجه گیری خواهیم نمود.
1- مفاهیم اولیه
حسابان تصادفي مربوط به مطالعه فرآيندهاي تصادفي، انتگرالهاي تصادفي و معادلات ديفرانسيل تصادفي میباشد. براي مطالعه اين موضوعات، نياز به مباحث نظريه احتمال و فرآيندهاي تصادفي داريم. هدف از اين بخش، مروري بر تعاريف اساسي و نتايج اصلي مربوط به حسابان تصادفي شامل نظريه احتمال و فرآيندهاي تصادفي میباشد.
1-1. متغیر تصادفی:
فرض کنید (Ω, F, P) یک فضای احتمال باشد. X : Ω →R را یک متغیر تصادفی روی فضای احتمال (Ω, F , P) گوئیم.
1-2:فرآیند تصادفی:
در بسياري از كاربردهاي فيزيكي، يك دنباله از متغيرهاي تصادفي اغلب ميتواند بعنوان توصيف سادهاي از ريشهيابي يك سيستم احتمالاتي روي لحظههاي گسسته زمان در نظر گرفته شود. از اين رو رفتار چنين سيستمی ميتواند توسط يك خانواده از متغيرهاي تصادفي كه منجر به يك فرآيند تصادفي ميشود، توصيف گردد.
يك فرآيند تصادفي خانوادهاي از متغيرهاي تصادفي از دو متغیر و ، روی فضای مشترک است که مقادیر آن حقیقی فرض شده و بعنوان تابعی از برای هر ی ثابت میباشد. پارامتر بعنوان زمان در مجموعه زمان تعبیر میشود. برای هری ثابت یک متغیر تصادفی روی فضای احتمال میباشد و برای هر ی ثابت یک مسیر نمونه یا مسیر فرآیند تصادفی نامیده میشود. اگر مجموعه زمان گسسته فرض شود آنگاه یک فرآیند تصادفی زمان گسسته فرض میشود، مادامیکه اگر مجموعه زمان یک بازه کراندار یا بیکران باشد آنگاه یک فرآیند تصادفی زمان پیوسته نامیده میشود. بطور شهودی اگر بعنوان زمان و بعنوان یک ذره(یا آزمایش) فرض شده باشند آنگاه میتواند بعنوان نمایش مکان (یا نتیجه) یک ذره(یا آزمایش) در زمان تعبیر شود. برای هر ی ثابت فرآیند تصادفی را با نشان میدهیم، لذا در این مقاله، هرگاه صحبت از فرآیند تصادفی میشود، منظور فرآیند تصادفی بازای ثابت است.
1-3 فرآیند وینر:
فرآیند را فرآیند وینر گوئیم هرگاه
1)
2) یک فرآیند با نموهای مستقل باشد. یعنی و ... و مستقل از هم باشند.
3)
اگر بهازاي هر ، ثابتهاي مثبت وجود داشته باشند بطوري كه فرآيند تصادفي در شرط:
بهازاي هر صدق كند، آنگاه فرآيند تصادفي داراي يك نسخه پيوسته خواهد بود. چون براي فرآيند وينر، بهازاي هر ، بنابراين فرآيند وينر در شرط كولموگورف فوق با انتخاب ، صدق ميكند و در نتيجه فرآيند وينر داراي يك نسخه پيوسته خواهد بود[6]. حال چند ویژگی اسا سی فرآیند وینر را بیان میکنیم:
1-4 چند خصوصیت مهم فرآیند وینر
الف- فرآیند وینر دارای مسیرهای نمونه ای پیوسته است.
ب- حرکت براونی تقریباً در هیچ نقطهای از مسیر مشتق ندارد.
ج- حرکت براونی دارای خاصیت مارکفی است.
د- حرکت براونی دارای خاصیت مارتینگلی است .
ه- مسیر براونی در هیچ بازه ای یکنوا نمی باشد.
یرای اثبات خواص فوق می توانید به منبع [7] مراجعه نمائید.
2- حسابان تصادفی
در محاسبات تصادفی به انتگرال هائی برخورد می نمائیم که با انتگرال های معمولی، تفاوت فاحشی دارد چراکه در انتگرال تصادفی . در این فصل قصد داریم چنین انتگرال های تصادفی را تعریف نمائیم، خواص آن را بیان کنیم و سپس هم به روش مستقیم یعنی به کمک تعریف آن و گسسته سازی توسط افراز روی بازه زمانی و هم بکمک فرمول زنجیره ای تصادفی حاصل انتگرال تصادفی را بدست آوریم.
2-1-انتگرال ایتو
فرض کنید β سیگما بورل در [0, ∞] ، F سیگما جبر روی Ω و ν=ν (S, T) تابعی از کلاس
باشد، در این صورتf(t, ω)→ (t, ω) اندازه پذیر روی β×F هستند و
[6] را ببینید.
تعریف: فرض کنید fν (S, T). انتگرال ایتو f از S تا T بصورت زیر تعریف می گردد:
وقتی که دنباله ای از توابع باشد که در شرط زیر صدق نمایند:
[6] را ببینید.
2-2 قضیه (خاصیت ایزومتری ایتو)
فرض نمائید fν (S, T).در این صورت ( برای اثبات به صفحه 29 اوکسندال [6] مراجعه نمائید):
.
2-3 خواص انتگرال ایتو:
فرض کنید و در این صورت:
2)
3)
4-فرمول ایتو (قاعده زنجیره ای ایتو) در حالت یک بعدی
فرض کنید ، و ،
وقتی که:
اثبات: ببینید [6] .
2-4 مدل رشد لجستیک تصادفی
مدل رشد جمعیت زیر را در نظر بگیرید که در آن تعداد افراد جمعیت در زمان ، جمعیت اولیه در زمان t=0 که غیر تصادفی است، k گنجایش محیط مورد نظر( اندازه ماکزیمم جمعیت) و نسبت پایداری جمعیت می باشد:
جواب این معادله دیفرانسیل معمولی بفرم زیر است([6] را ببینید):
با فرض r(t)=r (r مقدار ثابت) ، نتیجه می شود:
از آنجائیکه نرخ رشد کاملا مشخص نمی باشد و به عوامل تصادفی وابسته است ، پس در مدل رشد لجستیک قطعی عامل نرخ رشد را به صورت زیر در نظر می گیریم:
, (1)
که r(t) تابعی غیر تصادفی از متغیر زمان است. بنابراین:
وقتی که یک فرآیند نویز سفید یک بعدی و B(t) حرکت براونی یک بعدی، تابعی غیر تصادفی است. کامپیلو و همکارانش با در نظر گرفتن نرخ رشد بصورت (1)، مدل رشد لجستیک تصادفی بفرم زیر را در نظر گرفتند:
(2)
وقتی نرخ زاد(تولد)، نرخ مرگ، ضریب لجستیک و شدت نویز می باشد. پارامترهای مدل به روشهای مختلف براورد می شود] 8، 9[ . توجه داریم که مدل (2) را می توان بفرم زیر بازنویسی کرد(ببینید ] 8[):
(3)
با
and
3-6-1 لم:
برای هر مقدار اولیه نامنفی ، معادله (2) یا معادل آن (3) دارای یک جواب منحصربفرد می باشد.
اثبات: ببینید ] 7[ .
جواب معادله (3) بصورت زیر می باشد:
وقتی که:
.
توجه داریم که اگر ، صفر باشد به معادله دیفرانسیل معمولی تبدیل می شود( ببینید ] 7[).
3 - شبیه سازی عددی
جدول (1) شامل تعداد واقعی جمعیت مبتلایان به ویروس ایدز طی سالهای 1384 تا 1394 است.
فرض می کنیم 0t= متناظر با سال 1384 باشد، بنابراین جمعیت اولیه 13702 .
جدول 1. جمعیت مبتلایان به ویروس ایدز
تعداد | سال | زمان |
13702 | 1384 | 0 |
14090 | 1385 | 1 |
15587 | 1386 | 2 |
18320 | 1387 | 3 |
20547 | 1388 | 4 |
21890 | 1389 | 5 |
24290 | 1390 | 6 |
26125 | 1391 | 7 |
27416 | 1392 | 8 |
28663 | 1393 | 9 |
30183 | 1394 | 10 |
بر اساس مشاهدات اولیه جدول (1) و بکمک نرم افزار SPSS ، مدلهای مختلفی را برازش نمودیم و ضریب تعیین و انحراف معیار خطاهای مدل را در مدلهای مختلف بدست آوردیم که نتایج در جدول زیر مشخص شده اند:
جدول2. جدول ضریب تعیین حاصل از مدلهای مختلف
انحراف معیار خطاهای مدل | ضریب تعیین | مدل رگرسیونی |
192/619 | 990/0 | لگاریتمی |
907/448 | 996/0 | درجه سه |
050/0 | 972/0 | لجستیک |
مطابق جدول (2)، برحسب ضریب تعیین بهترین مدل، مدل رگرسیونی درجه سه است ولی انحراف معیار مدل رگرسیونی درجه سه بسیار بالاست. با مقایسه ضریب تعیین و انحراف معیار بدست آمده مدل رگرسیون لجستیک را برای این سری از مشاهدات برازش می نمائیم.
شکل (1): نمودار برآورد جمعیت مبتلایان به ویروس ایدز با مدل رگرسیونی درجه سه و لجستیک
حال پارامترهای مدل لجستیک را بر اساس داده های جدول (1)، به کمک نرم افزار SPSS برآورد می نمائیم. نتایج در جدول (3) آمده است:
جدول3. جدول ضرایب مدل لجستیک | |||||
---|---|---|---|---|---|
| ضرائب غیر استاندارد | ضرائب استاندارد | Sig. | ||
| B | Std. Error | Beta | ||
t | 918/0 | 004/0 | 373/0 | 000/0 | |
(Constant | 000007/0 | 000/0 |
| 000/0 | |
|
|
|
|
مطابق جدول (3) ،000007/0= و 918/0=
بنابراین برای محاسبه نرخ رشد جمعیت مبتلایان به ویروس ایدز حاصل از مدل لجستیک داریم:
، نرخ رشد جمعیت بیماران طی سالهای 1384 تا 1394 در جدول (4) نشان داده شده اند.
جدول4. جدول برآورد نرخ رشد بر اساس مدل لجستیک
t | سال | N(t) |
|
0 | 1384 | 13702 | ------ |
1 | 1385 | 14090 | 272/0 |
2 | 1386 | 15587 | 137/0 |
3 | 1387 | 18320 | 059/0 |
4 | 1388 | 20547 | 024/0 |
5 | 1389 | 21890 | 010/0 |
6 | 1390 | 24290 | 004/0 |
7 | 1391 | 26125 | 001/0 |
8 | 1392 | 27416 | 0006/0 |
9 | 1393 | 28663 | 0002/0 |
10 | 1394 | 30183 | 0001/0 |
کران بالای فاصله اطمینان | کران پائین فاصله اطمینان | مقدار پیش بینی | سال |
42288 | 30742 | 35193 | 1395 |
44109 | 33289 | 38319 | 1396 |
48321 | 36025 | 41722 | 1397 |
52963 | 38965 | 45428 | 1398 |
58078 | 42126 | 49463 | 1399 |
63712 | 45526 | 53857 | 1400 |
حال به کمک برنامه متلب، به روش عددی اویلر-ماریاما جواب تقریبی مدل لجستیک تصادفی (2) را با فرض 5/0= ، 76/0=، 76/0-= و 14/0= بدست آوردیم ( ببینید ]8[ ) که نتایج در نمودار زیر نشان داده شده است که خط آبی مقادیر واقعی تعداد بیماران مبتلا به ویروس ایدز و نقاطی که با رنگ سبز مشخص شده اند ، مقدار برآورد تعداد بیماران توسط مدل لجستیک تصادفی را نشان می دهد :
شکل (2): نمودار برآورد جمعیت مبتلایان به ویروس ایدز با مدل رگرسیونی لجستیک تصادفی
پیش بینی تعداد افراد مبتلا به ویروس ایدز در ایران در سالهای 1395 تا 1399 بر اساس مدل لجستیک تصادفی به کمک نرم افزار متلب در جدول (6) نشان داده شده است.
جدول6. جدول برآورد پیش بینی بر اساس مدل لجستیک تصادفی
مقدار پیش بینی تعداد بیماران
| سال |
33000 | 1395 |
33700 | 1396 |
34400 | 1397 |
34900 | 1398 |
35300 | 1399 |
در سال 1396 پیش بینی می گردد جمعیت مبتلایان به ویروس ایدز، مطابق مدل لجستیک تصادفی، حدودا 33700 نفر باشد در حالی که جمعیت واقعی تعداد بیماران مبتلا به ویروس ایدز در ایران در این سال 37650 نفر هست. همچنین مطابق آمار ارائه شده از سوی وزارت بهداشت در سال 1399 حدودا 39200 نفر در ایران مبتلا به ویروس ایدز بودند که بر اساس مدل لجستیک تصادفی در این سال تعداد بیماران 35300 نفر براورد گردیده است. اختلاف مقدار واقعی با مقدار برآورد شده در سال 1399 بر اساس دو مدل لجستیک قطعی و تصادفی، نشان دهنده دقت بالای مدل لجستیک تصادفی می باشد.
نتیجه گیری:
هدفمان پیش بینی تعداد مبتلایان به ویروس ایدز در ایران بر اساس تعداد مشاهدات سال 1384 تا 1394 بوده است. به کمک نرم افزار SPSS مدلهای مختلفی برازش کردیم که بر اساس ضریب تعیین بهترین مدل، مدل لجستیک بوده است. بر اساس این مدل توانسته ایم تعداد بیماران را برای سالهای 1395 تا 1399 برآورد نمائیم اختلاف بین مقدار واقعی و مقدار برآورد شده حاکی از آن است که نمی توان از عاملهای تصادفی صرفنظر کرد. با اضافه کردن این عوامل که عموما آن را نویز می نامیم، به مدل لجستیک معمولی، مدل لجستیک تصادفی دست پیدا کردیم. به کمک برنامه متلب و به روش عددی اویلر-ماریاما معادله دیفرانسیل تصادفی را شبیه سازی نمودیم و تعداد مبتلایان به ویروس ایدز را برآورد کردیم که نسبت به مدل معمولی( غیر تصادفی) از خطای بسیار کمتری برخوردار بوده است که نشان از کارائی بالای مدل تصادفی دارد. در نتیجه نمی توان عاملهای تصادفی را نادیده گرفت و در حال حاضر بهترین و کاراترین مدل برای برآورد بیماران مبتلا به ویروس ایدز، مدل لجستیک تصادفی می باشد.
منابع:
[1] Carleti, M., & Burrage, K., & Burrage,. P.M.(2004). Numerical simulation of stochastic ordinary differential equations in biomathematical modeling. Mathematics and Computers in simulation, 64, 271-277.
[2] Andreis, S. De., & Ricci, P. E.(2005). Modeling population growth via Laguerre-type exponentials. Mathematical and computer Modeling. 42, 1421-1428.
[3] Khodabin, M., & Maleknejad, K., & Rostami M., & Nouri, M. Interpolation solution in generalized stochastic exponential population growth model, Applied Mathematical Modeling, accepted manuscript.
[4] Matisa, J. H. & Kiffe, T. R.(2008). On stochastic logistic population growth models with immigration and multiple births, Theorrtical population Biology, 65, 89-104.
[5] Rezaeyan, R., & Jafari, M. A.(2015). Confidence interval for number of population in stochastic exponential population growth models with mixture noise, 46th Annaul Iranian mathematics conference, Yazd.
[6] Oksendal, B.(1998). Stochastic Differential Equations, An Introduction with Applications. Fifth Edition, Spronger-Verlag, New York.
[7] Khodabin, M., & Kiaee, N.(2011). Stochastic dynamical Logistic population growth model, Journal of mathematical sciences: Advances and Applications, 11, 11-29.
[8] Campillo, F., & Joannides, M., Estimation of the parameters of a stochastic logistic growth model, hal-00842291.
[9] Rahman, H. A., & Mohed, A. B. (2009). Parameter estimation of stochastic logistic model ,Matematical, 25(2), 91-106.
[10] Zheng, Z., & Shu, H., & Kan, X., & Fang, Y. (2017). Parameter estimation for the continuous time stochastic logistic diffusion model., Open journal of statistics, 7, 1039-1052.
Efficiency of stochastic logistics model in
Predicting the population infected with HIV in Iran
Ramzan Rezaeyan, Seyed Saleh Mohseni, Samira Alla, Sahebeh Aqababai
Introduction:
The study of population growth and population forecasting is a major problem in biology. Since the growth rate is not completely known over time and depends on environmental factors that are completely random, then all biological populations (virus, humans, bacteria, etc.) have some kind of random behavior or noise. It is generally referred to as a random process.
The purpose of this article is to predict the number of people living with HIV in Iran based on a random logistics model and compare it with a non-random (definitive) model. For a case study to predict the number of AIDS patients in Iran, we considered the population of patients during the years 1384 to 1394 and with the help of MATLAB program we simulated the number of patients for the coming years. Comparison of the obtained results with real values and the results of other models, shows the high accuracy and efficiency of the model.
key words:
Stochastic logistics model, prediction, ITO integral, AIDS virus.