پیشگویی سمیت و ضریب توزیع اکتانول-آب آفت کشهای آلی کلردار با استفاده ازتوصیف گرهای مولکولی و روشهای الگوریتم ژنتیک و رگرسیون خطی چند متغیره
محورهای موضوعی : حشره شناسی و سایر بندپایانفاطمه شفیعی 1 * , زهرا زمانی 2 *
1 - عضو هیئت علمی واحد اراک
2 - دانشجوی دکتری شیمی فیزیک،گروه شیمی،واحد اراک،دانشگاه آزاداسلامی، اراک، ایران
کلید واژه: واژههای کلیدی: "سمیت", "ارتباط کمی ساختار- فعالیت", "روش رگرسیون خطی چند متغیره ", الگوریتم ژنتیک", "آفت کشهای آلی کلردار", "ضریب توزیع اکتانول-آب", Keywords: "toxicity", "QSAR", "Multiple linear regression", "genetic algorithm (GA)", "organochlorine pesticides", "octanol - water distribution coefficient",
چکیده مقاله :
در این تحقیق ازمطالعه ارتباط کمی ساختار- فعالیت (QSAR) جهت پیشگویی فعالیت های آفت کش های آلی کلردار استفاده شد. ابتدا به کمک نرم افزارگوس ویو 05 ساختار شیمیایی تمام مولکول های مورد مطالعه رسم گردید و سپس بهینه سازی با نرمافزار گوسین 09 و روش هارتری-فاک و سری پایه G* 31-6 انجام پذیرفت. خواص فیزیکی- شیمیایی نظیر سمیت(logLD50) وضریب توزیع اکتانول-آب (logP) از منابع معتبر علمی به دست آورده شده است. برای تمامی سموم مورد مطالعه توصیفگرهای مناسب با استفاده از نرم افزار دراگون و روش های الگوریتم ژنتیک و برگشتی تعیین شدند. سپس ارتباط بین توصیف گرهای مولکولی و فعالیت ها با استفاده از روش چند متغیره خطی مورد بررسی قرار گرفت. به منظور ساخت و آزمون مدل هایQSAR داده ها به طور تصادفی به دو دسته :آموزشی (80 درصد ) و آزمون (20 درصد) تقسیم گردیدند. مدل ها با استفاده از ضرایب آماری نظیر ضریب همبستگی(R)، مجذور آن (R2) و ریشه میانگین مربع خطاRMSE) ) انتخاب شدند. برای بررسی توانایی پیش بینی و اعتبار مدل ها از اعتبار سنجی تقاطعی "یکی بیرون" و اعتبار سنجی خارجی استفاده شد. اعتبار سنجی خارجی با استفاده از ضرایب رگرسیونی مجموعه آزمون انجام گردید. نتایج اعتبار سنجی و کیفیت بالای ضرایب مدل ها نشان می دهد که مدل های GA-MLR به دست آمده مدل های قابل قبول QSAR می باشند .این مدل ها می توانند جهت شناسایی توصیف گر های مناسب و پیشگویی فعالیت های آن ها به کار گرفته شوند.
In this research, Quantitative Structure–Activity Relationship (QSAR) studies have been used to predict activities of organochlorine pesticides. Firstly, the chemical structure of molecules was drawn with the Gauss view 05 program and optimized at Hartree–Fock level of theory and 6-31G* basis sets using Gaussian 09 software. The physiochemical properties namely octanol-water partition coefficient (logP) and toxicity (log LD50) are taken from the scientific web book. The dragon software has been used for the calculation of molecular descriptors. The suitable descriptors were selected with the aid of the genetic algorithm (GA) and backward techniques. At the next step, the relationship between molecular descriptors and the activities was investigated by multiple linear regression (MLR) method. In order to build and test QSAR models, a data set of organochlorine pesticides was randomly separated into 2 groups: training (80%) and test (20%) sets. The models were evaluated with regression parameters: correlation coefficient (R), squared regression coefficient (R2), adjusted correlation coefficient (R2 adj) and root mean squared error (RMSE). For the predictive ability and verification of the models are discussed by using Leave-One-Out (LOO) cross-validation and external test set. The external prediction accuracy of the obtained models was examined using the above regression parameters. Results of validations and high statistical quality of models indicate that generated GA-MLR models are reasonable QSAR models. These models help to delineate the important descriptors responsible for predicting their activities.
_||_