پیشبینی سمیت و ضریب تقسیم اکتانول-آب آفت کش ها فنیل کاربامات با استفاده از روش الگوریتم ژنتیک- رگرسیون چندگانه خطی
محورهای موضوعی : حشره شناسی و سایر بندپایانعاطفه سادات نوابی 1 , طاهره مومنی اصفهانی 2 , مجید رمضانی 3 , محمد علیمرادی 4
1 - گروه شیمی ، واحد اراک، دانشگاه آزاد اسلامی اراک،
اراک، ایران
2 - گروه شیمی، واحد اراک، دانشگاه آزاد اسلامی اراک، اراک، ایران
3 - گروه شیمی، واحد اراک، دانشگاه آزاد اسلامی اراک، اراک، ایران
4 - گروه شیمی، واحد اراک، دانشگاه آزاد اسلامی اراک، اراک، ایران
کلید واژه: QSAR, Insecticides, "QSAR", واژههای کلیدی:"مشتقات کاربامات", Keywords: carbamate derivatives, logIC50, Octanol-water partition coefficients, "توصیفگرهای مولکولی", "کولین استراز", " logIC50", " ضریب توزیع اکتانول-آب ", " آفتکش ",
چکیده مقاله :
مطالعه ارتباط کمی ساختار-فعالیت (QSAR) مبتنی بر الگوریتم ژنتیک رگرسیون خطی چندگانه (GA-MLR) برای پیشگویی سمیت (logIC50) و لگاریتم ضریب توزیع اکتانول-آب (logPow) برخی مشتقات کاربامات به عنوان آفت کش انجام شد. ساختار ترکیبات شیمیایی با نرم افزاز گوسین 98 و روش هارتریفاک و سری پایه G*31-6 (HF/6-31G*) بهینه شدند. توصیفگرهای مولکولی با نرمافزار دراگون محاسبه شد. مجموعه دادهها به طور تصادفی به دو دسته آموزش و آزمون تقسیم گردیدند. مناسبترین توصیفگرهای با استفاده از روش الگوریتم ژنتیک وبرگشتی تعیین شدند. بهترین مدل GA-MLR با استفاده از پارامترهای آماری مانند مجذور ضریب همبستگی (R2)، ضریب همبستگی تنظیم شده (R2adj)، ریشه مربعات میانگین خطا (RMSE) برای دودسته آموزش و آزمون انتخاب گردید. بهترین مدل QSAR مبتنی بر پارامترهای آماری اعتبارسنجی تقاطعی آزمون خارجی (LOO)، پارمترهای اعتبارسنجی خارجی (Q2F1, Q2F2, Q2F3) و ضریب همبستگی تطابق (CCC) برای کیفیت توانایی پیشگویی مدل GA-MLR بررسی گردید. این نتایج نشان می دهد که مدل های GA-MLR میتواند برای پیشگویی فعالیت مشتقات کاربامات مورد استفاده قرار گیرد.
A Quantitative Structure–Activity Relationship (QSAR) study based on Genetic Algorithm Multiple Linear Regressions (GA-MLR) were carried out for the prediction of the toxicity (logIC50) and the logarithm of octanol-water partition coefficient (logPow) of some carbamate derivatives as insecticides. The optimized conformation of compounds were obtained at HF/6-31G* level with Gaussian 98 software. Dragon software is used to calculate molecular descriptors. A data set of these compounds was randomly divided into 2 groups: training and test sets. The QSAR models were optimized using multiple linear regressions (MLR).The most relevant molecular descriptors were collected by Genetic Algorithm (GA) and backward regression. The best GA-MLR models are obtained using statistical parameters, such as squared correlation coefficient (R2), adjusted squared correlation coefficient (R2adj), root mean square error (RMSE) values for training and test sets. The best QSAR models are obtained based on the statistical parameters Leave-one-out (LOO) cross-validation, external test set, external validation parameters (Q2F1, Q2F2, Q2F3) and the concordance correlation coefficient (CCC) were used to quantify the predictive ability of GA-MLR models. The results showed that GA-MLR models could be used to predict the activities of carbamate derivatives.
_||_