ویژگی های روانسنجی درس ریاضی آزمون سراسری گروه ریاضی - فیزیک سال 1391
محورهای موضوعی : روان سنجیمرتضی حسینی 1 * , علی مقدم زاده 2 , مصطفی رستگار آگاه 3
1 - دانشجوی دکتری روان سنجی (سنجش و اندازه گیری)، دانشگاه علامه طباطبایی ، دانشکده روانشناسی و علوم تربیتی، گروه سنجش و اندازه گیری، تهران، ایران.
2 - استادیار دانشگاه تهران، دانشکده روانشناسی و علوم تربیتی، تهران، ایران.
3 - دانشجوی دکتری روانسنجی (سنجش و اندازه گیری)، دانشگاه علامه طباطبایی، گروه سنجش و اندازه گیری، تهران، ایران.
کلید واژه: ", آزمون های سرنوشت ساز", , ", اندازه گیری", , ", نظریه کلاسیک", , ", نظریه سؤال - پاسخ", , ", ویژگی های روانسنجی", ,
چکیده مقاله :
هدف این پژوهش توصیفی و کاربردی؛ تعیین ویژگیهای روانسنجی درس ریاضی آزمون سراسری گروه ریاضی-فیزیک سال 91 بر اساس هر دو نظریه کلاسیک و سؤال – پاسخ بود. به همین منظور از بین کلیه شرکت کنندگان این گروه، یک نمونه 1000 نفری بطور تصادفی انتخاب و برای تجزیه و تحلیل داده ها نیز از نرم افزار های SPSS و Bilog استفاده گردید. نتایج تحلیلهای کلاسیک نشان داد؛ این آزمون دارای روایی و اعتبار خوبی است. بیشترین و کمترین ضریب تشخیص بترتیب به سؤالهای 37 و 51 تعلق داشت. 3 سؤال دارای ضریب تشخیص منفی و اشکال اساسی بودند. بررسی مفروضه های نظریه سؤال-پاسخ نشان داد که این آزمون تک بعدی بوده و از استقلال موضعی نیز برخوردار است. 21 سؤال با هیچ کدام از مدلهای سؤال-پاسخ برازش نداشتند. مجموعه داده ها با مدل دوپارامتری برازش داشت. نتایج تحلیلهای سؤال-پاسخ (بر خلاف کلاسیک) نشان داد، ضریب تشخیص هیچ سؤالی منفی نیست. 17 سؤال نیز دارای ضریب تشخیص نامناسب و سؤالات 17 و 42 بترتیب دارای بیشترین و کمترین ضریب تشخیص بودند. با توجه به منحنی آگاهی و سطوح دشواری سؤالات در تحلیلهای سؤال-پاسخ (همانند نتایج کلاسیک)، سؤالات این درس مربوطبه یک آزمون دشوار بوده است. در نهایت، این آزمون بدلیل برازش با مدل 2پارامتری دارای مزیت، و بعلت داشتن آیتمهای دشوار و ضریب تشخیص منفی در نظریه کلاسیک دارای اشکال می باشد. ارجحیت نظریه سؤال-پاسخ نسبت به کلاسیک نیز در این تحقیق به اثبات رسید.
Abstract: The purpose of this study was to examine psychometric properties of mathematics items of university entrance examination 2012/2013 academic year of mathematics and physics students in Iran. The method of this study was descriptive and applied. To do so, 1000 math university participants were randomly selected out of all of participants. For data analysis, SPSS-19 and Bilog-mg was used. All items analyzed based on CTT and IRT. Then Item difficulty and item parameters were calculated in terms of both IRT and CTT. CTT results showed that math examination was so hard with good reliability and validity. As well, some items had low discrimination index. Three of items had negative discrimination index that had major problems based on CTT. The assumptions and the goodness of fit analysis were checked for IRT. The results showed that this is a Unidimensional test with good Local independence. The items that had fit with none of models are: 1-2-3-4-6-12-14-15-17-19-21-26-29-38-40-41-43-44-45-51-54. Also, the most appropriate model which fit the data was achieved by 2pl logistic IRT model. IR analysis based on 2pl showed that none of items had negative discrimination index. Also, 17 items had not good discrimination index. Item difficulty of items in IRT such as CTT showed that math questions were so hard. These results were showed test information curve.