بررسی کنشافتراقی سوالات ضعف روانی و ضداجتماعی در آزمونهای استخدامی بدو ورود: مقایسه روش منتلهنزل و مدل راش
محورهای موضوعی : روانشناسیمهدی رحمانی 1 * , محمد رضا فلسفی نژاد 2 , اصغر مینائی 3 , نورعلی فرخی 4
1 - دانشجوی دکتری سنجش و اندازه گیری، دانشکده روانشناسی و علوم تربیتی، دانشگاه علامه طباطبائی، تهران، ایران
2 - دانشیار گروه سنجش و اندازه گیری، دانشکده روانشناسی و علوم تربیتی، دانشگاه علامه طباطبائی، تهران، ایران.
3 - دانشیار گروه سنجش و اندازه گیری، دانشکده روانشناسی و علوم تربیتی، دانشگاه علامه طباطبائی، تهران، ایران.
4 - دانشیار گروه سنجش و اندازه گیری، دانشکده روانشناسی و علوم تربیتی، دانشگاه علامه طباطبائی، تهران، ایران.
کلید واژه: کنشافتراقی سوال, مدلراش, منتلهنزل, ضداجتماعی, ضعفروانی, داوطلبان استخدامی.,
چکیده مقاله :
انتخاب نیروی انسانی سالم جزء وظایف اصلی آزمونهای استخدامی است به شرط آنکه ابزارهای اندازهگیری دارای انصاف و عدالت در سنجش باشند. روش: پژوهش از نوع پیمایشی است و جامعه آماری کلیه داوطلبان استخدامی شهر اصفهان بود. حجم نمونه 5997 نفر بود که به روش خوشهای یکمرحلهای انتخاب شد. ابزار مورد استفاده پرسشنامه MMPI-2 بود. برازش سوالات با مدل با استفاده از شاخصهای outfit MnSq و infit MnSq تائید شد و کنشافتراقی سوالات بر حسب جنسیت با دو رویکرد مدل راش و منتلهنزل توسط نرمافزار Winsteps نسخه 3.64 بررسی شد. یافته ها: پس از آنکه برازش دادهها با مدل تائید شد، تحلیل کنشافتراقی انجام شد. نتایج نشانداد که 38 درصد از سوالات ضداجتماعی و 9/22 درصد از سوالات ضعفروانی دارای تورش به جهت مردان است. روش منتلهنزل در برخی سوالات عملکرد ضعیفتری نسبت به مدل راش داشت. نتیجهگیری: نتایج نشانداد که سوالات ضداجتماعی و ضعفروانی به ضرر مردان است و مردان به طور سوءگیرانهای نمرات بالاتری را به دست خواهند آورد. همچنین بهتر است که از مدل راش به جای روش منتلهنزل در تشخیص سوالات دارای تورش استفاده کرد.
Choosing healthy human resources is one of the main tasks of recruitment tests, provided that the measurement tools are fairness in test. Methods: This research is survey research and the statistical population was all the Recruitment candidates of Isfahan city. The sample size was 5997 people who were selected by one-step cluster method. The tools used was the MMPI-2. The fit of the Items with the model was confirmed using outfit MnSq and infit MnSq, and DIF according to gender was checked and compared with Rasch Model and Mantel-Haenszel by Winsteps version 3.64. Results: After fitting the data with Rasch model, DIF analysis was performed. The results showed that 38% of psychopathic deviate items and 22.9% of psychasthenia items were biased towards men. Mantel-Haenszel had a weaker performance than Rasch Model in some items. Conclusion: Psychopathic deviate and psychasthenia and items have been to the bias of men and they have naturally obtained higher scores in these two scales. Also, due to the strength of the Rasch model compared to the CTT, it is better to use this model to detect biased items
Antikchi. E, Bigdeli. I. A. & Sabahi. P. (2017). The comparision of neuropsychological index related to executive functions in antisocial personality disorder, obsessive-compulsive personality disorder and normal people. Advances in Cognitive Science, Vol. 19, No. 1. [Persian]
Baker. C. A, Baum. L. J & Francis. J. C. (2023). Assessment of test bias on the MMPI-2-RF higher order and restructured clinical scales as a function of gender and race. Professional Psychology Research and Practice. 54 (4) Follow journal. DOI: 10.1037/pro0000517.
Bethune M. M. (2011). Predictors of Performance in a Professional Counselor Masters Program, Doctoral Thesis http://gradworks.umi.com/34/93/3493607.html.
Björkqvist, K. (2018). Gender differences in aggression. Current Opinion in Psychology. Volume 19, February, Pages 39-42.
Buribayev. Y. A and Khamzina Z. A. (2019). Gender equality in employment: The experience of Kazakhstan. International Journal of Discrimination and the Law, Vol. 19(2) 110–124.
Camilli, G. (2006). Test fairness. In R. Brennan (Ed.), Educational measurement (4th ed.) (pp. 221-256). New York: American Council on Education & Praeger series on higher education.
Camilli, G., & Congdon, P. (1999). Application of a method of estimating DIF for polytomous test items. Journal of Educational and Behavioral Statistics, 24(4), 323-341.
Camilli, G., & Shepard, L. (1994). Methods for identifying biased test items. Newbury Park, CA Sage.
Cao. W, Li. P. Vander Wal. R.C & Taris. T.W. (2022). Leadership and Workplace Aggression: A Meta-analysis. Journal of Business Ethics. Published: 15 July. volume 186, pages347–36
Card N. A, Stucky. B. D, Sawalani. G. M & Little. T. D. (2008). Direct and indirect aggression during childhood and adolescence: a meta-analytic review of gender differences, intercorrelations, and relations to maladjustment. Sep-Oct;79(5): 1185-229. doi: 10.1111/j.1467-8624.2008.01184.x.
Chapelle, C. A. (2020). Validity in language assessment. The Routledge Handbook of Second Language Acquisition and Language Testing, 11.
Chen, M. Y., Liu, Y., & Zumbo, B. D. (2020). A propensity score method for investigating differential item functioning in performance assessment. Educational and Psychological Measurement, 80(3), 476-498.
Cherry Kendra. (2021) The Minnesota Multiphasic Personality Inventory (MMPI). Updated on September 02 Medically reviewed by Amy Morin, LCSW.
Embretson, S. E., and Reise, S. P. (2000). Item Response Theory for Psychologists. Mahwah, NJ: Lawrence Erlbaum Associates. 11, 57- 74.
Gori. E & Marin. R. F. (2015). Rasch Analysis of some MMPI-2 scales in a sample of university freshmen. International Journal of Arts & Sciences. 1944-6934 :: 08(03):107–150.
Hambleton, R. K., & Rogers, H. J. (1989). Detecting potentially biased test items: Comparison of IRT area and Mantel-Haenszel methods. Applied Measurement in Education, 2(4), 313-334.
Hambleton, Ronald K.; Saminathan, H.; Rogers, H.. Jane (1991). Fundamentals of Question-Answer Theory. Translated by Mohammad Reza Filsafinejad (2010). Tehran: Allameh Tabatabai University. [Persian]
Karami, H. (2013) The quest for fairness in language testing. Educational Research and Evaluation, 19(2&3), 158-169. [Persian]
Karami, Hossein & Khodi, Ali (2021). Differential Item Functioning and Test Performance: a Comparison Between the Rasch Model, Logistic Regression and Mantel-Haenszel. Journal of Foreign Language Research, 10 (4), 842-853. [Persian]
Karami. H. R, Gramipour. M & Minaei. A. (2021). Differential Item Functioning (DIF) Detection Rate Using Rasch Trees Model: A Simulated and Real Data Study of the NAJA High Stakes Tests. Educational Measurement. 11(44), 1-30. [Persian]
Lee JC, Zhang Z, Yin H. (2010). Using multidimensional Rasch analysis to validate the Chinese version of the Motivated Strategies for Learning Questionnaire (MSLQ-CV). Eur J Psychol Educ; 25.
Linacre, J. M. (2010). A User's Guide to WINSTEPS®. Retrieved May 2, from http://www.winsteps.com/ .
Lord, F. M.y. & Novick, MR. (1968). Statistical Theory of Mental Test Scores. Addison-Wesley Publishing Company.
Marnat, G. G. & Wright, A. J. (2016). Handbook of Psychological Assessment. 6th ed.
McNulty J. L., Forbey J. D., Graham J. R., Ben-Porath Y. S., Black M. S., Anderson S. V. & Burlew A. K. (2015). MMPI-2 Validity Scale Characteristics in a Correctional Sample. Sage Journals, Volume 10, No. 3, September. 288-298.
Minaei. A. (2015). Aapplication of Rasch measurement model to evaluate measurement properties of the Test of Visual- Motor Skills-Revised. Journal of Educational Measurement. Volume 5, Issue 18 - Serial Number 18. January. 77-114. [Persian]
Penfield, R. D. & Algina, J. (2003). Applying the Liu–Agresti estimator of the cumulative common odds ratio to DIF detection in polytomous items. Journal of Educational Measurement, 40: 353–370.
Queirolo L, Bacci C, Roccon A, Zanette G and Mucignat C. (2023). Anxiety in a regular day of work: A 24 hour psychophysiological investigation in young dentists with gender comparison. Front Psychol. 14:1045974. doi: 10.3389/fpsyg.1045974
Siegert, R. J., Tennant, A., & Turner-Stokes, L. (2010). Rasch analysis of the Beck Depression Inventory-II in a neurological rehabilitation sample. Disability and Rehabilitation, 32(1), 8–17.
Skrondal, A., Rabe-Hesketh, S., and Boca Raton, F. (2004). Generalized Latent Variable Modeling: Multilevel, Longitudinal and Structural Equation Models: Chapman & Hall/ CRC Press.
Soltani Shal R, Saadatbin Javaheri F, Zebardast F. (2020). Survey the level of well-being and Psychometric characteristics of hospital nurses’ well-being at work scale. Occupational Medicine Quarterly Journal:12(1): 55-68. [Persian]
Su. Y & Wang N. (2005). Use of the Rasch IRT model in standard setting: An item‐ mapping method. Journal of Educational Measurement. Sep; 40 (3): 231- 53.
Talerico G. M, McCallum. J. J, Whitman M. R, Tarescavage. M, Corey D. M & Ben-Porath. Y. B. (2023): Comparing the Validity of MMPI-3 Scores in Prehire Psychological Screenings of Male and Female Police Officer Candidates, Journal of Personality Assessment, DOI: 10.1080/00223891.2023.2191278
Tennant, A., & Conaghan, P.G. (2007). The Rasch measurement model in rheumatology: what is it and why use it? When should it be applied, and what should one look for in a Rasch paper? Arthritis & Rheumatism journal. 57, 1358– 1362.
Valianpour. Z, Modarres Gharavi. M & Mahram. B. (2020). Validation of the Minnesota Multiphasic Personality Inventory (MMPI 2) in psychiatric patients and non-patient individuals in Mashhad city, Iran. Journal of Fundamentals of Mental Health, Nov-Dec. [Persian]
Wiberg, M. (2007). Measuring and detecting differential item functioning in criterion-referenced licensing test: A theoretic comparison of methods. Educational Measurement, technical report No. 2.
Zahid. Z, nasrollahi. Z & Mahinizadeh. M. (2020). From Gender Discrimination to Equality and Economic Growth (Study of Developing Countries). Journal of Woman in Development and Politics. 662- 643. [Persian]
Zumbo, B. D. (2003). Does item-level DIF manifest itself in scale-level analyses? Implications for translating language tests. Language testing, 20(2), 136-147.
بررسی کنشافتراقی سوالات ضعف روانی و ضداجتماعی در آزمونهای استخدامی بدو ورود: مقایسه روش منتلهنزل و مدل راش
*مهدی رحمانی ملکآباد
دانشجوی دکتری سنجش و اندازه گیری، دانشکده روانشناسی و علوم تربیتی، دانشگاه علامه طباطبائی، تهران، ایران
محمدرضا فلسفینژاد
دانشیار گروه سنجش و اندازه گیری، دانشکده روانشناسی و علوم تربیتی، دانشگاه علامه طباطبائی، تهران، ایران.
اصغر مینائی
دانشیار گروه سنجش و اندازه گیری، دانشکده روانشناسی و علوم تربیتی، دانشگاه علامه طباطبائی، تهران، ایران.
نورعلی فرخی
دانشیار گروه سنجش و اندازه گیری، دانشکده روانشناسی و علوم تربیتی، دانشگاه علامه طباطبائی، تهران، ایران.
چکیده
انتخاب نیروی انسانی سالم جزء وظایف اصلی آزمونهای استخدامی است به شرط آنکه ابزارهای اندازهگیری دارای انصاف و عدالت در سنجش باشند. روش: پژوهش از نوع پیمایشی است و جامعه آماری کلیه داوطلبان استخدامی شهر اصفهان بود. حجم نمونه 5997 نفر بود که به روش خوشهای یکمرحلهای انتخاب شد. ابزار مورد استفاده پرسشنامه MMPI-2 بود. برازش سوالات با مدل با استفاده از شاخصهای outfit MnSq و infit MnSq تائید شد و کنشافتراقی سوالات بر حسب جنسیت با دو رویکرد مدل راش و منتلهنزل توسط نرمافزار Winsteps نسخه 3.64 بررسی شد. یافته ها: پس از آنکه برازش دادهها با مدل تائید شد، تحلیل کنشافتراقی انجام شد. نتایج نشانداد که 38 درصد از سوالات ضداجتماعی و 9/22 درصد از سوالات ضعفروانی دارای تورش به جهت مردان است. روش منتلهنزل در برخی سوالات عملکرد ضعیفتری نسبت به مدل راش داشت. نتیجهگیری: نتایج نشانداد که سوالات ضداجتماعی و ضعفروانی به ضرر مردان است و مردان به طور سوءگیرانهای نمرات بالاتری را به دست خواهند آورد. همچنین بهتر است که از مدل راش به جای روش منتلهنزل در تشخیص سوالات دارای تورش استفاده کرد.
کلید واژه: کنشافتراقی سوال، مدلراش، منتلهنزل، ضداجتماعی، ضعفروانی، داوطلبان استخدامی.
Differential Item Functioning of Psychasthenia and Psychopathic Deviate Items in Entrance Employment Tests: A Comparison between the Mantel-Haenszel and Rasch Model
Mahdi Rahmani Malek Abad, PhD student
Assessment and Measurement, Faculty of Psychology and Educational Sciences, Allameh Tabataba’i University, Tehran, Iran
Mohammad Reza Falsafinejad, Ph.D
Associate Professor, Faculty of Psychology and Educational Sciences, Allameh Tabataba’i University, Tehran, Iran
Asghar Minaei, Ph.D
Associate Professor, Faculty of Psychology and Educational Sciences, Allameh Tabataba’i University, Tehran, Iran
Noor Ali Farrokhi, Ph.D
Associate Professor, Faculty of Psychology and Educational Sciences, Allameh Tabataba’i University, Tehran, Iran
Abstract
Choosing healthy human resources is one of the main tasks of recruitment tests, provided that the measurement tools are fairness in test. Methods: This research is survey research and the statistical population was all the Recruitment candidates of Isfahan city. The sample size was 5997 people who were selected by one-step cluster method. The tools used was the MMPI-2. The fit of the Items with the model was confirmed using outfit MnSq and infit MnSq, and DIF according to gender was checked and compared with Rasch Model and Mantel-Haenszel by Winsteps version 3.64. Results: After fitting the data with Rasch model, DIF analysis was performed. The results showed that 38% of psychopathic deviate items and 22.9% of psychasthenia items were biased towards men. Mantel-Haenszel had a weaker performance than Rasch Model in some items. Conclusion: Psychopathic deviate and psychasthenia and items have been to the bias of men and they have naturally obtained higher scores in these two scales. Also, due to the strength of the Rasch model compared to the CTT, it is better to use this model to detect biased items.
Keyword: differential item functioning, Rasch model, Mantel-Haenszel, psychopathic deviate, psychasthenia, recruitment candidates.
مقدمه
استخدام جزء یکی از مهمترین و پیچیدهترین فرایندهای هر سازمان است که در آن سازمان بهدنبال بهکارگیری افرادی توانمند است که هم از نظر علمی و مهارتی مناسب و هم از نظر روانی سالم باشند، چرا که اگر افراد از نظر روانی سالم نباشند در آینده میتوانند با ایجاد تنش بینفردی یا قانونگریزی و سهلانگاری موجب کاهش بازدهی و کماثر شدن فرایند کار، ایجاد خلل سازمانی و آسیب رساندن به همکاران از نظر روانی و حتی جسمی شوند، بهویژه اگر سازمان هدف مسئول آموزش و تعلیم نسل آینده کشور باشد. بدین جهت شناسائی و بکارگیری افراد سالم از نظر روانشناختی بسیار قابل اهمیت است (Baker, Baum & Francis, 2023). یکی از ابعادی که توسط آزمونهای بدو ورود به سازمان ها مورد سنجش قرار میگیرد، بررسی سطح ضداجتماعی و ضعفروانی افراد است. ویژگی افراد پرخاشگر در محیط کار عدم رعایت حقوق دیگران و احترام نگذاشتن به قوانین کار است. رفتار افراد دارای اختلال ضداجتماعی و ضداجتماعی خارج از استانداردهای اجتماعی، رفتاری و اخلاقی سازمانها است، و این اختلالات باعث کاهش بازدهای سازمان میشود (Cao, Li, Van Der Wal & Taris, 2022). روانشناسان بالینی در اختلال شخصیت ضداجتماعی (Psychasthenia) دو صفت را مشخص کرده اند. اولین صفت بیتفاوتی، بیاحساسی و خودخواهی است. به این صورت که فرد از کارهای خود احساس پشیمانی نمیکند و نمیتواند با دیگران همدلی داشته باشد. دومین ویژگی سبک زندگی خاصی است که به علت فکر نکردن قبل از عمل است و باعث میشود رفتارهای ضداجتماعی به وجود آید (Antikchi, Bigdeli & Sabahi, 2017).
بعد دیگری که در محیط کار میتواند به فرد یا سازمان آسیب برساند داشتن شخصیت ضعفروانی (Psychopathic Deviate) است. ضعفروانی، معمولا احساس مبهم و نامطبوع ترس و تشويش تعريف میشود. اجزاي جسمي و هيجاني ضعفروانی شبيه اجزاي ترس است، اما شديدتر از آن است. اين اشخاص نهتنها مشكلاتي در تصميمگيري دارند، بلكه پس از آن نيز بهخاطر احتمال اشتباهات و وقايع پيشبيني نشدهاي كه ممكن است منجر به مصيبت گردد بسيار نگران ميشوند. این اختلال از یک سو میتواند در قالب شکایت از خستگی فزاینده پس از فعالیت ذهنی بروز کند که همراه با کاهش نسبی در عملکرد شغلی و حتی انجام فعالیتهای روزانه خواهد بود و از سوی دیگر میتواند فرد را دچار احساس ضعف جسمی یا بدنی و فرسودگی ناشی از کمترین فعالیت کند که با دردها و ناراحتی عضلانی و ناتوانی در شل کردن آنها همراه است (Queirolo, Bacci, Roccon, Zanette & Mucignat, 2023) و این امر در بین معلمین بیشتر اهمیت دارد زیرا معلمین هر روز با چالشهای جدیدی در بین دانشآموزان مواجهه هستند.
این دو مولفه ضداجتماعی وضعفروانی در آزمونهای بدو استخدام توسط مقیاس انحراف روانی-اجتماعی (Psychopathic Deviate) و ضعفروانی- اجتماعی (Psychasthenia) پرسشنامه MMPI-2 مورد سنجش قرار میگیرد. اما مسئله مهم دیگری که در سنجش این مقیاسها موثر است، تفاوتهای جنسیتی است. برخی پژوهشها نشان داد که نتایج پرسشنامه MMPI-2 احتمالا دارای سوگیری است، در حالی که دیگران احساس کردند که خود پرسشنامهMMPI-2 حاوی سؤالات جنسیتی و نژادپرستانه است که میتواند منجر به عدمانصاف در نمرهگذاری و اعلام ناصحیح نتایج شود (Talerico, McCallum, Whitman, Tarescavage, Corey & Ben-Porath, 2023). پژوهشهای دیگر در مورد تفاوت ضداجتماعی زن و مرد در حالت و صفت انجام شده است، بررسيها در مورد ابراز خشم مردان و زنان حاكي از آن است كه در مردان حملة فيزيكي و كلامي بيشتر از زنهاست و ابراز خشم در زنان بيشتر به صورت گريه كردن ظاهر ميشود ولی در هر دو حالت ضداجتماعی و خشم مشاهده میشود (Björkqvist, 2018). نتايج كلي بررسي ها نشان ميدهد كه مردان و زناني كه چند ويژگي مردانه دارند، تمايل بيشتري به برون ريزي خشم دارند و مردان و زناني كه ويژگيهاي زنانگي در آنها بارزتر است، تمايل به درون ريزي خشم دارند و این وجود ضداجتماعی و ضعفروانی یکسان با حالتهای بروز متفاوت میتواند سبب پاسخگوئی به سوالات به صورت متفاوت گردد که در پی آن نتایج به دور از واقعیت خواهد بود و موجب سوءگیری آزمون میشود. از طرفی مرحله گزینش و استخدام اغلب همراه با سوءگیری و عدم انصاف در گزینش به ویژه تورش در جنسیت بوده است(Zahid, nasrollahi & Mahinizadeh, 2020)، هرچند که چندین قانون جهت از بین بردن این تبعیضها در نظر گرفته شده است اما همانطور که بیان شد محققان هنوز به خوبی به تاثیر تفاوتهای جنسیتی در نحوه پاسخگوئی افراد به سوالات آزمونهای روانشناختی نپرداختهاند (Baker et al, 2023).
یکی از راهها برای پیبردن به اینکه آزمونی غیرمنصفانه است کشف پرسشهای دارای کنشافتراقی (Differential Item Functioning) است. Dorans & Holland (1993) کنشافتراقی را چنین تعریف کردند: "منظور از DIF، تفاوتهای موجود در عملکرد هر پرسش از گروهها با توجه به توانایی یا ویژگی است که پرسشها از افراد گروه بطور مفهومی میخواهد بهدست آورد. DIF یک تفاوت ناخواسته بین گروههای امتحان دهنده است که قرار است براساس تفاوت در تواناییهاشان در هر پرسش و هر امتحان قیاس شوند" (Wiberg, 2007). Camilli & Congdon (1999) DIF را در قالب یک مفهوم بیطرفی آزمون (Test fairness) توضیح داده است. روشهای آماری آشکارسازی DIF را میتوان دو دسته کلی تقسیم نمود. دسته اول براساس نظریه کلاسیک آزمون (Classic Test Theory) است. نمرات مشاهده شده در این روش به عنوان متغیر همتا برای پیشبینی نمرات واقعی در نظر گرفته خواهد شد (Lord & Novick, 1968). از جمله روشهایی که در این دسته قرار میگیرند عبارت از روش منتلهنزل (Mantel- Haenszel)، روش منتلهنزل تعمیم دادهشده (Generalized Mantel- Haenszel) (Penfield & Algina, 2003 ; Su & Wang, 2005)، روش اختلاف میانگین استاندارد شده (Standadized Mean Difference) و روش رگرسیون لوجستیک است (Swaminathan & Rogers, 1990; Zumbo, 2003). دسته دوم شامل روشهای مبتنی بر نظریه سوال- پاسخ (Item Response Theory) است، زیرا نمره متغیر مکنون به عنوان متغیر همتا برای برآورد نمرات متغیر مکنون مورد استفاده قرار میگیرد. روشهای این دسته شامل روشهای مجذور کای-دو لرد (Lord's chi-square)، راجو و روشهای آزمون نسبت درست نمایی (likelihood ratio test) است (Embretson & Reis, 2000; Karami, Gramipour & Minaei, 2021).
روشهای بررسی DIF مبتنی بر نمرات مشاهده شده و متغیرهای مکنون میتوانند در چهارچوب مدلهای مختلط خطی و غیرخطی تعمیم دادهشده ترکیب شود و مدلهای سلسلهمراتبی IRT و رگرسیون لوجستیک (logistic regression) را به وجود بیاورد. در این مدلها اندازه اثر DIF و جایگزینی دادههای گمشده امکانپذیر است (Skrondal, Rabe-Hesketh and Boca Raton, 2004). Gori and Marin (2015) در پژوهشی به بررسی کنش افتراقی سوالات اسکیزوفرنی، ضعفروانی و ضداجتماعی پرسشنامه MMPI-2 در بین دانشجویان تازه وارد دانشگاه با مدل راش (Rasch Model) پرداخت و نشان داد برخی تفاوت ها در نحوه برازش و تشخیص سوالات وجود داشت. همچنین(2008) Card, Stucky, Sawalani & Little در یک بررسی فرا تحلیلی از 148 مطالعه در مورد تفاوتهای جنسیتی در ضداجتماعی مستقیم و غیرمستقیم نشانداد که یک تفاوت جنسیتی به جهت مردان در مورد ضداجتماعی مستقیم است، اما فقط یک تفاوت جنسی ناچیز به جهت زنان در مورد ضداجتماعی غیرمستقیم وجود دارد. به همیندلیل با توجه به اهمیت رعایت انصاف در گزینش نیروی انسانی سالم و مناسب در آزمونهای بدو ورود و انتخاب بدون سوءگیری افراد، سوال اول به تعیین ضرایب مطلوبیت سوالات پرداخته است؟ سوال دوم این پژوهش این است که آیا سوالات مقیاس ضداجتماعی و ضعفروانی پرسشنامه MMPI-2 با مدل راش برازش دارد؟ سوال سوم اینکه کدام سوالات مقیاس ضداجتماعی و ضعفروانی با مدلراش و کدام با روش منتلهنزل دارای کنشافتراقی است؟ و سوال چهارم اینکه آیا تفاوتی در تشخیص سوالات دارای سوءگیری بین دو روش منتلهنزل و مدل راش وجود دارد یا خیر؟
روش پژوهش
طرح این پژوهش توصیفی و از نوع پیمایشی است. جامعه آماری کلیه داوطلبان استخدامی شهر اصفهان بودند که در آزمونهای بدو ورود به مراکز طبکار شهر اصفهان در زمستان 1401 و بهار 1402 مراجعه نمودند. نمونه مورد مطالعه به روش خوشه ای غیر تصادفی از مراکز طب کار پژوهش انتخاب شد. مراکز طبکار بنا به جدیدترین تعریف از کالج سلطنتی پزشکان و جراحان کانادا (2012) به مراکزی گفته میشود که با ادغام جنبه های بالینی و اجرایی و با در نظر داشتن محیط شغلی افراد و گروهها به نیازهای مربوط به سلامت ایشان میپردازد و شامل فعالیتهایی از جمله شناسایی، ارزیابی، درمان، کنترل و پیگیری درمان و پیشـگیری از بیماریها جسمی و روانشناختی و صـدمات مـرتبط با کار است. تعداد کل داوطلبان استخدامی در سال 1401 و بهار 1402 شهر اصفهان بیش از 10 هزار نفر بوده است که با تحصیلات دیپلم به بالا متقاضی شغل معلمی (یا دانشجو معلمی) بودند. حجم نمونه در این پژوهش با توجه به شیوه تجزیه و تحلیل دادهها و استفاده از مدلهای برازش راش و پس از حذف تعداد افرادی که ناقص به سوالات پاسخ دادهاند (طبق دستور العمل آزمون افرادی که به تعداد 35 سوال و بیشتر پاسخ ندادهاند، پاسخ نامه آنها قابل استفاده نیست) برابر با 5997 نفر در نظر گرفته شد که پس از تحلیلهای اولیه نشان داد که در دادهها، داده پرت تکمتغیری (univariate outlier) وجود نداشت، اما بر اساس آماره ماهالانوبیس (Mahalanobis) تعداد 733 داده پرت چندمتغیری (multivariate outlier) وجود داشت که تمام این 733 نفر از فایل دادهها حذف و تحلیل بر روی حجم 5264 نفر انجام گرفت.
ابزار سنجش
ابزارهای استفاده شده در این پژوهش عبارت از پرسشنامه چندوجهی شخصیتی مینهسوتا-2 (Minnesota Multiphasic Personality Inventory-2) بود. این پرسشنامه توسط هاتاوی و مک کینلی در 1943 ساخته شده و در سال 1970 و در نهایت سال 2008 مورد آخرین بازنگری قرار گرفت و باز انتشار شد. این نسخه از مقیاس با 370 ماده دارای 3 شاخص روائی (L، F و K) و 10 شاخص بالینی است. در این پژوهش به مولفه منحرف ضداجتماعی (Psychopathic Deviate) با 50 سوال (برای مثال سوال 35 با عبارت: در گذشته گاهی چیزهائی را دزدیدهام) و ضعفروانی (Psychasthenia) با 48 سوال (برای مثال سوال 31 با عبارت: برایم مشکل است که حواسم را روی یک کار متمرکز کنم) پرداخته شد. بزای مثال یک سوال از مقیاس ضد اجتماعی پاسخ های به این مادهها به صورت دو گزینه ای بلی/ درست (1) و خیر/ غلط (0) است. روائی این مقیاس در مطالعات فراوانی بررسی و مورد تائید قرار گرفته است و نشان داده شده است که مقیاس انحراف روانی و اجتماعی با افرادی که دارای نشانگان بالینی ضد اجتماعی دارند همخوان است و دارای روائی قابل قبولی است (Marnat & Wright, 2016). ضریب اعتبار مقیاس ضداجتماعی و ضعفروانی پرسشنامه اصلی با روش آلفای کرونباخ برابر با 80/0 و 90/0 و اعتبار مقیاس ضداجتماعی و ضعفروانی از راه باز آزمایی برابر 88/0 و 93/0 بود (Valianpour, Morteza Modarres Gharavi & Behrouz Mahram, 2020). اعتبار مقیاس ضداجتماعی و ضعفروانی در این تحقیق با روش آلفای کرونباخ به ترتیب برابر با 76/0 و 81/0 بدست آمد.
روش اجراء و تحلیل دادهها
هدف این پژوهش بررسی و مقایسه کنشافتراقی سوالات مولفه ضداجتماعی و ضعفروانی پرسشنامه چندوجهی شخصیتی مینهسوتا-2 با استفاده از نظریه روش منتلهنزل و مدل راش برای داوطلبان استخدامی بود. بدین منظور ابتدا فهرست مراکز طب کار شهر اصفهان استخراج و از بین 17 مرکز 9 مرکز اعلام آمادگی برای همکاری کردند که از این بین 3 مرکز به تصادف و با توجه به حجم داوطلبان استخدامی انتخاب و پس از صحبت با مسئول مرکز مقرر شد ضمن حفظ محرمانه بودن اسامی داوطلبان شرکت دادهشده در طرح پژوهش و محرمانه ماندن نتایج به دست آمده از آزمونهای هر فرد از مراجعه کنندگان برای معاینات استخدامی، آزمون MMPI-2 در محل مرکز گرفته شود و نتایج آزمونها به صورت هفتگی در اختیار دستیار پژوهشگر قرار گیرد. دستیار پژوهشگر نیز پاسخهای افراد را وارد نرم افزار کرد و پس از تجمیع در اختیار پژوهشگر قرار داده شد.
برای محاسبه آماره های توصیفی میانگین و انحراف استاندارد و ضریب آلفایکرونباخ و اعتبار مقیاس از طریق نظریه کلاسیک از نرم افزار SPSS نسخه 27 استفاده شد و برای بررسی برازش سوال از آماره outfit MnSq و infit MnSq و با استفاده نرم افزار Winsteps نسخه 3.64 بهره گرفته شد، همچنین ضریب مطلوبیت سوالات نیز با شاخص Measure بیان شد. در بررسی تناسب شاخصها ابتدا به شاخص MNSQ مراجعه میشود و در صورت عدم تائید به شاخص ZSTD باید رجوع کرد. مقادیر MNSQ از 0 تا مثبت بینهایت قرار دارد و مقدار مطلوب برابر 1 است. هر چه این مقدار به 0 نزدیک شود نشان از بيش برازش الگوهای پاسخ با مدل است كه به معنای وجود وابستگی در ميان پاسخها یا سوالات است و مقادیر بالاتر از 1 بیانگر انحراف از تك بعدی بودن است. در کل مقادیر بیشتر از 2 غیر مفید و حاکی از اعتبار و برازش پائین است. مقادیر بین 1.5 تا 2 با اینکه بالاست اما گمراه کننده نیست و قابل اغماض است. مقادیر بین 0.5 تا 1.5 برای برازش مقیاس اندازهگیری مناسب و میزان اعتبار مقیاس را افزایش میدهد و در نهایت مقادیر کمتر از 0.5 برای برازش مقیاس اندازهگیری بهره پائینی دارد و میزان اعتبار را به صورت غیر واقعی بالا میبرد. مقادیر ZSTD نیز بهتر است بین 2- تا 2+ گزارش شود، البته با توجه به اینکه این آماره به حجم نمونه بسيار حساس است (Lincare, 2012)، و حجم نمونه این پژوهش بالاست، در این پژوهش جهت بررسی برازش سوال با مدل از آماره MnSq كه به دو شكل outfit و infit آمده است، استفاده شد.
یافتهها
با توجه به اینکه هدف این پژوهش بررسی کنشافتراقی سوالات مولفه ضداجتماعی و ضعفروانی پرسشنامه MMPI-2 در بین داطلبین استخدامی با مدل راش در کنار روش کلاسیک اندازهگیری (منتلهنزل) بود، ابتدا به تبیین تناسب مدل و دادهها و مفروضات نظریه راش پرداخته شد و سپس شاخصهای کمی سنجش سوالات گزارش شد. شاخصهای کمّی در جدول 1 آمده است.
جدول.1 پیشفرضهای مدلراش و بررسی تناسب مدل با دادهها
| مقیاس ضداجتماعی |
|
| مقیاس ضعفروانی | ||||||||||||
Measure | Infit MNSQ | Infit ZSTD | Outfit MNSQ | Outfit ZSTD |
| شماره سوال | Measure | Infit MNSQ | Infit ZSTD | Outfit MNSQ | Outfit ZSTD | |||||
0٫26 | 1٫06 | 1٫3 | 1٫35 | 4٫9 | 33 | 3٫59- | 1٫34 | 9٫9 | 1٫51 | 9٫9 | ||||||
214 | 0٫40 | 1٫05 | 1٫0 | 1٫29 | 3٫8 | 293 | 3٫46- | 1٫24 | 9٫7 | 1٫46 | 9٫9 | |||||
158 | 1٫54- | 1٫16 | 9٫9 | 1٫26 | 9٫9 | 309 | 2٫58- | 1٫17 | 9٫9 | 1٫42 | 9٫9 | |||||
171 | 0٫94- | 1٫13 | 6٫0 | 1٫24 | 7٫1 | 242 | 1٫69- | 1٫27 | 9٫9 | 1٫39 | 9٫9 | |||||
143 | 1٫75- | 1٫10 | 7٫7 | 1٫15 | 7٫8 | 321 | 0٫96- | 1٫27 | 9٫9 | 1٫36 | 9٫6 | |||||
113 | 1٫60- | 1٫09 | 6٫5 | 1٫15 | 6٫8 | 174 | 1٫92 | 1٫08 | 1٫0 | 1٫33 | 2٫3 | |||||
157 | 1٫82- | 1٫09 | 7٫0 | 1٫13 | 6٫9 | 9 | 0٫71- | 1٫14 | 6٫2 | 1٫19 | 4٫5 | |||||
34 | 0٫81- | 1٫07 | 3٫0 | 1٫12 | 3٫1 | 170 | 0٫22 | 1٫09 | 2٫8 | 1٫13 | 1٫9 | |||||
261 | 0٫93- | 1٫07 | 3٫2 | 1٫11 | 3٫2 | 23 | 0٫40- | 1٫10 | 4٫1 | 0٫99 | -0٫2 | |||||
263 | 2٫65- | 1٫06 | 6٫1 | 1٫10 | 6٫8 | 165 | 0٫78 | 1٫08 | 1٫9 | 1٫07 | 0٫8 | |||||
264 | 1٫64 | 0٫99 | 0٫0 | 1٫09 | 0٫7 | 285 | 0٫90- | 1٫07 | 3٫6 | 1٫01 | 0٫3 | |||||
79 | 1٫94- | 1٫06 | 5٫7 | 1٫09 | 5٫1 | 140 | 0٫35 | 1٫06 | 1٫8 | 1٫07 | 0٫9 | |||||
12 | 0٫24 | 1٫03 | 0٫8 | 1٫08 | 1٫2 | 313 | 0٫06 | 1٫05 | 1٫8 | 1٫04 | 0٫7 | |||||
167 | 0٫28 | 1٫00 | 0٫0 | 1٫07 | 1٫0 | 109 | 0٫90 | 1٫01 | 0٫3 | 0٫94 | 0٫6- | |||||
266 | 0٫57- | 1٫05 | 1٫8 | 1٫05 | 1٫2 | 317 | 0٫89 | 1٫01 | 0٫2 | 0٫82 | 2٫1- | |||||
209 | 1٫13- | 1٫04 | 2٫1 | 1٫04 | 1٫4 | 304 | 0٫87- | 1٫01 | 0٫4 | 0٫89 | 3٫1- | |||||
9 | 0٫64- | 1٫02 | 0٫7 | 1٫02 | 0٫5 | 3 | 0٫37 | 1٫00 | 0٫0 | 0٫85 | 2٫1- | |||||
160 | 1٫23 | 1٫00 | 0٫0 | 0٫93 | 0٫6 | 308 | 1٫18 | 1٫00 | 0٫0 | 0٫99 | 0٫0 | |||||
105 | 0٫27 | 1٫00 | 0٫0 | 0٫82 | 2٫9- | 331 | 0٫63- | 1٫00 | 0٫1- | 0٫91 | 2٫1- | |||||
225 | 0٫02- | 1٫00 | 0٫1- | 0٫98 | 0٫3- | 320 | 0٫32 | 0٫99 | 0٫3- | 0٫87 | 2٫0- | |||||
54 | 2٫31 | 0٫98 | 0٫1- | 0٫99 | 0٫0 | 326 | 1٫47- | 0٫98 | 1٫1- | 0٫92 | 3٫3- | |||||
267 | 1٫75- | 0٫99 | 0٫8- | 0٫98 | 0٫9- | 11 | 1٫33 | 0٫98 | 0٫3- | 0٫89 | 1٫0- | |||||
217 | 1٫44- | 0٫99 | 0٫8- | 0٫99 | 0٫5- | 275 | 0٫18 | 0٫98 | -0٫6 | 0٫82 | 2٫9- | |||||
125 | 0٫77 | 0٫99 | 0٫2- | 0٫91 | 1٫0- | 147 | 0٫59 | 0٫98 | -0٫5 | 0٫82 | 2٫3- | |||||
219 | 0٫27 | 0٫98 | 0٫3- | 0٫86 | 2٫1- | 38 | 1٫28- | 0٫96 | 2٫6- | 0٫89 | 3٫9- | |||||
70 | 0٫95 | 0٫98 | 0٫2- | 0٫96 | 0٫4- | 16 | 0٫35 | 0٫95 | 1٫4- | 0٫76 | 3٫7- | |||||
35 | 1٫08 | 0٫98 | 0٫2- | 0٫86 | 1٫4- | 310 | 0٫89 | 0٫95 | 1٫2- | 0٫78 | 2٫6- | |||||
226 | 1٫04- | 0٫98 | 0٫9- | 0٫91 | 3٫1- | 4 | 0٫46- | 0٫94 | 2٫6- | 0٫79 | 5٫0- | |||||
42 | 0٫05- | 0٫96 | 1٫0- | 0٫81 | 3٫6- | 89 | 0٫95- | 0٫94 | 3٫5- | 0٫83 | 5٫1- | |||||
243 | 0٫38 | 0٫96 | 0٫8- | 0٫81 | 2٫9- | 218 | 1٫56- | 0٫93 | 4٫8- | 0٫85 | 6٫3- | |||||
122 | 1٫84- | 0٫96 | 3٫6- | 0٫94 | 3٫7- | 31 | 0٫89 | 0٫93 | 1٫6- | 0٫83 | 2٫0- | |||||
95 | 0٫83 | 0٫96 | 0٫7- | 0٫79 | 2٫5- | 130 | 0٫88 | 0٫90 | 2٫2- | 0٫62 | 4٫8- | |||||
202 | 1٫67 | 0٫96 | 0٫4- | 0٫69 | 2٫7- | 175 | 1٫03 | 0٫90 | 2٫1- | 0٫74 | 2٫9- | |||||
195 | 1٫37 | 0٫95 | 0٫6- | 0٫89 | 1٫0- | 329 | 1٫66 | 0٫90 | 1٫6- | 0٫62 | 3٫5- | |||||
185 | 0٫07- | 0٫95 | 1٫4- | 0٫81 | 3٫6- | 327 | 1٫45 | 0٫90 | 1٫8- | 0٫45 | 6٫0- | |||||
288 | 1٫79 | 0٫95 | 0٫5- | 0٫54 | 4٫0- | 82 | 0٫20 | 0٫90 | 3٫3- | 0٫65 | 6٫1- | |||||
31 | 1٫26 | 0٫94 | 0٫7- | 0٫76 | 2٫4- | 73 | 0٫65 | 0٫89 | 2٫8- | 0٫65 | 4٫8- | |||||
89 | 0٫73- | 0٫94 | 2٫4- | 0٫84 | 4٫5- | 56 | 0٫29 | 0٫89 | 3٫3- | 0٫63 | 6٫1- | |||||
99 | 0٫62- | 0٫94 | 2٫3- | 0٫81 | 5٫0- | 316 | 0٫99 | 0٫88 | 2٫7- | 0٫51 | 6٫3- | |||||
32 | 0٫98- | 0٫94 | 3٫0- | 0٫84 | 5٫2- | 302 | 0٫48 | 0٫87 | 3٫8- | 0٫54 | 7٫4- | |||||
129 | 1٫28- | 0٫94 | 3٫8- | 0٫89 | 4٫2- | 328 | 0٫06 | 0٫86 | 5٫0- | 0٫58 | 8٫1- | |||||
94 | 0٫30- | 0٫93 | 2٫2- | 0٫81 | 4٫3- | 325 | 0٫99 | 0٫86 | 3٫3- | 0٫47 | 7٫0- | |||||
22 | 1٫11 | 0٫92 | 1٫1- | 0٫60 | 4٫5- | 273 | 0٫85 | 0٫86 | 3٫5- | 0٫47 | 7٫4- | |||||
17 | 0٫84 | 0٫92 | 1٫3- | 0٫73 | 3٫3- | 289 | 1٫01 | 0٫85 | 3٫3- | 0٫43 | 7٫6- | |||||
259 | 0٫81- | 0٫92 | 3٫6- | 0٫80 | 6٫1- | 301 | 0٫19- | 0٫85 | 6٫0- | 0٫63 | 8٫0- | |||||
82 | 0٫54 | 0٫92 | 1٫6- | 0٫66 | -5٫0 | 277 | 0٫09- | 0٫83 | 6٫6- | 0٫59 | 8٫6- | |||||
21 | 2٫55 | 0٫92 | 0٫5- | 0٫41 | 4٫3- | 65 | 0٫58 | 0٫82 | 5٫1- | 0٫46 | 8٫5- | |||||
56 | 0٫82 | 0٫91 | 1٫5- | 0٫66 | 4٫3- | 196 | 0٫44 | 0٫79 | 6٫5- | 0٫45 | 9٫4- | |||||
71 | 1٫93 | 0٫91 | 0٫8- | 0٫63 | 2٫9- | -- | -- | -- | -- | -- | -- | |||||
52 | 2٫46 | 0٫90 | 0٫7- | 0٫48 | 3٫8- | -- | -- | -- | -- | -- | -- |
در جدول شماره 1 ستون اول از سمت راست به شماره سوالات مولفه ضداجتماعی و ضعفروانی در پرسشنامه MMPI-2 تعلق دارد و اینکه ترتیب هر سوال در پرسشنامه برای شرکتکنندگان به چه صورت بوده است. در ستون دوم (Measure) به میزان و درجه سختی هر پرسش در واحد لوجیت (Logit) اشاره دارد که در پرسشنامههای شخصیتی به عنوان ضریب دشواری یا مطلوبیت معرفی گردید (Lincare, 2010). سخت ترین سوالات مقیاس ضداجتماعی متعلق به سوال 21، 52 و 54 بود و سختترین سوالات مقیاس ضعفروانی که کمترین میزان پاسخدهی مثبت را داشتند سوالات 174 و 329 بوده است و در این مقیاس بالاترین میزان مقبولیت متعلق به سوالات 33، 293 و 309 بود. مابقی سوالات در سطح متوسطی از درجه سختی و یا مطلوبیت قرار داشتند. ستون سوم و چهارم مربوط به شاخصهای تناسب Infit و ستون پنجم و ششم متعلق به شاخصهای تناسب Outfit است. در پاسخ به سوال دوم میتوان بیان داشت که با توجه به نتایج جدول، شاخصهای برازش تمامی سوالات در دامنه مطلوبی قرار دارد و سوالات برازش خوبی با مدل راش دارد. پس از تائید برازش دادهها با مدل، در ادامه برای تشخیص و مقایسه سوالات مقیاس ضداجتماعی و ضعفروانی دارای کنشافتراقی بر حسب جنسیت از دو شیوه کلاسیک (منتلهنزل) و نظریه سوال- پاسخ (مدلراش) استفاده شد و نتایج آن در جدول 2 آورده شد.
جدول.2 مقایسه توانش مدلراش و منتلهنزل در تشخیص کنشافتراقی پرسشها بر حسب جنسیت
مقیاس | شماره سوال | منتلهنزل |
| مدل راش | جهت تورش | ||||||||||||
Size | Prob. | نتیجه |
| DIF Contrast | DIF Size | Welch Prob. | نتیجه | ||||||||||
0٫60 | 0٫0000 | B |
| 0٫55 | 0٫37 | 0٫0000 | B | F | |||||||||
35 | 0٫22 | 0٫0045 | A |
| 0٫64 | 0٫45 | 0٫0004 | B | F | ||||||||
70 | 0٫82- | 0٫0000 | C |
| 0٫72- | 0٫41- | 0٫0000 | C | M | ||||||||
71 | 0٫75- | 0٫0035 | C |
| 0٫19- | 0٫12- | 0٫4221 | A | -- | ||||||||
79 | 0٫48- | 0٫0000 | B |
| 0٫57- | 0٫32- | 0٫0000 | B | M | ||||||||
99 | 0٫40 | 0٫0000 | B |
| 0٫51 | 0٫32 | 0٫0000 | B | F | ||||||||
105 | 1٫08 | 0٫0000 | C |
| 1٫26 | 0٫92 | 0٫0000 | C | F | ||||||||
113 | 0٫30- | 0٫0000 | A |
| 0٫46- | 0٫26- | 0٫0000 | B | M | ||||||||
122 | 0٫45- | 0٫0000 | B |
| 0٫34- | 0٫19- | 0٫0000 | A | -- | ||||||||
143 | 0٫44- | 0٫0000 | B |
| 0٫60- | 0٫33- | 0٫0000 | B | M | ||||||||
157 | 0٫51- | 0٫0000 | B |
| 0٫64- | 0٫36- | 0٫0000 | B | M | ||||||||
167 | 0٫76- | 0٫0000 | C |
| 0٫72- | 0٫40- | 0٫0000 | C | M | ||||||||
171 | 0٫38- | 0٫0000 | A |
| 0٫61- | 0٫34- | 0٫0000 | B | M | ||||||||
202 | 0٫10 | 0٫0103 | A |
| 0٫88 | 0٫64 | 0٫0006 | C | F | ||||||||
214 | 0٫43- | 0٫0002 | B |
| 0٫64- | 0٫37- | 0٫0000 | B | M | ||||||||
225 | 0٫86 | 0٫0000 | C |
| 0٫93 | 0٫64 | 0٫0000 | C | F | ||||||||
243 | 0٫58- | 0٫0000 | B |
| 0٫43- | 0٫25- | 0٫0003 | B | M | ||||||||
261 | 0٫47- | 0٫0000 | B |
| 0٫57- | 0٫33- | 0٫0000 | B | M | ||||||||
263 | 0٫68- | 0٫0000 | C |
| 0٫79- | 0٫43- | 0٫0000 | C | M | ||||||||
264 | 0٫23 | 0٫0086 | A |
| 0٫63 | 0٫43 | 0٫0097 | B | F | ||||||||
267 | 0٫49- | 0٫0000 | B |
| 0٫43- | 0٫23- | 0٫0000 | B | M | ||||||||
سوالات ضعفروانی | 38 | 0٫68- | 0٫0000 | C |
| 0٫55- | 0٫33- | 0٫0000 | B | M | |||||||
175 | 0٫66- | 0٫0000 | C |
| 0٫49- | 0٫31- | 0٫0001 | B | M | ||||||||
196 | 0٫57- | 0٫0000 | B |
| 0٫19- | 0٫12- | 0٫0657 | A | -- | ||||||||
242 | 0٫47- | 0٫0000 | B |
| 0٫69- | 0٫41- | 0٫0000 | C | M | ||||||||
289 | 0٫98- | 0٫0000 | C |
| 0٫52- | 0٫33- | 0٫0000 | B | M | ||||||||
293 | 0٫53- | 0٫0000 | B |
| 1٫11- | 0٫61- | 0٫0000 | C | M | ||||||||
304 | 0٫57- | 0٫0000 | B |
| 0٫47- | 0٫29- | 0٫0000 | B | M | ||||||||
309 | 0٫36- | 0٫0000 | A |
| 0٫47- | 0٫27- | 0٫0000 | B | M | ||||||||
316 | 0٫43 | 0٫0004 | B |
| 0٫62 | 0٫45 | 0٫0000 | B | F | ||||||||
327 | 0٫83 | 0٫0000 | C |
| 1٫18 | 0٫92 | 0٫0000 | C | F | ||||||||
328 | 0٫76- | 0٫0000 | C |
| 0٫47- | 0٫29- | 0٫0000 | B | M | ||||||||
329 | 0٫10 | 0٫1426 | A |
| 0٫47 | 0٫34 | 0٫0104 | B | F |
M= مردان، F= زنان
شکل.1 نمودار کنشافتراقی سوالات ضداجتماعی بر حسب ویژگی جنسیت (0= زن و 1= مرد)
شکل.2 نمودار کنشافتراقی سوالات ضعفروانی بر حسب ویژگی جنسیت (0= زن و 1= مرد)
در ستون اول این جدول شماره سوالات مقیاس ضداجتماعی و ضعفروانی پرسشنامه MMPI-2 آورده شد. سپس نتایج به دست آمده از رویکرد منتلهنزل ارائه شد. در این روش مقادیر کنشافتراقی با Size و سطح معناداری آن با Prob. آورده شد. پساز آن نتایج به دست آمده از کنشافتراقی مدل راش گزارش شد که با شاخصهای DIF Contrast و DIF Size مشخص شد و معناداری کنشافتراقی با Prob. نشان داده شد. برای بررسی وجود کنشافتراقی باید سطح Prob. کمتر از 05/0 گزارش شود. اگر مقادیر Size کمتر از 43/0 باشد نشان از عدم کنشافتراقی (A) است، اگر این شاخص بین 43/0 تا 64/0 باشد دارای کنشافتراقی متوسط (B) است و اگر بالاتر از 64/0 باشد داری کنشافتراقی بزرگ (C) است. کنشافتراقی بزرگ گواهی بر ناعادلانه بودن سوال است، این بدین معناست که اگر پاسخ به سؤالهای آزمون با کنترل توانایی آزمودنیها تابعی از ویژگیهای گروهی که آزمودنیها به آن تعلق دارند، مانند جنسیت و سن باشد، آن سؤالها نسبت به آن افراد دارای کنش افتراقی و سوءگیری است.
همچنین با توجه به نتایج ارائه شده در جدول 2 در پاسخ به سوال سوم میتوان بیان داشت که از بین 50 سوال مقیاس ضداجتماعی تکمیل شده توسط داوطلبان استخدامی، تعداد 19 سوال دارای کنشافتراقی است و مابقی سوالات (31 مورد) کنشافتراقی بین زنان و مردان نداشته است، از بین سوالات دارای کنشافتراقی تعداد 13 سوال دارای کنشافتراقی متوسط و 6 سوال کنشافتراقی بزرگی را بر حسب ویژگی جنسیت گزارش دادند. از بین 48 سوال مقیاس ضعفروانی بر اساس مدل راش تعداد 11 سوال دارای کنش افتراقی تشخیص داده شد که 8 سوال دارای کنش افتراقی در سطح متوسط و 3 سوال دارای کنش افتراقی بزرگ بود. در نهایت در پاسخ به سوال چهارم در ارتباط با مقایسه بین دو رویکرد کلاسیک (منتلهنزل) و مدل راش در بررسی کنشافتراقی نیز میتوان بیان داشت که بیشتر سوالاتی که در مدل راش دارای کنشافتراقی تشخیص داده شدند نیز در روش منتلهنزل نیز دارای کنشافتراقی تشخیص داده شدند به جز 5 مورد (سوالات 35، 113، 171، 202 و 264) از مقیاس ضداجتماعی و 2 مورد (سوالات 309 و 329) از مقیاس ضعفروانی که در مدل راش دارای کنشافتراقی بود اما در روش منتلهنزل شناسائی نشد، که این نشان دهنده دقت بیشتر مدل راش نسبت به مدل منتلهنزل است که توانائی تشخیص بیشتر سوالات دارای کنشافتراقی را داراست. با توجه به حجم سوالات و تعداد نسبتا یکسان در شناسائی سوالات دارای کنشافتراقی توسط دو روش میتوان بیان داشت که دو روش منتلهنزل و مدل راش با وجود تقریبا عملکرد یکسان در شناسائی سوالات دارای کنشافتراقی، اما عملکرد مدل راش 08/0 درصد بهتر از روش منتلهنزل بوده است. این درصد از تقسیم سوالات اختلافی در تشخیص کنشافتراقی بر تعداد کل سوالات مورد بررسی بدست آمدهاست (لینکر، 2010). در شکل شماره 1 و 2 نتایج کنشافتراقی سوالات ضداجتماعی و ضعفروانی برحسب ویژگی جنسیت به صورت نمودار نشان دادهشد. در ستون آخر جدول جهت تورش سوالات داری کنشافتراقی نشان داده شده است. اگر در سوال تورش دار، مردان بیشتر جواب مثبت داده باشند، آن سوال با M نشان داده شده است و نشان از این است که این سوال برای مردان دارای کنشافتراقی بیشتری است و اگر در سوال تورش دار، زنان جواب مثبت بیشتر داده بودند، آن سوال با F نشان داده شده است و نشان از این است که زنان به این سوال پاسخ مثبت بیشتری دادهاند. با توجه به ستون آخر جدول شماره 2 نشان داده شد که در مقیاس ضداجتماعی 12 سوال دارای تورش به جهت مردان و 7 سوال دارای تورش به جهت زنان بوده است و از بین سوالات دارای کنشافتراقی مقیاس ضعفروانی 8 سوال به جهت مردان و تنها 3 سوال به ضرر زنان تورش داشته است. در مجموع میتوان بیان داشت که بیشتر سوالات این دو مقیاس به ضرر مردان دارای سوءگیری بود و مردان به طور معمول نمره بالاتری را نسبت به زنان در دو مقیاس ضداجتماعی و ضعفروانی خواهند گرفت.
تاثیر وجود کنشافتراقی بر انصاف آزمون را میتوان از منظر تفاوتهای عملکردی شرکتکنندگان در پرسشنامه مشخص نمود. وجود پرسشهایی با ویژگی کنشافتراقی بدان مفهوم است که سازههای غیرمرتبطی به پاسخ افراد تاثیر میگذارد و مالک توانایی شرکت کنندگان در آن آزمون نیست. در مقیاس ضداجتماعی و ضعفروانی پرسشنامه MMPI-2، به دلیل وجود تعداد پرسشها با ویژگی کنشافتراقی میتوان بیان کرد که 38 درصد سوالات مقیاس ضداجتماعی و 23 درصد از مقیاس ضعفروانی متاثر از جنسیت شرکت کنندگان بود، که در بیشتر موارد به ضرر مردان و در برخی اوقات به نفع آنان بوده است. پر واضح است که بهصورت کلی بخشی از سوالات پرسشنامه حاضر دارای تبعیضی برای شرکت کنندگان بوده است و انصاف در آزمون را تا حد زیادی نقض کرده است و تنها در 68 سوال از نظر تبعیض جنسیتی انصاف در تشخیص برای مولفه ضداجتماعی و ضعفروانی رعایت شده بود. لیکن باید در نظر داشت که مفهوم انصاف آزمون مفهومی چند بعدی است و وجود یا فقدان آن متاثر از عوامل مختلفی است که از زمان طراحی آزمون باید آنان را کنترل کرد و سرانجام در زمان تفسیر نتایج، اثرگذاری آن عوامل را در نظر گرفت.
بحث و نتیجه گیری
هدف از این پژوهش تعیین و تبین قدرت هر یک از شیوههای سنجش و تشخیص کنشافتراقی سوالات مقیاس انحراف ضداجتماعی و ضعفروانی پرسشنامه چندوجهی مینهسوتا-2 بود که بر اساس مدل راش و روش منتلهنزل بررسی و مقایسه شد. هدف دیگر ارائه شده در این پژوهش، اثرگذاری این شیوهها بر صحت تحلیلهای آماری انجام شده بر نحوه پاسخگوئی داوطلبان استخدامی با توجه به خصیصه جنسیت بود. بر اساس نتایج گزارش شده در جدول 1 میتوان بیان داشت که تمامی سوالات مولفه ضعفروانی و انحراف ضداجتماعی با مدل راش یک پارامتری دارای برازش خوبی است و دادهها با مدل برازش داشته است. بنابراین نتایج به دست آمده از کنشهای افتراقی، مورد اعتماد و اتکاء و قابل استفاده است.
بر اساس آنچه در جدول شماره 2 در بحث تشخیص سوالات دارای کنش افتراقی، مشخص شد که از بین سوالات مقیاس ضداجتماعی 38 درصد و از بین سوالات مقیاس ضعفروانی 9/22 درصد سوالات دارای کنشافتراقی بر اساس جنسیت بین زن و مرد گزارش شد و بیشتر سوالات به جهت (ضرر) مردان دارای تورش بود. این بدین معناست که مردان داوطلب استخدام به طور معمول بیشتر از زنان در سوالات مقیاس ضداجتماعی و ضعفروانی نمره بالائی گرفتهاند در صورتی که در واقع این صفت در مردان بیشتر از زنان نبوده است. این تورش سبب شده است تا مردان در گزارشهای نهائی نمرات بالاتری را در مقیاس ضداجتماعی و ضعفروانی بهدست آورده و احتمال عدم تائید سلامت روان آنان در مقایسه با زنان در آزمونهای سلامت روان بدون ورود به سازمان بیشتر بوده است و تا حدی انصاف در گزینش رعایت نشده است. این نتایج با یافتههای Gori & Marin (2015), Card, Stucky, Sawalani & Little (2008) و McNulty, Forbey, Graham & et al (2015) همسو بود. البته در تبیین این نکته که چرا سوالات زیادی دارای کنش افتراقی تشخیص داده شدهاست را میتوان چنین بیان داشت که نمونه مورد هدف این پژوهش، داوطلبان استخدامی بودند و این گروه نمونه با توجه به اینکه در حیطه غیر بالینی و جامعه نرمال قرار گرفتند، شاخصهای خصیصهای بیشتر از شاخصهای بالینی نمایان میگردد و این یکی از دلایلی است که میتوان برای بالا بودن تعداد سوالات دارای کنش افتراقی در این مقیاس بیان داشت. البته سوالاتی نیز که دارای کنش افتراقی نبودند نیز میتوان بهعنوان سوالات منصفانه و سوالاتی معرفی کرد که گروههای جنسیتی تاثیری در نتایج آنان ندارد و این سوالات به دور از هر گونه سوءگیری ناشی از گروهبندیهای جنسیتی نتایج را گزارش میکنند.
در مقایسه شیوههای سنجش کنشافتراقی مطرح شد در تشخیص پرسشهائی با سطح کنشافتراقی متوسط و یا بالا (37 سوال از 57 سوال) مدل منتلهنزل تاحدی کارآمدی مناسبی از خود ارئه داد. با اینحال نتایج نشان داد که نظریه کلاسیک اندازهگیری (منتلهنزل) نسبت به مدل راش در تشخیص کنشافتراقی توانمند نبود و این روش در تشخیص کنش افتراقی سوالات در سطح متوسط نسبت به سوالات بسیار ساده و بسیار سخت ضعیف تر عمل کرده است و این یافته با مفروضهای مبنی بر اینکه روش منتلهنزل برای آزمونهای بسیار ساده و یا بسیار سخت کارآمدتر است، اما برای آزمونها و سوالات با میزان سختی متوسط از کارآمدی آن کاسته میشود Karami & Khodi (2021)، همسو بوده است. همچنین در بحث اینکه سوالات در تشخیص کنشافتراقی غیریکنواخت (Non-uniform) چگونه عمل میکنند نیز نیازمند بحث و بررسی بیشتر است.
یافتههای این پژوهش برای روانسنج و متخصصان طراحی آزمون و تحلیلگران نتایج آزمون، رویکردهای جدید سنجش کنشافتراقی را توصیه می نماید، چرا که مدلهای راش برتری نسبی خوبی نسبت به نظریه کلاسیک اندازهگیری دارد (Wilson, 2005). به نظر Lee, Zhang, Yin (2010) دقت همبستگی هاي بین خرده مقیاسها و اعتبار آزمون با استفاده از مدل راش بهبود مییابد زیرا این مدل خطاي اندازهگیري را در برآورد به حساب میآورد. مدل راش با فراهم آوردن یك روش مناسب برای تبدیل غيرخطی دادههای خام رتبهای به اندازههای فاصلهای بر یكی از نگرانیها و دغدغههای رایج در ساخت ابزارهای اندازه گيری های روانی و تربيتی، یعنی دستيابی به عينيت خاص یا تغيير ناپذیری مقایسهها غلبه میكند (Minaei, 2015; Tennant & Conaghan, 2007). البته در تعمیمپذیری نتایج به دست آمده از مدل راش باید دقت لازم را در نظر داشت چرا که مقیاس ضداجتماعی و ضعفروانی پرسشنامه چندوجهی شخصیتی مینهسوتا-2 به کار رفته در این پژوهش دارای سازه تک بعدی (unidimensional) است و مفروضات لازم نظریه سوال- پاسخ را رعایت کرده است. اما اگر سازهای مفروضه عدم وابستگی مکانی (local Independence) در آن رعایت نشده باشد، ممکن است در سنجش با شیوههای ذکر شده نتایج متفاوتی را بدست آورد. همچنین باید در نظر گرفت اگر در مدلهای نظریه سوال- پاسخ فراتر از مدل راش رفته و مدلهای دو یا سه پارامتری را استفاده کنیم، محتمل است که نتایج تغییر یافته و حساسیت نظریه سوال- پاسخ افزایش یابد.
همچنین با توجه به نتایج حاصل از این پژوهش به روانسنج و روانشناسانی که با مراکز طب کار جهت بررسی سلامت روان داوطلبان استخدامی همکاری دارند و به ویژه مجریان آزمون MMPI-2 توصیه میشود که نگاهی به کنشهای افتراقی سوالات بر اساس جنسیت کرده و در تفسیر و نمرهگذار به این ویژگیهای دموگرافیک داوطلبان نیز توجه بیشتری نمایند، چرا که مردان به طور طبیعی دارای نمره بالاتری در مولفه ضداجتماعی و ضعفروانی است و این نشانهای بر داشتن میزان بالائی از این صفات در مردان نمیباشد. در نهایت به پژوهشگران پیشنهاد میشود تا کنشافتراقی مولفههای دیگر پرسشنامه چندوجهی مینهسوتا مانند پارانوئیا، اسکیزوفرنی و هیپومانیا را در بین داوطلبان استخدامی بررسی نموده و همچنین از روشهای دیگر بررسی کنشهای افتراقی نیز در کنار مدل راش بهره ببرند. همچنین به پژوهشگران توصیه میگردد که به بررسی نقاط برش مولفههای ضداجتماعی و ضعفروانی و مولفههای دیگر پرسشنامه MMPI-2 به تفکیک جنسیت پرداخته شود تا نهایت انصاف در آزمون صورت پذیرد.
منابع
Baker. C. A, Baum. L. J & Francis. J. C. (2023). Assessment of test bias on the MMPI-2-RF higher order and restructured clinical scales as a function of gender and race. Professional Psychology Research and Practice. 54 (4) Follow journal. DOI: 10.1037/pro0000517.
Bethune M. M. (2011). Predictors of Performance in a Professional Counselor Masters Program, Doctoral Thesis http://gradworks.umi.com/34/93/3493607.html.
Björkqvist, K. (2018). Gender differences in aggression. Current Opinion in Psychology. Volume 19, February, Pages 39-42.
Buribayev. Y. A and Khamzina Z. A. (2019). Gender equality in employment: The experience of Kazakhstan. International Journal of Discrimination and the Law, Vol. 19(2) 110–124.
Camilli, G. (2006). Test fairness. In R. Brennan (Ed.), Educational measurement (4th ed.) (pp. 221-256). New York: American Council on Education & Praeger series on higher education.
Camilli, G., & Congdon, P. (1999). Application of a method of estimating DIF for polytomous test items. Journal of Educational and Behavioral Statistics, 24(4), 323-341.
Camilli, G., & Shepard, L. (1994). Methods for identifying biased test items. Newbury Park, CA Sage.
Cao. W, Li. P. Vander Wal. R.C & Taris. T.W. (2022). Leadership and Workplace Aggression: A Meta-analysis. Journal of Business Ethics. Published: 15 July. volume 186, pages347–36
Card N. A, Stucky. B. D, Sawalani. G. M & Little. T. D. (2008). Direct and indirect aggression during childhood and adolescence: a meta-analytic review of gender differences, intercorrelations, and relations to maladjustment. Sep-Oct;79(5): 1185-229. doi: 10.1111/j.1467-8624.2008.01184.x.
Chapelle, C. A. (2020). Validity in language assessment. The Routledge Handbook of Second Language Acquisition and Language Testing, 11.
Chen, M. Y., Liu, Y., & Zumbo, B. D. (2020). A propensity score method for investigating differential item functioning in performance assessment. Educational and Psychological Measurement, 80(3), 476-498.
Cherry Kendra. (2021) The Minnesota Multiphasic Personality Inventory (MMPI). Updated on September 02 Medically reviewed by Amy Morin, LCSW.
Embretson, S. E., and Reise, S. P. (2000). Item Response Theory for Psychologists. Mahwah, NJ: Lawrence Erlbaum Associates. 11, 57- 74.
Gori. E & Marin. R. F. (2015). Rasch Analysis of some MMPI-2 scales in a sample of university freshmen. International Journal of Arts & Sciences. 1944-6934 :: 08(03):107–150.
Hambleton, R. K., & Rogers, H. J. (1989). Detecting potentially biased test items: Comparison of IRT area and Mantel-Haenszel methods. Applied Measurement in Education, 2(4), 313-334.
Hambleton, Ronald K.; Saminathan, H.; Rogers, H.. Jane (1991). Fundamentals of Question-Answer Theory. Translated by Mohammad Reza Filsafinejad (2010). Tehran: Allameh Tabatabai University. [Persian]
Karami, H. (2013) The quest for fairness in language testing. Educational Research and Evaluation, 19(2&3), 158-169. [Persian]
Karami, Hossein & Khodi, Ali (2021). Differential Item Functioning and Test Performance: a Comparison Between the Rasch Model, Logistic Regression and Mantel-Haenszel. Journal of Foreign Language Research, 10 (4), 842-853. [Persian]
Karami. H. R, Gramipour. M & Minaei. A. (2021). Differential Item Functioning (DIF) Detection Rate Using Rasch Trees Model: A Simulated and Real Data Study of the NAJA High Stakes Tests. Educational Measurement. 11(44), 1-30. [Persian]
Lee JC, Zhang Z, Yin H. (2010). Using multidimensional Rasch analysis to validate the Chinese version of the Motivated Strategies for Learning Questionnaire (MSLQ-CV). Eur J Psychol Educ; 25.
Linacre, J. M. (2010). A User's Guide to WINSTEPS®. Retrieved May 2, from http://www.winsteps.com/ .
Lord, F. M.y. & Novick, MR. (1968). Statistical Theory of Mental Test Scores. Addison-Wesley Publishing Company.
Marnat, G. G. & Wright, A. J. (2016). Handbook of Psychological Assessment. 6th ed.
McNulty J. L., Forbey J. D., Graham J. R., Ben-Porath Y. S., Black M. S., Anderson S. V. & Burlew A. K. (2015). MMPI-2 Validity Scale Characteristics in a Correctional Sample. Sage Journals, Volume 10, No. 3, September. 288-298.
Minaei. A. (2015). Aapplication of Rasch measurement model to evaluate measurement properties of the Test of Visual- Motor Skills-Revised. Journal of Educational Measurement. Volume 5, Issue 18 - Serial Number 18. January. 77-114. [Persian]
Penfield, R. D. & Algina, J. (2003). Applying the Liu–Agresti estimator of the cumulative common odds ratio to DIF detection in polytomous items. Journal of Educational Measurement, 40: 353–370.
Queirolo L, Bacci C, Roccon A, Zanette G and Mucignat C. (2023). Anxiety in a regular day of work: A 24 hour psychophysiological investigation in young dentists with gender comparison. Front Psychol. 14:1045974. doi: 10.3389/fpsyg.1045974
Siegert, R. J., Tennant, A., & Turner-Stokes, L. (2010). Rasch analysis of the Beck Depression Inventory-II in a neurological rehabilitation sample. Disability and Rehabilitation, 32(1), 8–17.
Skrondal, A., Rabe-Hesketh, S., and Boca Raton, F. (2004). Generalized Latent Variable Modeling: Multilevel, Longitudinal and Structural Equation Models: Chapman & Hall/ CRC Press.
Soltani Shal R, Saadatbin Javaheri F, Zebardast F. (2020). Survey the level of well-being and Psychometric characteristics of hospital nurses’ well-being at work scale. Occupational Medicine Quarterly Journal:12(1): 55-68. [Persian]
Su. Y & Wang N. (2005). Use of the Rasch IRT model in standard setting: An item‐ mapping method. Journal of Educational Measurement. Sep; 40 (3): 231- 53.
Talerico G. M, McCallum. J. J, Whitman M. R, Tarescavage. M, Corey D. M & Ben-Porath. Y. B. (2023): Comparing the Validity of MMPI-3 Scores in Prehire Psychological Screenings of Male and Female Police Officer Candidates, Journal of Personality Assessment, DOI: 10.1080/00223891.2023.2191278
Tennant, A., & Conaghan, P.G. (2007). The Rasch measurement model in rheumatology: what is it and why use it? When should it be applied, and what should one look for in a Rasch paper? Arthritis & Rheumatism journal. 57, 1358– 1362.
Valianpour. Z, Modarres Gharavi. M & Mahram. B. (2020). Validation of the Minnesota Multiphasic Personality Inventory (MMPI 2) in psychiatric patients and non-patient individuals in Mashhad city, Iran. Journal of Fundamentals of Mental Health, Nov-Dec. [Persian]
Zahid. Z, nasrollahi. Z & Mahinizadeh. M. (2020). From Gender Discrimination to Equality and Economic Growth (Study of Developing Countries). Journal of Woman in Development and Politics. 662- 643. [Persian]
Zumbo, B. D. (2003). Does item-level DIF manifest itself in scale-level analyses? Implications for translating language tests. Language testing, 20(2), 136-147.