بررسی کنش‌افتراقی سوالات ضعف روانی و ضد‌اجتماعی در آزمون‌های استخدامی بدو ورود: مقایسه روش منتل‌هنزل و مدل راش

رحمانی, مهدی; فلسفی نژاد, محمد رضا; مینائی, اصغر; فرخی, نورعلی

doi:10.30486/jsrp.2023.1996664.3830

کد مقاله : JSRP-2309-3830 (R2) بازدید : 511 صفحه: 33 - 45

10.30486/jsrp.2023.1996664.3830

نوع مقاله: پژوهشی

بررسی کنش‌افتراقی سوالات ضعف روانی و ضد‌اجتماعی در آزمون‌های استخدامی بدو ورود: مقایسه روش منتل‌هنزل و مدل راش

محورهای موضوعی : روانشناسی

مهدی رحمانی ^{1
*} , محمد رضا فلسفی نژاد ² , اصغر مینائی ³ , نورعلی فرخی ⁴

1 - دانشجوی دکتری سنجش و اندازه گیری، دانشکده روان‌شناسی و علوم تربیتی، دانشگاه علامه طباطبائی، تهران، ایران
2 - دانشیار گروه سنجش و اندازه گیری، دانشکده روان‌شناسی و علوم تربیتی، دانشگاه علامه طباطبائی، تهران، ایران.
3 - دانشیار گروه سنجش و اندازه گیری، دانشکده روان‌شناسی و علوم تربیتی، دانشگاه علامه طباطبائی، تهران، ایران.
4 - دانشیار گروه سنجش و اندازه گیری، دانشکده روان‌شناسی و علوم تربیتی، دانشگاه علامه طباطبائی، تهران، ایران.

تاریخ دریافت : 1402/06/26 تاریخ پذیرش : 1402/07/19 تاریخ انتشار : 1403/09/21

کلید واژه: کنش‌افتراقی سوال, مدل‌راش, منتل‌هنزل, ضد‌اجتماعی, ضعف‌روانی, داوطلبان استخدامی.,

چکیده مقاله :

انتخاب نیروی انسانی سالم جزء وظایف اصلی آزمون‌های استخدامی است به شرط آنکه ابزارهای اندازه‌گیری دارای انصاف و عدالت در سنجش باشند. روش: پژوهش از نوع پیمایشی است و جامعه آماری کلیه داوطلبان استخدامی شهر اصفهان بود. حجم نمونه 5997 نفر بود که به روش خوشه‌ای یک‌مرحله‌ای انتخاب شد. ابزار مورد استفاده پرسشنامه MMPI-2 بود. برازش سوالات با مدل با استفاده از شاخص‌های outfit MnSq و infit MnSq تائید شد و کنش‌افتراقی سوالات بر حسب جنسیت با دو رویکرد مدل راش و منتل‌هنزل توسط نرم‌افزار Winsteps نسخه 3.64 بررسی شد. یافته ها: پس از آنکه برازش داده‌ها با مدل تائید شد‌، تحلیل کنش‌افتراقی انجام شد. نتایج نشان‌‌داد که 38 درصد از سوالات ضد‌اجتماعی و 9/22 درصد از سوالات ضعف‌روانی دارای تورش به جهت مردان ‌است. روش منتل‌هنزل در برخی سوالات عملکرد ضعیف‌تری نسبت به مدل راش داشت. نتیجه‌گیری: نتایج نشان‌داد که سوالات ضد‌اجتماعی و ضعف‌روانی به ضرر مردان است و مردان به طور سوءگیرانه‌ای نمرات بالاتری را به دست خواهند آورد. همچنین بهتر است که از مدل راش به جای روش منتل‌هنزل در تشخیص سوالات دارای تورش استفاده کرد.

چکیده انگلیسی:

Choosing healthy human resources is one of the main tasks of recruitment tests, provided that the measurement tools are fairness in test. Methods: This research is survey research and the statistical population was all the Recruitment candidates of Isfahan city. The sample size was 5997 people who were selected by one-step cluster method. The tools used was the MMPI-2. The fit of the Items with the model was confirmed using outfit MnSq and infit MnSq, and DIF according to gender was checked and compared with Rasch Model and Mantel-Haenszel by Winsteps version 3.64. Results: After fitting the data with Rasch model, DIF analysis was performed. The results showed that 38% of psychopathic deviate items and 22.9% of psychasthenia items were biased towards men. Mantel-Haenszel had a weaker performance than Rasch Model in some items. Conclusion: Psychopathic deviate and psychasthenia and items have been to the bias of men and they have naturally obtained higher scores in these two scales. Also, due to the strength of the Rasch model compared to the CTT, it is better to use this model to detect biased items

منابع و مأخذ:

Antikchi. E, Bigdeli. I. A. & Sabahi. P. (2017). The comparision of neuropsychological index related to executive functions in antisocial personality disorder, obsessive-compulsive personality disorder and normal people. Advances in Cognitive Science, Vol. 19, No. 1. [Persian]
Baker. C. A, Baum. L. J & Francis. J. C. (2023). Assessment of test bias on the MMPI-2-RF higher order and restructured clinical scales as a function of gender and race. Professional Psychology Research and Practice. 54 (4) Follow journal. DOI: 10.1037/pro0000517.
Bethune M. M. (2011). Predictors of Performance in a Professional Counselor Masters Program, Doctoral Thesis http://gradworks.umi.com/34/93/3493607.html.
Björkqvist, K. (2018). Gender differences in aggression. Current Opinion in Psychology. Volume 19, February, Pages 39-42.
Buribayev. Y. A and Khamzina Z. A. (2019). Gender equality in employment: The experience of Kazakhstan. International Journal of Discrimination and the Law, Vol. 19(2) 110–124.
Camilli, G. (2006). Test fairness. In R. Brennan (Ed.), Educational measurement (4th ed.) (pp. 221-256). New York: American Council on Education & Praeger series on higher education.
Camilli, G., & Congdon, P. (1999). Application of a method of estimating DIF for polytomous test items. Journal of Educational and Behavioral Statistics, 24(4), 323-341.
Camilli, G., & Shepard, L. (1994). Methods for identifying biased test items. Newbury Park, CA Sage.
Cao. W, Li. P. Vander Wal. R.C & Taris. T.W. (2022). Leadership and Workplace Aggression: A Meta-analysis. Journal of Business Ethics. Published: 15 July. volume 186, pages347–36
Card N. A, Stucky. B. D, Sawalani. G. M & Little. T. D. (2008). Direct and indirect aggression during childhood and adolescence: a meta-analytic review of gender differences, intercorrelations, and relations to maladjustment. Sep-Oct;79(5): 1185-229. doi: 10.1111/j.1467-8624.2008.01184.x.
Chapelle, C. A. (2020). Validity in language assessment. The Routledge Handbook of Second Language Acquisition and Language Testing, 11.
Chen, M. Y., Liu, Y., & Zumbo, B. D. (2020). A propensity score method for investigating differential item functioning in performance assessment. Educational and Psychological Measurement, 80(3), 476-498.
Cherry Kendra. (2021) The Minnesota Multiphasic Personality Inventory (MMPI). Updated on September 02 Medically reviewed by Amy Morin, LCSW.
Embretson, S. E., and Reise, S. P. (2000). Item Response Theory for Psychologists. Mahwah, NJ: Lawrence Erlbaum Associates. 11, 57- 74.
Gori. E & Marin. R. F. (2015). Rasch Analysis of some MMPI-2 scales in a sample of university freshmen. International Journal of Arts & Sciences. 1944-6934 :: 08(03):107–150.
Hambleton, R. K., & Rogers, H. J. (1989). Detecting potentially biased test items: Comparison of IRT area and Mantel-Haenszel methods. Applied Measurement in Education, 2(4), 313-334.
Hambleton, Ronald K.; Saminathan, H.; Rogers, H.. Jane (1991). Fundamentals of Question-Answer Theory. Translated by Mohammad Reza Filsafinejad (2010). Tehran: Allameh Tabatabai University. [Persian]
Karami, H. (2013) The quest for fairness in language testing. Educational Research and Evaluation, 19(2&3), 158-169. [Persian]
Karami, Hossein & Khodi, Ali (2021). Differential Item Functioning and Test Performance: a Comparison Between the Rasch Model, Logistic Regression and Mantel-Haenszel. Journal of Foreign Language Research, 10 (4), 842-853. [Persian]
Karami. H. R, Gramipour. M & Minaei. A. (2021). Differential Item Functioning (DIF) Detection Rate Using Rasch Trees Model: A Simulated and Real Data Study of the NAJA High Stakes Tests. Educational Measurement. 11(44), 1-30. [Persian]
Lee JC, Zhang Z, Yin H. (2010). Using multidimensional Rasch analysis to validate the Chinese version of the Motivated Strategies for Learning Questionnaire (MSLQ-CV). Eur J Psychol Educ; 25.
Linacre, J. M. (2010). A User's Guide to WINSTEPS®. Retrieved May 2, from http://www.winsteps.com/ .
Lord, F. M.y. & Novick, MR. (1968). Statistical Theory of Mental Test Scores. Addison-Wesley Publishing Company.
Marnat, G. G. & Wright, A. J. (2016). Handbook of Psychological Assessment. 6th ed.
McNulty J. L., Forbey J. D., Graham J. R., Ben-Porath Y. S., Black M. S., Anderson S. V. & Burlew A. K. (2015). MMPI-2 Validity Scale Characteristics in a Correctional Sample. Sage Journals, Volume 10, No. 3, September. 288-298.
Minaei. A. (2015). Aapplication of Rasch measurement model to evaluate measurement properties of the Test of Visual- Motor Skills-Revised. Journal of Educational Measurement. Volume 5, Issue 18 - Serial Number 18. January. 77-114. [Persian]
Penfield, R. D. & Algina, J. (2003). Applying the Liu–Agresti estimator of the cumulative common odds ratio to DIF detection in polytomous items. Journal of Educational Measurement, 40: 353–370.
Queirolo L, Bacci C, Roccon A, Zanette G and Mucignat C. (2023). Anxiety in a regular day of work: A 24 hour psychophysiological investigation in young dentists with gender comparison. Front Psychol. 14:1045974. doi: 10.3389/fpsyg.1045974
Siegert, R. J., Tennant, A., & Turner-Stokes, L. (2010). Rasch analysis of the Beck Depression Inventory-II in a neurological rehabilitation sample. Disability and Rehabilitation, 32(1), 8–17.
Skrondal, A., Rabe-Hesketh, S., and Boca Raton, F. (2004). Generalized Latent Variable Modeling: Multilevel, Longitudinal and Structural Equation Models: Chapman & Hall/ CRC Press.
Soltani Shal R, Saadatbin Javaheri F, Zebardast F. (2020). Survey the level of well-being and Psychometric characteristics of hospital nurses’ well-being at work scale. Occupational Medicine Quarterly Journal:12(1): 55-68. [Persian]
Su. Y & Wang N. (2005). Use of the Rasch IRT model in standard setting: An item‐ mapping method. Journal of Educational Measurement. Sep; 40 (3): 231- 53.
Talerico G. M, McCallum. J. J, Whitman M. R, Tarescavage. M, Corey D. M & Ben-Porath. Y. B. (2023): Comparing the Validity of MMPI-3 Scores in Prehire Psychological Screenings of Male and Female Police Officer Candidates, Journal of Personality Assessment, DOI: 10.1080/00223891.2023.2191278
Tennant, A., & Conaghan, P.G. (2007). The Rasch measurement model in rheumatology: what is it and why use it? When should it be applied, and what should one look for in a Rasch paper? Arthritis & Rheumatism journal. 57, 1358– 1362.
Valianpour. Z, Modarres Gharavi. M & Mahram. B. (2020). Validation of the Minnesota Multiphasic Personality Inventory (MMPI 2) in psychiatric patients and non-patient individuals in Mashhad city, Iran. Journal of Fundamentals of Mental Health, Nov-Dec. [Persian]
Wiberg, M. (2007). Measuring and detecting differential item functioning in criterion-referenced licensing test: A theoretic comparison of methods. Educational Measurement, technical report No. 2.
Zahid. Z, nasrollahi. Z & Mahinizadeh. M. (2020). From Gender Discrimination to Equality and Economic Growth (Study of Developing Countries). Journal of Woman in Development and Politics. 662- 643. [Persian]
Zumbo, B. D. (2003). Does item-level DIF manifest itself in scale-level analyses? Implications for translating language tests. Language testing, 20(2), 136-147.

متن کامل:

بررسی کنش‌افتراقی سوالات ضعف روانی و ضد‌اجتماعی در آزمون‌های استخدامی بدو ورود: مقایسه روش منتل‌هنزل و مدل راش

*مهدی رحمانی ملک‌آباد

دانشجوی دکتری سنجش و اندازه گیری، دانشکده روان‌شناسی و علوم تربیتی، دانشگاه علامه طباطبائی، تهران، ایران

محمد‌رضا فلسفی‌نژاد

دانشیار گروه سنجش و اندازه گیری، دانشکده روان‌شناسی و علوم تربیتی، دانشگاه علامه طباطبائی، تهران، ایران.

اصغر مینائی

دانشیار گروه سنجش و اندازه گیری، دانشکده روان‌شناسی و علوم تربیتی، دانشگاه علامه طباطبائی، تهران، ایران.

نورعلی فرخی

دانشیار گروه سنجش و اندازه گیری، دانشکده روان‌شناسی و علوم تربیتی، دانشگاه علامه طباطبائی، تهران، ایران.

چکیده

کلید واژه: کنش‌افتراقی سوال، مدل‌راش، منتل‌هنزل، ضد‌اجتماعی، ضعف‌روانی، داوطلبان استخدامی.

Differential Item Functioning of Psychasthenia and Psychopathic Deviate Items in Entrance Employment Tests: A Comparison between the Mantel-Haenszel and Rasch Model

Mahdi Rahmani Malek Abad, PhD student

Assessment and Measurement, Faculty of Psychology and Educational Sciences, Allameh Tabataba’i University, Tehran, Iran

Mohammad Reza Falsafinejad, Ph.D

Associate Professor, Faculty of Psychology and Educational Sciences, Allameh Tabataba’i University, Tehran, Iran

Asghar Minaei, Ph.D

Associate Professor, Faculty of Psychology and Educational Sciences, Allameh Tabataba’i University, Tehran, Iran

Noor Ali Farrokhi, Ph.D

Associate Professor, Faculty of Psychology and Educational Sciences, Allameh Tabataba’i University, Tehran, Iran

Abstract

Keyword: differential item functioning, Rasch model, Mantel-Haenszel, psychopathic deviate, psychasthenia, recruitment candidates.

مقدمه

استخدام جزء یکی از مهمترین و پیچیده‌ترین فرایندهای هر سازمان است که در آن سازمان به‌دنبال به‌کارگیری افرادی توانمند است که هم از نظر علمی و مهارتی مناسب و هم از نظر روانی سالم باشند، چرا که اگر افراد از نظر روانی سالم نباشند در آینده می‌توانند با ایجاد تنش بین‌فردی یا قانون‌گریزی و سهل‌انگاری موجب کاهش بازدهی و کم‌اثر شدن فرایند کار، ایجاد خلل سازمانی و آسیب رساندن به همکاران از نظر روانی و حتی جسمی شوند، به‌ویژه اگر سازمان هدف مسئول آموزش و تعلیم نسل آینده کشور باشد. بدین جهت شناسائی و بکارگیری افراد سالم از نظر روان‌شناختی بسیار قابل اهمیت است (Baker, Baum & Francis, 2023). یکی از ابعادی که توسط آزمون‌های بدو ورود به سازمان ها مورد سنجش قرار می‌گیرد، بررسی سطح ضد‌اجتماعی و ضعف‌روانی‌ افراد است. ویژگی افراد پرخاشگر در محیط کار عدم رعایت حقوق دیگران و احترام نگذاشتن به قوانین کار است. رفتار افراد دارای اختلال ضد‌اجتماعی و ضد‌اجتماعی خارج از استانداردهای اجتماعی، رفتاری و اخلاقی سازمان‌ها است، و این اختلالات باعث کاهش بازده‌ای سازمان‌ می‌شود (Cao, Li, Van Der Wal & Taris, 2022). روان‌شناسان بالینی در اختلال شخصیت ضد‌اجتماعی (Psychasthenia) دو صفت را مشخص کرده اند. اولین صفت بی‌تفاوتی، بی‌احساسی و خودخواهی است. به این صورت که فرد از کارهای خود احساس پشیمانی نمی‌کند و نمی‌تواند با دیگران همدلی داشته باشد. دومین ویژگی سبک زندگی خاصی است که به علت فکر نکردن قبل از عمل است و باعث می‌شود رفتارهای ضد‌اجتماعی به وجود آید (Antikchi, Bigdeli & Sabahi, 2017).

بعد دیگری که در محیط کار می‌تواند به فرد یا سازمان آسیب برساند داشتن شخصیت ضعف‌روانی (Psychopathic Deviate) است. ضعف‌روانی، معمولا احساس مبهم و نامطبوع ترس و تشويش تعريف می‌شود. اجزاي جسمي و هيجاني ضعف‌روانی شبيه اجزاي ترس است، اما شديدتر از آن است. اين اشخاص نه‌تنها مشكلاتي در تصميم‌گيري دارند، بلكه پس از آن نيز به‌خاطر احتمال اشتباهات و وقايع پيش‌بيني نشده‌اي كه ممكن است منجر به مصيبت گردد بسيار نگران مي‌شوند. این اختلال از یک سو می‌تواند در قالب شکایت از خستگی فزاینده پس از فعالیت ذهنی بروز کند که همراه با کاهش نسبی در عملکرد شغلی و حتی انجام فعالیت‌های روزانه خواهد بود و از سوی دیگر می‌تواند فرد را دچار احساس ضعف جسمی یا بدنی و فرسودگی ناشی از کمترین فعالیت کند که با دردها و ناراحتی عضلانی و ناتوانی در شل کردن آنها همراه است (Queirolo, Bacci, Roccon, Zanette & Mucignat, 2023) و این امر در بین معلمین بیشتر اهمیت دارد زیرا معلمین هر روز با چالش‌های جدیدی در بین دانش‌آموزان مواجهه هستند.

این دو مولفه ضد‌اجتماعی وضعف‌روانی در آزمون‌های بدو استخدام توسط مقیاس انحراف روانی-اجتماعی (Psychopathic Deviate) و ضعف‌روانی- اجتماعی (Psychasthenia) پرسشنامه MMPI-2 مورد سنجش قرار می‌گیرد. اما مسئله مهم دیگری که در سنجش این مقیاس‌ها موثر است، تفاوت‌های جنسیتی است. برخی پژوهش‌ها نشان داد که نتایج پرسشنامه MMPI-2 احتمالا دارای سوگیری است، در حالی که دیگران احساس کردند که خود پرسشنامهMMPI-2 حاوی سؤالات جنسیتی و نژادپرستانه است که می‌تواند منجر به عدم‌انصاف در نمره‌گذاری و اعلام ناصحیح نتایج شود (Talerico, McCallum, Whitman, Tarescavage, Corey & Ben-Porath, 2023). پژوهش‌های دیگر در مورد تفاوت ضد‌اجتماعی زن و مرد در حالت و صفت انجام شده است، بررسي‌ها در مورد ابراز خشم مردان و زنان حاكي از آن است كه در مردان حملة فيزيكي و كلامي بيشتر از زن‌هاست و ابراز خشم در زنان بيشتر به صورت گريه كردن ظاهر مي‌شود ولی در هر دو حالت ضد‌اجتماعی و خشم مشاهده می‌شود (Björkqvist, 2018). نتايج كلي بررسي ها نشان مي‌دهد كه مردان و زناني كه چند ويژگي مردانه دارند، تمايل بيشتري به برون ريزي خشم دارند و مردان و زناني كه ويژگي‌هاي زنانگي در آن‌ها بارزتر است، تمايل به درون ريزي خشم دارند و این وجود ضد‌اجتماعی و ضعف‌روانی یکسان با حالت‌های بروز متفاوت می‌تواند سبب پاسخگوئی به سوالات به صورت متفاوت گردد که در پی آن نتایج به دور از واقعیت خواهد بود و موجب سوءگیری آزمون می‌شود. از طرفی مرحله گزینش و استخدام اغلب همراه با سوءگیری و عدم انصاف در گزینش به ویژه تورش در جنسیت بوده است(Zahid, nasrollahi & Mahinizadeh, 2020)، هرچند که چندین قانون جهت از بین بردن این تبعیض‌ها در نظر گرفته شده است اما همانطور که بیان شد محققان هنوز به خوبی به تاثیر تفاوت‌های جنسیتی در نحوه پاسخگوئی افراد به سوالات آزمون‌های روانشناختی نپرداخته‌اند (Baker et al, 2023).

یکی از راه‌ها برای پی‌بردن به اینکه آزمونی غیر‌منصفانه است کشف پرسش‌های دارای کنش‌افتراقی (Differential Item Functioning) است. Dorans & Holland (1993) کنش‌‌افتراقی را چنین تعریف کردند: "منظور از DIF، تفاوت‌های موجود در عملکرد هر پرسش از گروه‌ها با توجه به توانایی یا ویژگی است که پرسش‌ها از افراد گروه بطور مفهومی می‌خواهد به‌دست آورد. DIF یک تفاوت ناخواسته بین گروه‌های امتحان دهنده است که قرار است براساس تفاوت در توانایی‌هاشان در هر پرسش و هر امتحان قیاس شوند" (Wiberg, 2007). Camilli & Congdon (1999) DIF را در قالب یک مفهوم بی‌طرفی آزمون (Test fairness) توضیح داده است. روش‌های آماری آشکارسازی DIF را می‌توان دو دسته کلی تقسیم نمود. دسته اول بر‌اساس نظریه کلاسیک آزمون (Classic Test Theory) است. نمرات مشاهده شده در این روش به عنوان متغیر همتا برای پیش‌بینی نمرات واقعی در نظر گرفته خواهد شد (Lord & Novick, 1968). از جمله روش‌هایی که در این دسته قرار می‌گیرند عبارت از روش منتل‌هنزل (Mantel- Haenszel)، روش منتل‌هنزل تعمیم داده‌شده (Generalized Mantel- Haenszel) (Penfield & Algina, 2003 ; Su & Wang, 2005)، روش اختلاف میانگین استاندارد شده (Standadized Mean Difference) و روش رگرسیون لوجستیک است (Swaminathan & Rogers, 1990; Zumbo, 2003). دسته دوم شامل روش‌های مبتنی بر نظریه سوال- پاسخ (Item Response Theory) است، زیرا نمره متغیر مکنون به عنوان متغیر همتا برای برآورد نمرات متغیر مکنون مورد استفاده قرار می‌گیرد. روش‌های این دسته شامل روش‌های مجذور کای-دو لرد (Lord's chi-square)، راجو و روش‌های آزمون نسبت درست نمایی (likelihood ratio test) است (Embretson & Reis, 2000; Karami, Gramipour & Minaei, 2021).

روش‌های بررسی DIF مبتنی بر نمرات مشاهده شده و متغیرهای مکنون می‌توانند در چهارچوب مدل‌های مختلط خطی و غیر‌خطی تعمیم داده‌شده ترکیب شود و مدل‌های سلسله‌مراتبی IRT و رگرسیون لوجستیک (logistic regression) را به وجود بیاورد. در این مدل‌ها اندازه اثر DIF و جایگزینی داده‌های گمشده امکان‌پذیر است (Skrondal, Rabe-Hesketh and Boca Raton, 2004). Gori and Marin (2015) در پژوهشی به بررسی کنش افتراقی سوالات اسکیزوفرنی، ضعف‌روانی و ضد‌اجتماعی پرسشنامه MMPI-2 در بین دانشجویان تازه وارد دانشگاه با مدل راش (Rasch Model) پرداخت و نشان داد برخی تفاوت ها در نحوه برازش و تشخیص سوالات وجود داشت. همچنین(2008) Card, Stucky, Sawalani & Little در یک بررسی فرا تحلیلی از 148 مطالعه در مورد تفاوت‌های جنسیتی در ضد‌اجتماعی مستقیم و غیرمستقیم نشان‌داد که یک تفاوت جنسیتی به جهت مردان در مورد ضد‌اجتماعی مستقیم است، اما فقط یک تفاوت جنسی ناچیز به جهت زنان در مورد ضد‌اجتماعی غیرمستقیم وجود دارد. به همین‌دلیل با توجه به اهمیت رعایت انصاف در گزینش نیروی انسانی سالم و مناسب در آزمون‌های بدو ورود و انتخاب بدون سوء‌گیری افراد، سوال اول به تعیین ضرایب مطلوبیت سوالات پرداخته است؟ سوال دوم این پژوهش این است که آیا سوالات مقیاس ضد‌اجتماعی و ضعف‌روانی پرسشنامه MMPI-2 با مدل راش برازش دارد؟ سوال سوم اینکه کدام سوالات مقیاس ضد‌اجتماعی و ضعف‌روانی با مدل‌راش و کدام با روش منتل‌هنزل دارای کنش‌افتراقی است؟ و سوال چهارم اینکه آیا تفاوتی در تشخیص سوالات دارای سوءگیری بین دو روش منتل‌هنزل و مدل راش وجود دارد یا خیر؟

روش پژوهش

طرح این پژوهش توصیفی و از نوع پیمایشی است. جامعه آماری کلیه داوطلبان استخدامی شهر اصفهان بودند که در آزمون‌های بدو ورود به مراکز طب‌کار شهر اصفهان در زمستان 1401 و بهار 1402 مراجعه نمودند. نمونه مورد مطالعه به روش خوشه ای غیر تصادفی از مراکز طب کار پژوهش انتخاب شد. مراکز طب‌کار بنا به جدیدترین تعریف از کالج سلطنتی پزشکان و جراحان کانادا (2012) به مراکزی گفته می‌شود که با ادغام جنبه های بالینی و اجرایی و با در نظر داشتن محیط شغلی افراد و گروه‌ها به نیازهای مربوط به سلامت ایشان می‌پردازد و شامل فعالیت‌هایی از جمله شناسایی، ارزیابی، درمان، کنترل و پیگیری درمان و پیشـگیری از بیماری‌ها جسمی و روانشناختی و صـدمات مـرتبط با کار است. تعداد کل داوطلبان استخدامی در سال 1401 و بهار 1402 شهر اصفهان بیش از 10 هزار نفر بوده است که با تحصیلات دیپلم به بالا متقاضی شغل معلمی (یا دانشجو معلمی) بودند. حجم نمونه در این پژوهش با توجه به شیوه تجزیه و تحلیل داده‌ها و استفاده از مدل‌های برازش راش و پس از حذف تعداد افرادی که ناقص به سوالات پاسخ داده‌اند (طبق دستور العمل آزمون افرادی که به تعداد 35 سوال و بیشتر پاسخ نداده‌اند، پاسخ نامه آن‌ها قابل استفاده نیست) برابر با 5997 نفر در نظر گرفته شد که پس از تحلیل‌های اولیه نشان داد که در داده‌ها، داده پرت تک‌متغیری (univariate outlier) وجود نداشت، اما بر اساس آماره ماهالانوبیس (Mahalanobis) تعداد 733 داده پرت چند‌متغیری (multivariate outlier) وجود داشت که تمام این 733 نفر از فایل داده‌ها حذف و تحلیل بر روی حجم 5264 نفر انجام گرفت.

ابزار سنجش

ابزارهای استفاده شده در این پژوهش عبارت از پرسشنامه چند‌وجهی شخصیتی مینه‌سوتا-2 (Minnesota Multiphasic Personality Inventory-2) بود. این پرسشنامه توسط هاتاوی و مک کینلی در 1943 ساخته شده و در سال 1970 و در نهایت سال 2008 مورد آخرین بازنگری قرار گرفت و باز انتشار شد. این نسخه از مقیاس با 370 ماده دارای 3 شاخص روائی (L، F و K) و 10 شاخص بالینی است. در این پژوهش به مولفه منحرف ضد‌اجتماعی (Psychopathic Deviate) با 50 سوال (برای مثال سوال 35 با عبارت: در گذشته گاهی چیزهائی را دزدیده‌ام) و ضعف‌روانی (Psychasthenia) با 48 سوال (برای مثال سوال 31 با عبارت: برایم مشکل است که حواسم را روی یک کار متمرکز کنم) پرداخته شد. بزای مثال یک سوال از مقیاس ضد اجتماعی پاسخ های به این ماده‌ها به صورت دو گزینه ای بلی/ درست (1) و خیر/ غلط (0) است. روائی این مقیاس در مطالعات فراوانی بررسی و مورد تائید قرار گرفته است و نشان داده شده است که مقیاس انحراف روانی و اجتماعی با افرادی که دارای نشانگان بالینی ضد اجتماعی دارند همخوان است و دارای روائی قابل قبولی است (Marnat & Wright, 2016). ضریب اعتبار مقیاس‌ ضد‌اجتماعی و ضعف‌روانی پرسشنامه اصلی با روش آلفای کرونباخ برابر با 80/0 و 90/0 و اعتبار مقیاس‌ ضد‌اجتماعی و ضعف‌روانی از راه باز آزمایی برابر 88/0 و 93/0 بود (Valianpour, Morteza Modarres Gharavi & Behrouz Mahram, 2020). اعتبار مقیاس ضد‌اجتماعی و ضعف‌روانی در این تحقیق با روش آلفای کرونباخ به ترتیب برابر با 76/0 و 81/0 بدست آمد.

روش اجراء و تحلیل داده‌ها

هدف این پژوهش بررسی و مقایسه کنش‌افتراقی سوالات مولفه ضد‌اجتماعی و ضعف‌روانی پرسشنامه چند‌وجهی شخصیتی مینه‌سوتا-2 با استفاده از نظریه روش منتل‌هنزل و مدل راش برای داوطلبان استخدامی بود. بدین منظور ابتدا فهرست مراکز طب کار شهر اصفهان استخراج و از بین 17 مرکز 9 مرکز اعلام آمادگی برای همکاری کردند که از این بین 3 مرکز به تصادف و با توجه به حجم داوطلبان استخدامی انتخاب و پس از صحبت با مسئول مرکز مقرر شد ضمن حفظ محرمانه بودن اسامی داوطلبان شرکت داده‌شده در طرح پژوهش و محرمانه ماندن نتایج به دست آمده از آزمون‌های هر فرد از مراجعه کنندگان برای معاینات استخدامی، آزمون MMPI-2 در محل مرکز گرفته شود و نتایج آزمون‌ها به صورت هفتگی در اختیار دستیار پژوهشگر قرار گیرد. دستیار پژوهشگر نیز پاسخ‌های افراد را وارد نرم افزار کرد و پس از تجمیع در اختیار پژوهشگر قرار داده شد.

برای محاسبه آماره های توصیفی میانگین و انحراف استاندارد و ضریب آلفای‌کرونباخ و اعتبار مقیاس از طریق نظریه کلاسیک از نرم افزار SPSS نسخه 27 استفاده شد و برای بررسی برازش سوال از آماره outfit MnSq و infit MnSq و با استفاده نرم افزار Winsteps نسخه 3.64 بهره گرفته شد، همچنین ضریب مطلوبیت سوالات نیز با شاخص Measure بیان شد. در بررسی تناسب شاخص‌ها ابتدا به شاخص MNSQ مراجعه می‌شود و در صورت عدم تائید به شاخص ZSTD باید رجوع کرد. مقادیر MNSQ از 0 تا مثبت بی‌نهایت قرار دارد و مقدار مطلوب برابر 1 است. هر چه این مقدار به 0 نزدیک شود نشان از بيش برازش الگوهای پاسخ با مدل است كه به معنای وجود وابستگی در ميان پاسخ‌ها یا سوالات است و مقادیر بالاتر از 1 بیانگر انحراف از تك بعدی بودن است. در کل مقادیر بیشتر از 2 غیر مفید و حاکی از اعتبار و برازش پائین است. مقادیر بین 1.5 تا 2 با اینکه بالاست اما گمراه کننده نیست و قابل اغماض است. مقادیر بین 0.5 تا 1.5 برای برازش مقیاس اندازه‌گیری مناسب و میزان اعتبار مقیاس را افزایش می‌دهد و در نهایت مقادیر کمتر از 0.5 برای برازش مقیاس اندازه‌گیری بهره پائینی دارد و میزان اعتبار را به صورت غیر واقعی بالا می‌برد. مقادیر ZSTD نیز بهتر است بین 2- تا 2+ گزارش شود، البته با توجه به اینکه این آماره به حجم نمونه بسيار حساس است (Lincare, 2012)، و حجم نمونه این پژوهش بالاست، در این پژوهش جهت بررسی برازش سوال با مدل از آماره MnSq كه به دو شكل outfit و infit آمده است، استفاده شد.

یافتهها

با توجه به اینکه هدف این پژوهش بررسی کنش‌افتراقی سوالات مولفه ضد‌اجتماعی و ضعف‌روانی پرسشنامه MMPI-2 در بین داطلبین استخدامی با مدل راش در کنار روش کلاسیک اندازه‌گیری (منتل‌هنزل) بود، ابتدا به تبیین تناسب مدل و داده‌ها و مفروضات نظریه راش پرداخته شد و سپس شاخص‌های کمی سنجش سوالات گزارش شد. شاخص‌های کمّی در جدول 1 آمده است.

جدول.1 پیش‌فرض‌های مدل‌راش و بررسی تناسب مدل با داده‌ها

مقیاس ضد‌اجتماعی

مقیاس ضعف‌روانی

شماره سوال

Measure

Infit MNSQ

Infit ZSTD

Outfit MNSQ

Outfit ZSTD

شماره سوال

Measure

Infit MNSQ

Infit ZSTD

Outfit MNSQ

Outfit ZSTD

0٫26

1٫06

1٫3

1٫35

4٫9

3٫59-

1٫34

9٫9

1٫51

9٫9

214

0٫40

1٫05

1٫0

1٫29

3٫8

293

3٫46-

1٫24

9٫7

1٫46

9٫9

158

1٫54-

1٫16

9٫9

1٫26

9٫9

309

2٫58-

1٫17

9٫9

1٫42

9٫9

171

0٫94-

1٫13

6٫0

1٫24

7٫1

242

1٫69-

1٫27

9٫9

1٫39

9٫9

143

1٫75-

1٫10

7٫7

1٫15

7٫8

321

0٫96-

1٫27

9٫9

1٫36

9٫6

113

1٫60-

1٫09

6٫5

1٫15

6٫8

174

1٫92

1٫08

1٫0

1٫33

2٫3

157

1٫82-

1٫09

7٫0

1٫13

6٫9

0٫71-

1٫14

6٫2

1٫19

4٫5

0٫81-

1٫07

3٫0

1٫12

3٫1

170

0٫22

1٫09

2٫8

1٫13

1٫9

261

0٫93-

1٫07

3٫2

1٫11

3٫2

0٫40-

1٫10

4٫1

0٫99

-0٫2

263

2٫65-

1٫06

6٫1

1٫10

6٫8

165

0٫78

1٫08

1٫9

1٫07

0٫8

264

1٫64

0٫99

0٫0

1٫09

0٫7

285

0٫90-

1٫07

3٫6

1٫01

0٫3

1٫94-

1٫06

5٫7

1٫09

5٫1

140

0٫35

1٫06

1٫8

1٫07

0٫9

0٫24

1٫03

0٫8

1٫08

1٫2

313

0٫06

1٫05

1٫8

1٫04

0٫7

167

0٫28

1٫00

0٫0

1٫07

1٫0

109

0٫90

1٫01

0٫3

0٫94

0٫6-

266

0٫57-

1٫05

1٫8

1٫05

1٫2

317

0٫89

1٫01

0٫2

0٫82

2٫1-

209

1٫13-

1٫04

2٫1

1٫04

1٫4

304

0٫87-

1٫01

0٫4

0٫89

3٫1-

0٫64-

1٫02

0٫7

1٫02

0٫5

0٫37

1٫00

0٫0

0٫85

2٫1-

160

1٫23

1٫00

0٫0

0٫93

0٫6

308

1٫18

1٫00

0٫0

0٫99

0٫0

105

0٫27

1٫00

0٫0

0٫82

2٫9-

331

0٫63-

1٫00

0٫1-

0٫91

2٫1-

225

0٫02-

1٫00

0٫1-

0٫98

0٫3-

320

0٫32

0٫99

0٫3-

0٫87

2٫0-

2٫31

0٫98

0٫1-

0٫99

0٫0

326

1٫47-

0٫98

1٫1-

0٫92

3٫3-

267

1٫75-

0٫99

0٫8-

0٫98

0٫9-

1٫33

0٫98

0٫3-

0٫89

1٫0-

217

1٫44-

0٫99

0٫8-

0٫99

0٫5-

275

0٫18

0٫98

-0٫6

0٫82

2٫9-

125

0٫77

0٫99

0٫2-

0٫91

1٫0-

147

0٫59

0٫98

-0٫5

0٫82

2٫3-

219

0٫27

0٫98

0٫3-

0٫86

2٫1-

1٫28-

0٫96

2٫6-

0٫89

3٫9-

0٫95

0٫98

0٫2-

0٫96

0٫4-

0٫35

0٫95

1٫4-

0٫76

3٫7-

1٫08

0٫98

0٫2-

0٫86

1٫4-

310

0٫89

0٫95

1٫2-

0٫78

2٫6-

226

1٫04-

0٫98

0٫9-

0٫91

3٫1-

0٫46-

0٫94

2٫6-

0٫79

5٫0-

0٫05-

0٫96

1٫0-

0٫81

3٫6-

0٫95-

0٫94

3٫5-

0٫83

5٫1-

243

0٫38

0٫96

0٫8-

0٫81

2٫9-

218

1٫56-

0٫93

4٫8-

0٫85

6٫3-

122

1٫84-

0٫96

3٫6-

0٫94

3٫7-

0٫89

0٫93

1٫6-

0٫83

2٫0-

0٫83

0٫96

0٫7-

0٫79

2٫5-

130

0٫88

0٫90

2٫2-

0٫62

4٫8-

202

1٫67

0٫96

0٫4-

0٫69

2٫7-

175

1٫03

0٫90

2٫1-

0٫74

2٫9-

195

1٫37

0٫95

0٫6-

0٫89

1٫0-

329

1٫66

0٫90

1٫6-

0٫62

3٫5-

185

0٫07-

0٫95

1٫4-

0٫81

3٫6-

327

1٫45

0٫90

1٫8-

0٫45

6٫0-

288

1٫79

0٫95

0٫5-

0٫54

4٫0-

0٫20

0٫90

3٫3-

0٫65

6٫1-

1٫26

0٫94

0٫7-

0٫76

2٫4-

0٫65

0٫89

2٫8-

0٫65

4٫8-

0٫73-

0٫94

2٫4-

0٫84

4٫5-

0٫29

0٫89

3٫3-

0٫63

6٫1-

0٫62-

0٫94

2٫3-

0٫81

5٫0-

316

0٫99

0٫88

2٫7-

0٫51

6٫3-

0٫98-

0٫94

3٫0-

0٫84

5٫2-

302

0٫48

0٫87

3٫8-

0٫54

7٫4-

129

1٫28-

0٫94

3٫8-

0٫89

4٫2-

328

0٫06

0٫86

5٫0-

0٫58

8٫1-

0٫30-

0٫93

2٫2-

0٫81

4٫3-

325

0٫99

0٫86

3٫3-

0٫47

7٫0-

1٫11

0٫92

1٫1-

0٫60

4٫5-

273

0٫85

0٫86

3٫5-

0٫47

7٫4-

0٫84

0٫92

1٫3-

0٫73

3٫3-

289

1٫01

0٫85

3٫3-

0٫43

7٫6-

259

0٫81-

0٫92

3٫6-

0٫80

6٫1-

301

0٫19-

0٫85

6٫0-

0٫63

8٫0-

0٫54

0٫92

1٫6-

0٫66

-5٫0

277

0٫09-

0٫83

6٫6-

0٫59

8٫6-

2٫55

0٫92

0٫5-

0٫41

4٫3-

0٫58

0٫82

5٫1-

0٫46

8٫5-

0٫82

0٫91

1٫5-

0٫66

4٫3-

196

0٫44

0٫79

6٫5-

0٫45

9٫4-

1٫93

0٫91

0٫8-

0٫63

2٫9-

2٫46

0٫90

0٫7-

0٫48

3٫8-

در جدول شماره 1 ستون اول از سمت راست به شماره سوالات مولفه ضد‌اجتماعی و ضعف‌روانی در پرسشنامه MMPI-2 تعلق دارد و اینکه ترتیب هر سوال در پرسشنامه برای شرکت‌کنندگان به چه صورت بوده است. در ستون دوم (Measure) به میزان و درجه سختی هر پرسش در واحد لوجیت (Logit) اشاره دارد که در پرسشنامه‌های شخصیتی به عنوان ضریب دشواری یا مطلوبیت معرفی ‌گردید (Lincare, 2010). سخت ترین سوالات مقیاس ضد‌اجتماعی متعلق به سوال 21، 52 و 54 بود و سخت‌ترین سوالات مقیاس ضعف‌روانی که کمترین میزان پاسخ‌دهی مثبت را داشتند سوالات 174 و 329 بوده است و در این مقیاس بالاترین میزان مقبولیت متعلق به سوالات 33، 293 و 309 بود. مابقی سوالات در سطح متوسطی از درجه سختی و یا مطلوبیت قرار داشتند. ستون سوم و چهارم مربوط به شاخص‌های تناسب Infit و ستون پنجم و ششم متعلق به شاخص‌های تناسب Outfit است. در پاسخ به سوال دوم می‌توان بیان داشت که با توجه به نتایج جدول، شاخص‌های برازش تمامی سوالات در دامنه مطلوبی قرار دارد و سوالات برازش خوبی با مدل راش دارد. پس از تائید برازش داده‌ها با مدل، در ادامه برای تشخیص و مقایسه سوالات مقیاس ضد‌اجتماعی و ضعف‌روانی دارای کنش‌افتراقی بر حسب جنسیت از دو شیوه کلاسیک (منتل‌هنزل) و نظریه سوال- پاسخ (مدل‌راش) استفاده شد و نتایج آن در جدول 2 آورده شد.

جدول.2 مقایسه توانش مدل‌راش و منتل‌هنزل در تشخیص کنش‌افتراقی پرسش‌ها بر حسب جنسیت

مقیاس

شماره سوال

منتل‌هنزل

مدل راش

جهت تورش

Size

Prob.

نتیجه

DIF

Contrast

DIF

Size

Welch Prob.

نتیجه

سوالات ضد‌اجتماعی

0٫60

0٫0000

0٫55

0٫37

0٫0000

0٫22

0٫0045

0٫64

0٫45

0٫0004

0٫82-

0٫0000

0٫72-

0٫41-

0٫0000

0٫75-

0٫0035

0٫19-

0٫12-

0٫4221

0٫48-

0٫0000

0٫57-

0٫32-

0٫0000

0٫40

0٫0000

0٫51

0٫32

0٫0000

105

1٫08

0٫0000

1٫26

0٫92

0٫0000

113

0٫30-

0٫0000

0٫46-

0٫26-

0٫0000

122

0٫45-

0٫0000

0٫34-

0٫19-

0٫0000

143

0٫44-

0٫0000

0٫60-

0٫33-

0٫0000

157

0٫51-

0٫0000

0٫64-

0٫36-

0٫0000

167

0٫76-

0٫0000

0٫72-

0٫40-

0٫0000

171

0٫38-

0٫0000

0٫61-

0٫34-

0٫0000

202

0٫10

0٫0103

0٫88

0٫64

0٫0006

214

0٫43-

0٫0002

0٫64-

0٫37-

0٫0000

225

0٫86

0٫0000

0٫93

0٫64

0٫0000

243

0٫58-

0٫0000

0٫43-

0٫25-

0٫0003

261

0٫47-

0٫0000

0٫57-

0٫33-

0٫0000

263

0٫68-

0٫0000

0٫79-

0٫43-

0٫0000

264

0٫23

0٫0086

0٫63

0٫43

0٫0097

267

0٫49-

0٫0000

0٫43-

0٫23-

0٫0000

سوالات ضعف‌روانی

0٫68-

0٫0000

0٫55-

0٫33-

0٫0000

175

0٫66-

0٫0000

0٫49-

0٫31-

0٫0001

196

0٫57-

0٫0000

0٫19-

0٫12-

0٫0657

242

0٫47-

0٫0000

0٫69-

0٫41-

0٫0000

289

0٫98-

0٫0000

0٫52-

0٫33-

0٫0000

293

0٫53-

0٫0000

1٫11-

0٫61-

0٫0000

304

0٫57-

0٫0000

0٫47-

0٫29-

0٫0000

309

0٫36-

0٫0000

0٫47-

0٫27-

0٫0000

316

0٫43

0٫0004

0٫62

0٫45

0٫0000

327

0٫83

0٫0000

1٫18

0٫92

0٫0000

328

0٫76-

0٫0000

0٫47-

0٫29-

0٫0000

329

0٫10

0٫1426

0٫47

0٫34

0٫0104

M= مردان، F= زنان

شکل.1 نمودار کنش‌افتراقی سوالات ضد‌اجتماعی بر حسب ویژگی جنسیت (0= زن و 1= مرد)

شکل.2 نمودار کنش‌افتراقی سوالات ضعف‌روانی بر حسب ویژگی جنسیت (0= زن و 1= مرد)

در ستون اول این جدول شماره سوالات مقیاس ضد‌اجتماعی و ضعف‌روانی پرسشنامه MMPI-2 آورده شد. سپس نتایج به دست آمده از رویکرد منتل‌هنزل ارائه شد. در این روش مقادیر کنش‌افتراقی با Size و سطح معناداری آن با Prob. آورده شد. پس‌از آن نتایج به دست آمده از کنش‌افتراقی مدل راش گزارش شد که با شاخص‌های DIF Contrast و DIF Size مشخص شد و معناداری کنش‌افتراقی با Prob. نشان داده شد. برای بررسی وجود کنش‌افتراقی باید سطح Prob. کمتر از 05/0 گزارش شود. اگر مقادیر Size کمتر از 43/0 باشد نشان از عدم کنش‌افتراقی (A) است، اگر این شاخص بین 43/0 تا 64/0 باشد دارای کنش‌افتراقی متوسط (B) است و اگر بالاتر از 64/0 باشد داری کنش‌افتراقی بزرگ (C) است. کنش‌افتراقی بزرگ گواهی بر ناعادلانه بودن سوال است، این بدین معناست که اگر پاسخ به سؤال‌های آزمون با کنترل توانایی آزمودنی‌ها تابعی از ویژگی‌های گروهی که آزمودنی‌ها به آن تعلق دارند، مانند جنسیت و سن باشد، آن سؤال‌ها نسبت به آن‌ افراد دارای کنش افتراقی و سوءگیری است.

همچنین با توجه به نتایج ارائه شده در جدول 2 در پاسخ به سوال سوم می‌توان بیان داشت که از بین 50 سوال مقیاس ضد‌اجتماعی تکمیل شده توسط داوطلبان استخدامی، تعداد 19 سوال دارای کنش‌افتراقی است و مابقی سوالات (31 مورد) کنش‌افتراقی بین زنان و مردان نداشته است، از بین سوالات دارای کنش‌افتراقی تعداد 13 سوال دارای کنش‌افتراقی متوسط و 6 سوال کنش‌افتراقی بزرگی را بر حسب ویژگی جنسیت گزارش دادند. از بین 48 سوال مقیاس ضعف‌روانی بر اساس مدل راش تعداد 11 سوال دارای کنش افتراقی تشخیص داده شد که 8 سوال دارای کنش افتراقی در سطح متوسط و 3 سوال دارای کنش افتراقی بزرگ بود. در نهایت در پاسخ به سوال چهارم در ارتباط با مقایسه بین دو رویکرد کلاسیک (منتل‌هنزل) و مدل راش در بررسی کنش‌افتراقی نیز می‌توان بیان داشت که بیشتر سوالاتی که در مدل راش دارای کنش‌افتراقی تشخیص داده شدند نیز در روش منتل‌هنزل نیز دارای کنش‌افتراقی تشخیص داده شدند به جز 5 مورد (سوالات 35، 113، 171، 202 و 264) از مقیاس ضد‌اجتماعی و 2 مورد (سوالات 309 و 329) از مقیاس ضعف‌روانی که در مدل راش دارای کنش‌افتراقی بود اما در روش منتل‌هنزل شناسائی نشد، که این نشان دهنده دقت بیشتر مدل راش نسبت به مدل منتل‌هنزل است که توانائی تشخیص بیشتر سوالات دارای کنش‌افتراقی را داراست. با توجه به حجم سوالات و تعداد نسبتا یکسان در شناسائی سوالات دارای کنش‌افتراقی توسط دو روش می‌توان بیان داشت که دو روش منتل‌هنزل و مدل راش با وجود تقریبا عملکرد یکسان در شناسائی سوالات دارای کنش‌افتراقی، اما عملکرد مدل راش 08/0 درصد بهتر از روش منتل‌هنزل بوده است. این درصد از تقسیم سوالات اختلافی در تشخیص کنش‌افتراقی بر تعداد کل سوالات مورد بررسی بدست آمده‌است (لینکر، 2010). در شکل شماره 1 و 2 نتایج کنش‌افتراقی سوالات ضد‌اجتماعی و ضعف‌روانی بر‌حسب ویژگی جنسیت به صورت نمودار نشان داده‌شد. در ستون آخر جدول جهت تورش سوالات داری کنش‌افتراقی نشان داده شده است. اگر در سوال تورش دار، مردان بیشتر جواب مثبت داده باشند، آن سوال با M نشان داده شده است و نشان از این است که این سوال برای مردان دارای کنش‌افتراقی بیشتری است و اگر در سوال تورش دار، زنان جواب مثبت بیشتر داده بودند، آن سوال با F نشان داده شده است و نشان از این است که زنان به این سوال پاسخ مثبت بیشتری داده‌اند. با توجه به ستون آخر جدول شماره 2 نشان داده شد که در مقیاس ضد‌اجتماعی 12 سوال دارای تورش به جهت مردان و 7 سوال دارای تورش به جهت زنان بوده است و از بین سوالات دارای کنش‌افتراقی مقیاس ضعف‌روانی 8 سوال به جهت مردان و تنها 3 سوال به ضرر زنان تورش داشته است. در مجموع می‌توان بیان داشت که بیشتر سوالات این دو مقیاس به ضرر مردان دارای سوءگیری بود و مردان به طور معمول نمره بالاتری را نسبت به زنان در دو مقیاس ضد‌اجتماعی و ضعف‌روانی خواهند گرفت.

تاثیر وجود کنش‌افتراقی بر انصاف آزمون را می‌توان از منظر تفاوت‌های عملکردی شرکت‌کنندگان در پرسشنامه مشخص نمود. وجود پرسش‌هایی با ویژگی کنش‌افتراقی بدان مفهوم است که سازه‌های غیرمرتبطی به پاسخ افراد تاثیر می‌گذارد و مالک توانایی شرکت کنندگان در آن آزمون نیست. در مقیاس ضد‌اجتماعی و ضعف‌روانی پرسشنامه MMPI-2، به دلیل وجود تعداد پرسش‌ها با ویژگی کنش‌افتراقی می‌توان بیان کرد که 38 درصد سوالات مقیاس ضد‌اجتماعی و 23 درصد از مقیاس ضعف‌روانی متاثر از جنسیت شرکت کنندگان بود، که در بیشتر موارد به ضرر مردان و در برخی اوقات به نفع آنان بوده است. پر واضح است که به‌صورت کلی بخشی از سوالات پرسشنامه حاضر دارای تبعیضی برای شرکت کنندگان بوده است و انصاف در آزمون را تا حد زیادی نقض کرده است و تنها در 68 سوال از نظر تبعیض جنسیتی انصاف در تشخیص برای مولفه ضد‌اجتماعی و ضعف‌روانی رعایت شده بود. لیکن باید در نظر داشت که مفهوم انصاف آزمون مفهومی چند بعدی است و وجود یا فقدان آن متاثر از عوامل مختلفی است که از زمان طراحی آزمون باید آنان را کنترل کرد و سرانجام در زمان تفسیر نتایج، اثرگذاری آن عوامل را در نظر گرفت.

بحث و نتیجه گیری

هدف از این پژوهش تعیین و تبین قدرت هر یک از شیوه‌های سنجش و تشخیص کنش‌افتراقی سوالات مقیاس انحراف ضد‌اجتماعی و ضعف‌روانی پرسشنامه چندوجهی مینه‌سوتا-2 بود که بر اساس مدل راش و روش منتل‌هنزل بررسی و مقایسه شد. هدف دیگر ارائه شده در این پژوهش، اثرگذاری این شیوه‌ها بر صحت تحلیل‌های آماری انجام شده بر نحوه پاسخگوئی داوطلبان استخدامی با توجه به خصیصه جنسیت بود. بر اساس نتایج گزارش شده در جدول 1 می‌توان بیان داشت که تمامی سوالات مولفه ضعف‌روانی و انحراف ضد‌اجتماعی با مدل راش یک پارامتری دارای برازش خوبی است و داده‌ها با مدل برازش داشته است. بنابراین نتایج به دست آمده از کنش‌های افتراقی، مورد اعتماد و اتکاء و قابل استفاده است.

بر اساس آنچه در جدول شماره 2 در بحث تشخیص سوالات دارای کنش افتراقی، مشخص شد که از بین سوالات مقیاس ضد‌اجتماعی 38 درصد و از بین سوالات مقیاس ضعف‌روانی 9/22 درصد سوالات دارای کنش‌افتراقی بر اساس جنسیت بین زن و مرد گزارش شد و بیشتر سوالات به جهت (ضرر) مردان دارای تورش بود. این بدین معناست که مردان داوطلب استخدام به طور معمول بیشتر از زنان در سوالات مقیاس ضد‌اجتماعی و ضعف‌روانی نمره بالائی گرفته‌اند در صورتی که در واقع این صفت در مردان بیشتر از زنان نبوده است. این تورش سبب شده است تا مردان در گزارش‌های نهائی نمرات بالاتری را در مقیاس ضد‌اجتماعی و ضعف‌روانی به‌دست آورده و احتمال عدم تائید سلامت روان آنان در مقایسه با زنان در آزمون‌های سلامت روان بدون ورود به سازمان بیشتر بوده است و تا حدی انصاف در گزینش رعایت نشده است. این نتایج با یافته‌های Gori & Marin (2015), Card, Stucky, Sawalani & Little (2008) و McNulty, Forbey, Graham & et al (2015) همسو بود. البته در تبیین این نکته که چرا سوالات زیادی دارای کنش افتراقی تشخیص داده شده‌است را می‌توان چنین بیان داشت که نمونه مورد هدف این پژوهش، داوطلبان استخدامی بودند و این گروه نمونه با توجه به اینکه در حیطه غیر بالینی و جامعه نرمال قرار گرفتند، شاخص‌های خصیصه‌ای بیشتر از شاخص‌های بالینی نمایان می‌گردد و این یکی از دلایلی است که می‌توان برای بالا بودن تعداد سوالات دارای کنش افتراقی در این مقیاس بیان داشت. البته سوالاتی نیز که دارای کنش افتراقی نبودند نیز می‌توان به‌عنوان سوالات منصفانه و سوالاتی معرفی کرد که گروه‌های جنسیتی تاثیری در نتایج آنان ندارد و این سوالات به دور از هر گونه سوءگیری ناشی از گروه‌بندی‌های جنسیتی نتایج را گزارش می‌کنند.

در مقایسه شیوه‌های سنجش کنش‌افتراقی مطرح شد در تشخیص پرسش‌هائی با سطح کنش‌افتراقی متوسط و یا بالا (37 سوال از 57 سوال) مدل منتل‌هنزل تا‌حدی کارآمدی مناسبی از خود ارئه داد. با این‌حال نتایج نشان داد که نظریه کلاسیک اندازه‌گیری (منتل‌هنزل) نسبت به مدل راش در تشخیص کنش‌افتراقی توانمند نبود و این روش در تشخیص کنش افتراقی سوالات در سطح متوسط نسبت به سوالات بسیار ساده و بسیار سخت ضعیف تر عمل کرده است و این یافته با مفروضه‌ای مبنی بر اینکه روش منتل‌هنزل برای آزمون‌های بسیار ساده و یا بسیار سخت کارآمدتر است، اما برای آزمون‎‌ها و سوالات با میزان سختی متوسط از کارآمدی آن کاسته می‌شود Karami & Khodi (2021)، همسو بوده است. همچنین در بحث اینکه سوالات در تشخیص کنش‌افتراقی غیر‌یکنواخت (Non-uniform) چگونه عمل می‌کنند نیز نیازمند بحث و بررسی بیشتر است.

یافته‌های این پژوهش برای روان‌سنج و متخصصان طراحی آزمون و تحلیل‌گران نتایج آزمون، رویکردهای جدید سنجش کنش‌افتراقی را توصیه می نماید، چرا که مدل‌های راش برتری نسبی خوبی نسبت به نظریه کلاسیک اندازه‌گیری دارد (Wilson, 2005). به نظر Lee, Zhang, Yin (2010) دقت همبستگی هاي بین خرده مقیاس‌ها و اعتبار آزمون با استفاده از مدل راش بهبود می‌یابد زیرا این مدل خطاي اندازه‌گیري را در برآورد به حساب می‌آورد. مدل راش با فراهم آوردن یك روش مناسب برای تبدیل غيرخطی داده‌های خام رتبه‌ای به اندازه‌های فاصله‌ای بر یكی از نگرانی‌ها و دغدغه‌های رایج در ساخت ابزارهای اندازه گيری های روانی و تربيتی، یعنی دستيابی به عينيت خاص یا تغيير ناپذیری مقایسه‌ها غلبه می‌كند (Minaei, 2015; Tennant & Conaghan, 2007). البته در تعمیم‌پذیری نتایج به دست آمده از مدل راش باید دقت لازم را در نظر داشت چرا که مقیاس ضد‌اجتماعی و ضعف‌روانی پرسشنامه چند‌وجهی شخصیتی مینه‌سوتا-2 به کار رفته در این پژوهش دارای سازه تک بعدی (unidimensional) است و مفروضات لازم نظریه سوال- پاسخ را رعایت کرده است. اما اگر سازه‌ای مفروضه عدم ‌وابستگی مکانی (local Independence) در آن رعایت نشده باشد، ممکن است در سنجش با شیوه‌های ذکر شده نتایج متفاوتی را بدست آورد. همچنین باید در نظر گرفت اگر در مدل‌های نظریه سوال- پاسخ فراتر از مدل راش رفته و مدل‌های دو یا سه پارامتری را استفاده کنیم، محتمل است که نتایج تغییر یافته و حساسیت نظریه سوال- پاسخ افزایش یابد.

همچنین با توجه به نتایج حاصل از این پژوهش به روان‌سنج و روان‌شناسانی که با مراکز طب کار جهت بررسی سلامت روان داوطلبان استخدامی همکاری دارند و به ویژه مجریان آزمون MMPI-2 توصیه می‌شود که نگاهی به کنش‌های افتراقی سوالات بر اساس جنسیت کرده و در تفسیر و نمره‌گذار به این ویژگی‌های دموگرافیک داوطلبان نیز توجه بیشتری نمایند، چرا که مردان به طور طبیعی دارای نمره بالاتری در مولفه ضد‌اجتماعی و ضعف‌روانی است و این نشانه‌ای بر داشتن میزان بالائی از این صفات در مردان نمی‌باشد. در نهایت به پژوهشگران پیشنهاد می‌شود تا کنش‌افتراقی مولفه‌های دیگر پرسشنامه چندوجهی مینه‌سوتا مانند پارانوئیا، اسکیزوفرنی و هیپومانیا را در بین داوطلبان استخدامی بررسی نموده و همچنین از روش‌های دیگر بررسی کنش‌های افتراقی نیز در کنار مدل راش بهره ببرند. همچنین به پژوهشگران توصیه می‌گردد که به بررسی نقاط برش مولفه‌های ضد‌اجتماعی و ضعف‌روانی و مولفه‌های دیگر پرسشنامه MMPI-2 به تفکیک جنسیت پرداخته شود تا نهایت انصاف در آزمون صورت پذیرد.

منابع

Antikchi. E, Bigdeli. I. A. & Sabahi. P. (2017). The comparision of neuropsychological index related to executive functions in antisocial personality disorder, obsessive-compulsive personality disorder and normal people. Advances in Cognitive Science, Vol. 19, No. 1. [Persian]

Baker. C. A, Baum. L. J & Francis. J. C. (2023). Assessment of test bias on the MMPI-2-RF higher order and restructured clinical scales as a function of gender and race. Professional Psychology Research and Practice. 54 (4) Follow journal. DOI: 10.1037/pro0000517.

Bethune M. M. (2011). Predictors of Performance in a Professional Counselor Masters Program, Doctoral Thesis http://gradworks.umi.com/34/93/3493607.html.

Björkqvist, K. (2018). Gender differences in aggression. Current Opinion in Psychology. Volume 19, February, Pages 39-42.

Buribayev. Y. A and Khamzina Z. A. (2019). Gender equality in employment: The experience of Kazakhstan. International Journal of Discrimination and the Law, Vol. 19(2) 110–124.

Camilli, G. (2006). Test fairness. In R. Brennan (Ed.), Educational measurement (4th ed.) (pp. 221-256). New York: American Council on Education & Praeger series on higher education.

Camilli, G., & Congdon, P. (1999). Application of a method of estimating DIF for polytomous test items. Journal of Educational and Behavioral Statistics, 24(4), 323-341.

Camilli, G., & Shepard, L. (1994). Methods for identifying biased test items. Newbury Park, CA Sage.

Cao. W, Li. P. Vander Wal. R.C & Taris. T.W. (2022). Leadership and Workplace Aggression: A Meta-analysis. Journal of Business Ethics. Published: 15 July. volume 186, pages347–36

Card N. A, Stucky. B. D, Sawalani. G. M & Little. T. D. (2008). Direct and indirect aggression during childhood and adolescence: a meta-analytic review of gender differences, intercorrelations, and relations to maladjustment. Sep-Oct;79(5): 1185-229. doi: 10.1111/j.1467-8624.2008.01184.x.

Chapelle, C. A. (2020). Validity in language assessment. The Routledge Handbook of Second Language Acquisition and Language Testing, 11.

Chen, M. Y., Liu, Y., & Zumbo, B. D. (2020). A propensity score method for investigating differential item functioning in performance assessment. Educational and Psychological Measurement, 80(3), 476-498.

Cherry Kendra. (2021) The Minnesota Multiphasic Personality Inventory (MMPI). Updated on September 02 Medically reviewed by Amy Morin, LCSW.

Embretson, S. E., and Reise, S. P. (2000). Item Response Theory for Psychologists. Mahwah, NJ: Lawrence Erlbaum Associates. 11, 57- 74.

Gori. E & Marin. R. F. (2015). Rasch Analysis of some MMPI-2 scales in a sample of university freshmen. International Journal of Arts & Sciences. 1944-6934 :: 08(03):107–150.

Hambleton, R. K., & Rogers, H. J. (1989). Detecting potentially biased test items: Comparison of IRT area and Mantel-Haenszel methods. Applied Measurement in Education, 2(4), 313-334.

Hambleton, Ronald K.; Saminathan, H.; Rogers, H.. Jane (1991). Fundamentals of Question-Answer Theory. Translated by Mohammad Reza Filsafinejad (2010). Tehran: Allameh Tabatabai University. [Persian]

Karami, H. (2013) The quest for fairness in language testing. Educational Research and Evaluation, 19(2&3), 158-169. [Persian]

Karami, Hossein & Khodi, Ali (2021). Differential Item Functioning and Test Performance: a Comparison Between the Rasch Model, Logistic Regression and Mantel-Haenszel. Journal of Foreign Language Research, 10 (4), 842-853. [Persian]

Karami. H. R, Gramipour. M & Minaei. A. (2021). Differential Item Functioning (DIF) Detection Rate Using Rasch Trees Model: A Simulated and Real Data Study of the NAJA High Stakes Tests. Educational Measurement. 11(44), 1-30. [Persian]

Lee JC, Zhang Z, Yin H. (2010). Using multidimensional Rasch analysis to validate the Chinese version of the Motivated Strategies for Learning Questionnaire (MSLQ-CV). Eur J Psychol Educ; 25.

Linacre, J. M. (2010). A User's Guide to WINSTEPS®. Retrieved May 2, from http://www.winsteps.com/ .

Lord, F. M.y. & Novick, MR. (1968). Statistical Theory of Mental Test Scores. Addison-Wesley Publishing Company.

Marnat, G. G. & Wright, A. J. (2016). Handbook of Psychological Assessment. 6th ed.

McNulty J. L., Forbey J. D., Graham J. R., Ben-Porath Y. S., Black M. S., Anderson S. V. & Burlew A. K. (2015). MMPI-2 Validity Scale Characteristics in a Correctional Sample. Sage Journals, Volume 10, No. 3, September. 288-298.

Minaei. A. (2015). Aapplication of Rasch measurement model to evaluate measurement properties of the Test of Visual- Motor Skills-Revised. Journal of Educational Measurement. Volume 5, Issue 18 - Serial Number 18. January. 77-114. [Persian]

Penfield, R. D. & Algina, J. (2003). Applying the Liu–Agresti estimator of the cumulative common odds ratio to DIF detection in polytomous items. Journal of Educational Measurement, 40: 353–370.

Queirolo L, Bacci C, Roccon A, Zanette G and Mucignat C. (2023). Anxiety in a regular day of work: A 24 hour psychophysiological investigation in young dentists with gender comparison. Front Psychol. 14:1045974. doi: 10.3389/fpsyg.1045974

Siegert, R. J., Tennant, A., & Turner-Stokes, L. (2010). Rasch analysis of the Beck Depression Inventory-II in a neurological rehabilitation sample. Disability and Rehabilitation, 32(1), 8–17.

Skrondal, A., Rabe-Hesketh, S., and Boca Raton, F. (2004). Generalized Latent Variable Modeling: Multilevel, Longitudinal and Structural Equation Models: Chapman & Hall/ CRC Press.

Soltani Shal R, Saadatbin Javaheri F, Zebardast F. (2020). Survey the level of well-being and Psychometric characteristics of hospital nurses’ well-being at work scale. Occupational Medicine Quarterly Journal:12(1): 55-68. [Persian]

Su. Y & Wang N. (2005). Use of the Rasch IRT model in standard setting: An item‐ mapping method. Journal of Educational Measurement. Sep; 40 (3): 231- 53.

Talerico G. M, McCallum. J. J, Whitman M. R, Tarescavage. M, Corey D. M & Ben-Porath. Y. B. (2023): Comparing the Validity of MMPI-3 Scores in Prehire Psychological Screenings of Male and Female Police Officer Candidates, Journal of Personality Assessment, DOI: 10.1080/00223891.2023.2191278

Tennant, A., & Conaghan, P.G. (2007). The Rasch measurement model in rheumatology: what is it and why use it? When should it be applied, and what should one look for in a Rasch paper? Arthritis & Rheumatism journal. 57, 1358– 1362.

Valianpour. Z, Modarres Gharavi. M & Mahram. B. (2020). Validation of the Minnesota Multiphasic Personality Inventory (MMPI 2) in psychiatric patients and non-patient individuals in Mashhad city, Iran. Journal of Fundamentals of Mental Health, Nov-Dec. [Persian]

Wiberg, M. (2007). Measuring and detecting differential item functioning in criterion-referenced licensing test: A theoretic comparison of methods. Educational Measurement, technical report No. 2.

Zahid. Z, nasrollahi. Z & Mahinizadeh. M. (2020). From Gender Discrimination to Equality and Economic Growth (Study of Developing Countries). Journal of Woman in Development and Politics. 662- 643. [Persian]

Zumbo, B. D. (2003). Does item-level DIF manifest itself in scale-level analyses? Implications for translating language tests. Language testing, 20(2), 136-147.

مقالات مرتبط

تاثیر الگوهای ارتباطی خانواده بر کیفیت زندگی با میانجی‌گری استرس ادراک شده
تاریخ چاپ : 1402/09/01
مقایسه اثربخشی آموزش ازدواج موفق و آموزش نظریه انتخاب بر نوع انتخاب زوج‌های جوان
تاریخ چاپ : 1401/06/01
مدل معادلات ساختاری تأثیر سرزندگی تحصیلی بر خلاقیت با نقش واسطه‌ گری سواد‌ رایانه‌ای دانشجویان
تاریخ چاپ : 1402/09/01
ارائه مدل ساختاری تاثیر جو عاطفی خانواده بر رفتارهای پر خطر با میانجی‌گری تاب‌آوری و تنظیم هیجان در دانش‌آموزان پسر دوره دوم متوسطه
تاریخ چاپ : 1401/09/01
الگوی معادلات ساختاری کفایت اجتماعی با قلدری سایبری بر¬اساس میانجیگری دشواری در تنظیم هیجان در دانش¬آموزان پسر دوره دوم متوسطه
تاریخ چاپ : 1403/09/21
تدوین بسته روان¬درمانی سیستمی فردی و اثربخشی آن بر تعلیق من بیماران افسرده
تاریخ چاپ : 1403/07/04

اشتراک گذاری

آدرس مقاله

بررسی کنش‌افتراقی سوالات ضعف روانی و ضد‌اجتماعی در آزمون‌های استخدامی بدو ورود: مقایسه روش منتل‌هنزل و مدل راش