短測(cè)驗(yàn)項(xiàng)目功能差異檢測(cè)方法的比較研究
本文關(guān)鍵詞:短測(cè)驗(yàn)項(xiàng)目功能差異檢測(cè)方法的比較研究
更多相關(guān)文章: 短測(cè)驗(yàn) DIF SIBTEST方法 IRT-LR方法 DFIT方法
【摘要】:項(xiàng)目功能差異(Differential Item Functioning,簡(jiǎn)稱DIF)是指對(duì)于某個(gè)特定項(xiàng)目,如果在來(lái)自同一目標(biāo)特質(zhì)的兩批平行被試組中,顯現(xiàn)出不同的統(tǒng)計(jì)特性,那么該項(xiàng)目就存在功能差異。為了檢測(cè)DIF,人們提出了很多方法,并且為了考察在不同條件下各方法的適用性,針對(duì)DIF檢測(cè)方法進(jìn)行比較研究,其中主要考察了樣本容量、匹配變量、測(cè)驗(yàn)含DIF試題的比例、DIF類型(一致性DIF,非一致性DIF,混合性DIF)等因素對(duì)不同方法DIF檢測(cè)效果的影響。但是,以往關(guān)于DIF檢測(cè)方法的研究主要是針對(duì)教育測(cè)驗(yàn),測(cè)驗(yàn)長(zhǎng)度基本在60題以上。而許多心理測(cè)量量表題數(shù)較少,《心理量表評(píng)定手冊(cè)(增訂版)》與《行為醫(yī)學(xué)量表手冊(cè)》105個(gè)量表中,測(cè)驗(yàn)長(zhǎng)度30題以下占68.5%,20題以下占37.1%,10題以下占11.4%。已有研究表明,測(cè)試長(zhǎng)度對(duì)題目參數(shù)及DIF檢測(cè)都有影響,因此在“長(zhǎng)測(cè)驗(yàn)”研究中得出的結(jié)論可能無(wú)法直接應(yīng)用到心理量表的DIF檢測(cè)。為了探求適用于“短測(cè)驗(yàn)”的DIF檢測(cè)方法,本研究采用模擬數(shù)據(jù)的方法對(duì)SIBTEST方法,IRT-LR方法和DFIT方法等三種常見的DIF檢測(cè)方法進(jìn)行比較研究。研究設(shè)計(jì)為3*3*3的實(shí)驗(yàn)設(shè)計(jì),研究設(shè)置了三種長(zhǎng)度(10題、20題、30題)的測(cè)驗(yàn),每個(gè)測(cè)驗(yàn)中設(shè)置相同比例的一致性DIF、非一致性DIF和混合性DIF試題,每題為5級(jí)計(jì)分題,使用三種方法對(duì)模擬數(shù)據(jù)進(jìn)行DIF檢測(cè)。采用WinGen軟件生成等級(jí)反應(yīng)模型下的試題參數(shù)和正態(tài)分布的被試參數(shù),最后生成各測(cè)驗(yàn)長(zhǎng)度條件下的50批被試作答反應(yīng)模擬數(shù)據(jù)。然后用三種方法對(duì)模擬數(shù)據(jù)進(jìn)行DIF檢測(cè),以I型錯(cuò)誤率和統(tǒng)計(jì)檢驗(yàn)力為因變量,比較三種方法的適用性,所得結(jié)論如下:(1)測(cè)驗(yàn)長(zhǎng)度為10題時(shí),三種方法檢測(cè)結(jié)果I型錯(cuò)誤率偏高,但統(tǒng)計(jì)檢驗(yàn)力也很高,三種方法的檢測(cè)效果都一般,其中DFIT方法表現(xiàn)最佳。IRT-LR方法和DFIT方法能檢測(cè)出大部分的非一致性DIF題,但SIBTEST方法檢測(cè)非一致性DIF效果較差。三種方法能百分百檢測(cè)出一致性DIF和非一致性DIF。(2)在測(cè)驗(yàn)長(zhǎng)度增加到20題時(shí),SIBTEST方法,IRT-LR方法檢測(cè)結(jié)果I型錯(cuò)誤率中等,IRT-LR和DFIT方法在統(tǒng)計(jì)檢驗(yàn)力有尚可的表現(xiàn),三種方法中DFIT方法稍勝一籌。SIBTEST方法檢測(cè)位于測(cè)驗(yàn)中間部分的一致性DIF檢測(cè)效果較差,IRT-LR方法,DFIT方法檢測(cè)非一致性DIF效果中等。(3)在測(cè)驗(yàn)長(zhǎng)度增加到30題時(shí),三種方法檢測(cè)結(jié)果I型錯(cuò)誤率低,DFIT方法表現(xiàn)最佳。SIBTEST方法檢測(cè)非一致性DIF效果最差,IRT-LR方法和DFIT方法檢測(cè)非一致性DIF效果較好。(4)三種方法的I型錯(cuò)誤率隨著測(cè)驗(yàn)長(zhǎng)度增加而逐步降低,而三種方法的統(tǒng)計(jì)檢驗(yàn)力也隨著測(cè)驗(yàn)長(zhǎng)度增加而有所降低。三種方法對(duì)一致性DIF和混合性DIF檢測(cè)效果較優(yōu)。對(duì)于非一致性DIF,SIBTEST方法檢測(cè)效果較差,IRT-LR方法和DFIT方法檢測(cè)效果良好。
【學(xué)位授予單位】:江西師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:B841
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前4條
1 張龍;涂冬波;;多級(jí)計(jì)分題項(xiàng)目功能差異常用檢測(cè)方法及比較[J];江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2015年05期
2 喻曉鋒;羅照盛;秦春影;耿濤;;基于項(xiàng)目反應(yīng)理論的教育測(cè)量模擬軟件-WinGen[J];貴州師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年06期
3 劉曦;張建新;;項(xiàng)目功能差異在臨床問(wèn)卷分析中的應(yīng)用[J];中國(guó)臨床心理學(xué)雜志;2006年04期
4 嚴(yán)芳,張?jiān)鲂?用Logistic Regression偵察題目差異功能[J];應(yīng)用心理學(xué);2001年01期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 蔡曉芬;SP程序和DFTD策略應(yīng)用于IRT取向下DIF檢測(cè)方法的效應(yīng)比較[D];江西師范大學(xué);2014年
2 陳鐸;三種測(cè)量不變性檢驗(yàn)方法的比較研究[D];江西師范大學(xué);2009年
3 宋麗紅;LDFA方法及其在項(xiàng)目功能差異分析中的應(yīng)用研究[D];江西師范大學(xué);2008年
4 王艷;基于項(xiàng)目反應(yīng)理論的項(xiàng)目功能差異檢驗(yàn)[D];北京語(yǔ)言大學(xué);2006年
5 李莉;多等級(jí)試題項(xiàng)目功能差異(DIF)參數(shù)方法的檢測(cè)研究[D];江西師范大學(xué);2005年
6 于媛穎;多種DIF檢測(cè)方法的比較研究[D];北京語(yǔ)言大學(xué);2004年
,本文編號(hào):1139908
本文鏈接:http://sikaile.net/shekelunwen/xinlixingwei/1139908.html