兩種多組DIF檢測方法的比較研究
發(fā)布時間:2017-11-07 11:08
本文關鍵詞:兩種多組DIF檢測方法的比較研究
更多相關文章: 項目功能差異 多組DIF方法 GLR GLord PISA
【摘要】:項目功能差異(DIF)分析作為確保測驗公平的環(huán)節(jié)中非常重要的一環(huán),受到了國際上的大量關注。但是目前對于DIF的研究主要集中于研究適用于檢測兩個群體間的DIF效應的方法之上,而隨著大型國際評估項目的興起與盛行,如PISA, TIMSS等,對能夠檢測多個群體間DIF效應的方法的需求也隨之增大了。而目前針對于多組DIF方法的研究較少,且不夠深入,。在經(jīng)過文獻分析后發(fā)現(xiàn),還未有多組DIF檢測方法:GLR和GLord卡方方法的模擬比較研究,因此本研究將研究對象確定為這兩種方法。本研究在對DIF的相關概念及兩組DIF方法進行簡要介紹后,回顧了多組DIF檢測方法的發(fā)展過程,然后介紹了GLR和GLord卡方方法的模型與公式。本研究的實驗共包括三個:研究一作為預實驗,簡單比較了GLR和GLord卡方方法及各自對應的兩組方法(LR、BLR、Lord卡方、BLord卡方)在多組條件下的檢測情況,研究結果發(fā)現(xiàn)兩組DIF方法(LR和Lord)的Ⅰ型錯誤膨脹幅度太大,而Bonferroni校正后的BLR和BLord卡方則檢出率太低,兩類方法無論在控制Ⅰ型錯誤率上還是檢出率上,都不如多組方法(GLR和GLord卡方)的結果,因此在多組DIF檢測時推薦使用多組方法;研究二是本研究的重點,探索GLR和GLord卡方方法的DIF檢測情況。研究發(fā)現(xiàn),兩種方法的Ⅰ型錯誤率都隨樣本量的增加而下降,隨DIF組數(shù)量的增加而升高。在能力分布不等時,兩種方法出現(xiàn)了不同程度的Ⅰ型錯誤膨脹,GLR膨脹的程度更大;而檢出率在能力分布相等和不等時的變化趨勢是一致的,都隨著樣本量的增加而升高,隨著DIF題目比例和DIF組數(shù)量的增加而呈現(xiàn)先上升后下降的趨勢;研究三則選用PISA2009閱讀素養(yǎng)中的部分數(shù)據(jù)(4個國家在29個題目上的作答數(shù)據(jù))比較了GLR和GLord卡方方法的DIF檢測情況。檢測結果發(fā)現(xiàn),兩種方法檢測出的含有DIF的題目及比例是相同的,測驗中檢測出含有DIF的題目比例較大。
【學位授予單位】:浙江師范大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:B841
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 康春花;辛濤;;測驗理論的新發(fā)展:多維項目反應理論[J];心理科學進展;2010年03期
,本文編號:1152140
本文鏈接:http://sikaile.net/shekelunwen/xinlixingwei/1152140.html
教材專著