共同總體假設下基于虛擬人的測驗等值研究
發(fā)布時間:2022-05-08 09:27
在大規(guī)模教育測驗中,為了測試題本的安全以及減少學生的作答時間,同一測驗項目中需要構建多份不同形式的測試題本。不同考生可能作答的測試題本不一樣,這樣得到的分數不具有可比性。以浙江英語高考為例,通過控制每年兩次的試題難度不變,使參加不同測驗的考生成績具有可比性。目前我國高考試題難度控制主要依賴于命題專家多年的經驗,但是2018年浙江英語高考事故充分說明了經驗并不完全可靠,以此控制試題難度是困難的。因此我們通過對測驗結果進行等值,使得參加不同測驗的考生成績可比。國外對等值的研究和運用已經較為成熟,較為常用的方法是通過在測驗中加入錨測驗進行測驗等值。但是以我國高考為例,試題施測以后便不再具有保密性,錨題曝光的必然性嚴重威脅到錨題設計的有效性,因此本文提出引入共同虛擬人的做法,在無錨題情況下進行測驗等值。本文分為三個研究,全部基于共同總體假設。研究一和研究二分別在經典測驗理論(Classical Test Theory,CTT)和項目反應理論(Item Response Theory,IRT)框架下進行有無共同虛擬人對等值穩(wěn)定性影響的研究,研究三通過比較不同共同虛擬人比例下60次抽樣IRT等值分...
【文章頁數】:72 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
1 前言
2 文獻綜述
2.1 等值概述
2.1.1 等值條件
2.1.2 等值設計
2.2 等值理論
2.2.1 經典測驗理論
2.2.2 項目反應理論
2.3 虛擬樣本
2.4 等值評價標準
3 研究設計與數據
3.1 研究設計
3.2 符號說明
3.3 數據準備
3.3.1 模擬數據生成
3.3.2 實證數據來源
3.3.3 虛擬人數據生成
4 研究一:虛擬人在CTT下對等值影響研究
4.1 研究目的
4.2 研究假設
4.3 研究方法
4.3.1 模擬研究
4.3.2 實證研究
5 研究二:虛擬人在IRT下的等值影響研究
5.1 研究目的
5.2 研究假設
5.3 研究方法
5.3.1 模擬研究
5.3.2 實證研究
6 研究三:IRT下共同虛擬人比例對等值的影響
6.1 研究目的
6.2 研究假設
6.3 研究方法
6.3.1 模擬研究
6.3.2 實證研究
7 研究結論與展望
7.1 研究結論
7.2 展望
參考文獻
致謝
【參考文獻】:
期刊論文
[1]基于Bootstrap方法的等百分位等值誤差分析[J]. 杜海燕,李付鵬,宋吉祥. 教育測量與評價. 2018(09)
[2]中國英語聽力能力等級量表描述語效度驗證——基于學生自我評價的多級計分IRT模型分析[J]. 閔尚超,何蓮珍,羅藍. 中國外語. 2018(02)
[3]等百分位等值方法的理論與考試應用研究[J]. 宋吉祥,李付鵬,杜海燕. 考試研究. 2017(03)
[4]線性等值與等百分位等值的實施條件與步驟[J]. 楊志明. 教育測量與評價. 2016(12)
[5]IRT理論不同模型下同時校準等值方法的跨樣本研究[J]. 張泉慧,黃慧英. 中國考試. 2016(02)
[6]無鉚題情況下測驗分數等值方法探索——構造鉚測驗法[J]. 劉玥,劉紅云. 心理科學. 2015(06)
[7]高考數學中考試評價的研究——基于CTT與IRT的實證比較[J]. 閆成海,杜文久,宋乃慶,張健. 華東師范大學學報(教育科學版). 2014(03)
[8]不同定義平行測驗等值的群體不變性[J]. 劉鐵川,戴海琦,趙玉. 心理學探新. 2012(01)
[9]垂直等值的應用及最新發(fā)展述評[J]. 王燁暉,邊玉芳,辛濤. 心理學探新. 2011(05)
[10]基于RSM對Q矩陣相同的無錨題測驗的等值[J]. 高慧健,辛濤,李峰. 心理科學. 2011(04)
碩士論文
[1]基于錨測驗的幾種新的等值方法[D]. 裴博陽.東北師范大學 2014
[2]經典測量理論與題目反應理論結合的模擬研究[D]. 常蕤.華南師范大學 2003
[3]項目反應理論(IRT)中等值方法及其比較[D]. 熊建華.江西師范大學 2002
本文編號:3651391
【文章頁數】:72 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
1 前言
2 文獻綜述
2.1 等值概述
2.1.1 等值條件
2.1.2 等值設計
2.2 等值理論
2.2.1 經典測驗理論
2.2.2 項目反應理論
2.3 虛擬樣本
2.4 等值評價標準
3 研究設計與數據
3.1 研究設計
3.2 符號說明
3.3 數據準備
3.3.1 模擬數據生成
3.3.2 實證數據來源
3.3.3 虛擬人數據生成
4 研究一:虛擬人在CTT下對等值影響研究
4.1 研究目的
4.2 研究假設
4.3 研究方法
4.3.1 模擬研究
4.3.2 實證研究
5 研究二:虛擬人在IRT下的等值影響研究
5.1 研究目的
5.2 研究假設
5.3 研究方法
5.3.1 模擬研究
5.3.2 實證研究
6 研究三:IRT下共同虛擬人比例對等值的影響
6.1 研究目的
6.2 研究假設
6.3 研究方法
6.3.1 模擬研究
6.3.2 實證研究
7 研究結論與展望
7.1 研究結論
7.2 展望
參考文獻
致謝
【參考文獻】:
期刊論文
[1]基于Bootstrap方法的等百分位等值誤差分析[J]. 杜海燕,李付鵬,宋吉祥. 教育測量與評價. 2018(09)
[2]中國英語聽力能力等級量表描述語效度驗證——基于學生自我評價的多級計分IRT模型分析[J]. 閔尚超,何蓮珍,羅藍. 中國外語. 2018(02)
[3]等百分位等值方法的理論與考試應用研究[J]. 宋吉祥,李付鵬,杜海燕. 考試研究. 2017(03)
[4]線性等值與等百分位等值的實施條件與步驟[J]. 楊志明. 教育測量與評價. 2016(12)
[5]IRT理論不同模型下同時校準等值方法的跨樣本研究[J]. 張泉慧,黃慧英. 中國考試. 2016(02)
[6]無鉚題情況下測驗分數等值方法探索——構造鉚測驗法[J]. 劉玥,劉紅云. 心理科學. 2015(06)
[7]高考數學中考試評價的研究——基于CTT與IRT的實證比較[J]. 閆成海,杜文久,宋乃慶,張健. 華東師范大學學報(教育科學版). 2014(03)
[8]不同定義平行測驗等值的群體不變性[J]. 劉鐵川,戴海琦,趙玉. 心理學探新. 2012(01)
[9]垂直等值的應用及最新發(fā)展述評[J]. 王燁暉,邊玉芳,辛濤. 心理學探新. 2011(05)
[10]基于RSM對Q矩陣相同的無錨題測驗的等值[J]. 高慧健,辛濤,李峰. 心理科學. 2011(04)
碩士論文
[1]基于錨測驗的幾種新的等值方法[D]. 裴博陽.東北師范大學 2014
[2]經典測量理論與題目反應理論結合的模擬研究[D]. 常蕤.華南師范大學 2003
[3]項目反應理論(IRT)中等值方法及其比較[D]. 熊建華.江西師范大學 2002
本文編號:3651391
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/3651391.html
教材專著