大尺度教育測評(píng)中IRT等值方法的比較研究
[Abstract]:All countries and international organizations regard large-scale education evaluation as an effective way to pay attention to the quality of education. The effective use of large-scale education evaluation can not be separated from the in-depth study of its evaluation techniques and methods. Equivalence is an important method of data processing in large-scale education evaluation, which is helpful to realize the fairness of the test. In this study, three equivalent methods (synchronous calibration, StockingLord calibration method and Mean-Mean calibration method) and two separate calibration link schemes (centralized link, centralized link) were compared by using non-equal group design of common problem and using actual data. Link) the equivalent precision of the title parameters. The results show that the estimation accuracy of StockingLord method is higher than that of Mean-Mean method. The precision of parameter estimation of Mean-Mean and StockingLord is higher than that of synchronous calibration in centralized link scheme and chain link scheme respectively. In the link scheme, with the increase of the number of link items, the equivalent precision of the parameters is decreasing, but in the centralized link scheme, the equivalent accuracy is not so obvious. The effect of the equivalent method on the accuracy is greater than that of the link scheme. Among them, although different equivalence methods have been adopted in different studies, there is no empirical study at home and abroad to consider the link schemes of different questions at the same time. The results of this study not only make up for the deficiency of domestic and foreign empirical research on different equivalence methods and link schemes under the common design of multi-topic books, but also provide reference and empirical basis for the equivalent design of the related large-scale education evaluation in our country. And then better realize the fairness of the test.
【作者單位】: 北京師范大學(xué)教育統(tǒng)計(jì)與測量研究所;北京師范大學(xué)發(fā)展心理研究所;北京師范大學(xué)認(rèn)知神經(jīng)科學(xué)與學(xué)習(xí)國家重點(diǎn)實(shí)驗(yàn)室;
【分類號(hào)】:G647
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 焦麗亞;;基于IRT的共同題非等組設(shè)計(jì)中五種項(xiàng)目參數(shù)等值方法的比較研究[J];考試研究;2009年02期
2 謝小慶;對(duì)15種測驗(yàn)等值方法的比較研究[J];心理學(xué)報(bào);2000年02期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉瑜;;對(duì)男大學(xué)生上肢力量類測驗(yàn)項(xiàng)目的等值研究[J];首都體育學(xué)院學(xué)報(bào);2005年06期
2 謝小慶;;科學(xué)技術(shù)進(jìn)步為高考改革帶來新的可能性[J];湖北招生考試;2009年30期
3 鹿士義,余嘉元;當(dāng)前HSK中若干值得進(jìn)一步研究的課題探討[J];漢語學(xué)習(xí);2003年04期
4 孫恒;;大規(guī)模教育考試平行試卷的設(shè)計(jì)[J];教育科學(xué);2011年06期
5 范曉玲;廖利國;;測驗(yàn)等值綜述[J];科技信息;2009年34期
6 謝小慶;;HSK和MHK的等值[J];考試研究;2005年01期
7 謝小慶;;考試分?jǐn)?shù)等值的新框架[J];考試研究;2008年02期
8 黎光明;張敏強(qiáng);;全測驗(yàn)與錨測驗(yàn)題型分值比對(duì)等值誤差的影響[J];考試研究;2009年03期
9 張晉軍;張慧君;張鐵英;符華均;黃賀臣;;新漢語水平考試HSK(六級(jí))試卷難度控制研究[J];中國考試;2012年11期
10 賈志先;;基于聚類分析的錨測驗(yàn)等值樣本選取方法研究[J];控制工程;2012年06期
相關(guān)會(huì)議論文 前1條
1 謝小慶;任杰;;HSK等值方法的改進(jìn)[A];對(duì)外漢語教學(xué)的全方位探索——對(duì)外漢語研究學(xué)術(shù)討論會(huì)論文集[C];2004年
相關(guān)博士學(xué)位論文 前2條
1 王漢衛(wèi);華語閱讀測試論[D];暨南大學(xué);2008年
2 羅蓮;基于HSK數(shù)據(jù)對(duì)核等值法與其他等值方法的比較研究[D];北京語言大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 戴步云;題目難度分布和樣本容量對(duì)兩種CTT等值結(jié)果的影響[D];江西師范大學(xué);2011年
2 熊建華;項(xiàng)目反應(yīng)理論(IRT)中等值方法及其比較[D];江西師范大學(xué);2002年
3 劉瑜;對(duì)上肢力量類測驗(yàn)項(xiàng)目等值的實(shí)證研究[D];揚(yáng)州大學(xué);2002年
4 王艷;基于項(xiàng)目反應(yīng)理論的項(xiàng)目功能差異檢驗(yàn)[D];北京語言大學(xué);2006年
5 吳銳;含題組測驗(yàn)的IRT等值問題研究[D];江西師范大學(xué);2007年
6 孫菡;基于項(xiàng)目反應(yīng)理論的應(yīng)征公民數(shù)學(xué)推理測驗(yàn)項(xiàng)目的初步編制[D];第四軍醫(yī)大學(xué);2007年
7 劉江鷹;項(xiàng)目反應(yīng)理論在大學(xué)英語分級(jí)測試題庫建設(shè)中的應(yīng)用[D];湖南大學(xué);2008年
8 金微敏;英語專業(yè)四級(jí)考試等值化的優(yōu)化設(shè)計(jì)[D];北京郵電大學(xué);2008年
9 周世科;混合題型的IRT等值問題研究[D];江西師范大學(xué);2008年
10 陳俊麗;核等值與其它等值方法的比較研究[D];北京語言大學(xué);2008年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 曾彥;;論同時(shí)的相對(duì)性[J];欽州學(xué)院學(xué)報(bào);2006年03期
2 易杰雄;劉榮;;溝通同時(shí)性、零距離與當(dāng)代國際關(guān)系[J];江漢論壇;2007年05期
3 張三慧;;同時(shí)性的相對(duì)性與經(jīng)典同時(shí)性[J];物理通報(bào);2001年02期
4 杜經(jīng)緯;楊光年;;SQL數(shù)據(jù)庫同步技術(shù)的應(yīng)用[J];文教資料;2006年02期
5 鄭憶石;;唯科學(xué)的西方馬克思主義社會(huì)形態(tài)觀評(píng)析[J];湘潭大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2006年05期
6 盧春紅;;同時(shí)性與“你”——論伽達(dá)默爾理解問題中的空·間性視角[J];浙江學(xué)刊;2010年06期
7 資中勇;孫習(xí)成;;具有主從關(guān)系的同時(shí)性表達(dá)[J];寧夏大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版);2007年05期
8 張建勇,,李耐國;應(yīng)加強(qiáng)對(duì)新興學(xué)科───教育測評(píng)的研究和運(yùn)用[J];解放軍外國語學(xué)院學(xué)報(bào);1995年03期
9 李潤田;整體的同時(shí)性與教學(xué)過程中的頓悟[J];太原師范學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版);1993年04期
10 陳建國;同時(shí)性真是相對(duì)的嗎?[J];江西社會(huì)科學(xué);1992年02期
相關(guān)會(huì)議論文 前10條
1 焦麗亞;辛濤;;基于IRT等值的共同題設(shè)計(jì)中五種題目參數(shù)等化方法的比較研究[A];全國教育與心理統(tǒng)計(jì)測量學(xué)術(shù)年會(huì)論文摘要集[C];2006年
2 羅冠中;;IRT軟件新發(fā)展與RUMM簡介[A];全國教育與心理統(tǒng)計(jì)測量學(xué)術(shù)年會(huì)論文摘要集[C];2006年
3 陳如冰;吳向東;;導(dǎo)熱系數(shù)測試儀校準(zhǔn)方法研究[A];江蘇省計(jì)量測試學(xué)術(shù)論文集[C];2007年
4 李莉;;放射性電離真空計(jì)的校準(zhǔn)方法[A];第十四屆全國質(zhì)譜分析和檢漏會(huì)議·第九屆全國真空計(jì)量測試年會(huì)摘要及論文集[C];2007年
5 李舒;;氣容、滴定式碳硫聯(lián)測儀校準(zhǔn)方法[A];江蘇省計(jì)量測試學(xué)會(huì)2006年論文集[C];2006年
6 張文東;王國衍;張麗芳;;木材水分儀校準(zhǔn)方法研究[A];第八屆全國氣濕敏傳感器技術(shù)學(xué)術(shù)交流會(huì)論文集[C];2004年
7 季智勇;;西門子ONCOR直線加速器多葉光柵故障維修與校準(zhǔn)[A];2008年中華臨床醫(yī)學(xué)工程及數(shù)字醫(yī)學(xué)大會(huì)暨中華醫(yī)學(xué)會(huì)醫(yī)學(xué)工程學(xué)分會(huì)第九次學(xué)術(shù)年會(huì)論文集[C];2008年
8 丁伏林;陳海燕;;線材測試儀的校準(zhǔn)方法[A];江蘇省計(jì)量測試學(xué)會(huì)2005年論文集[C];2005年
9 魏燕婷;錢健;;數(shù)字信號(hào)發(fā)生器的校準(zhǔn)技術(shù)研究[A];2008年江蘇省計(jì)量測試學(xué)術(shù)論文集[C];2008年
10 張娟;季學(xué)勤;董著勇;;直流電子負(fù)載校準(zhǔn)方法的研究[A];2008年江蘇省計(jì)量測試學(xué)術(shù)論文集[C];2008年
相關(guān)重要報(bào)紙文章 前10條
1 顏一;美“教育測評(píng)”領(lǐng)跑者看好中國市場[N];國際商報(bào);2005年
2 張忠田 唐群;血液透析機(jī)有校準(zhǔn)方法[N];健康報(bào);2002年
3 記者 蔡韜;省紀(jì)委監(jiān)察廳召開先進(jìn)性教育測評(píng)會(huì)[N];黑龍江日?qǐng)?bào);2006年
4 記者 孟曉明;先進(jìn)性教育測評(píng):滿意度99%[N];吐魯番報(bào)(漢);2006年
5 郝建宇(高級(jí)工程師);狹義相對(duì)論自我否定剖析[N];北京科技報(bào);2006年
6 徐風(fēng);角膜接觸鏡用校驗(yàn)鏡片國際標(biāo)準(zhǔn)拍板[N];中國質(zhì)量報(bào);2005年
7 劉方雄;七○一所測量放大器國標(biāo)通過評(píng)審[N];中國船舶報(bào);2006年
8 ;學(xué)生考分與經(jīng)濟(jì)增長有關(guān)系嗎[N];中國教師報(bào);2006年
9 記者 冰梅;Harcourt 測評(píng)公司來華試水[N];計(jì)算機(jī)世界;2005年
10 鄭武;讓你的測試械檢驗(yàn)更準(zhǔn)確更可靠[N];中國包裝報(bào);2006年
相關(guān)博士學(xué)位論文 前10條
1 孫向東;基于單位元的大口徑電磁流量計(jì)干校準(zhǔn)方法研究[D];上海大學(xué);2010年
2 丁彭;多灶性喉鱗癌的臨床與分子生物學(xué)研究[D];復(fù)旦大學(xué);2005年
3 高思田;計(jì)量型原子力顯微鏡的研究[D];天津大學(xué);2007年
4 袁繼敏;基于混沌和神經(jīng)網(wǎng)絡(luò)的時(shí)域參數(shù)測試研究及其在示波器中的應(yīng)用[D];電子科技大學(xué);2009年
5 蔡艷;群體水平的英語閱讀問題解決能力評(píng)估及認(rèn)知診斷[D];江西師范大學(xué);2010年
6 徐巧玉;大型裝備在線三維視覺測量系統(tǒng)關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2007年
7 何密;同時(shí)極化測量體制雷達(dá)的校準(zhǔn)方法研究[D];國防科學(xué)技術(shù)大學(xué);2012年
8 閆士舉;基于C形臂手術(shù)導(dǎo)航關(guān)鍵技術(shù)研究及系統(tǒng)實(shí)現(xiàn)[D];上海交通大學(xué);2008年
9 年桂君;抗同步攻擊魯棒性數(shù)字水印技術(shù)研究[D];吉林大學(xué);2008年
10 陳華;基于數(shù)字散斑相關(guān)方法的視覺變形測量技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 成芳芳;表示時(shí)間同時(shí)性的語法功能詞[D];大連理工大學(xué);2005年
2 鄭岱;基于IRT展開模型的中學(xué)生學(xué)習(xí)焦慮綜合量表的編制[D];湖南師范大學(xué);2013年
3 毛艷;基于IRT展開模型中學(xué)生學(xué)習(xí)適應(yīng)性測驗(yàn)的編制[D];湖南師范大學(xué);2013年
4 張倩倩;IRT在《現(xiàn)代教育技術(shù)》題庫構(gòu)建中的應(yīng)用[D];山東師范大學(xué);2011年
5 李華群;基于IRT計(jì)算機(jī)自適應(yīng)測試的研究[D];南昌大學(xué);2010年
6 張婷婷;測驗(yàn)項(xiàng)目的評(píng)分和IRT中能力參數(shù)的估計(jì)[D];西南大學(xué);2012年
7 曾凡梅;基于IRT的3-6年級(jí)多重成就測驗(yàn)的修訂及湖南省區(qū)域性常模的建立[D];湖南師范大學(xué);2012年
8 陳佳程;基于IRT模型的數(shù)學(xué)試題類型測驗(yàn)效果的研究[D];蘇州大學(xué);2013年
9 蔡理力;企事業(yè)人事測評(píng)的分析方法研究[D];華北電力大學(xué)(河北);2008年
10 丁鼎;短路瞬態(tài)大電流測試平臺(tái)的校準(zhǔn)方法研究[D];天津大學(xué);2012年
本文編號(hào):2431814
本文鏈接:http://sikaile.net/jiaoyulunwen/shifanjiaoyulunwen/2431814.html