基于計算機(jī)的適應(yīng)性英語閱讀測試的可行性驗(yàn)證
本文關(guān)鍵詞:基于計算機(jī)的適應(yīng)性英語閱讀測試的可行性驗(yàn)證,由筆耕文化傳播整理發(fā)布。
【摘要】:為了使測試變得更科學(xué)和更人性化,在將來的外語測試中,不是是否采用適應(yīng)性測試的問題,而是怎樣應(yīng)用的問題。目前我國還沒有實(shí)施具有一定規(guī)模的適應(yīng)性語言測試。本文就實(shí)施小規(guī)模適應(yīng)性英語閱讀測試的可行性進(jìn)行探討,為今后適應(yīng)性語言測試的推廣提供參考。 本論文中的適應(yīng)性英語閱讀測試的目的是使高校和其他教育機(jī)構(gòu)能夠在短時間內(nèi)確定考生的英語水平,進(jìn)而使得考生能夠進(jìn)入相應(yīng)的班級學(xué)習(xí)。因此該適應(yīng)性英語測試是一種低風(fēng)險、小規(guī)模的分級考試;诖四康脑摽荚囋谝韵路矫娌煌谄渌m應(yīng)性測試。首先,該測試采用商業(yè)軟件作為開發(fā)平臺。其次,該測試題庫中的題目改編自閱讀出版物。最后,該英語閱讀測試采用短語境形式。 該測試包含兩個階段。第一個階段旨在大致確定考生的英語水平,根據(jù)第一個階段考生的答題情況,計算機(jī)程序在第二個階段提供適合考生英語水平的試題,以便于用更少的題目和時間取得更準(zhǔn)確的考試結(jié)果。該測試長度是20題至28題,題目由計算機(jī)程序根據(jù)考生的答題情況從含有300道閱讀題目的題庫中調(diào)取。完成該測試需要的時間最長為35分鐘。 基于閱讀理解和考試評價的相關(guān)理論,本論文提出六個研究問題,從不同的方面對該測試進(jìn)行驗(yàn)證: 1.改編自閱讀出版物的題目難度是否可靠? 2.該測試對考生焦慮是否有影響? 3.考生對該適應(yīng)性閱讀測試的態(tài)度是否與對計算機(jī)的態(tài)度相關(guān)? 4.該適應(yīng)性英語測試能否測量預(yù)期的閱讀能力? 5.該適應(yīng)性英語測試和其他測試的相關(guān)性如何? 6.該適應(yīng)性英語閱讀測試的信度如何? 本論文中采用Spielberger (1980)等人的測試焦慮量表(Test AnxietyInventory)來測量考試的焦慮程度。采用Selwyn (1997)的學(xué)生對計算機(jī)的態(tài)度量表(Students’Attitudes Toward Computers)和作者設(shè)計的量表測量學(xué)生對計算機(jī)的態(tài)度。采用出聲思考(Thinking aloud verbal protocol)來發(fā)現(xiàn)考生在閱讀過程中所采用的閱讀技巧。 測試于2011-2012秋季學(xué)期在中國農(nóng)業(yè)大學(xué)實(shí)施,包括紙筆分級測試和適應(yīng)性英語閱讀測試。受試來自六個班級,共212人。研究數(shù)據(jù)包括定性數(shù)據(jù)和定量數(shù)據(jù)。采用方差分析,,t檢驗(yàn),皮爾遜相關(guān)分析和描述性統(tǒng)計對定量數(shù)據(jù)進(jìn)行分析。研究結(jié)果表明改編自閱讀出版物的題目難度是可靠的,這說明作者確定題目難度的方法是恰當(dāng)?shù)摹T摐y試引起考生焦慮程度的提高,其原因是由于對適應(yīng)性測試的陌生感和對考試長度缺乏認(rèn)知。研究結(jié)果還發(fā)現(xiàn),考生對該適應(yīng)性閱讀測試的態(tài)度和他們對計算機(jī)的態(tài)度顯著相關(guān)。考生對計算機(jī)的態(tài)度和考生使用計算機(jī)的時間顯著相關(guān)。通過定性分析發(fā)現(xiàn)該適應(yīng)性短語境閱讀測試能夠測量預(yù)期的閱讀技巧,說明該測試在一定程度上具有良好的構(gòu)念效度。此外,相關(guān)分析顯示,該測試和紙筆測試中度相關(guān),并且該測試具有較高的信度。研究結(jié)果顯示了在小規(guī)模,低風(fēng)險計算機(jī)適應(yīng)性測試中采用出版物材料進(jìn)行題庫建設(shè)和采用商業(yè)軟件作為開發(fā)平臺是可行的。本研究是針對于英語閱讀的適應(yīng)性測試,對于英語聽力,語法詞匯等適應(yīng)性測試具有一定的借鑒意義。 本文總計六章內(nèi)容,詳情如下: 第一章引言,介紹論文主題、意義;第二章文獻(xiàn)綜述從項(xiàng)目反映理論、閱讀理解的過程和測試評價三個層面勾勒出本研究的理論框架;第三章詳述了該適應(yīng)性閱讀測試的設(shè)計,具體包括題庫的大小、進(jìn)入水平、終止原則、設(shè)計詳圖、計分原則和節(jié)目設(shè)計。第四章詳細(xì)描述了研究方法,其中包括研究設(shè)計、受試、研究工具、數(shù)據(jù)采集和分析步驟。第五章呈現(xiàn)了數(shù)據(jù)分析結(jié)果。第六章包括討論和結(jié)論。此外還指出了本研究的學(xué)術(shù)價值和意義。對于考慮采用適應(yīng)性測試的考試設(shè)計者而言,在設(shè)計低風(fēng)險、小規(guī)模的適應(yīng)性測試時可以采用現(xiàn)有的軟件作為開發(fā)平臺,通過改編現(xiàn)有題目進(jìn)行題庫建設(shè)。本研究證實(shí)了以上兩點(diǎn)的可行性。對于語言教師而言本研究的意義在于教師要鼓勵學(xué)生更多的使用計算機(jī),因?yàn)檠芯匡@示在一定程度內(nèi)更多的使用計算機(jī)能提高學(xué)生對計算機(jī)的積極態(tài)度,并且降低學(xué)生的考試焦慮。 本論文具有一定的局限性。在今后的研究中應(yīng)選取具有更高或更低英語水平的受試來驗(yàn)證這種適應(yīng)性英語閱讀測試的有效性。
【關(guān)鍵詞】:適應(yīng)性英語閱讀測試 短語境閱讀 驗(yàn)證 效度 信度
【學(xué)位授予單位】:上海外國語大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2014
【分類號】:H310.4
【目錄】:
- Acknowledgements4-6
- Dedication6-7
- Abstract (Chinese)7-9
- Abstract (English)9-17
- List of Tables17-19
- List of Figures19-20
- Chapter One: Introduction20-24
- 1.1 Background20-21
- 1.2 Purpose of the Study21
- 1.3 Research Questions21-22
- 1.4 Definition of Terms22
- 1.5 Significance of the Study22-23
- 1.6 Structure of the Dissertation23-24
- Chapter Two: Literature Review24-58
- 2.1 Theoretical Foundation of CAT: Item Response Theory24-25
- 2.1.1 Basic Assumptions of Item Response Theory24-25
- 2.1.2 Compromise of Unidimensionality25
- 2.2 CAT Components25-28
- 2.2.1 Item Banking and Item Calibration26-28
- 2.3 Development of Language CAT Projects28-34
- 2.3.1 Purposes of Language CAT31-33
- 2.3.2 Task Types of Language CAT33-34
- 2.3.3 Multi-stage Design34
- 2.4 Computer Adaptive or Computer Mediated Reading Research34-39
- 2.4.1 Score Equivalence34-36
- 2.4.2 Construct Equivalence36-37
- 2.4.3 Computer Familiarity, Anxiety Level and Computer Interfaces37-39
- 2.5 Construct of Reading Ability: Theoretical Considerations39-50
- 2.5.1 Reading Process39-42
- 2.5.2 Dimensionality of Reading Construct42-44
- 2.5.3 Reading Skills44-50
- 2.6 Test Evaluation50-58
- 2.6.1 Messick’s Test Validation Theory50-51
- 2.6.2 Bachman and Palmer’s Framework of Test Usefulness Evaluation51-54
- 2.6.3 Evaluation of CALT Usefulness54-58
- Chapter Three: The Design of Reading CAT58-80
- 3.1 Purposes of the Computer Adaptive Reading Test58-59
- 3.2 Software Template59-65
- 3.2.1 Questionmark Overview59-60
- 3.2.2 Questionmark Perception60-61
- 3.2.3 Jump Blocks61-65
- 3.3 Item Adaptation65-70
- 3.3.1 Change the Items to Suit Chinese Cultural Situation68-69
- 3.3.2 Change the Words to Suit Chinese Curriculum69-70
- 3.3.3 Change the Choices to be Parallel70
- 3.4 Method of Determining Item Difficulty70-72
- 3.4.1 Item Difficulty70-71
- 3.4.2 Readability71-72
- 3.5 Common Issues in CAT Design72-80
- 3.5.1 Size of Item Bank72-73
- 3.5.2 Entry Level73
- 3.5.3 Stopping Rule73-74
- 3.5.4 Design Map74-77
- 3.5.5 Scoring Rule77-78
- 3.5.6 Interface Design78-80
- Chapter Four: Research Methodology80-92
- 4.1 Overview of the Research Design80-81
- 4.2 The Pilot Study81-83
- 4.3 The Main Study83-85
- 4.4 The Study Population and Participants85-86
- 4.4.1 The Population85
- 4.4.2 The Participants85
- 4.4.3 ESL Instructors85-86
- 4.5 The Instrumentation86-90
- 4.5.1 Test Anxiety Inventory86
- 4.5.2 Students’ Attitudes Towards Computers86-87
- 4.5.3 Evaluating Test Design with Think Aloud Verbal Protocol87-88
- 4.5.4 Student Interviews88
- 4.5.5 Researcher-developed Questionnaire88
- 4.5.6 Computer Adaptive Reading Test88-89
- 4.5.7 Placement Test89-90
- 4.6 Data Collection and Analysis Procedure90-92
- 4.6.1 Data Collection and Analysis in the First and Second Phase90
- 4.6.2 Data Collection and Analysis in the Third Phase90-92
- Chapter Five: Results, Findings and Discussion92-143
- 5.1 Introduction92
- 5.2 Descriptive and Inferential Analysis of Test Anxiety92-96
- 5.3 Students’ Attitudes toward Computers96-98
- 5.4 Data on Students’ Experiences with Computers and Computerized Test98-111
- 5.4.1 Descriptive Data Analysis on Time Spent with Computers99-103
- 5.4.2 Descriptive Data Analysis on Attitudes toward Computerized Test103-110
- 5.4.3 Descriptive Data Analysis on Reading Skills110-111
- 5.5 Analysis of Data on Think Aloud Protocol111-116
- 5.5.1 Analysis of Data on Item Difficulty111-113
- 5.5.2 Analysis of Data on Reading Skill113-116
- 5.6 Analysis of Test Scores116-127
- 5.6.1 Analysis of Computer Adaptive Test Scores116-121
- 5.6.2 Analysis of Placement Test Scores121-125
- 5.6.3 Correlation of Scores of Computer Adaptive Reading Test and Placement Test125-127
- 5.7 Correlation Analysis of Factors Concerned in the Study127-130
- 5.8 Findings and Discussions130-143
- 5.8.1 Research Question 1 : Is the item difficulty from published materials reliable?130-132
- 5.8.2 Research Question 2: Is the participants’ test anxiety influenced by the computer adaptive reading test?132-134
- 5.8.3 Research Question 3: What is the relationship between participants’perception of the computer adaptive reading test and their attitudes or experiences with computer?134-136
- 5.8.4 Research Question 4: Can the computer adaptive reading test measure the expected reading skill?136-137
- 5.8.5 Research Question 5: What is the correlation of the computer adaptive reading test with other test?137-139
- 5.8.6 Research Question 6: How reliable is the computer adaptive reading test?139-143
- Chapter Six: Summary and Conclusion143-156
- 6.1 Summary of the Study143-145
- 6.2 Conclusion145-148
- 6.3 Educational Implications148-150
- 6.3.1 Educational Implications for Test Designers148-150
- 6.3.2 Educational Implications for Language Teachers150
- 6.4 Limitations and Delimitations150-153
- 6.4.1 Limitations150-152
- 6.4.2 Delimitations152-153
- 6.5 Recommendation for Future Research153-156
- 6.5.1 Recommendation for Future Research Relative to Study Limitations129153-154
- 6.5.2 Recommendation for Future Research Relative to Study Delimitations154-156
- References156-171
- Appendix A: Scoring Scheme of the Test171-175
- Appendix B: Test Directions for the Computer Adaptive Reading Test175-176
- Appendix C: Instruction and Practice Tasks for Retrospective Verbal Report176-177
- Appendix D: Material Used in the Third Phase of the Study177-180
- Appendix E: Test Anxiety Inventory180-182
- Appendix F: Attitudes Toward Computers182-184
- Appendix G: Researcher-Developed Questionnaire184-187
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前8條
1 韓少杰;李新濤;;基于英語網(wǎng)絡(luò)測試系統(tǒng)的自適應(yīng)測試與常規(guī)測試的對比實(shí)驗(yàn)研究[J];外國語言文學(xué);2006年04期
2 張武保;自適應(yīng)性測試的實(shí)驗(yàn)研究[J];解放軍外國語學(xué)院學(xué)報;1999年03期
3 曾用強(qiáng);電腦順應(yīng)性測試模式的設(shè)計[J];外語教學(xué)與研究;1992年02期
4 金艷;吳江;;大學(xué)英語四級網(wǎng)考效度初探——影響考生評價和考試成績的因素分析[J];外語電化教學(xué);2010年02期
5 李清華;;基于紙筆的語言測試與基于計算機(jī)的語言測試的等效研究綜述[J];外語界;2006年04期
6 陳慧麟;;基于紙筆的語言測試和基于計算機(jī)的語言測試之間效度對等性驗(yàn)證模式初探[J];外語界;2009年03期
7 何蓮珍;短語境閱讀測試法的效度研究[J];現(xiàn)代外語;1998年02期
8 羅娟;;大學(xué)英語四級機(jī)助測試效度實(shí)證研究[J];中南林業(yè)科技大學(xué)學(xué)報(社會科學(xué)版);2009年06期
本文關(guān)鍵詞:基于計算機(jī)的適應(yīng)性英語閱讀測試的可行性驗(yàn)證,由筆耕文化傳播整理發(fā)布。
本文編號:303814
本文鏈接:http://sikaile.net/shoufeilunwen/rwkxbs/303814.html