日語自動詞性賦碼器的信度研究
本文關(guān)鍵詞:日語自動詞性賦碼器的信度研究
更多相關(guān)文章: 語料庫 賦碼 隱馬爾科夫模型 日語
【摘要】:詞性自動賦碼技術(shù)的日臻成熟為語料庫建設(shè)提供了有力支撐。與本族語語料不同,學(xué)習(xí)者產(chǎn)出中充斥著大量錯誤。這必然會對賦碼的準(zhǔn)確性造成干擾。因此,除了精度以外,抗干擾能力也是需要著重考慮的因素。本文統(tǒng)計并比較了日語開源自動詞性賦碼器對學(xué)習(xí)者語料賦碼的精度以及賦碼信度與語料質(zhì)量的相關(guān)性。從中發(fā)現(xiàn),MeCab表現(xiàn)最出色,ChaSen次之,JUMAN則稍遜一籌。此外,研究證實,日語開源賦碼器對學(xué)習(xí)者語料賦碼的精度甚至超過了本族語語料。因此,完全可以充當(dāng)語料庫建設(shè)的可靠工具。
【作者單位】: 上海外國語大學(xué);
【基金】:2012年教育部人文社會科學(xué)研究青年基金項目課題“中國日語學(xué)習(xí)者表達(dá)失誤的認(rèn)知語言學(xué)研究(12YJC740076)” 上海外國語大學(xué)青年科研創(chuàng)新團(tuán)隊項目“基于日語學(xué)習(xí)者語料庫的二語習(xí)得研究(QJTD11MWW01)”的研究成果
【分類號】:H36
【正文快照】: 1引言從研究方法看,基于學(xué)習(xí)者語料庫的研究大致可以分為中介語對比分析(CIA)和計算機輔助錯誤分析(CEA)兩種(Granger et al.,2002)。由于國內(nèi)現(xiàn)有的各類學(xué)習(xí)者語料庫幾乎都未進(jìn)行詞性賦碼,標(biāo)注局限于各類表達(dá)失誤,導(dǎo)致我國基于學(xué)習(xí)者語料庫開展的二語習(xí)得研究也以計算機輔助
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前4條
1 毛文偉;;日語學(xué)習(xí)者產(chǎn)出文本特征的量化分析[J];解放軍外國語學(xué)院學(xué)報;2012年01期
2 梁茂成;;學(xué)習(xí)者英語書面語料自動詞性賦碼的信度研究[J];外語教學(xué)與研究;2006年04期
3 毛文偉;;語料庫在歷時語言學(xué)研究領(lǐng)域的應(yīng)用——以對機能辭「とたん(に)」的考察為例[J];外語電化教學(xué);2009年01期
4 毛文偉;;整合型學(xué)習(xí)者語料庫平臺的規(guī)劃與實現(xiàn)——以中國日語學(xué)習(xí)者語料庫CJLC的構(gòu)建為例[J];現(xiàn)代教育技術(shù);2009年09期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 吳寧;徐筠;;英漢應(yīng)用語言學(xué)實證論文體裁對比分析——以方法部分為例[J];畢節(jié)學(xué)院學(xué)報;2009年11期
2 劉艾娟;;中國大學(xué)生的語塊使用頻率及類別與寫作質(zhì)量的相關(guān)性研究[J];長春師范學(xué)院學(xué)報(人文社會科學(xué)版);2010年07期
3 李新利;;學(xué)習(xí)者筆語中BE動詞的類聯(lián)接研究[J];瘋狂英語(教師版);2011年03期
4 王曉燕;;運用計算機技術(shù)和任務(wù)教學(xué)法提高英語教學(xué)水平[J];長春理工大學(xué)學(xué)報;2012年03期
5 鄭玉榮;欒嵐;王麗麗;;我國語料庫研究發(fā)展歷程分析[J];黑龍江教育學(xué)院學(xué)報;2011年06期
6 陳功;;語料庫檢索的模式、問題及啟示[J];當(dāng)代外語研究;2011年10期
7 毛文偉;;日語學(xué)習(xí)者產(chǎn)出文本特征的量化分析[J];解放軍外國語學(xué)院學(xué)報;2012年01期
8 毛文偉;;基于語料庫的歷時語言學(xué)研究——以對瞬間繼起機能辭的考察為例[J];日語學(xué)習(xí)與研究;2010年04期
9 毛文偉;;二語習(xí)得量化研究中兩種數(shù)據(jù)采集方法的對比研究[J];日語學(xué)習(xí)與研究;2011年01期
10 王莉;梁茂成;;學(xué)習(xí)者口語語料自動詞性賦碼的信度研究[J];外語教學(xué);2007年04期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 葛詩利;面向大學(xué)英語教學(xué)的通用計算機作文評分和反饋方法研究[D];北京語言大學(xué);2008年
2 潘鳴威;多模態(tài)視角下的口語交際能力:重構(gòu)與探究[D];上海外國語大學(xué);2011年
3 朱慧敏;大學(xué)生英語寫作中的詞匯豐富性發(fā)展特征研究[D];山東大學(xué);2011年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 梁燕,馮友,程良坤;近十年我國語料庫實證研究綜述[J];解放軍外國語學(xué)院學(xué)報;2004年06期
2 高見;戴曼純;;英語學(xué)習(xí)者主題結(jié)構(gòu)的習(xí)得研究[J];解放軍外國語學(xué)院學(xué)報;2009年01期
3 孫海燕;;中國EFL學(xué)習(xí)者搭配能力的發(fā)展特征探析[J];外語研究;2008年02期
4 毛文偉;;日語詞辭轉(zhuǎn)化的可能性初探——兼論機能辭的來源及分類[J];日語學(xué)習(xí)與研究;2006年04期
5 張雪梅;楊瀅瀅;;英語專業(yè)學(xué)習(xí)者的時態(tài)習(xí)得現(xiàn)狀——一項基于中國英語專業(yè)寫作語料庫的研究[J];外國語文;2009年03期
6 文秋芳 ,丁言仁,王文宇;中國大學(xué)生英語書面語中的口語化傾向——高水平英語學(xué)習(xí)者語料對比分析[J];外語教學(xué)與研究;2003年04期
7 吳福祥;近年來語法化研究的進(jìn)展[J];外語教學(xué)與研究;2004年01期
8 毛文偉;;論語料庫信息自動篩選技術(shù)的實現(xiàn)及排錯——以對接尾詞“み”的考察為例[J];外語電化教學(xué);2007年01期
9 馬剛;呂曉娟;;基于中國學(xué)習(xí)者英語語料庫的情態(tài)動詞研究[J];外語電化教學(xué);2007年03期
10 毛文偉;;語料庫在歷時語言學(xué)研究領(lǐng)域的應(yīng)用——以對機能辭「とたん(に)」的考察為例[J];外語電化教學(xué);2009年01期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 朱寶鋒;;學(xué)生英語寫作中的詞匯冗余現(xiàn)象[J];重慶科技學(xué)院學(xué)報(社會科學(xué)版);2011年12期
2 楊行;;語料庫工具與英語詞匯教學(xué)之light Vs.heavy[J];科技信息;2011年16期
3 譚晶華;毛文偉;;中國日語學(xué)習(xí)者語料庫CLJC建設(shè)及應(yīng)用綜述[J];日語學(xué)習(xí)與研究;2011年04期
4 谷婧;;語料庫在中學(xué)英語詞匯教學(xué)中的應(yīng)用[J];新教育;2011年08期
5 梁健麗;;“英語作為通用語”語料庫介評(英文)[J];語文學(xué)刊(外語教育與教學(xué));2011年08期
6 劉藝;;英語職業(yè)教育中語料庫作用探討[J];黑龍江科技信息;2011年21期
7 李安玲;張曉雁;;探究語料庫在英語寫作教學(xué)中的應(yīng)用[J];校園英語(教研版);2011年06期
8 董娜;;語料庫與翻譯教學(xué)[J];語文學(xué)刊;2011年09期
9 米歇爾·保爾;海倫·夏普維拉;迪萊塔·迪·洛克;斯戴芬妮亞·格拉斯亞尼;徐潔;;CoDiSV:奧斯塔山谷地區(qū)學(xué)校兒童書面作業(yè)的數(shù)字語料庫[J];中國兒童文化;2010年00期
10 張敏;李學(xué)寧;;西方主要英語語料庫結(jié)構(gòu)代表性分析[J];赤峰學(xué)院學(xué)報(漢文哲學(xué)社會科學(xué)版);2011年06期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 郭曙綸;;基于語料庫的HSK多功能例解字典:設(shè)想與樣例[A];2004年辭書與數(shù)字化研討會論文集[C];2004年
2 梁紅梅;尹曉霞;李宇莊;;有關(guān)語料庫驅(qū)動下的外語在線自主學(xué)習(xí)的工作底稿[A];全國大學(xué)英語教學(xué)改革暨網(wǎng)絡(luò)環(huán)境下外語教學(xué)學(xué)術(shù)研討會論文集[C];2004年
3 許小星;亢世勇;孫茂松;劉金鳳;;語料庫語義成分標(biāo)注的若干問題[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
4 宋鴻彥;劉軍;姚天f ;劉全升;黃高輝;;漢語意見型主觀性文本標(biāo)注語料庫的構(gòu)建[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
5 黃玉;李生;孟遙;丁華福;;基于大規(guī)模語料庫的英語從句識別[A];第一屆學(xué)生計算語言學(xué)研討會論文集[C];2002年
6 李明;;語料庫·藍(lán)本·雙語詞典[A];中國辭書學(xué)會雙語詞典專業(yè)委員會第五屆年會暨學(xué)術(shù)研討會論文集[C];2003年
7 郭啟新;;論語料庫與英漢詞典配例[A];中國辭書學(xué)會雙語詞典專業(yè)委員會第四屆年會暨學(xué)術(shù)研討會論文集[C];2001年
8 蔡蓮紅;蔡銳;吳志勇;陶建華;;語音合成語料庫的設(shè)計與聲學(xué)特征分析[A];中國聲學(xué)學(xué)會2002年全國聲學(xué)學(xué)術(shù)會議論文集[C];2002年
9 孫述學(xué);;新詞語語料庫建設(shè)的一些構(gòu)想[A];2004年辭書與數(shù)字化研討會論文集[C];2004年
10 王仁華;胡郁;李威;凌震華;;基于決策樹的漢語大語料庫合成系統(tǒng)[A];第六屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2001年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 何方雄;藥企該青睞怎樣的賦碼產(chǎn)品[N];醫(yī)藥經(jīng)濟(jì)報;2010年
2 小城;物聯(lián)網(wǎng)技術(shù)于中藥監(jiān)碼賦碼系統(tǒng)之應(yīng)用[N];中國包裝報;2010年
3 王超 唐晨;賦碼令藥企叫苦印企竊喜[N];中國新聞出版報;2011年
4 本報記者 趙玲;賦碼時限無余地 質(zhì)量問題“零容忍”[N];中國醫(yī)藥報;2011年
5 本報記者 李彥;基本藥物包裝賦碼給印企大商機[N];中國新聞出版報;2011年
6 記者 王坤寧;商務(wù)方正合作開發(fā)辭書語料庫及編纂系統(tǒng)[N];中國新聞出版報;2002年
7 記者 趙玲;基本藥物進(jìn)口品種需今年年底前完成賦碼[N];中國醫(yī)藥報;2011年
8 本報記者 周建華;數(shù)字戰(zhàn)略打造核心競爭力[N];中國圖書商報;2001年
9 盧偉;文學(xué)語言的語料庫研究方法[N];文藝報;2004年
10 王揚;愛創(chuàng)舉辦“藥監(jiān)賦碼系統(tǒng)研討會”[N];現(xiàn)代物流報;2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張廷香;基于語料庫的3-6歲漢語兒童詞匯研究[D];山東大學(xué);2010年
2 夏云;基于語料庫的英漢翻譯小說常規(guī)化研究:歷時的視角[D];山東大學(xué);2010年
3 何婷婷;語料庫研究[D];華中師范大學(xué);2003年
4 孫廣路;基于統(tǒng)計學(xué)習(xí)的中文組塊分析技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2008年
5 王青;基于語料庫的《尤利西斯》漢譯本譯者風(fēng)格研究[D];山東大學(xué);2010年
6 唐斌;《人民日報》中(1987-2007)農(nóng)民工的話語再現(xiàn)[D];上海外國語大學(xué);2010年
7 徐欣;基于語料庫的英漢小說語篇中話語標(biāo)記功能研究[D];山東大學(xué);2011年
8 姜維;統(tǒng)計中文詞法分析及其強化學(xué)習(xí)機制的研究[D];哈爾濱工業(yè)大學(xué);2007年
9 張建梅;基于語料庫的現(xiàn)代蒙古語簡單陳述句句型分析研究[D];內(nèi)蒙古大學(xué);2010年
10 王麗;基于語料庫的中國學(xué)習(xí)者英語口語中語用標(biāo)記語研究[D];上海交通大學(xué);2008年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 岳炳詞;面向語言學(xué)研究的大規(guī)模漢語生語料庫檢索工具CCRLT[D];北京工業(yè)大學(xué);2001年
2 徐琰;基于語料庫的ONLY研究[D];大連海事大學(xué);2003年
3 楊麗萍;基于語料庫的英語專業(yè)大學(xué)生議論文限時寫作中的四字詞塊研究[D];江西師范大學(xué);2010年
4 李淼;用先進(jìn)的語料庫工具推進(jìn)英語教學(xué)[D];首都師范大學(xué);2004年
5 李春青;[D];電子科技大學(xué);2004年
6 王蓉;新聞英語的批評性語篇分析[D];上海師范大學(xué);2010年
7 劉鼎甲;連接成分的顯化:基于語料庫的中英文翻譯文本對比[D];燕山大學(xué);2010年
8 劉露露;漢語衍名的雙事件隱喻分析[D];四川外語學(xué)院;2011年
9 黃潔;基于語料庫的商務(wù)英語詞匯特點的研究[D];大連海事大學(xué);2010年
10 李艷梅;基于語料庫的中國英語學(xué)習(xí)者與本族語者闡發(fā)性話語標(biāo)記語的對比分析[D];沈陽師范大學(xué);2011年
,本文編號:1238456
本文鏈接:http://sikaile.net/waiyulunwen/lxszy/1238456.html