針對中國學生英文文章的詞性標注方法
[Abstract]:A two-layer part-of-speech tagging method based on word vector is proposed in this paper. A small number of manually extracted features are used. Most of the features can be obtained by automatic training of word vectors and layer 1 tagging vectors. In this method, the dimension set is divided into two categories, which are used as the dimension set of different layers. First, the categories which are easy to be labeled are labeled, and then the verbs or nouns which are difficult to be labeled are labeled at the second level, and they are labeled as specific verbs or nouns. The accuracy of part-of-speech tagging of English articles written by Chinese students can be improved from 95.23% to 95.63%, which exceeds the accuracy of the existing part-of-speech tagging of the same corpus based on word vector tagging.
【作者單位】: 北京郵電大學智能科學與技術中心;
【分類號】:TP391.1
【相似文獻】
相關期刊論文 前10條
1 完么才讓;安見才讓;;藏語詞性標注[J];信息與電腦(理論版);2013年08期
2 魏歐;孫玉芳;;漢語詞性標注方法的研究[J];計算機科學;2000年07期
3 王素格,張永奎;基于搭配模式的漢語詞性標注規(guī)則的獲取方法[J];計算機工程與應用;2001年05期
4 杜永萍,鄭家恒;分詞及詞性標注一致性校對系統(tǒng)的設計與實現(xiàn)[J];電腦開發(fā)與應用;2001年10期
5 劉健,鄭家恒;基于實例的詞性標注方法研究[J];山西氣象;2001年02期
6 錢揖麗,鄭家恒;漢語語料詞性標注自動校對方法的研究[J];中文信息學報;2004年02期
7 張虎,鄭家恒,劉江;語料庫詞性標注一致性檢查方法研究[J];中文信息學報;2004年05期
8 呂琳,周世斌,劉玉樹;一種高性能英文詞性標注器的設計與實現(xiàn)[J];北京理工大學學報;2005年10期
9 牛洪梅;吐爾根;伊不拉音;;維吾爾語的詞性標注校對初探[J];微型電腦應用;2006年12期
10 牛洪梅;加米拉·吾守爾;吐爾根·依布拉音;;現(xiàn)代維吾爾語的詞性標注校對技術研究[J];伊犁師范學院學報(自然科學版);2007年01期
相關會議論文 前10條
1 劉婭瓊;;論漢語語文辭書詞性標注[A];中國辭書學會第六屆中青年辭書工作者學術研討會論文集[C];2010年
2 姜尚仆;陳群秀;;基于規(guī)則和統(tǒng)計的日語分詞和詞性標注的研究[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年
3 通拉嘎;;漢、蒙、藏、維分詞與詞性標注技術發(fā)展現(xiàn)狀研究[A];第五屆全國青年計算語言學研討會論文集[C];2010年
4 李志江;;關于語文辭書詞性標注的探討[A];中國辭書學文集[C];1998年
5 邢富坤;宋柔;;自動詞性標注中語法因素和詞匯因素對英漢語的不同影響[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
6 帕里旦·吐爾遜;艾山·吾買爾;吐爾根·依布拉音;早克熱·卡德爾;阿力木江·艾沙;;基于最大熵的維吾爾語詞性標注模型[A];少數(shù)民族青年自然語言處理技術研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設聯(lián)合學術研討會論文集[C];2010年
7 蘇祺;昝紅英;胡景賀;項錕;;詞性標注對信息檢索系統(tǒng)性能的影響[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學術會議論文集[C];2004年
8 張艷;徐波;;基于轉(zhuǎn)換的錯誤學習方法的漢語詞性自動標注研究[A];輝煌二十年——中國中文信息學會二十周年學術會議論文集[C];2001年
9 溫鎖林;;漢語詞性自動標注軟件兼類詞鑒別規(guī)則庫的設計[A];世紀之交的中國應用語言學研究——第二屆全國語言文字應用學術研討會論文集[C];1998年
10 楊爾弘;方瑩;喬羽;;漢語自動分詞和詞性標注評測[A];第二屆全國學生計算語言學研討會論文集[C];2004年
相關博士學位論文 前2條
1 康才uo;藏語分詞與詞性標注研究[D];上海師范大學;2014年
2 華卻才讓;基于樹到串藏語機器翻譯若干關鍵技術研究[D];陜西師范大學;2014年
相關碩士學位論文 前10條
1 劉慧敏;中文詞性標注及未登錄詞詞性預測研究[D];南京師范大學;2015年
2 劉海峰;基于web語科庫的哈薩克語詞法分析[D];中央民族大學;2015年
3 朱曉;古漢語編年體的人名實體識別與詞性標注[D];復旦大學;2012年
4 趙嘉億;中文詞性標注中異構(gòu)數(shù)據(jù)問題研究[D];復旦大學;2014年
5 米爾阿迪力江·麥麥提;基于Morfessor的維吾爾語詞干提取和詞性標注的研究[D];新疆大學;2015年
6 努爾曙阿克·阿斯哈爾;哈薩克語詞性標注軟件的開發(fā)[D];新疆大學;2015年
7 韓霞;基于半監(jiān)督隱馬爾科夫的漢語詞性標注研究[D];大連理工大學;2015年
8 趙梓鈞;“N+的+V”與相關的動名兼類分歧詞考察[D];黑龍江大學;2015年
9 洛桑嘎登;藏文自動分詞與詞性標注研究[D];中央民族大學;2016年
10 楊蓓;老撾語分詞和詞性標注方法研究[D];昆明理工大學;2016年
,本文編號:2474668
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2474668.html