針對(duì)中國(guó)學(xué)生英文文章的詞性標(biāo)注方法
[Abstract]:A two-layer part-of-speech tagging method based on word vector is proposed in this paper. A small number of manually extracted features are used. Most of the features can be obtained by automatic training of word vectors and layer 1 tagging vectors. In this method, the dimension set is divided into two categories, which are used as the dimension set of different layers. First, the categories which are easy to be labeled are labeled, and then the verbs or nouns which are difficult to be labeled are labeled at the second level, and they are labeled as specific verbs or nouns. The accuracy of part-of-speech tagging of English articles written by Chinese students can be improved from 95.23% to 95.63%, which exceeds the accuracy of the existing part-of-speech tagging of the same corpus based on word vector tagging.
【作者單位】: 北京郵電大學(xué)智能科學(xué)與技術(shù)中心;
【分類號(hào)】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 完么才讓;安見(jiàn)才讓;;藏語(yǔ)詞性標(biāo)注[J];信息與電腦(理論版);2013年08期
2 魏歐;孫玉芳;;漢語(yǔ)詞性標(biāo)注方法的研究[J];計(jì)算機(jī)科學(xué);2000年07期
3 王素格,張永奎;基于搭配模式的漢語(yǔ)詞性標(biāo)注規(guī)則的獲取方法[J];計(jì)算機(jī)工程與應(yīng)用;2001年05期
4 杜永萍,鄭家恒;分詞及詞性標(biāo)注一致性校對(duì)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];電腦開(kāi)發(fā)與應(yīng)用;2001年10期
5 劉健,鄭家恒;基于實(shí)例的詞性標(biāo)注方法研究[J];山西氣象;2001年02期
6 錢(qián)揖麗,鄭家恒;漢語(yǔ)語(yǔ)料詞性標(biāo)注自動(dòng)校對(duì)方法的研究[J];中文信息學(xué)報(bào);2004年02期
7 張虎,鄭家恒,劉江;語(yǔ)料庫(kù)詞性標(biāo)注一致性檢查方法研究[J];中文信息學(xué)報(bào);2004年05期
8 呂琳,周世斌,劉玉樹(shù);一種高性能英文詞性標(biāo)注器的設(shè)計(jì)與實(shí)現(xiàn)[J];北京理工大學(xué)學(xué)報(bào);2005年10期
9 牛洪梅;吐?tīng)柛?伊不拉音;;維吾爾語(yǔ)的詞性標(biāo)注校對(duì)初探[J];微型電腦應(yīng)用;2006年12期
10 牛洪梅;加米拉·吾守爾;吐?tīng)柛ひ啦祭?;現(xiàn)代維吾爾語(yǔ)的詞性標(biāo)注校對(duì)技術(shù)研究[J];伊犁師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2007年01期
相關(guān)會(huì)議論文 前10條
1 劉婭瓊;;論漢語(yǔ)語(yǔ)文辭書(shū)詞性標(biāo)注[A];中國(guó)辭書(shū)學(xué)會(huì)第六屆中青年辭書(shū)工作者學(xué)術(shù)研討會(huì)論文集[C];2010年
2 姜尚仆;陳群秀;;基于規(guī)則和統(tǒng)計(jì)的日語(yǔ)分詞和詞性標(biāo)注的研究[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
3 通拉嘎;;漢、蒙、藏、維分詞與詞性標(biāo)注技術(shù)發(fā)展現(xiàn)狀研究[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年
4 李志江;;關(guān)于語(yǔ)文辭書(shū)詞性標(biāo)注的探討[A];中國(guó)辭書(shū)學(xué)文集[C];1998年
5 邢富坤;宋柔;;自動(dòng)詞性標(biāo)注中語(yǔ)法因素和詞匯因素對(duì)英漢語(yǔ)的不同影響[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
6 帕里旦·吐?tīng)栠d;艾山·吾買(mǎi)爾;吐?tīng)柛ひ啦祭?早克熱·卡德?tīng)?阿力木江·艾沙;;基于最大熵的維吾爾語(yǔ)詞性標(biāo)注模型[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
7 蘇祺;昝紅英;胡景賀;項(xiàng)錕;;詞性標(biāo)注對(duì)信息檢索系統(tǒng)性能的影響[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
8 張艷;徐波;;基于轉(zhuǎn)換的錯(cuò)誤學(xué)習(xí)方法的漢語(yǔ)詞性自動(dòng)標(biāo)注研究[A];輝煌二十年——中國(guó)中文信息學(xué)會(huì)二十周年學(xué)術(shù)會(huì)議論文集[C];2001年
9 溫鎖林;;漢語(yǔ)詞性自動(dòng)標(biāo)注軟件兼類詞鑒別規(guī)則庫(kù)的設(shè)計(jì)[A];世紀(jì)之交的中國(guó)應(yīng)用語(yǔ)言學(xué)研究——第二屆全國(guó)語(yǔ)言文字應(yīng)用學(xué)術(shù)研討會(huì)論文集[C];1998年
10 楊爾弘;方瑩;喬羽;;漢語(yǔ)自動(dòng)分詞和詞性標(biāo)注評(píng)測(cè)[A];第二屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2004年
相關(guān)博士學(xué)位論文 前2條
1 康才uo;藏語(yǔ)分詞與詞性標(biāo)注研究[D];上海師范大學(xué);2014年
2 華卻才讓;基于樹(shù)到串藏語(yǔ)機(jī)器翻譯若干關(guān)鍵技術(shù)研究[D];陜西師范大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 劉慧敏;中文詞性標(biāo)注及未登錄詞詞性預(yù)測(cè)研究[D];南京師范大學(xué);2015年
2 劉海峰;基于web語(yǔ)科庫(kù)的哈薩克語(yǔ)詞法分析[D];中央民族大學(xué);2015年
3 朱曉;古漢語(yǔ)編年體的人名實(shí)體識(shí)別與詞性標(biāo)注[D];復(fù)旦大學(xué);2012年
4 趙嘉億;中文詞性標(biāo)注中異構(gòu)數(shù)據(jù)問(wèn)題研究[D];復(fù)旦大學(xué);2014年
5 米爾阿迪力江·麥麥提;基于Morfessor的維吾爾語(yǔ)詞干提取和詞性標(biāo)注的研究[D];新疆大學(xué);2015年
6 努爾曙阿克·阿斯哈爾;哈薩克語(yǔ)詞性標(biāo)注軟件的開(kāi)發(fā)[D];新疆大學(xué);2015年
7 韓霞;基于半監(jiān)督隱馬爾科夫的漢語(yǔ)詞性標(biāo)注研究[D];大連理工大學(xué);2015年
8 趙梓鈞;“N+的+V”與相關(guān)的動(dòng)名兼類分歧詞考察[D];黑龍江大學(xué);2015年
9 洛桑嘎登;藏文自動(dòng)分詞與詞性標(biāo)注研究[D];中央民族大學(xué);2016年
10 楊蓓;老撾語(yǔ)分詞和詞性標(biāo)注方法研究[D];昆明理工大學(xué);2016年
,本文編號(hào):2474668
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2474668.html