天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

針對(duì)中國(guó)學(xué)生英文文章的詞性標(biāo)注方法

發(fā)布時(shí)間:2019-05-11 16:41
【摘要】:提出了一種基于詞向量的兩層詞性標(biāo)注方法,使用少量人工提取的特征,大部分特征可使用詞向量和第1層標(biāo)注向量自動(dòng)訓(xùn)練得到.該方法將標(biāo)注集分成兩類,分別作為不同層的標(biāo)注集.首先,對(duì)容易標(biāo)注的類別進(jìn)行標(biāo)注;然后,對(duì)難以標(biāo)注的動(dòng)詞或者名詞進(jìn)行第2層標(biāo)注,將其標(biāo)注為具體的某類動(dòng)詞或名詞.利用該方法對(duì)中國(guó)學(xué)生寫(xiě)的英語(yǔ)文章進(jìn)行詞性標(biāo)注的準(zhǔn)確率可從95.23%提高到95.63%,超過(guò)了現(xiàn)有基于詞向量詞性標(biāo)注器對(duì)相同語(yǔ)料詞性標(biāo)注的準(zhǔn)確率.
[Abstract]:A two-layer part-of-speech tagging method based on word vector is proposed in this paper. A small number of manually extracted features are used. Most of the features can be obtained by automatic training of word vectors and layer 1 tagging vectors. In this method, the dimension set is divided into two categories, which are used as the dimension set of different layers. First, the categories which are easy to be labeled are labeled, and then the verbs or nouns which are difficult to be labeled are labeled at the second level, and they are labeled as specific verbs or nouns. The accuracy of part-of-speech tagging of English articles written by Chinese students can be improved from 95.23% to 95.63%, which exceeds the accuracy of the existing part-of-speech tagging of the same corpus based on word vector tagging.
【作者單位】: 北京郵電大學(xué)智能科學(xué)與技術(shù)中心;
【分類號(hào)】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 完么才讓;安見(jiàn)才讓;;藏語(yǔ)詞性標(biāo)注[J];信息與電腦(理論版);2013年08期

2 魏歐;孫玉芳;;漢語(yǔ)詞性標(biāo)注方法的研究[J];計(jì)算機(jī)科學(xué);2000年07期

3 王素格,張永奎;基于搭配模式的漢語(yǔ)詞性標(biāo)注規(guī)則的獲取方法[J];計(jì)算機(jī)工程與應(yīng)用;2001年05期

4 杜永萍,鄭家恒;分詞及詞性標(biāo)注一致性校對(duì)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];電腦開(kāi)發(fā)與應(yīng)用;2001年10期

5 劉健,鄭家恒;基于實(shí)例的詞性標(biāo)注方法研究[J];山西氣象;2001年02期

6 錢(qián)揖麗,鄭家恒;漢語(yǔ)語(yǔ)料詞性標(biāo)注自動(dòng)校對(duì)方法的研究[J];中文信息學(xué)報(bào);2004年02期

7 張虎,鄭家恒,劉江;語(yǔ)料庫(kù)詞性標(biāo)注一致性檢查方法研究[J];中文信息學(xué)報(bào);2004年05期

8 呂琳,周世斌,劉玉樹(shù);一種高性能英文詞性標(biāo)注器的設(shè)計(jì)與實(shí)現(xiàn)[J];北京理工大學(xué)學(xué)報(bào);2005年10期

9 牛洪梅;吐?tīng)柛?伊不拉音;;維吾爾語(yǔ)的詞性標(biāo)注校對(duì)初探[J];微型電腦應(yīng)用;2006年12期

10 牛洪梅;加米拉·吾守爾;吐?tīng)柛ひ啦祭?;現(xiàn)代維吾爾語(yǔ)的詞性標(biāo)注校對(duì)技術(shù)研究[J];伊犁師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2007年01期

相關(guān)會(huì)議論文 前10條

1 劉婭瓊;;論漢語(yǔ)語(yǔ)文辭書(shū)詞性標(biāo)注[A];中國(guó)辭書(shū)學(xué)會(huì)第六屆中青年辭書(shū)工作者學(xué)術(shù)研討會(huì)論文集[C];2010年

2 姜尚仆;陳群秀;;基于規(guī)則和統(tǒng)計(jì)的日語(yǔ)分詞和詞性標(biāo)注的研究[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

3 通拉嘎;;漢、蒙、藏、維分詞與詞性標(biāo)注技術(shù)發(fā)展現(xiàn)狀研究[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年

4 李志江;;關(guān)于語(yǔ)文辭書(shū)詞性標(biāo)注的探討[A];中國(guó)辭書(shū)學(xué)文集[C];1998年

5 邢富坤;宋柔;;自動(dòng)詞性標(biāo)注中語(yǔ)法因素和詞匯因素對(duì)英漢語(yǔ)的不同影響[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

6 帕里旦·吐?tīng)栠d;艾山·吾買(mǎi)爾;吐?tīng)柛ひ啦祭?早克熱·卡德?tīng)?阿力木江·艾沙;;基于最大熵的維吾爾語(yǔ)詞性標(biāo)注模型[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年

7 蘇祺;昝紅英;胡景賀;項(xiàng)錕;;詞性標(biāo)注對(duì)信息檢索系統(tǒng)性能的影響[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年

8 張艷;徐波;;基于轉(zhuǎn)換的錯(cuò)誤學(xué)習(xí)方法的漢語(yǔ)詞性自動(dòng)標(biāo)注研究[A];輝煌二十年——中國(guó)中文信息學(xué)會(huì)二十周年學(xué)術(shù)會(huì)議論文集[C];2001年

9 溫鎖林;;漢語(yǔ)詞性自動(dòng)標(biāo)注軟件兼類詞鑒別規(guī)則庫(kù)的設(shè)計(jì)[A];世紀(jì)之交的中國(guó)應(yīng)用語(yǔ)言學(xué)研究——第二屆全國(guó)語(yǔ)言文字應(yīng)用學(xué)術(shù)研討會(huì)論文集[C];1998年

10 楊爾弘;方瑩;喬羽;;漢語(yǔ)自動(dòng)分詞和詞性標(biāo)注評(píng)測(cè)[A];第二屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2004年

相關(guān)博士學(xué)位論文 前2條

1 康才uo;藏語(yǔ)分詞與詞性標(biāo)注研究[D];上海師范大學(xué);2014年

2 華卻才讓;基于樹(shù)到串藏語(yǔ)機(jī)器翻譯若干關(guān)鍵技術(shù)研究[D];陜西師范大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 劉慧敏;中文詞性標(biāo)注及未登錄詞詞性預(yù)測(cè)研究[D];南京師范大學(xué);2015年

2 劉海峰;基于web語(yǔ)科庫(kù)的哈薩克語(yǔ)詞法分析[D];中央民族大學(xué);2015年

3 朱曉;古漢語(yǔ)編年體的人名實(shí)體識(shí)別與詞性標(biāo)注[D];復(fù)旦大學(xué);2012年

4 趙嘉億;中文詞性標(biāo)注中異構(gòu)數(shù)據(jù)問(wèn)題研究[D];復(fù)旦大學(xué);2014年

5 米爾阿迪力江·麥麥提;基于Morfessor的維吾爾語(yǔ)詞干提取和詞性標(biāo)注的研究[D];新疆大學(xué);2015年

6 努爾曙阿克·阿斯哈爾;哈薩克語(yǔ)詞性標(biāo)注軟件的開(kāi)發(fā)[D];新疆大學(xué);2015年

7 韓霞;基于半監(jiān)督隱馬爾科夫的漢語(yǔ)詞性標(biāo)注研究[D];大連理工大學(xué);2015年

8 趙梓鈞;“N+的+V”與相關(guān)的動(dòng)名兼類分歧詞考察[D];黑龍江大學(xué);2015年

9 洛桑嘎登;藏文自動(dòng)分詞與詞性標(biāo)注研究[D];中央民族大學(xué);2016年

10 楊蓓;老撾語(yǔ)分詞和詞性標(biāo)注方法研究[D];昆明理工大學(xué);2016年

,

本文編號(hào):2474668

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2474668.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fb18b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com