基于詞向量的藏文詞性標(biāo)注方法研究
本文選題:詞向量 + 藏文 ; 參考:《中文信息學(xué)報(bào)》2017年01期
【摘要】:藏文詞性標(biāo)注是藏文信息處理的基礎(chǔ),在藏文文本分類(lèi)、自動(dòng)檢索、機(jī)器翻譯等領(lǐng)域有廣泛的應(yīng)用。該文針對(duì)藏文語(yǔ)料匱乏,人工標(biāo)注費(fèi)時(shí)費(fèi)力等問(wèn)題,提出一種基于詞向量模型的詞性標(biāo)注方法和相應(yīng)算法,該方法首先利用詞向量的語(yǔ)義近似計(jì)算功能,擴(kuò)展標(biāo)注詞典;其次結(jié)合語(yǔ)義近似計(jì)算和標(biāo)注詞典,完成詞性標(biāo)注。實(shí)驗(yàn)結(jié)果表明,該方法能夠快速有效地?cái)U(kuò)大了標(biāo)注詞典規(guī)模,并能取得較好的標(biāo)注結(jié)果。
[Abstract]:Tibetan part of speech tagging is the basis of Tibetan information processing. It is widely used in Tibetan text classification, automatic retrieval, machine translation and so on. In view of the shortage of Tibetan corpus and the time-consuming and laborious manual annotation, this paper presents a new method and algorithm of word vector model based on word vector model. Firstly, this method uses the semantic approximate computing function of word vector to expand the tagging dictionary. Secondly, the part of speech tagging is completed by combining semantic approximate calculation and tagging dictionary. The experimental results show that the proposed method can quickly and effectively enlarge the scale of tagging dictionaries and obtain better annotation results.
【作者單位】: 西藏大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系;西南交通大學(xué)信息科學(xué)與技術(shù)學(xué)院;
【基金】:國(guó)家自然基金(61262058) 國(guó)家社會(huì)科學(xué)基金(15ZDB11) 西藏高校青年教師創(chuàng)新支持計(jì)劃項(xiàng)目(QC2005_18) 高原學(xué)者計(jì)劃—珠杰
【分類(lèi)號(hào)】:TP391
【參考文獻(xiàn)】
相關(guān)期刊論文 前6條
1 洛桑嘎登;趙小兵;;藏文詞級(jí)處理研究現(xiàn)狀及熱點(diǎn)方法[J];電腦知識(shí)與技術(shù);2015年32期
2 華卻才讓;劉群;趙海興;;判別式藏語(yǔ)文本詞性標(biāo)注研究[J];中文信息學(xué)報(bào);2014年02期
3 于洪志;李亞超;汪昆;冷本扎西;;融合音節(jié)特征的最大熵藏文詞性標(biāo)注研究[J];中文信息學(xué)報(bào);2013年05期
4 扎西多杰;安見(jiàn)才讓;;基于HMM藏文詞性標(biāo)注的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)光盤(pán)軟件與應(yīng)用;2012年12期
5 扎西加;珠杰;;面向信息處理的藏文分詞規(guī)范研究[J];中文信息學(xué)報(bào);2009年04期
6 蘇俊峰;祁坤鈺;本太;;基于HMM的藏語(yǔ)語(yǔ)料庫(kù)詞性自動(dòng)標(biāo)注研究[J];西北民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年01期
相關(guān)會(huì)議論文 前1條
1 才讓加;吉太加;;藏語(yǔ)語(yǔ)料庫(kù)中詞性分類(lèi)代碼的確定[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
相關(guān)博士學(xué)位論文 前1條
1 康才uo;藏語(yǔ)分詞與詞性標(biāo)注研究[D];上海師范大學(xué);2014年
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 艾金勇;;面向信息處理的藏文文本規(guī)范化方法研究[J];西北師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2017年02期
2 陳小瑩;;現(xiàn)代藏文中黏著語(yǔ)的規(guī)范化處理[J];電腦與信息技術(shù);2017年01期
3 鄭亞楠;珠杰;;基于詞向量的藏文詞性標(biāo)注方法研究[J];中文信息學(xué)報(bào);2017年01期
4 陳小瑩;;藏文文本規(guī)范化處理研究[J];智能計(jì)算機(jī)與應(yīng)用;2016年06期
5 陳小瑩;;基于詞典庫(kù)的藏文黏著語(yǔ)規(guī)范化處理研究[J];西藏科技;2016年10期
6 江濤;于洪志;;一種面向藏文聚類(lèi)的文本建模方法[J];西北民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2016年03期
7 洛桑嘎登;趙小兵;;藏文詞級(jí)處理研究現(xiàn)狀及熱點(diǎn)方法[J];電腦知識(shí)與技術(shù);2015年32期
8 華卻才讓;趙海興;;藏文屏幕取詞和翻譯關(guān)鍵技術(shù)研究[J];青海師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2015年04期
9 李亞超;江靜;加羊吉;于洪志;;TIP-LAS:一個(gè)開(kāi)源的藏文分詞詞性標(biāo)注系統(tǒng)[J];中文信息學(xué)報(bào);2015年06期
10 高紅梅;仁青諾布;普次仁;;領(lǐng)域本體的藏文主題爬蟲(chóng)搜索策略研究[J];計(jì)算機(jī)應(yīng)用與軟件;2015年09期
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 于洪志;李亞超;汪昆;冷本扎西;;融合音節(jié)特征的最大熵藏文詞性標(biāo)注研究[J];中文信息學(xué)報(bào);2013年05期
2 吳若南;;強(qiáng)化企業(yè)民主管理 推動(dòng)轉(zhuǎn)型跨越發(fā)展[J];江淮法治;2013年09期
3 繆中平;;加強(qiáng)國(guó)有企業(yè)民主管理的幾點(diǎn)思考[J];現(xiàn)代營(yíng)銷(xiāo)(學(xué)苑版);2013年02期
4 劉超;;夯實(shí)企務(wù)公開(kāi)民主管理為企業(yè)和諧發(fā)展創(chuàng)造環(huán)境[J];科學(xué)之友;2013年02期
5 扎西多杰;安見(jiàn)才讓;;基于HMM藏文詞性標(biāo)注的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)光盤(pán)軟件與應(yīng)用;2012年12期
6 巴桑杰布;羊毛卓瑪;歐珠;;藏文分詞系統(tǒng)中緊縮格識(shí)別和藏字復(fù)原的算法研究[J];西藏科技;2012年02期
7 張貫虹;斯·勞格勞;烏達(dá)巴拉;;融合形態(tài)特征的最大熵蒙古文詞性標(biāo)注模型[J];計(jì)算機(jī)研究與發(fā)展;2011年12期
8 史曉東;盧亞軍;;央金藏文分詞系統(tǒng)[J];中文信息學(xué)報(bào);2011年04期
9 才智杰;;班智達(dá)藏文自動(dòng)分詞系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];青海師范大學(xué)民族師范學(xué)院學(xué)報(bào);2010年02期
10 才智杰;才讓卓瑪;;班智達(dá)藏文標(biāo)注詞典設(shè)計(jì)[J];中文信息學(xué)報(bào);2010年05期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 完么才讓;安見(jiàn)才讓;;藏語(yǔ)詞性標(biāo)注[J];信息與電腦(理論版);2013年08期
2 魏歐;孫玉芳;;漢語(yǔ)詞性標(biāo)注方法的研究[J];計(jì)算機(jī)科學(xué);2000年07期
3 王素格,張永奎;基于搭配模式的漢語(yǔ)詞性標(biāo)注規(guī)則的獲取方法[J];計(jì)算機(jī)工程與應(yīng)用;2001年05期
4 杜永萍,鄭家恒;分詞及詞性標(biāo)注一致性校對(duì)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];電腦開(kāi)發(fā)與應(yīng)用;2001年10期
5 劉健,鄭家恒;基于實(shí)例的詞性標(biāo)注方法研究[J];山西氣象;2001年02期
6 錢(qián)揖麗,鄭家恒;漢語(yǔ)語(yǔ)料詞性標(biāo)注自動(dòng)校對(duì)方法的研究[J];中文信息學(xué)報(bào);2004年02期
7 張虎,鄭家恒,劉江;語(yǔ)料庫(kù)詞性標(biāo)注一致性檢查方法研究[J];中文信息學(xué)報(bào);2004年05期
8 呂琳,周世斌,劉玉樹(shù);一種高性能英文詞性標(biāo)注器的設(shè)計(jì)與實(shí)現(xiàn)[J];北京理工大學(xué)學(xué)報(bào);2005年10期
9 牛洪梅;吐?tīng)柛?伊不拉音;;維吾爾語(yǔ)的詞性標(biāo)注校對(duì)初探[J];微型電腦應(yīng)用;2006年12期
10 牛洪梅;加米拉·吾守爾;吐?tīng)柛ひ啦祭?;現(xiàn)代維吾爾語(yǔ)的詞性標(biāo)注校對(duì)技術(shù)研究[J];伊犁師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2007年01期
相關(guān)會(huì)議論文 前10條
1 劉婭瓊;;論漢語(yǔ)語(yǔ)文辭書(shū)詞性標(biāo)注[A];中國(guó)辭書(shū)學(xué)會(huì)第六屆中青年辭書(shū)工作者學(xué)術(shù)研討會(huì)論文集[C];2010年
2 姜尚仆;陳群秀;;基于規(guī)則和統(tǒng)計(jì)的日語(yǔ)分詞和詞性標(biāo)注的研究[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
3 通拉嘎;;漢、蒙、藏、維分詞與詞性標(biāo)注技術(shù)發(fā)展現(xiàn)狀研究[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年
4 李志江;;關(guān)于語(yǔ)文辭書(shū)詞性標(biāo)注的探討[A];中國(guó)辭書(shū)學(xué)文集[C];1998年
5 邢富坤;宋柔;;自動(dòng)詞性標(biāo)注中語(yǔ)法因素和詞匯因素對(duì)英漢語(yǔ)的不同影響[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
6 帕里旦·吐?tīng)栠d;艾山·吾買(mǎi)爾;吐?tīng)柛ひ啦祭?早克熱·卡德?tīng)?阿力木江·艾沙;;基于最大熵的維吾爾語(yǔ)詞性標(biāo)注模型[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
7 蘇祺;昝紅英;胡景賀;項(xiàng)錕;;詞性標(biāo)注對(duì)信息檢索系統(tǒng)性能的影響[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
8 張艷;徐波;;基于轉(zhuǎn)換的錯(cuò)誤學(xué)習(xí)方法的漢語(yǔ)詞性自動(dòng)標(biāo)注研究[A];輝煌二十年——中國(guó)中文信息學(xué)會(huì)二十周年學(xué)術(shù)會(huì)議論文集[C];2001年
9 溫鎖林;;漢語(yǔ)詞性自動(dòng)標(biāo)注軟件兼類(lèi)詞鑒別規(guī)則庫(kù)的設(shè)計(jì)[A];世紀(jì)之交的中國(guó)應(yīng)用語(yǔ)言學(xué)研究——第二屆全國(guó)語(yǔ)言文字應(yīng)用學(xué)術(shù)研討會(huì)論文集[C];1998年
10 楊爾弘;方瑩;喬羽;;漢語(yǔ)自動(dòng)分詞和詞性標(biāo)注評(píng)測(cè)[A];第二屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2004年
相關(guān)博士學(xué)位論文 前2條
1 康才uo;藏語(yǔ)分詞與詞性標(biāo)注研究[D];上海師范大學(xué);2014年
2 華卻才讓;基于樹(shù)到串藏語(yǔ)機(jī)器翻譯若干關(guān)鍵技術(shù)研究[D];陜西師范大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 劉慧敏;中文詞性標(biāo)注及未登錄詞詞性預(yù)測(cè)研究[D];南京師范大學(xué);2015年
2 劉海峰;基于web語(yǔ)科庫(kù)的哈薩克語(yǔ)詞法分析[D];中央民族大學(xué);2015年
3 朱曉;古漢語(yǔ)編年體的人名實(shí)體識(shí)別與詞性標(biāo)注[D];復(fù)旦大學(xué);2012年
4 趙嘉億;中文詞性標(biāo)注中異構(gòu)數(shù)據(jù)問(wèn)題研究[D];復(fù)旦大學(xué);2014年
5 米爾阿迪力江·麥麥提;基于Morfessor的維吾爾語(yǔ)詞干提取和詞性標(biāo)注的研究[D];新疆大學(xué);2015年
6 努爾曙阿克·阿斯哈爾;哈薩克語(yǔ)詞性標(biāo)注軟件的開(kāi)發(fā)[D];新疆大學(xué);2015年
7 韓霞;基于半監(jiān)督隱馬爾科夫的漢語(yǔ)詞性標(biāo)注研究[D];大連理工大學(xué);2015年
8 趙梓鈞;“N+的+V”與相關(guān)的動(dòng)名兼類(lèi)分歧詞考察[D];黑龍江大學(xué);2015年
9 洛桑嘎登;藏文自動(dòng)分詞與詞性標(biāo)注研究[D];中央民族大學(xué);2016年
10 楊蓓;老撾語(yǔ)分詞和詞性標(biāo)注方法研究[D];昆明理工大學(xué);2016年
,本文編號(hào):1884234
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1884234.html