統(tǒng)計與規(guī)則相結(jié)合的維吾爾語人名識別方法
[Abstract]:Named entity recognition (Named entity recognition,NER) is an important task in natural language processing (Natural language processing,NLP). In this paper, the Uygur words are split from stem, syllable and string according to the adhesive characteristics of Uygur language, and a smaller language unit is obtained. The new unit of segmentation is added to the conditional random field (Conditional random field, as a feature. In CRF, the effect of data sparsity is alleviated obviously, and the performance of the method is better than that of the human name recognition method based on words. At the same time, based on the characteristics of Han nationality names in Uygur language, a rule-based recognition method of Han nationality names in Uygur language is proposed. Finally, the accuracy of recognition is further improved by combining statistics with rules. The experimental results show that the accuracy, recall rate and F1 value of this method are 87.47% and 88.29% respectively.
【作者單位】: 新疆大學信息科學與工程學院;中國科學院自動化研究所模式識別國家重點實驗室;新疆大學軟件學院;
【基金】:國家自然科學基金(61562081) 新疆高技術(shù)研究發(fā)展計劃(201312103)資助~~
【分類號】:TP391.1
【相似文獻】
相關(guān)期刊論文 前10條
1 ;中央電臺新疆維吾爾語編輯部開工建設(shè)[J];中國廣播;2010年06期
2 盛朝川;;維吾爾語專線廣播[J];新聞記者;1984年03期
3 艾山·吾買爾;吐爾根·依步拉音;;基于最大熵的維吾爾語句子邊界識別模型[J];計算機工程;2010年06期
4 王昆侖;張貫虹;吐爾洪江·阿布都克力木;;維吾爾語元音的聲頻特性分析和識別[J];中文信息學報;2010年02期
5 地里木拉提.吐爾遜;艾斯卡爾.艾木都拉;;維吾爾語中清化元音的實驗語音學研究[J];中文信息學報;2010年05期
6 丁玉忠;吾守爾·斯拉木;那斯爾江·吐爾遜;;基于垃圾模型的維吾爾語關(guān)鍵詞識別[J];現(xiàn)代計算機(專業(yè)版);2011年13期
7 塔世根·加帕爾,帕爾哈提·艾孜木,伊力亞斯·吐爾遜;維吾爾語地理學術(shù)語規(guī)范表達的必要性和緊迫性[J];術(shù)語標準化與信息技術(shù);1998年04期
8 阿麗葉.阿布列孜;;中央人民廣播電臺維吾爾語頻道《生活》欄目探析[J];新聞世界;2014年05期
9 哈妮克孜·伊拉洪;祖麗皮亞·阿曼;艾斯卡爾·艾木都拉;;維吾爾語單音節(jié)詞復(fù)輔音聲學分析[J];中文信息學報;2009年04期
10 劉改霞;;從《維吾爾語會話300句速成》談選題策劃的特性[J];新疆新聞出版;2010年05期
相關(guān)會議論文 前10條
1 吾買爾江·庫爾班;阿里甫·庫爾班;;維吾爾語框架語義知識庫語義角色描述體系研究[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學術(shù)研討會論文集[C];2010年
2 阿里甫·庫爾班;吾買爾江·庫爾班;尼加提·阿不都肉蘇力;;維吾爾語框架語義網(wǎng)的數(shù)據(jù)庫結(jié)構(gòu)的設(shè)計[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學術(shù)研討會論文集[C];2010年
3 古麗娜爾·艾力;買買提玉素甫·蘇來曼;;維吾爾語語音數(shù)據(jù)自動標注[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學術(shù)研討會論文集[C];2010年
4 阿布都熱依木·熱合曼;艾山·吾買爾;吐爾根·依布拉音;帕里旦·吐爾遜;哈里旦木·阿布都克里木;;維吾爾語句法樹庫標注體系[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學術(shù)研討會論文集[C];2010年
5 艾斯卡爾·艾木都拉;;維吾爾語鼻音的聲學特征分析[A];第九屆中國語音學學術(shù)會議論文集[C];2010年
6 梁潔;楊新璐;;維吾爾語韻律層級邊界感知及其聲學特征研究[A];第九屆中國語音學學術(shù)會議論文集[C];2010年
7 阿依克孜.卡德爾;開沙爾.卡德爾;吐爾根.依布拉音;;面向自然語言信息處理的維吾爾語名詞形態(tài)分析研究[A];第二屆全國學生計算語言學研討會論文集[C];2004年
8 吾守爾.斯拉木;馬歡;;維吾爾語文語轉(zhuǎn)換系統(tǒng)的研究[A];第十屆全國少數(shù)民族語言文字信息處理學術(shù)研討會論文集[C];2005年
9 易斌;;維吾爾語元音/y/的聲學特征分析[A];第十屆全國少數(shù)民族語言文字信息處理學術(shù)研討會論文集[C];2005年
10 艾斯卡爾·艾木都拉;賽爾達爾·雅力坤;祖麗皮亞·阿曼;地里木拉提·吐爾遜;;維吾爾語濁塞音的聲學特征分析[A];第十二屆全國人機語音通訊學術(shù)會議(NCMMSC'2013)論文集[C];2013年
相關(guān)重要報紙文章 前10條
1 記者井波、實習生郁萌;維吾爾語水平考試系統(tǒng)進入研發(fā)階段[N];新疆日報(漢);2010年
2 特約記者 藺高峰 通訊員 武瑞;女法醫(yī)“西日古麗”[N];喀什日報(漢);2010年
3 本報記者 任紅芳;阿克蘇電視臺維吾爾語譯制中心錄音棚投用[N];阿克蘇日報;2010年
4 一東;以多語種服務(wù)打造溝通新渠道[N];亞洲中心時報(漢);2011年
5 自治區(qū)地方志編委會、自治區(qū)黨委駐伽師縣工作隊 張堅義;語言架起溝通心靈的橋梁[N];新疆日報(漢);2012年
6 劉冰;從王蒙流利的維吾爾語想到的[N];中國民族報;2013年
7 記者 江亞平;搞分裂慌不擇言,熱比婭謊話連篇[N];新華每日電訊;2009年
8 陳學迅;王蒙談維吾爾民族語言文化[N];新疆日報(漢);2005年
9 記者 王新紅;中央人民廣播電臺新疆維吾爾語編輯部工程開建[N];新疆日報(漢);2010年
10 記者 達·照日格圖;我國首部蒙古文字手機研制成功[N];內(nèi)蒙古日報(漢);2006年
相關(guān)博士學位論文 前10條
1 阿布都那扎爾·阿布都拉;維吾爾語構(gòu)詞詞綴歷時比較研究[D];中央民族大學;2009年
2 巴克力·阿卜杜熱西提;古代維吾爾語醫(yī)學文獻的語文學研究[D];中央民族大學;2013年
3 倪宏鳴;維吾爾語和阿美語語言特征對比分析[D];中央民族大學;2007年
4 魏玉清;維吾爾語和諧現(xiàn)象的音系學研究[D];華東師范大學;2010年
5 尼加提·蘇皮;維吾爾語伊犁土語研究[D];中央民族大學;2010年
6 斯迪克江·伊布拉音;現(xiàn)代維吾爾語中的比喻研究[D];華東師范大學;2008年
7 阿克里·先木西;維吾爾語表語—系動詞謂語結(jié)構(gòu)[D];中央民族大學;2012年
8 吐爾遜·卡得;維吾爾語柯坪土語研究[D];中央民族大學;2011年
9 木再帕爾(Muzappar Abdurusul);論維吾爾語的名詞化短語[D];中央民族大學;2007年
10 席艷玲;維吾爾語失語癥特點及其檢查法的標準化研究和維吾爾族、漢族正常人腦激活區(qū)差異性的fMRI研究[D];新疆醫(yī)科大學;2013年
相關(guān)碩士學位論文 前10條
1 魏文娟;改革開放以來維吾爾語新詞研究[D];新疆大學;2008年
2 阿孜古麗·阿不都熱西提;維吾爾語伊犁土語中的借詞研究[D];西北民族大學;2008年
3 張紅;探析維吾爾語中茶文化[D];新疆師范大學;2012年
4 熱依拉·艾紕漏拉;漢語—維吾爾語顏色詞翻譯對比研究[D];中央民族大學;2013年
5 孔席梅;維吾爾語和回族話中借詞的分析比較[D];新疆師范大學;2013年
6 吾斯曼·艾買爾(Osman Emer);《五體清文鑒》中的近代維吾爾語動物名稱研究[D];伊犁師范學院;2015年
7 瑪依熱·吾司曼;漢維動力情態(tài)對比研究[D];中央民族大學;2015年
8 錢悅;漢語“V1著V2”結(jié)構(gòu)與維吾爾語相關(guān)表達方式對比研究[D];中央民族大學;2015年
9 奇曼古麗·許庫力;現(xiàn)代維吾爾語同義詞研究[D];中央民族大學;2015年
10 田媛瑋;漢語—維吾爾語五官詞匯的對比研究[D];中央民族大學;2015年
,本文編號:2341428
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2341428.html