少數(shù)民族語言文字網(wǎng)站的自動(dòng)識(shí)別和采集
本文選題:少數(shù)民族語言文字 + 網(wǎng)站; 參考:《計(jì)算機(jī)科學(xué)》2015年S1期
【摘要】:分析了少數(shù)民族語言文字網(wǎng)站的特殊性,綜合采用基于特殊字符、網(wǎng)頁標(biāo)簽屬性和N-gram的方法對(duì)傳統(tǒng)蒙古文、藏文、阿拉伯字母體系的維吾爾文、哈薩克文和柯爾克孜文以及彝文、新傣文、朝鮮文、俄文和壯文等10種少數(shù)民族語言文字網(wǎng)站進(jìn)行了自動(dòng)識(shí)別研究。所提方法對(duì)10種少數(shù)民族語言文字網(wǎng)站的平均正確識(shí)別率達(dá)到95%以上,效果令人滿意。
[Abstract]:This paper analyzes the particularity of the language and language websites of ethnic minorities, and combines the methods of special characters based on special characters, web label attributes and N-gram to the traditional Mongolian, Tibetan, Arabia alphabet Uygur, Kazakhstan and Kirgiz, Yi, new Dai, Korean, Russian and Zhuang. An automatic recognition study was conducted. The average correct recognition rate of the proposed method for 10 kinds of ethnic language website is over 95%, and the result is satisfactory.
【作者單位】: 中央民族大學(xué)理學(xué)院;中央民族大學(xué)信息工程學(xué)院;中央民族大學(xué)少數(shù)民族語言文學(xué)系;
【基金】:中央民族大學(xué)2014年校級(jí)自主科研項(xiàng)目(2014MDLXYZY04)資助
【分類號(hào)】:TP393.092;TP391.4
【共引文獻(xiàn)】
相關(guān)期刊論文 前2條
1 薛中奇;維尼拉·木沙江;趙麗紅;;維吾爾文搜索引擎中的壓縮技術(shù)[J];電腦知識(shí)與技術(shù);2011年27期
2 戴遠(yuǎn)君;徐海;;電子詞典研究現(xiàn)狀與展望[J];辭書研究;2014年04期
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 確精扎布,那順烏日?qǐng)D;關(guān)于蒙古文編碼(上)[J];內(nèi)蒙古大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);1994年04期
相關(guān)碩士學(xué)位論文 前1條
1 敖登巴拉;蒙古文變形顯現(xiàn)字符到名義字符轉(zhuǎn)換的研究與實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2010年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 魏傳忠,倫立廣,楊杰,田恩深,康燕齡,趙良剛,劉艷華,陳亦農(nóng),徐波,李成榮,張翠鳳,楊永良,屈韶琳,夏明磊,曹杰文,李峰;入境健康檢疫申明卡自動(dòng)識(shí)別通關(guān)系統(tǒng)的研究[J];檢驗(yàn)檢疫科學(xué);2004年03期
2 李莉;自動(dòng)識(shí)別的新紀(jì)元[J];現(xiàn)代制造;2004年19期
3 趙岷;;中國自動(dòng)識(shí)別產(chǎn)業(yè)進(jìn)入快速發(fā)展期[J];信息與電腦;2005年02期
4 ;開創(chuàng)中國自動(dòng)識(shí)別產(chǎn)業(yè)的新局面——中國自動(dòng)識(shí)別技術(shù)協(xié)會(huì)第二屆會(huì)員代表大會(huì)在北京召開[J];金卡工程;2005年03期
5 ;高效可靠的自動(dòng)識(shí)別[J];現(xiàn)代制造;2005年03期
6 王艷春;李建軍;何鵬;尹明;;公路交通管理中行駛車輛自動(dòng)識(shí)別技術(shù)研究[J];微計(jì)算機(jī)信息;2006年02期
7 黃宇紅;;運(yùn)用自動(dòng)識(shí)別技術(shù)提高煙草物流效益[J];物流科技;2006年03期
8 ;自動(dòng)識(shí)別[J];金卡工程;2006年05期
9 矯云起;;創(chuàng)刊詞[J];中國自動(dòng)識(shí)別技術(shù);2006年01期
10 王云爭;王明磊;;自動(dòng)識(shí)別技術(shù)在食品安全中的集成與應(yīng)用綜述[J];中國自動(dòng)識(shí)別技術(shù);2006年02期
相關(guān)會(huì)議論文 前10條
1 謝江;;自動(dòng)識(shí)別技術(shù)在稱重系統(tǒng)中的應(yīng)用[A];首屆全國稱重技術(shù)研討會(huì)論文集[C];1999年
2 邵金陵;何艷;趙榮椿;任金昌;;計(jì)算機(jī)對(duì)顱頜面影像的自動(dòng)識(shí)別研究[A];第六屆全國生物醫(yī)學(xué)體視學(xué)學(xué)術(shù)會(huì)議暨第九屆全軍軍事病理學(xué)學(xué)術(shù)會(huì)議、第五屆全軍定量病理學(xué)學(xué)術(shù)會(huì)議論文匯編[C];2005年
3 楊宇航;鄭德權(quán);于浩;趙鐵軍;;基于內(nèi)容分析的作弊評(píng)論自動(dòng)識(shí)別[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)論文集(上冊)[C];2007年
4 買志玉;趙丹;昝紅英;張坤麗;;基于例句語料庫的現(xiàn)代漢語方位詞用法自動(dòng)識(shí)別研究[A];第五屆全國青年計(jì)算語言學(xué)研討會(huì)論文集[C];2010年
5 周麗娟;張坤麗;袁應(yīng)成;昝紅英;;基于規(guī)則的現(xiàn)代漢語連詞用法自動(dòng)識(shí)別研究[A];第五屆全國青年計(jì)算語言學(xué)研討會(huì)論文集[C];2010年
6 朱霞;陳俊斌;肖書成;黃永強(qiáng);姚曉玲;;自動(dòng)識(shí)別技術(shù)應(yīng)用于軍用物資包裝標(biāo)志的探討[A];二十一世紀(jì)的中國包裝——學(xué)術(shù)討論會(huì)論文集[C];2000年
7 王玉崗;胡包鋼;鐘振民;莊順萬;;樂曲節(jié)拍的實(shí)時(shí)自動(dòng)識(shí)別研究與系統(tǒng)開發(fā)[A];2001年中國智能自動(dòng)化會(huì)議論文集(上冊)[C];2001年
8 馮敏萱;;數(shù)量結(jié)構(gòu)的自動(dòng)識(shí)別方案[A];第二屆全國學(xué)生計(jì)算語言學(xué)研討會(huì)論文集[C];2004年
9 任柯昱;唐丹;尹顯東;;特定圖像內(nèi)容的自動(dòng)識(shí)別與過濾系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[A];第二屆全國信息與電子工程學(xué)術(shù)交流會(huì)暨第十三屆四川省電子學(xué)會(huì)曙光分會(huì)學(xué)術(shù)年會(huì)論文集[C];2006年
10 韓裕生;王潤生;;航片中丘陵田的自動(dòng)識(shí)別研究[A];1998年中國智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(下冊)[C];1998年
相關(guān)重要報(bào)紙文章 前9條
1 周文豪;讓自動(dòng)識(shí)別技術(shù)的作用更強(qiáng)勁[N];中國包裝報(bào);2012年
2 劉洪;認(rèn)識(shí)自動(dòng)識(shí)別技術(shù)[N];中國商報(bào);2004年
3 本報(bào)記者 何立中;伍德蘭:自動(dòng)識(shí)別技術(shù)的先驅(qū)[N];中國計(jì)算機(jī)報(bào);2012年
4 通訊員 姚蓓邋記者 秦宵喊;表格自動(dòng)識(shí)別為出口退稅提速[N];南京日?qǐng)?bào);2008年
5 記者 蔡成剛;人民出版社探索語義自動(dòng)識(shí)別技術(shù)獲得可喜成果[N];今日信息報(bào);2010年
6 吳勇毅;物聯(lián)網(wǎng)自動(dòng)識(shí)別技術(shù)的發(fā)展趨勢與市場機(jī)遇[N];中國冶金報(bào);2010年
7 ;海關(guān)啟用“電眼”[N];國際經(jīng)貿(mào)消息;2000年
8 記者 周愛娟 實(shí)習(xí)記者 林瑋 通訊員 任小斌;河南:自動(dòng)識(shí)別車牌 有效遏制逃費(fèi)[N];中國交通報(bào);2010年
9 李廣進(jìn);現(xiàn)場指紋輸入計(jì)算機(jī)的新方法[N];人民公安報(bào);2004年
相關(guān)博士學(xué)位論文 前4條
1 周芳;焦炭顯微光學(xué)組織自動(dòng)識(shí)別關(guān)鍵技術(shù)研究[D];合肥工業(yè)大學(xué);2011年
2 劉德營;稻飛虱自動(dòng)識(shí)別關(guān)鍵技術(shù)的研究[D];南京農(nóng)業(yè)大學(xué);2011年
3 辛動(dòng)軍;彩色地形圖要素的自動(dòng)識(shí)別與獲取研究[D];南京理工大學(xué);2007年
4 王朝莉;基于橫截面圖像分析的纖維異形度的指標(biāo)表征和異形纖維種類的自動(dòng)識(shí)別[D];東華大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 周溢輝;基于規(guī)則與統(tǒng)計(jì)的語氣詞用法自動(dòng)識(shí)別研究[D];鄭州大學(xué);2011年
2 周麗娟;現(xiàn)代漢語連詞用法的自動(dòng)識(shí)別及應(yīng)用研究[D];鄭州大學(xué);2012年
3 張騰飛;介詞用法自動(dòng)識(shí)別及其在信息抽取中的應(yīng)用研究[D];鄭州大學(xué);2013年
4 張軍琿;基于統(tǒng)計(jì)的常用漢語副詞用法自動(dòng)識(shí)別研究[D];鄭州大學(xué);2010年
5 高彩紅;心電信號(hào)臨床信息的自動(dòng)識(shí)別研究[D];江蘇大學(xué);2010年
6 徐愛群;檔案自動(dòng)識(shí)別與存取技術(shù)研究及其自動(dòng)檔案庫系統(tǒng)設(shè)計(jì)[D];浙江大學(xué);2003年
7 楊學(xué)輝;基于自動(dòng)識(shí)別并支持多人協(xié)同工作的預(yù)算系統(tǒng)模型[D];浙江大學(xué);2003年
8 劉銳;基于規(guī)則的現(xiàn)代漢語副詞用法自動(dòng)識(shí)別研究[D];鄭州大學(xué);2009年
9 李茂兵;電成像測井自動(dòng)識(shí)別和定量評(píng)價(jià)研究[D];中國石油大學(xué);2010年
10 左航;測井曲線的自動(dòng)識(shí)別與提取[D];四川大學(xué);2003年
,本文編號(hào):2007549
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2007549.html