天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于字典的藏文分詞系統(tǒng)實現(xiàn)研究

發(fā)布時間:2019-03-11 07:47
【摘要】:隨著對語言文字信息處理研究工作的不斷加深,藏文信息處理技術(shù)也逐漸從字信息處理走向了語言信息處理。跟日語、漢語、韓語等語種的信息處理相同,藏文自動分詞(Tibetan Automatic Word Segmentation)是藏文信息處理中的一項必不可少的基礎(chǔ)性工作,在此基礎(chǔ)上才能劃分短語、抽取概念以及分析主題,以至自然語言理解,最終實現(xiàn)智能化。對于不同應(yīng)用環(huán)境,藏文自動分詞需要采用最合適的算法,本文通過對藏語語料的統(tǒng)計分析和藏語詞的分布特點、語法功能的研究,提出了設(shè)計開發(fā)基于詞典庫的藏文自動分詞系統(tǒng),力求為藏文輸入法研究、藏文電子詞典建設(shè)、藏文字詞頻統(tǒng)計、搜索引擎的設(shè)計和實現(xiàn)、機器翻譯系統(tǒng)的開發(fā)、網(wǎng)絡(luò)信息安全、藏文語料庫建設(shè)以及藏語語義分析研究奠定基礎(chǔ)。
[Abstract]:With the deepening of the research work on language information processing, Tibetan information processing technology has gradually changed from word information processing to language information processing. Like the information processing of Japanese, Chinese, Korean and other languages, Tibetan automatic word segmentation (Tibetan Automatic Word Segmentation) is an essential basic work in Tibetan information processing. On this basis, we can divide phrases, extract concepts and analyze topics. Even natural language understanding, finally to achieve intelligence. For different application environments, Tibetan automatic word segmentation needs to adopt the most suitable algorithm. Through the statistical analysis of Tibetan language data, the distribution characteristics of Tibetan words and the study of grammatical function, This paper puts forward the design and development of Tibetan automatic word segmentation system based on lexicon database, which aims at the research of Tibetan input method, the construction of Tibetan electronic dictionary, the statistics of Tibetan word frequency, the design and implementation of search engine, and the development of machine translation system. The network information security, the construction of Tibetan corpus and the research of Tibetan semantic analysis lay the foundation.
【作者單位】: 西藏大學(xué)藏文信息技術(shù)研究中心;西南交通大學(xué)信息科學(xué)與技術(shù)學(xué)院;
【基金】:2011年度國家自然科學(xué)基金項目“基于群體智能涌現(xiàn)的藏文網(wǎng)絡(luò)輿情分析及突發(fā)事件預(yù)警機制研究”(項目編號:61165013)階段性成果
【分類號】:TP311.52;TP391.1

【參考文獻】

相關(guān)期刊論文 前5條

1 才智杰;才讓卓瑪;;藏文自動分詞系統(tǒng)的設(shè)計[J];計算機工程與科學(xué);2011年05期

2 吳旭東;;正向最大匹配分詞算法的分析與改進[J];科技傳播;2011年20期

3 關(guān)白;;信息處理用藏文分詞單位研究[J];中文信息學(xué)報;2010年03期

4 向暉;郭一平;王亮;;基于Lucene的中文字典分詞模塊的設(shè)計與實現(xiàn)[J];現(xiàn)代圖書情報技術(shù);2006年08期

5 祁坤鈺;;基于國際標準編碼系統(tǒng)的藏文分詞詞典機制研究[J];西北民族大學(xué)學(xué)報(自然科學(xué)版);2010年04期

【共引文獻】

相關(guān)期刊論文 前10條

1 蔡兵;胡敏;;基于Lucene2.0的書目搜索引擎設(shè)計[J];重慶圖情研究;2009年01期

2 任惠靜;;基于Lucene的面向主題搜索引擎的索引技術(shù)的研究[J];電腦知識與技術(shù);2010年04期

3 郭若男;王晶;沈奇威;;基于HBase的實時消息推薦系統(tǒng)[J];電信工程技術(shù)與標準化;2014年11期

4 汪濤;;論基于Java的全文檢索實現(xiàn)和索引性能提高[J];湖北民族學(xué)院學(xué)報(自然科學(xué)版);2009年01期

5 宋佳;諸云強;劉潤達;;一種基于Lucene改進的全文檢索工具包[J];計算機工程與應(yīng)用;2008年04期

6 索紅光;孫鑫;;針對中文檢索的Lucene改進策略[J];計算機應(yīng)用與軟件;2009年06期

7 姜鑫;余平;;基于Lucene的音視頻資源檢索系統(tǒng)的研究與實現(xiàn)[J];計算機應(yīng)用與軟件;2011年11期

8 趙旭;王慶樺;;向LUCENE搜索引擎中加入中文同義詞查詢[J];科技信息;2011年07期

9 張麗媛;;1984—2011年中國自動分詞研究綜述[J];農(nóng)業(yè)圖書情報學(xué)刊;2012年06期

10 關(guān)白;才科扎西;;現(xiàn)代藏文音節(jié)字自動校對研究[J];計算機工程與應(yīng)用;2012年29期

相關(guān)會議論文 前1條

1 蘇亮;孫斌;;一種基于Lucene的Hash改進中文分詞算法的實現(xiàn)[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會議論文集(上冊)[C];2007年

相關(guān)博士學(xué)位論文 前2條

1 馬玉濤;在線客戶評論的產(chǎn)品族設(shè)計與加工方法研究[D];華中科技大學(xué);2012年

2 華卻才讓;基于樹到串藏語機器翻譯若干關(guān)鍵技術(shù)研究[D];陜西師范大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 張盛蕾;基于Java的浙江紡織服裝學(xué)院校園網(wǎng)搜索引擎[D];電子科技大學(xué);2010年

2 習(xí)明;基于WEB的社區(qū)智能醫(yī)療服務(wù)系統(tǒng)的研究[D];吉林農(nóng)業(yè)大學(xué);2011年

3 羅會紅;基于SSH和Lucene垂直搜索引擎研究[D];長沙理工大學(xué);2011年

4 徐晴;Web數(shù)據(jù)抽取技術(shù)及應(yīng)用[D];華東理工大學(xué);2012年

5 葉繼平;基于Lucene的全文信息檢索技術(shù)的研究與應(yīng)用[D];江南大學(xué);2012年

6 劉京會;基于ISG平臺的定位服務(wù)系統(tǒng)的研究[D];對外經(jīng)濟貿(mào)易大學(xué);2007年

7 劉琳;校園網(wǎng)搜索引擎系統(tǒng)的設(shè)計與實現(xiàn)[D];山東大學(xué);2007年

8 李文澤;個性化垂直搜索引擎研究[D];河南大學(xué);2007年

9 宋國柱;基于Agent的個性化信息服務(wù)關(guān)鍵技術(shù)研究[D];太原理工大學(xué);2007年

10 吳兵華;基于深度網(wǎng)絡(luò)的信息檢索模型研究[D];武漢理工大學(xué);2008年

【二級參考文獻】

相關(guān)期刊論文 前10條

1 胡錫衡;;正向最大匹配法在中文分詞技術(shù)中的應(yīng)用[J];鞍山師范學(xué)院學(xué)報;2008年02期

2 陳玉忠,俞士汶;藏文信息處理技術(shù)的研究現(xiàn)狀與展望[J];中國藏學(xué);2003年04期

3 趙汀,孟祥武;基于LUCENEAPI的中文全文數(shù)據(jù)庫設(shè)計與實現(xiàn)[J];計算機工程與應(yīng)用;2003年20期

4 劉遷;賈惠波;;中文信息處理中自動分詞技術(shù)的研究與展望[J];計算機工程與應(yīng)用;2006年03期

5 賀勝;曲維光;許超;;面向中文自動分詞的可擴展式電子詞典研究[J];計算機工程與應(yīng)用;2008年21期

6 孫茂松,左正平,黃昌寧;漢語自動分詞詞典機制的實驗研究[J];中文信息學(xué)報;2000年01期

7 俞士汶,朱學(xué)鋒,段慧明;大規(guī)模現(xiàn)代漢語標注語料庫的加工規(guī)范[J];中文信息學(xué)報;2000年06期

8 楊文峰,陳光英,李星;基于PATRICIA tree的漢語自動分詞詞典機制[J];中文信息學(xué)報;2001年03期

9 陳玉忠,李保利,俞士汶;藏文自動分詞系統(tǒng)的設(shè)計與實現(xiàn)[J];中文信息學(xué)報;2003年03期

10 李慶虎,陳玉健,孫家廣;一種中文分詞詞典新機制——雙字哈希機制[J];中文信息學(xué)報;2003年04期

【相似文獻】

相關(guān)期刊論文 前10條

1 杜超華;胡金柱;沈威;姚雙云;;基于復(fù)句語料庫分詞系統(tǒng)研究[J];計算機與數(shù)字工程;2007年05期

2 李小龍;;基于統(tǒng)計的分詞系統(tǒng)字典模型研究[J];湖北工業(yè)大學(xué)學(xué)報;2010年05期

3 羅智勇;宋柔;;現(xiàn)代漢語通用分詞系統(tǒng)中歧義切分的實用技術(shù)[J];計算機研究與發(fā)展;2006年06期

4 婁s,

本文編號:2438095


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2438095.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b44cc***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com