基于DRIS系統(tǒng)中的中文自動分詞模塊設計與實現(xiàn)
本文關鍵詞:基于DRIS系統(tǒng)中的中文自動分詞模塊設計與實現(xiàn)
更多相關文章: DRIS系統(tǒng) 中文自動分詞 搜索引擎 正向最大匹配法
【摘要】:隨著信息檢索技術(shù)越來越受到人們的重視,其中的中文自動分詞技術(shù)就顯得越來越重要。計算機通過對文本中的詞語進行識別與處理,直接將結(jié)果傳送給搜索引擎進行檢索。文中在域內(nèi)資源整合系統(tǒng)(DRIS)的基礎上,設計并開發(fā)了一個全新的中文自動分詞模塊。通過算法的比對,選擇了正向匹配算法作為該模塊的基本算法,對其文件結(jié)構(gòu),中文詞典初始化及識別處理過程做出詳細介紹。經(jīng)后期使用后可比較出該模塊在檢索效率與服務質(zhì)量上都有了很大程度上的提高,達到了設計要求。
【作者單位】: 陜西職業(yè)技術(shù)學院;
【分類號】:TP391.1
【正文快照】: 隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,其應用的層面也越來越廣泛。這就直接導致了互聯(lián)網(wǎng)上的信息資源出現(xiàn)了迅速的膨脹和增長。隨著資源的不斷擴充,其管理及檢索服務逐漸無法滿足人們對速度及準確性等越來越高的要求;ヂ(lián)網(wǎng)在快速發(fā)展中產(chǎn)生的問題特別是在進行信息檢索時產(chǎn)生的問題與當
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 張大方,戴明堅;多遍掃描聯(lián)想自動分詞系統(tǒng)[J];微電子學與計算機;1991年03期
2 陳斌;;基于數(shù)學設計的計算機自動分詞算法[J];江西科學;2009年05期
3 王成平;;彝文自動分詞系統(tǒng)的設計與實現(xiàn)[J];中國西部科技;2012年03期
4 蘇惠明;;自動分詞模型中的歧義字段消除探討[J];價值工程;2012年09期
5 王成平;金騁;;基于既定詞表的彝文自動分詞技術(shù)研究[J];科學技術(shù)與工程;2012年10期
6 王成平;;計算機彝文自動分詞技術(shù)的設計研究[J];湘潭大學自然科學學報;2012年03期
7 梁南元;漢語計算機自動分詞知識[J];中文信息學報;1990年02期
8 楊長生,潘凌云;基于知識的漢語拼音自動分詞[J];浙江大學學報(自然科學版);1992年02期
9 張永奎,李國臣;新聞語料自動分詞系統(tǒng)[J];山西大學學報(自然科學版);1993年03期
10 楊憲澤;中文自動分詞探討[J];西南民族學院學報(自然科學版);1994年03期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 黃昌寧;高劍峰;李沐;;對自動分詞的反思[A];語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學聯(lián)合學術(shù)會議論文集[C];2003年
2 徐潤華;陳小荷;;一種利用注疏的《左傳》分詞新方法[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
3 黃昌寧;林娟;孫承杰;;何謂金本位[A];全國第八屆計算語言學聯(lián)合學術(shù)會議(JSCL-2005)論文集[C];2005年
4 陳曉;;中文文本自動分詞研究述要[A];第四屆全國語言文字應用學術(shù)研討會論文集[C];2005年
5 劉懷t,
本文編號:1177023
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1177023.html