基于DRIS系統(tǒng)中的中文自動分詞模塊設(shè)計(jì)與實(shí)現(xiàn)
本文關(guān)鍵詞:基于DRIS系統(tǒng)中的中文自動分詞模塊設(shè)計(jì)與實(shí)現(xiàn)
更多相關(guān)文章: DRIS系統(tǒng) 中文自動分詞 搜索引擎 正向最大匹配法
【摘要】:隨著信息檢索技術(shù)越來越受到人們的重視,其中的中文自動分詞技術(shù)就顯得越來越重要。計(jì)算機(jī)通過對文本中的詞語進(jìn)行識別與處理,直接將結(jié)果傳送給搜索引擎進(jìn)行檢索。文中在域內(nèi)資源整合系統(tǒng)(DRIS)的基礎(chǔ)上,設(shè)計(jì)并開發(fā)了一個全新的中文自動分詞模塊。通過算法的比對,選擇了正向匹配算法作為該模塊的基本算法,對其文件結(jié)構(gòu),中文詞典初始化及識別處理過程做出詳細(xì)介紹。經(jīng)后期使用后可比較出該模塊在檢索效率與服務(wù)質(zhì)量上都有了很大程度上的提高,達(dá)到了設(shè)計(jì)要求。
【作者單位】: 陜西職業(yè)技術(shù)學(xué)院;
【分類號】:TP391.1
【正文快照】: 隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,其應(yīng)用的層面也越來越廣泛。這就直接導(dǎo)致了互聯(lián)網(wǎng)上的信息資源出現(xiàn)了迅速的膨脹和增長。隨著資源的不斷擴(kuò)充,其管理及檢索服務(wù)逐漸無法滿足人們對速度及準(zhǔn)確性等越來越高的要求�;ヂ�(lián)網(wǎng)在快速發(fā)展中產(chǎn)生的問題特別是在進(jìn)行信息檢索時產(chǎn)生的問題與當(dāng)
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張大方,戴明堅(jiān);多遍掃描聯(lián)想自動分詞系統(tǒng)[J];微電子學(xué)與計(jì)算機(jī);1991年03期
2 陳斌;;基于數(shù)學(xué)設(shè)計(jì)的計(jì)算機(jī)自動分詞算法[J];江西科學(xué);2009年05期
3 王成平;;彝文自動分詞系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];中國西部科技;2012年03期
4 蘇惠明;;自動分詞模型中的歧義字段消除探討[J];價值工程;2012年09期
5 王成平;金騁;;基于既定詞表的彝文自動分詞技術(shù)研究[J];科學(xué)技術(shù)與工程;2012年10期
6 王成平;;計(jì)算機(jī)彝文自動分詞技術(shù)的設(shè)計(jì)研究[J];湘潭大學(xué)自然科學(xué)學(xué)報(bào);2012年03期
7 梁南元;漢語計(jì)算機(jī)自動分詞知識[J];中文信息學(xué)報(bào);1990年02期
8 楊長生,潘凌云;基于知識的漢語拼音自動分詞[J];浙江大學(xué)學(xué)報(bào)(自然科學(xué)版);1992年02期
9 張永奎,李國臣;新聞?wù)Z料自動分詞系統(tǒng)[J];山西大學(xué)學(xué)報(bào)(自然科學(xué)版);1993年03期
10 楊憲澤;中文自動分詞探討[J];西南民族學(xué)院學(xué)報(bào)(自然科學(xué)版);1994年03期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 黃昌寧;高劍峰;李沐;;對自動分詞的反思[A];語言計(jì)算與基于內(nèi)容的文本處理——全國第七屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2003年
2 徐潤華;陳小荷;;一種利用注疏的《左傳》分詞新方法[A];中國計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
3 黃昌寧;林娟;孫承杰;;何謂金本位[A];全國第八屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年
4 陳曉;;中文文本自動分詞研究述要[A];第四屆全國語言文字應(yīng)用學(xué)術(shù)研討會論文集[C];2005年
5 劉懷t,
本文編號:1177023
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1177023.html