基于Lucene的中文字典分詞模塊的設(shè)計(jì)與實(shí)現(xiàn)
本文選題:搜索引擎 + Lucene ; 參考:《現(xiàn)代圖書情報(bào)技術(shù)》2006年08期
【摘要】:在分析Lucene語言分析器結(jié)構(gòu)的基礎(chǔ)上,采用基于中文字典的正向最大匹配分詞算法,設(shè)計(jì)實(shí)現(xiàn)能夠在基于Lucene的搜索引擎中處理中文信息的中文分詞模塊。
[Abstract]:On the basis of analyzing the structure of Lucene language analyzer, a Chinese word segmentation module which can deal with Chinese information in search engine based on Lucene is designed and implemented by using the forward maximum matching segmentation algorithm based on Chinese dictionary.
【作者單位】: 華中科技大學(xué)控制科學(xué)與工程系 華中科技大學(xué)圖書館 華中科技大學(xué)控制科學(xué)與工程系
【分類號(hào)】:TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 劉遷;賈惠波;;中文信息處理中自動(dòng)分詞技術(shù)的研究與展望[J];計(jì)算機(jī)工程與應(yīng)用;2006年03期
2 李慶虎,陳玉健,孫家廣;一種中文分詞詞典新機(jī)制——雙字哈希機(jī)制[J];中文信息學(xué)報(bào);2003年04期
3 高琰,谷士文,譚立球,費(fèi)耀平;基于Lucene的搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[J];微機(jī)發(fā)展;2004年10期
4 郭輝,蘇中義,王文 ,崔駿;一種改進(jìn)的MM分詞算法[J];微型電腦應(yīng)用;2002年01期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 于源,衣襲;中文全切分快速分詞方法[J];大連鐵道學(xué)院學(xué)報(bào);2005年02期
2 吳靜,蔡砥,王錚;地理信息系統(tǒng)中自然語言查詢的分詞處理與應(yīng)用[J];地球信息科學(xué);2005年03期
3 溫艷鴻;;基于lucene的文件搜索引擎的設(shè)計(jì)與擴(kuò)展[J];福建電腦;2007年08期
4 潘以鋒;;基于Lucene的網(wǎng)站全文檢索系統(tǒng)的開發(fā)[J];廣西教育學(xué)院學(xué)報(bào);2006年05期
5 韓正服;楊喜權(quán);張一鳴;叢榮華;;基于特征碼的大規(guī)模XML文檔去重研究[J];中國(guó)管理信息化(綜合版);2006年07期
6 蔣斌;楊超;趙歡;;基于二字詞位圖表的漢語自動(dòng)分詞詞典機(jī)制[J];湖南大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年01期
7 馬哲,姚敏;一種改進(jìn)的基于PATRICIA樹的漢語自動(dòng)分詞詞典機(jī)制[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年S1期
8 翟鳳文;赫楓齡;左萬利;;基于統(tǒng)計(jì)規(guī)則的交集型歧義處理方法[J];吉林大學(xué)學(xué)報(bào)(理學(xué)版);2006年02期
9 唐培麗,胡明,張勇;基于中文文本主題提取的分詞方法研究[J];吉林工程技術(shù)師范學(xué)院學(xué)報(bào);2005年02期
10 費(fèi)洪曉;胡海苗;鞏燕玲;;基于Hash結(jié)構(gòu)的機(jī)械統(tǒng)計(jì)分詞系統(tǒng)研究[J];計(jì)算機(jī)工程與應(yīng)用;2006年05期
相關(guān)博士學(xué)位論文 前8條
1 孫越恒;基于統(tǒng)計(jì)的NLP技術(shù)在中文信息檢索中的應(yīng)用研究[D];天津大學(xué);2005年
2 楊雨圖;支持雙語的協(xié)同CAPP系統(tǒng)若干關(guān)鍵技術(shù)研究[D];南京航空航天大學(xué);2006年
3 劉濤;現(xiàn)代信息檢索中的文本分類及圖像恢復(fù)研究[D];北京郵電大學(xué);2006年
4 楊傳耀;中文信息檢索索引模型及相關(guān)技術(shù)研究[D];復(fù)旦大學(xué);2007年
5 顏端武;面向知識(shí)服務(wù)的智能推薦系統(tǒng)研究[D];南京理工大學(xué);2007年
6 常娥;古籍智能處理技術(shù)研究[D];南京農(nóng)業(yè)大學(xué);2007年
7 何琳;古農(nóng)學(xué)本體的半自動(dòng)構(gòu)建及檢索研究[D];南京農(nóng)業(yè)大學(xué);2007年
8 胡燕;基于Web信息抽取的專業(yè)知識(shí)獲取方法研究[D];武漢理工大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 袁亮;一個(gè)基于WEB的信息組織與檢索模型(WIORS)研究[D];武漢大學(xué);2005年
2 張旭潔;基于語義網(wǎng)絡(luò)的類自然語言的知識(shí)獲取與轉(zhuǎn)換的研究[D];云南師范大學(xué);2006年
3 潘景劍;具有中文人名識(shí)別功能的漢語自動(dòng)分詞算法研究[D];河北工業(yè)大學(xué);2006年
4 王倩倩;基于覆蓋算法的中文垃圾郵件過濾[D];安徽大學(xué);2007年
5 劉軍;基于論點(diǎn)傾向的網(wǎng)絡(luò)信息內(nèi)容實(shí)時(shí)分析研究[D];四川大學(xué);2003年
6 劉鋼;基于神經(jīng)網(wǎng)絡(luò)的文本分類系統(tǒng)NNTCS的設(shè)計(jì)和實(shí)現(xiàn)[D];中國(guó)科學(xué)院研究生院(軟件研究所);2003年
7 王丁;基于中文文本分類的自動(dòng)診病系統(tǒng)[D];哈爾濱理工大學(xué);2003年
8 于波;中文全文檢索技術(shù)研究[D];華中師范大學(xué);2003年
9 馬哲;垃圾郵件過濾系統(tǒng)的研究與實(shí)現(xiàn)[D];浙江大學(xué);2005年
10 楊才峰;基于自動(dòng)分類的元搜索引擎的研究與應(yīng)用[D];華北電力大學(xué)(河北);2005年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 湛燕,陳昊,袁方,王熙照;基于中文文本分類的分詞方法研究[J];計(jì)算機(jī)工程與應(yīng)用;2003年23期
2 張濱,晏蒲柳,李文翔,夏德麟;基于漢語句模的中文分詞算法[J];計(jì)算機(jī)工程;2004年01期
3 孫茂松,肖明,鄒嘉彥;基于無指導(dǎo)學(xué)習(xí)策略的無詞表?xiàng)l件下的漢語自動(dòng)分詞[J];計(jì)算機(jī)學(xué)報(bào);2004年06期
4 揭春雨 ,劉源 ,梁南元;論漢語自動(dòng)分詞方法[J];中文信息學(xué)報(bào);1989年01期
5 駱正清,陳增武,胡上序;一種改進(jìn)的MM分詞方法的算法設(shè)計(jì)[J];中文信息學(xué)報(bào);1996年03期
6 孫茂松,左正平,黃昌寧;漢語自動(dòng)分詞詞典機(jī)制的實(shí)驗(yàn)研究[J];中文信息學(xué)報(bào);2000年01期
7 李蓉,劉少輝,葉世偉,史忠植;基于SVM和k-NN結(jié)合的漢語交集型歧義切分方法[J];中文信息學(xué)報(bào);2001年06期
8 雷西川,余靖維,盧曉玲;基于相鄰知識(shí)的漢語自動(dòng)分詞系統(tǒng)研究[J];情報(bào)科學(xué);1994年01期
9 郭祥昊,鐘義信,楊麗;基于兩字詞簇的漢語快速自動(dòng)分詞算法[J];情報(bào)學(xué)報(bào);1998年05期
10 亢臨生,張永奎;基于標(biāo)記的分詞算法[J];山西大學(xué)學(xué)報(bào)(自然科學(xué)版);1994年03期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 朱海豐;秦杰;;基于Lucene與JSF的搜索引擎[J];福建電腦;2008年10期
2 劉敏娜;葛萌;陳娟;;基于Lucene的全文搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[J];福建電腦;2009年05期
3 侯云;;構(gòu)建基于Lucene的網(wǎng)站站內(nèi)搜索[J];信息與電腦(理論版);2010年02期
4 溫艷鴻;;基于lucene的文件搜索引擎的設(shè)計(jì)與擴(kuò)展[J];福建電腦;2007年08期
5 劉建湘;楊文濤;;基于Lucene的搜索引擎在Struts中的應(yīng)用[J];軟件導(dǎo)刊;2007年03期
6 孟祥成;;基于Lucene和Heritrix技術(shù)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];中國(guó)現(xiàn)代教育裝備;2010年03期
7 任曉娜;;基于Lucene的全文搜索引擎的研究與實(shí)現(xiàn)[J];湖北廣播電視大學(xué)學(xué)報(bào);2010年05期
8 張春燕;劉發(fā)升;;關(guān)于Lucene索引工具的性能優(yōu)化研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年05期
9 嚴(yán)良達(dá);;基于Lucene搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];寧波職業(yè)技術(shù)學(xué)院學(xué)報(bào);2009年02期
10 趙旭;王慶樺;;向LUCENE搜索引擎中加入中文同義詞查詢[J];科技信息;2011年07期
相關(guān)會(huì)議論文 前10條
1 彭軻;廖聞劍;;淺析搜索引擎[A];中國(guó)通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年
2 鄧長(zhǎng)壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國(guó)數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
3 倪俊峰;;基于黃頁搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2005年
4 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2010年
5 陳援非;何哲;朱珍民;;基于普適計(jì)算的個(gè)性化搜索技術(shù)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第2屆中國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC'06)論文集[C];2006年
6 楊萌;李春麗;朱明;;網(wǎng)絡(luò)搜索技術(shù)下的編輯工作[A];學(xué)報(bào)編輯論叢(第十一集)[C];2003年
7 陳磊;茹立云;馬少平;;基于用戶日志挖掘的搜索引擎廣告效果分析[A];第四屆全國(guó)學(xué)生計(jì)算語言學(xué)研討會(huì)會(huì)議論文集[C];2008年
8 申琪君;;電子地圖搜索引擎比較[A];中國(guó)地理學(xué)會(huì)2007年學(xué)術(shù)年會(huì)論文摘要集[C];2007年
9 岑榮偉;劉奕群;張敏;茹立云;馬少平;;網(wǎng)絡(luò)搜索引擎用戶行為分析和研究[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
10 薩曉靜;;網(wǎng)絡(luò)化生存下的圖書館改革之路[A];福建省圖書館學(xué)會(huì)2008年學(xué)術(shù)年會(huì)論文集[C];2008年
相關(guān)重要報(bào)紙文章 前10條
1 博文邋譯;你的隱私 搜索引擎知道[N];計(jì)算機(jī)世界;2007年
2 楊潔;搜索引擎營(yíng)銷市場(chǎng)生變[N];中國(guó)計(jì)算機(jī)報(bào);2007年
3 劉文君;搜索引擎也在尋求創(chuàng)新[N];大眾科技報(bào);2007年
4 ;法國(guó)挑戰(zhàn)谷歌推出衛(wèi)星地圖搜索引擎[N];人民日?qǐng)?bào);2006年
5 MirrorCity.net技術(shù)總監(jiān) 姚浩;讓搜索引擎回歸最初夢(mèng)想[N];中國(guó)文化報(bào);2008年
6 本報(bào)記者 操秀英;國(guó)雙科技以技術(shù)加服務(wù)贏得市場(chǎng)[N];科技日?qǐng)?bào);2009年
7 趙敏;“魚群理論”破解搜索營(yíng)銷謎局[N];中國(guó)企業(yè)報(bào);2007年
8 本報(bào)記者 樊哲高;搜索引擎三國(guó)紛爭(zhēng) 中文市場(chǎng)兩軍對(duì)壘[N];中國(guó)電子報(bào);2009年
9 EndTo;優(yōu)化Meta討好搜索引擎[N];電腦報(bào);2009年
10 本報(bào)記者 馬文方;Yebol:從思維科學(xué)導(dǎo)出搜索引擎[N];中國(guó)計(jì)算機(jī)報(bào);2010年
相關(guān)博士學(xué)位論文 前10條
1 岑榮偉;基于用戶行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年
2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
4 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年
5 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
7 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年
8 白玉琪;空間信息搜索引擎研究[D];中國(guó)科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
9 費(fèi)巍;搜索引擎檢索功能的性能評(píng)價(jià)研究[D];武漢大學(xué);2010年
10 黃河;農(nóng)業(yè)復(fù)雜自適應(yīng)搜索模型研究及實(shí)現(xiàn)[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 聞崢;基于Lucene的搜索引擎優(yōu)化[D];北京交通大學(xué);2011年
2 張彬;基于lucene的搜索引擎[D];上海師范大學(xué);2010年
3 徐財(cái)應(yīng);基于Lucene的搜索引擎技術(shù)的研究與改進(jìn)[D];長(zhǎng)春理工大學(xué);2010年
4 楊曉丹;基于Lucene的主題搜索引擎模板的設(shè)計(jì)與實(shí)現(xiàn)[D];浙江工商大學(xué);2011年
5 李建林;基于Lucene的Web搜索引擎的研究[D];蘭州理工大學(xué);2010年
6 尉建興;基于Lucene搜索引擎的研究與應(yīng)用[D];太原理工大學(xué);2011年
7 潘亭瀝;基于Lucene的面向商業(yè)應(yīng)用的搜索引擎研究與實(shí)現(xiàn)[D];電子科技大學(xué);2007年
8 何世林;基于Java技術(shù)的搜索引擎研究與實(shí)現(xiàn)[D];西南交通大學(xué);2006年
9 王冬坡;基于Lucene的主題搜索引擎的研究與實(shí)現(xiàn)[D];河北科技大學(xué);2010年
10 馮斌;基于Lucene小型搜索引擎的研究與實(shí)現(xiàn)[D];武漢理工大學(xué);2008年
,本文編號(hào):1739252
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1739252.html