天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于Lucene的中文分詞系統(tǒng)設(shè)計與實現(xiàn)

發(fā)布時間:2017-07-20 23:18

  本文關(guān)鍵詞:基于Lucene的中文分詞系統(tǒng)設(shè)計與實現(xiàn)


  更多相關(guān)文章: 中文分詞 搜索引擎 檢索詞典 基于Lucene


【摘要】:隨著信息技術(shù)的不斷發(fā)展,中文分詞的應(yīng)用越來越廣泛,例如搜索引擎、機器翻譯等領(lǐng)域。論文介紹了對未識別部分采取檢索詞典的方法;對介詞副詞詞典、姓氏詞典和后綴詞詞典先檢索,再處理介詞、副詞、姓名和后綴詞等,處理完后再將剩余部分輸出單字等。設(shè)計并實現(xiàn)了一個基于Lucene的中文分詞系統(tǒng),系統(tǒng)運行良好,能對待切分的文本進行相對正確、快速的切分,系統(tǒng)輸出的結(jié)果基本符合預(yù)期的目標。
【作者單位】: 陜西郵電職業(yè)技術(shù)學(xué)院;
【關(guān)鍵詞】中文分詞 搜索引擎 檢索詞典 基于Lucene
【分類號】:TP391.1
【正文快照】: 0引言Lucene[1]是一個基于Java語言的全文信息檢索框架,它提供了一個框架。Lucene提供了org.apache.Lucene.analysis包,這是它的語言分析器[2]。Analyzer是一個抽象類,它定義了對文本內(nèi)容的切分詞規(guī)則。切分后返回一個Token Stream,有一個重要的方法next(),即收到下一個詞。通

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 張博;姜建國;萬平國;;對互聯(lián)網(wǎng)環(huán)境下中文分詞系統(tǒng)的一種架構(gòu)改進[J];計算機應(yīng)用研究;2006年11期

2 夏新松;肖建國;;一種新的錯誤驅(qū)動學(xué)習(xí)方法在中文分詞中的應(yīng)用[J];計算機科學(xué);2006年03期

3 周軍;王艷紅;;一種基于詞典的中文分詞法的設(shè)計與實現(xiàn)[J];黑龍江科技信息;2008年25期

4 許高建;胡學(xué)鋼;路遙;王慶人;;一種改進的中文分詞歧義消除算法研究[J];合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版);2008年10期

5 張培穎;;運用有向圖進行中文分詞研究[J];計算機工程與應(yīng)用;2009年22期

6 吳晶晶;荊繼武;聶曉峰;王平建;;一種快速中文分詞詞典機制[J];中國科學(xué)院研究生院學(xué)報;2009年05期

7 許華;;中文分詞系統(tǒng)設(shè)計之詞典構(gòu)造[J];科技創(chuàng)新導(dǎo)報;2010年20期

8 韓月陽;鄧世昆;賈時銀;李遠方;;基于字分類的中文分詞的研究[J];計算機技術(shù)與發(fā)展;2011年07期

9 莫建文;鄭陽;首照宇;張順嵐;;改進的基于詞典的中文分詞方法[J];計算機工程與設(shè)計;2013年05期

10 李慶虎,陳玉健,孫家廣;一種中文分詞詞典新機制——雙字哈希機制[J];中文信息學(xué)報;2003年04期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 王敏;葉寬余;薛峰;;一種面向網(wǎng)店商品搜索的中文分詞系統(tǒng)設(shè)計[A];全國第22屆計算機技術(shù)與應(yīng)用學(xué)術(shù)會議(CACIS·2011)暨全國第3屆安全關(guān)鍵技術(shù)與應(yīng)用(SCA·2011)學(xué)術(shù)會議論文摘要集[C];2011年

2 黃昌寧;趙海;;由字構(gòu)詞——中文分詞新方法[A];中文信息處理前沿進展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C];2006年

3 任飛亮;石磊;姚天順;;應(yīng)用支持向量機進行中文分詞[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

4 吳晶晶;荊繼武;王平建;;一種基于詞典的新型中文分詞機制[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會論文集(上冊)[C];2007年

5 李玉梅;靳光瑾;黃昌寧;;中文分詞規(guī)范中的歧義字段消解細則[A];第五屆全國語言文字應(yīng)用學(xué)術(shù)研討會論文集[C];2007年

6 修馳;宋柔;;基于“大詞”實例的中文分詞研究[A];中國計算語言學(xué)研究前沿進展(2009-2011)[C];2011年

7 黃居仁;;瓶頸,挑戰(zhàn),與轉(zhuǎn)機:中文分詞研究的新思維[A];中國計算機語言學(xué)研究前沿進展(2007-2009)[C];2009年

8 李壽山;黃居仁;;基于詞邊界分類的中文分詞方法[A];中國計算機語言學(xué)研究前沿進展(2007-2009)[C];2009年

9 張梅山;鄧知龍;車萬翔;劉挺;;統(tǒng)計與詞典相結(jié)合的領(lǐng)域自適應(yīng)中文分詞[A];中國計算語言學(xué)研究前沿進展(2009-2011)[C];2011年

10 王屹林;朱慕華;朱靖波;;針對SVM中文分詞特性的個性化后處理設(shè)計[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 王荔;統(tǒng)計全切分中文分詞系統(tǒng)的研究與實現(xiàn)[D];西安電子科技大學(xué);2009年

2 黃翼彪;開源中文分詞器的比較研究[D];鄭州大學(xué);2013年

3 許華婷;基于Active Learning的中文分詞領(lǐng)域自適應(yīng)方法的研究[D];北京交通大學(xué);2015年

4 周祺;基于統(tǒng)計與詞典相結(jié)合的中文分詞的研究與實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2015年

5 曹衛(wèi)峰;中文分詞關(guān)鍵技術(shù)研究[D];南京理工大學(xué);2009年

6 許順;中文分詞規(guī)范可計算化的研究與實現(xiàn)[D];蘇州大學(xué);2006年

7 魏博誠;中文分詞交集型歧義處理研究[D];安徽大學(xué);2011年

8 代聰;基于英漢平行語料的中文分詞研究與應(yīng)用[D];大連理工大學(xué);2012年

9 顧輝;基于中文分詞的購物中心微信平臺購物導(dǎo)航的設(shè)計與實現(xiàn)[D];華中師范大學(xué);2015年

10 王為磊;基于多目標優(yōu)化的中文分詞模型的研究[D];蘇州大學(xué);2008年

,

本文編號:570472

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/570472.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c45a4***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
久久国产青偷人人妻潘金莲| 日本av在线不卡一区| 日韩精品福利在线观看| 欧美大胆女人的大胆人体| 欧美日韩国产福利在线观看| 欧美在线观看视频三区| 日韩欧美一区二区不卡看片| 国产不卡的视频在线观看| 日韩精品一区二区三区射精 | 熟妇久久人妻中文字幕| 熟女中文字幕一区二区三区| 99久热只有精品视频免费看| 国产精品日韩欧美一区二区| 激情综合五月开心久久| 亚洲精品欧美精品一区三区| 国产女同精品一区二区| 开心久久综合激情五月天| 免费黄色一区二区三区| 国产精品白丝一区二区| 婷婷伊人综合中文字幕| 成人午夜激情免费在线| 久久热这里只有精品视频| 午夜亚洲精品理论片在线观看 | 中文人妻精品一区二区三区四区 | 黄色片一区二区在线观看| 久久精品色妇熟妇丰满人妻91 | 亚洲伦片免费偷拍一区| 国产亚洲中文日韩欧美综合网| 日本一本不卡免费视频| 在线免费国产一区二区| 粗暴蹂躏中文一区二区三区| 日本在线视频播放91| 国产高清三级视频在线观看| 中文字幕有码视频熟女| 黄色国产精品一区二区三区| 欧美胖熟妇一区二区三区| 国产日韩欧美在线亚洲| 真实国产乱子伦对白视频不卡| 欧美激情中文字幕综合八区| 欧美在线视频一区观看| 日韩在线免费看中文字幕|