天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

技術創(chuàng)新平臺—企業(yè)級搜索引擎搭建

發(fā)布時間:2017-10-07 17:10

  本文關鍵詞:技術創(chuàng)新平臺—企業(yè)級搜索引擎搭建


  更多相關文章: Solr Nutch 中文分詞 網(wǎng)頁爬蟲 搜索引擎


【摘要】:論述如何運用Nutch作為爬蟲爬取數(shù)據(jù)、Solr作為搜索引擎服務器實現(xiàn)索引、使用IKAnalyzer完成中文分詞來搭建一個企業(yè)級搜索引擎。并對定制技術創(chuàng)新平臺的搜索引擎需要解決的問題進行分析和提供解決方案。
【作者單位】: 云南電網(wǎng)有限責任公司電力科學研究院;昆明能訊科技有限責任公司;
【關鍵詞】Solr Nutch 中文分詞 網(wǎng)頁爬蟲 搜索引擎
【分類號】:TP391.3
【正文快照】: 0前言各種搜索引擎的功能側重不一樣,依靠單一的搜索引擎不能完全提供需要的信息,因此需要一種軟件或網(wǎng)站把各種搜索引擎無縫地融合在一起,智能搜索引擎是結合了人工智能技術的新一代搜索引擎。除了能提供傳統(tǒng)的快速檢索、相關度排序等功能,還能提供用戶角色登記、用戶興趣自

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前2條

1 王小正;侯青;;基于Nutch和Solr的基礎教育垂直搜索引擎的實現(xiàn)[J];電腦知識與技術;2012年04期

2 趙凱;王敏;;基于Solr的企業(yè)級搜索引擎的設計[J];電子世界;2013年22期

【共引文獻】

中國期刊全文數(shù)據(jù)庫 前1條

1 趙永鑫;張友華;辜麗川;胡嘉偉;陳瑩;;基于Nutch的農(nóng)村信息服務移動垂直搜索引擎研究[J];洛陽理工學院學報(自然科學版);2015年03期

【二級參考文獻】

中國期刊全文數(shù)據(jù)庫 前8條

1 楊曉江;李麗娟;田俊華;李藝;;面向基礎教育的Web資源垂直服務體系研究[J];中國遠程教育;2006年07期

2 丁偉;謝彥峰;張忠林;;一種基于用戶興趣的搜索引擎輸入信息處理方法[J];電腦與信息技術;2008年05期

3 張斌;周爾寧;;基于Nutch的分布式紡織垂直搜索引擎研究[J];電腦知識與技術;2009年21期

4 張敏;;中文垂直搜索引擎研究與實現(xiàn)[J];福建電腦;2010年06期

5 潘濤;梁正友;;Nutch中網(wǎng)頁排序效果的改進方法[J];計算機工程;2010年13期

6 申晉;;基于Lucene和Nutch的林業(yè)垂直搜索引擎的研建[J];農(nóng)業(yè)網(wǎng)絡信息;2008年04期

7 李明濤;羅軍勇;尹美娟;路林;;結合詞義的文本特征詞權重計算方法[J];計算機應用;2012年05期

8 王超;李書琴;肖紅;;基于本體的旱區(qū)農(nóng)業(yè)垂直搜索引擎研究[J];農(nóng)機化研究;2013年08期

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 程傳鵬;;一種簡單高效的中文分詞方法[J];鄭州輕工業(yè)學院學報;2006年03期

2 張博;姜建國;萬平國;;對互聯(lián)網(wǎng)環(huán)境下中文分詞系統(tǒng)的一種架構改進[J];計算機應用研究;2006年11期

3 夏新松;肖建國;;一種新的錯誤驅動學習方法在中文分詞中的應用[J];計算機科學;2006年03期

4 周軍;王艷紅;;一種基于詞典的中文分詞法的設計與實現(xiàn)[J];黑龍江科技信息;2008年25期

5 許高建;胡學鋼;路遙;王慶人;;一種改進的中文分詞歧義消除算法研究[J];合肥工業(yè)大學學報(自然科學版);2008年10期

6 張培穎;;運用有向圖進行中文分詞研究[J];計算機工程與應用;2009年22期

7 吳晶晶;荊繼武;聶曉峰;王平建;;一種快速中文分詞詞典機制[J];中國科學院研究生院學報;2009年05期

8 許華;;中文分詞系統(tǒng)設計之詞典構造[J];科技創(chuàng)新導報;2010年20期

9 韓月陽;鄧世昆;賈時銀;李遠方;;基于字分類的中文分詞的研究[J];計算機技術與發(fā)展;2011年07期

10 莫建文;鄭陽;首照宇;張順嵐;;改進的基于詞典的中文分詞方法[J];計算機工程與設計;2013年05期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 王敏;葉寬余;薛峰;;一種面向網(wǎng)店商品搜索的中文分詞系統(tǒng)設計[A];全國第22屆計算機技術與應用學術會議(CACIS·2011)暨全國第3屆安全關鍵技術與應用(SCA·2011)學術會議論文摘要集[C];2011年

2 黃昌寧;趙海;;由字構詞——中文分詞新方法[A];中文信息處理前沿進展——中國中文信息學會二十五周年學術會議論文集[C];2006年

3 黃居仁;;瓶頸,挑戰(zhàn),與轉機:中文分詞研究的新思維[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年

4 任飛亮;石磊;姚天順;;應用支持向量機進行中文分詞[A];全國第八屆計算語言學聯(lián)合學術會議(JSCL-2005)論文集[C];2005年

5 吳晶晶;荊繼武;王平建;;一種基于詞典的新型中文分詞機制[A];全國網(wǎng)絡與信息安全技術研討會論文集(上冊)[C];2007年

6 李玉梅;靳光瑾;黃昌寧;;中文分詞規(guī)范中的歧義字段消解細則[A];第五屆全國語言文字應用學術研討會論文集[C];2007年

7 修馳;宋柔;;基于“大詞”實例的中文分詞研究[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年

8 趙海;揭春雨;;基于子串標注的中文分詞:尋找更佳的標注單元[A];內(nèi)容計算的研究與應用前沿——第九屆全國計算語言學學術會議論文集[C];2007年

9 李壽山;黃居仁;;基于詞邊界分類的中文分詞方法[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年

10 張梅山;鄧知龍;車萬翔;劉挺;;統(tǒng)計與詞典相結合的領域自適應中文分詞[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年

中國重要報紙全文數(shù)據(jù)庫 前4條

1 本報記者 張彤;讓計算機說中國話[N];網(wǎng)絡世界;2004年

2 清華大學IT可用性實驗室;2005中文搜索引擎質(zhì)量對比[N];計算機世界;2005年

3 蔡勇邋北京師范大學珠海分校軟件研究所所長助理;讓中藥查詢省時省力[N];科技日報;2007年

4 記者 楊朝暉;醫(yī)藥搜索:不再“眾里尋他千百度”[N];科技日報;2007年

中國博士學位論文全文數(shù)據(jù)庫 前3條

1 修馳;適應于不同領域的中文分詞方法研究與實現(xiàn)[D];北京工業(yè)大學;2013年

2 何嘉;基于遺傳算法優(yōu)化的中文分詞研究[D];電子科技大學;2012年

3 李志國;面向分布式文本知識管理的中文分詞與文本分類研究[D];重慶大學;2008年

中國碩士學位論文全文數(shù)據(jù)庫 前10條

1 曹衛(wèi)峰;中文分詞關鍵技術研究[D];南京理工大學;2009年

2 許順;中文分詞規(guī)范可計算化的研究與實現(xiàn)[D];蘇州大學;2006年

3 王荔;統(tǒng)計全切分中文分詞系統(tǒng)的研究與實現(xiàn)[D];西安電子科技大學;2009年

4 魏博誠;中文分詞交集型歧義處理研究[D];安徽大學;2011年

5 代聰;基于英漢平行語料的中文分詞研究與應用[D];大連理工大學;2012年

6 黃翼彪;開源中文分詞器的比較研究[D];鄭州大學;2013年

7 許華婷;基于Active Learning的中文分詞領域自適應方法的研究[D];北京交通大學;2015年

8 王為磊;基于多目標優(yōu)化的中文分詞模型的研究[D];蘇州大學;2008年

9 王靖;基于機械切分和標注的中文分詞研究[D];湖南大學;2009年

10 劉春輝;基于優(yōu)化最大匹配的中文分詞方法研究[D];燕山大學;2009年

,

本文編號:989049

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/989049.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶eb40a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com