基于Nutch的節(jié)能減排垂直搜索引擎設計與實現(xiàn)
本文關鍵詞:基于Nutch的節(jié)能減排垂直搜索引擎設計與實現(xiàn)
更多相關文章: 節(jié)能減排 垂直搜索引擎 Nutch 向量空間模型 樸素貝葉斯
【摘要】:為提高搜索引擎檢索節(jié)能減排領域信息的準確度,在研究垂直搜索引擎的設計思想和相關技術的基礎上,利用Nutch開源框架設計實現(xiàn)節(jié)能減排垂直搜索引擎。采用網(wǎng)頁模板技術對網(wǎng)頁信息進行提取,利用改進的TF-IDF算法進行特征詞表示,采用基于特征詞的向量空間模型進行主題相關性判定,利用樸素貝葉斯分類算法對網(wǎng)頁信息進行分類。實驗結果表明,該搜索引擎可有效對節(jié)能減排的相關信息進行檢索。
【作者單位】: 安徽工業(yè)大學計算機學院;中國標準化研究院資源與環(huán)境分院;
【關鍵詞】: 節(jié)能減排 垂直搜索引擎 Nutch 向量空間模型 樸素貝葉斯
【基金】:國家科技支撐計劃基金項目(2012BAK30B04)
【分類號】:TP391.3
【正文快照】: 0引言目前已經(jīng)有許多專家學者面向不同領域設計和研發(fā)出各具特色的垂直搜索引擎。比如,劉運強[1]設計實現(xiàn)了一個檢索手機信息的垂直搜索引擎;周鵬等[2]設計實現(xiàn)了一個檢索農(nóng)業(yè)信息的垂直搜索引擎。本文采用Nutch框架,設計實現(xiàn)了一個檢索節(jié)能減排信息的垂直搜索引擎。為了提高N
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前9條
1 李學明;李海瑞;薛亮;何光軍;;基于信息增益與信息熵的TFIDF算法[J];計算機工程;2012年08期
2 黃劍韜;;基于商空間的向量空間模型文本分類方法[J];計算機應用;2011年S2期
3 施Oz;王恒山;肖仰華;丁衛(wèi)平;;面向主題的垂直搜索引擎系統(tǒng)的研究與實現(xiàn)[J];微電子學與計算機;2011年07期
4 張亞萍;陳得寶;侯俊欽;楊一軍;;樸素貝葉斯分類算法的改進及應用[J];計算機工程與應用;2011年15期
5 邵秀麗;劉彬;張濤;;基于Nutch的垂直搜索引擎的設計和實現(xiàn)[J];計算機工程與設計;2011年02期
6 張雯;張化祥;;屬性加權的樸素貝葉斯集成分類器[J];計算機工程與應用;2010年29期
7 劉運強;;垂直搜索引擎的研究與設計[J];計算機應用與軟件;2010年07期
8 施聰鶯;徐朝軍;楊曉江;;TFIDF算法研究綜述[J];計算機應用;2009年S1期
9 周鵬;吳華瑞;趙春江;楊寶祝;朱華吉;;基于Nutch農(nóng)業(yè)搜索引擎的研究與設計[J];計算機工程與設計;2009年03期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 袁志祥;張飛;鮑威;孫國華;劉明;;基于Nutch的節(jié)能減排垂直搜索引擎設計與實現(xiàn)[J];計算機工程與設計;2016年09期
2 石雁;李朝鋒;;基于協(xié)同相似計算的查詢推薦[J];計算機工程;2016年08期
3 張輝宜;謝業(yè)名;袁志祥;孫國華;;一種基于概率的卡方特征選擇方法[J];計算機工程;2016年08期
4 郭靜;陳澤亞;王慶;;基于關鍵詞網(wǎng)絡的熱點關鍵詞及熱點項目挖掘[J];計算機應用與軟件;2016年08期
5 呂愿愿;鄧永莉;劉明亮;崔宇佳;陸起涌;;利用實體與依存句法結構特征的病歷短文本分類方法[J];中國醫(yī)療器械雜志;2016年04期
6 楊浩;曾興斌;何加銘;;基于Hadoop微博熱點話題挖掘系統(tǒng)的設計與實現(xiàn)[J];數(shù)據(jù)通信;2016年02期
7 戰(zhàn)學剛;王曉;;基于LDA的問答網(wǎng)站話題抽取算法[J];計算機應用與軟件;2016年04期
8 王燕;王興芬;任俊玲;;面向釣魚網(wǎng)站敏感特征項選取的IIGAIN算法[J];計算機應用與軟件;2016年04期
9 韓飛;沈鎮(zhèn)林;;基于不完備集雙聚類的缺失數(shù)據(jù)填補算法[J];計算機工程;2016年04期
10 張劍飛;劉克會;杜曉昕;;基于k階依賴擴展的貝葉斯網(wǎng)絡分類器集成學習算法[J];東北師大學報(自然科學版);2016年01期
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉運強;;垂直搜索引擎的研究與設計[J];計算機應用與軟件;2010年07期
2 臺德藝;王俊;;文本分類特征權重改進算法[J];計算機工程;2010年09期
3 楊基棟;;EM算法理論及其應用[J];安慶師范學院學報(自然科學版);2009年04期
4 趙洋;滕桂法;張玉新;何冬梅;;基于Internet的農(nóng)業(yè)信息垂直搜索引擎的設計[J];河北農(nóng)業(yè)大學學報;2009年06期
5 李廣麗;劉覺夫;;垂直搜索引擎系統(tǒng)的研究與實現(xiàn)[J];情報雜志;2009年10期
6 余棟柱;黃謳;;用Nutch構建垂直搜索引擎的方案[J];知識經(jīng)濟;2009年14期
7 張斌;周爾寧;;基于Nutch的分布式紡織垂直搜索引擎研究[J];電腦知識與技術;2009年21期
8 王仕仲;寧龍兵;;基于Nutch的中文搜索引擎的研究與實現(xiàn)[J];電腦開發(fā)與應用;2009年07期
9 施聰鶯;徐朝軍;楊曉江;;TFIDF算法研究綜述[J];計算機應用;2009年S1期
10 張錦p,
本文編號:931021
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/931021.html