基于頁面分塊的網(wǎng)頁排序算法:BHITS
本文選題:網(wǎng)頁排序 切入點:搜索引擎 出處:《計算機工程》2010年11期 論文類型:期刊論文
【摘要】:介紹大型搜索引擎應(yīng)用的主流網(wǎng)頁排序算法,改進其中的HITSS算法,提出一種基于網(wǎng)頁分塊技術(shù)的BHITS算法。BHITS算法通過對分好的頁面板塊進行主題標定,根據(jù)待采集信息的主題為不同主題的板塊設(shè)定不同的權(quán)值實現(xiàn)相關(guān)度判定,在保持算法高效率的前提下,提高了算法區(qū)分鏈接重要性的能力。與相關(guān)算法的對比實驗結(jié)果表明,BHITS算法網(wǎng)頁排序的準確率明顯優(yōu)于其他算法。
[Abstract]:This paper introduces the mainstream web page sorting algorithm for large search engine applications, improves the HITSS algorithm, and proposes a BHITS algorithm. BHITS algorithm based on the partitioning technology of web pages is proposed to calibrate the theme of the partitioned pages. According to the topic of the information to be collected, different weights are set for different topics to determine the correlation degree. Under the premise of keeping the algorithm high efficiency, The experimental results show that the accuracy of BHITS is better than that of other algorithms.
【作者單位】: 解放軍信息工程大學信息工程學院;
【分類號】:TP391.3
【參考文獻】
相關(guān)期刊論文 前1條
1 石晶,龔震宇,裘杭萍,張毓森;一種更穩(wěn)定的鏈接分析算法——子空間HITS算法[J];吉林大學學報(理學版);2003年01期
【共引文獻】
相關(guān)期刊論文 前8條
1 李江;殷之明;;鏈接分析研究綜述[J];大學圖書館學報;2008年02期
2 侯青;;超鏈接的方式給應(yīng)用程序傳遞參數(shù)方法的實現(xiàn)[J];信息技術(shù);2009年10期
3 李向偉;曹博;;時間參數(shù)在HITS算法中的應(yīng)用及改進[J];蘭州工業(yè)高等?茖W校學報;2006年02期
4 葛蓉;利用網(wǎng)絡(luò)日志分析提高搜索引擎的檢準率[J];情報科學;2004年10期
5 閆建紅;;企業(yè)智能化Web商務(wù)數(shù)據(jù)挖掘引擎算法設(shè)計與實現(xiàn)[J];計算機工程與設(shè)計;2007年04期
6 丁寶瓊;蔣建中;郭軍利;;Web超鏈接分析算法研究[J];通信技術(shù);2009年01期
7 蔣衛(wèi)星;金甌;張彬;;Web搜索算法研究綜述[J];計算機技術(shù)與發(fā)展;2007年04期
8 王學龍;張雪梅;李向偉;;時間參數(shù)在HITS算法中的應(yīng)用及改進[J];現(xiàn)代計算機;2006年06期
相關(guān)碩士學位論文 前8條
1 丁寶瓊;網(wǎng)絡(luò)文本信息采集分析關(guān)鍵技術(shù)研究與實現(xiàn)[D];解放軍信息工程大學;2009年
2 蔣宇;面向Web安全的漏洞檢測系統(tǒng)的研究與實現(xiàn)[D];吉林大學;2011年
3 韓巍;Web信息智能檢索研究[D];合肥工業(yè)大學;2004年
4 王斐;基于增量反饋和自適應(yīng)機制的主題爬蟲系統(tǒng)的設(shè)計與實現(xiàn)[D];南京理工大學;2005年
5 徐金雷;專業(yè)搜索引擎的排序算法研究[D];南京師范大學;2007年
6 周炳;基于K-L變換的權(quán)威頁面挖掘的算法[D];華中科技大學;2006年
7 卜永忠;面向金融信息的主題爬蟲研究與應(yīng)用[D];哈爾濱工業(yè)大學;2008年
8 王菲;一種改進的HITS算法在SNS類網(wǎng)站用戶影響力評估系統(tǒng)中的應(yīng)用[D];吉林大學;2012年
【二級參考文獻】
相關(guān)期刊論文 前1條
1 王奇,宋國新,邵志清;信息檢索中基于鏈接的網(wǎng)頁排序算法[J];華東理工大學學報;2000年05期
【相似文獻】
相關(guān)期刊論文 前10條
1 張瑜;袁方;;基于用戶興趣的個性化信息檢索方法[J];山東大學學報(理學版);2006年03期
2 張磊;;搜索引擎綜述[J];泰州科技;2008年08期
3 劉飛;高紅艷;;基于數(shù)據(jù)挖掘的Web信息檢索的研究[J];江西科學;2008年02期
4 彭芳策;;基于Smarty的站內(nèi)搜索設(shè)計與實現(xiàn)[J];興義民族師范學院學報;2011年02期
5 任麗蕓;楊武;唐蓉;;搜索引擎網(wǎng)頁排序算法研究綜述[J];電腦與電信;2010年05期
6 唐君健;;基于個性化搜索技術(shù)的校園網(wǎng)內(nèi)部搜索引擎的設(shè)計[J];中國信息技術(shù)教育;2010年01期
7 徐家樹,邢立新,覃征;基于鏈接文本相關(guān)度的超鏈接算法(英文)[J];哈爾濱商業(yè)大學學報(自然科學版);2005年03期
8 胡必云;黃因生;謝榮傳;;基于語義的Web信息檢索[J];計算機技術(shù)與發(fā)展;2006年10期
9 李丹;魯明羽;時麗莎;;循證醫(yī)學信息化若干關(guān)鍵技術(shù)的研究[J];廣西師范大學學報(自然科學版);2008年03期
10 周鵬;吳華瑞;趙春江;楊寶祝;朱華吉;;基于Nutch農(nóng)業(yè)搜索引擎的研究與設(shè)計[J];計算機工程與設(shè)計;2009年03期
相關(guān)會議論文 前10條
1 李賀華;付鶴崗;;多Agent Web信息檢索應(yīng)用研究[A];2008年計算機應(yīng)用技術(shù)交流會論文集[C];2008年
2 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學會第五屆學術(shù)年會論文集[C];2008年
3 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國中醫(yī)藥信息研究會第二屆理事大會暨學術(shù)交流會議論文匯編[C];2003年
4 鄧長壽;郭景峰;楊焱林;鄧安遠;;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2001年
5 維尼拉·木沙江;吐爾洪·吾司曼;;維、哈、柯文搜索引擎中網(wǎng)頁爬行器的設(shè)計與實現(xiàn)[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學術(shù)研討會論文集[C];2010年
6 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計算機學會2008年年會論文集[C];2008年
7 姚樹宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國開放式分布與并行計算學術(shù)會議論文集[C];2005年
8 倪俊峰;;基于黃頁搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計與實現(xiàn)[A];2005年中國索引學會年會暨學術(shù)研討會論文集[C];2005年
9 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國索引學會年會暨學術(shù)研討會論文集[C];2010年
10 陳援非;何哲;朱珍民;;基于普適計算的個性化搜索技術(shù)[A];第二屆和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2006)——第2屆中國普適計算學術(shù)會議(PCC'06)論文集[C];2006年
相關(guān)重要報紙文章 前10條
1 郭京霞;百度勝訴搜索引擎排名糾紛案[N];中國企業(yè)報;2007年
2 焦艷玲;楓葉之都告百度惡意排名[N];市場報;2007年
3 夏凌;搜索引擎排名糾紛百度勝出[N];中華工商時報;2007年
4 李一鑫;搜索排名的紅與黑[N];財經(jīng)時報;2007年
5 周文林;搜狗3.0能否撼動搜索市場[N];經(jīng)濟參考報;2007年
6 惠正一;比爾·蓋茨:微軟不怕Google[N];第一財經(jīng)日報;2005年
7 賽迪顧問股份有限公司互聯(lián)網(wǎng)與電子商務(wù)咨詢中心 常燕杰;搜索,,還是門戶[N];中國計算機報;2005年
8 陳珊;浙江移動推出手機搜索引擎服務(wù)[N];人民郵電;2005年
9 趙法忠;搜索引擎還需悠著點[N];中國經(jīng)營報;2005年
10 金朝力;搜索引擎火拼搜索質(zhì)量[N];北京商報;2006年
相關(guān)博士學位論文 前10條
1 岑榮偉;基于用戶行為分析的搜索引擎評價研究[D];清華大學;2010年
2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學;2011年
3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學;2011年
4 陳紅濤;基于搜索日志的用戶行為研究及應(yīng)用[D];北京郵電大學;2008年
5 劉佐達;分布協(xié)作式搜索引擎模型及算法研究[D];清華大學;2011年
6 陳旭毅;基于索引云的企業(yè)搜索引擎實現(xiàn)研究[D];武漢大學;2011年
7 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學;2012年
8 曹歡歡;基于大規(guī)模搜索日志挖掘的上下文感知搜索研究[D];中國科學技術(shù)大學;2009年
9 王昤璞;基于用戶體驗的互聯(lián)網(wǎng)搜索引擎醫(yī)學信息檢索可用性評估研究[D];吉林大學;2010年
10 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學技術(shù)大學;2011年
相關(guān)碩士學位論文 前10條
1 王軍;中文搜索引擎的設(shè)計與實現(xiàn)[D];華中科技大學;2004年
2 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學;2010年
3 徐永紅;基于專題信息服務(wù)的智能搜索引擎技術(shù)研究[D];國防科學技術(shù)大學;2004年
4 金祖旭;基于用戶反饋的搜索引擎排名算法研究[D];復旦大學;2010年
5 尹輝;基于Nutch的搜索系統(tǒng)的研究[D];電子科技大學;2008年
6 閆繼鋼;搜索引擎的研究與實現(xiàn)[D];蘭州大學;2009年
7 蘇國榮;校園網(wǎng)搜索引擎排序的去重方法研究[D];國防科學技術(shù)大學;2010年
8 薛云;Internet上元搜索引擎的研究與設(shè)計[D];太原理工大學;2003年
9 黃大鵬;基于語義Web的搜索引擎研究[D];西安理工大學;2004年
10 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實現(xiàn)和優(yōu)化[D];吉林大學;2011年
本文編號:1640313
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1640313.html