SHITS:一種基于超鏈接和內(nèi)容的網(wǎng)頁排序方法
[Abstract]:This paper reviews the current mainstream web page sorting algorithms used in large search engines, and improves the ARC algorithm. In this paper, a web page sorting algorithm based on hyperlink and content, SHITS (Similarity-HITS) algorithm, is proposed. Shits algorithm uses the web page content referenced by hyperlink instead of the anchor text used in ARC algorithm to evaluate the importance of the hyperlink. This improvement not only improves the ability of the algorithm to distinguish the importance of links, but also avoids the analysis of a large number of anchor text content. Compared with the related algorithms, the results show that the SHITS algorithm is superior to other algorithms in web page sorting accuracy. In addition, the SHITS algorithm has a better efficiency than the ARC algorithm, which is similar to the HITS algorithm.
【作者單位】: 中國科學(xué)技術(shù)大學(xué)電子工程與信息科學(xué)系 中國科學(xué)技術(shù)大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系 中國科學(xué)技術(shù)大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系
【基金】:國家“九七三”計(jì)劃項(xiàng)目(2003CB17000)資助
【分類號】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 潘大勝;黃小龍;;基于校園網(wǎng)的信息資源搜索引擎系統(tǒng)的設(shè)計(jì)[J];貴州工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年05期
2 蔣建中;丁寶瓊;吳瓊;邱文武;;基于頁面分塊的網(wǎng)頁排序算法:BHITS[J];計(jì)算機(jī)工程;2010年11期
3 胡駿;李星;;校園網(wǎng)信息資源搜索引擎的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2006年24期
4 張毅;張冬梅;;搜索引擎PageRank算法的比較與改進(jìn)[J];科技創(chuàng)新導(dǎo)報(bào);2008年21期
5 賈麗柯;;基于校園網(wǎng)的搜索引擎排序算法研究[J];商丘職業(yè)技術(shù)學(xué)院學(xué)報(bào);2008年02期
6 郝金隆;王成良;;原創(chuàng)優(yōu)先的搜索引擎排序算法[J];計(jì)算機(jī)工程;2008年18期
7 金祖旭;李敏波;;基于用戶反饋的搜索引擎排名算法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2010年11期
8 韓紅芳;陳其勇;;小世界網(wǎng)絡(luò)在搜索引擎算法中的應(yīng)用[J];天津農(nóng)學(xué)院學(xué)報(bào);2006年02期
9 陳恩紅;李梁;;一種對象級搜索中的多查詢合并算法[J];中國科學(xué)技術(shù)大學(xué)學(xué)報(bào);2008年10期
10 蔣宗禮;李憲雷;徐學(xué)可;;基于主題Hub值的元搜索[J];北京工業(yè)大學(xué)學(xué)報(bào);2009年03期
相關(guān)會(huì)議論文 前10條
1 張健沛;李連江;楊靜;;個(gè)性化搜索引擎排序算法的研究與改進(jìn)[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
2 李賀華;付鶴崗;;多Agent Web信息檢索應(yīng)用研究[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C];2008年
3 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計(jì)算機(jī)學(xué)會(huì)2008年年會(huì)論文集[C];2008年
4 郭鴻志;陳清才;康永燕;王曉龍;;一種基于網(wǎng)站特征識別的搜索引擎排序算法[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
5 梁婷婷;張志強(qiáng);謝曉芹;;搜索引擎評估算法綜述[A];黑龍江省計(jì)算機(jī)學(xué)會(huì)2009年學(xué)術(shù)交流年會(huì)論文集[C];2010年
6 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年
7 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國中醫(yī)藥信息研究會(huì)第二屆理事大會(huì)暨學(xué)術(shù)交流會(huì)議論文匯編[C];2003年
8 鄧長壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
9 維尼拉·木沙江;吐爾洪·吾司曼;;維、哈、柯文搜索引擎中網(wǎng)頁爬行器的設(shè)計(jì)與實(shí)現(xiàn)[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
10 楊磊;束罡;牛振東;;基于引力模型的鏈接分析(英文)[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
相關(guān)重要報(bào)紙文章 前10條
1 王立群;搜索新生代[N];中國計(jì)算機(jī)報(bào);2005年
2 李一鑫;搜索排名的紅與黑[N];財(cái)經(jīng)時(shí)報(bào);2007年
3 周文林;搜狗3.0能否撼動(dòng)搜索市場[N];經(jīng)濟(jì)參考報(bào);2007年
4 惠正一;比爾·蓋茨:微軟不怕Google[N];第一財(cái)經(jīng)日報(bào);2005年
5 賽迪顧問股份有限公司互聯(lián)網(wǎng)與電子商務(wù)咨詢中心 常燕杰;搜索,還是門戶[N];中國計(jì)算機(jī)報(bào);2005年
6 陳珊;浙江移動(dòng)推出手機(jī)搜索引擎服務(wù)[N];人民郵電;2005年
7 趙法忠;搜索引擎還需悠著點(diǎn)[N];中國經(jīng)營報(bào);2005年
8 金朝力;搜索引擎火拼搜索質(zhì)量[N];北京商報(bào);2006年
9 本報(bào)記者 趙曉輝 孟昭麗;搜索引擎駛?cè)搿氨茱L(fēng)港”[N];中國證券報(bào);2006年
10 孫t;搜索引擎驚喜侵權(quán)官司止于“避風(fēng)港”?[N];第一財(cái)經(jīng)日報(bào);2006年
相關(guān)博士學(xué)位論文 前10條
1 陳紅濤;基于搜索日志的用戶行為研究及應(yīng)用[D];北京郵電大學(xué);2008年
2 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
3 劉玉婷;網(wǎng)頁排序中的隨機(jī)模型及算法[D];北京交通大學(xué);2009年
4 岑榮偉;基于用戶行為分析的搜索引擎評價(jià)研究[D];清華大學(xué);2010年
5 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
6 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
7 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
8 曹歡歡;基于大規(guī)模搜索日志挖掘的上下文感知搜索研究[D];中國科學(xué)技術(shù)大學(xué);2009年
9 陳冬玲;基于潛在語義的個(gè)性化搜索關(guān)鍵技術(shù)研究[D];東北大學(xué);2009年
10 王昤璞;基于用戶體驗(yàn)的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評估研究[D];吉林大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 程建;一種網(wǎng)頁搜索引擎原型系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2009年
2 李連江;個(gè)性化搜索引擎模型的研究與改進(jìn)[D];哈爾濱工程大學(xué);2008年
3 尹輝;基于Nutch的搜索系統(tǒng)的研究[D];電子科技大學(xué);2008年
4 王軍;中文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];華中科技大學(xué);2004年
5 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學(xué);2010年
6 蘇國榮;校園網(wǎng)搜索引擎排序的去重方法研究[D];國防科學(xué)技術(shù)大學(xué);2010年
7 劉青偉;搜索引擎中的Pagerank排序算法研究分析[D];電子科技大學(xué);2010年
8 尉建興;基于Lucene搜索引擎的研究與應(yīng)用[D];太原理工大學(xué);2011年
9 聞崢;基于Lucene的搜索引擎優(yōu)化[D];北京交通大學(xué);2011年
10 徐永紅;基于專題信息服務(wù)的智能搜索引擎技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2004年
,本文編號:2472916
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2472916.html