基于Web鏈接分析的HITS算法研究與改進(jìn)
本文關(guān)鍵詞:基于Web鏈接分析的HITS算法研究與改進(jìn)
更多相關(guān)文章: 垂直搜索 搜索策略 擴(kuò)散速率 文本分析 超鏈接分析主題搜索(HITS)
【摘要】:垂直搜索引擎的主題搜索策略有基于內(nèi)容評價(jià)的搜索策略和基于Web鏈接分析的搜索策略,其中HITS算法是一種經(jīng)典的基于Web鏈接分析的搜索策略,其主要的缺點(diǎn)是容易發(fā)生主題漂移。為了最大程度地避免主題漂移,提出了一種結(jié)合網(wǎng)頁文本分析和擴(kuò)散速率改進(jìn)的F-HITS算法。實(shí)驗(yàn)結(jié)果表明,這些改進(jìn)不僅節(jié)省了系統(tǒng)的開銷,并且提高了頁面搜索的準(zhǔn)確率。
【作者單位】: 江西理工大學(xué)工程研究院;江西理工大學(xué)信息工程學(xué)院;江西理工大學(xué)應(yīng)用科學(xué)學(xué)院;
【關(guān)鍵詞】: 垂直搜索 搜索策略 擴(kuò)散速率 文本分析 超鏈接分析主題搜索(HITS)
【基金】:江西省教育廳自然科學(xué)基金項(xiàng)目(No.GJJ12346)
【分類號】:TP393.09
【正文快照】: 1引言隨著Internet技術(shù)的飛速發(fā)展,互聯(lián)網(wǎng)對現(xiàn)代生活的影響越來越大,網(wǎng)頁已經(jīng)成為人們獲取和發(fā)布信息的重要媒介。垂直搜索引擎具有“!、“精”、“深”特點(diǎn)且具有行業(yè)色彩,相對于通用搜索引擎的信息量大、查詢不準(zhǔn)確、深度不夠等局限性,它是針對某一特定的人群、某個(gè)特定
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 何曉陽,吳治蓉,連麗紅,謝永碧;SALSA算法技術(shù)剖析[J];情報(bào)雜志;2004年07期
2 羅林波;陳綺;吳清秀;;基于Shark-Search和Hits算法的主題爬蟲研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2010年11期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前6條
1 方勇;;分布式智能垂直搜索引擎系統(tǒng)的設(shè)計(jì)[J];價(jià)值工程;2012年13期
2 屈振新;朱文昌;;基于云計(jì)算的定向搜索監(jiān)控研究[J];計(jì)算機(jī)工程與科學(xué);2013年01期
3 陸海丹;曹春萍;臧勁松;;移動(dòng)垂直搜索引擎在移動(dòng)醫(yī)療中的應(yīng)用研究[J];計(jì)算機(jī)應(yīng)用與軟件;2013年05期
4 曾晶晶;王亞平;奉國和;;2000—2009年國內(nèi)鏈接分析研究文獻(xiàn)計(jì)量分析[J];圖書館界;2011年02期
5 李瑩;吳曉軍;;基于最大流及頁面相似度的Web結(jié)構(gòu)挖掘[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年10期
6 文必龍;唐蘇龍;張浩;;主題搜索引擎中特征模型技術(shù)的研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2013年04期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉王峰;一種新的Web結(jié)構(gòu)挖掘算法的研究[D];西安電子科技大學(xué);2010年
2 熊霞;基于敘詞表詞間關(guān)系的領(lǐng)域信息檢索[D];中國農(nóng)業(yè)科學(xué)院;2011年
3 黃榮游;基于Lucene的網(wǎng)絡(luò)文學(xué)垂直搜索引擎的研究與實(shí)現(xiàn)[D];浙江工業(yè)大學(xué);2011年
4 徐金雷;專業(yè)搜索引擎的排序算法研究[D];南京師范大學(xué);2007年
5 吳勝兵;Web數(shù)據(jù)挖掘的應(yīng)用與研究[D];南昌大學(xué);2007年
6 盧虹宇;Web結(jié)構(gòu)挖掘中HITS算法的研究[D];西南交通大學(xué);2008年
7 范鑫鑫;基于頁面相似度的鏈接分析算法研究[D];大連理工大學(xué);2008年
8 段一飛;垂直搜索引擎主題特征提取及相關(guān)度算法研究[D];長安大學(xué);2007年
9 羅江鋒;一種抑制惡意網(wǎng)頁的web權(quán)威結(jié)點(diǎn)挖掘算法研究[D];國防科學(xué)技術(shù)大學(xué);2008年
10 楊宇;搜索詞的意圖分析與應(yīng)用[D];北京郵電大學(xué);2010年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前6條
1 康平波,田永鴻,黃鐵軍;智能化網(wǎng)頁資源收集工具的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2004年04期
2 歐陽柳波,李學(xué)勇,李國徽,王鑫;專業(yè)搜索引擎搜索策略綜述[J];計(jì)算機(jī)工程;2004年13期
3 黃萱菁,吳立德,石崎洋之,徐國偉;獨(dú)立于語種的文本分類方法[J];中文信息學(xué)報(bào);2000年06期
4 曹軍;Google的PageRank技術(shù)剖析[J];情報(bào)雜志;2002年10期
5 陳定權(quán);Web信息檢索技術(shù)最新進(jìn)展[J];現(xiàn)代圖書情報(bào)技術(shù);2002年02期
6 傅欣;第三代搜索引擎的智能化趨勢研究[J];現(xiàn)代圖書情報(bào)技術(shù);2002年06期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 耿冬;葉飛躍;林國俊;鄭國良;;基于語義的垂直搜索引擎搜索策略研究[J];微計(jì)算機(jī)信息;2009年33期
2 張麗敏;;垂直搜索引擎的主題爬蟲策略[J];電腦知識與技術(shù);2010年15期
3 張君;李保秀;;垂直搜索引擎中網(wǎng)絡(luò)蜘蛛的設(shè)計(jì)[J];福建電腦;2008年04期
4 莊芯;;風(fēng)投押寶垂直搜索 各方巨頭介入又添疑點(diǎn)[J];IT時(shí)代周刊;2008年01期
5 顧鵬堯;;讓搜索引擎更好地服務(wù)于教育教學(xué)[J];科學(xué)24小時(shí);2003年Z1期
6 陳新顏;垂直搜索引擎辨析[J];現(xiàn)代情報(bào);2004年09期
7 胡文勝;;垂直搜索助號碼百事通與商務(wù)領(lǐng)航[J];每周電腦報(bào);2006年32期
8 胡潔;丁寧;關(guān)靜;曹福年;張磊;;基于“PUBMED+PDF”的醫(yī)學(xué)垂直搜索引擎的實(shí)踐[J];信息系統(tǒng)工程;2009年05期
9 一林;;垂直搜索:前進(jìn)路上的喜與憂[J];互聯(lián)網(wǎng)天地;2010年02期
10 牟思;;基于垂直搜索引擎的學(xué)校網(wǎng)站的研究與建設(shè)[J];中國教育技術(shù)裝備;2011年21期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 林歡歡;王文杰;史忠植;;移動(dòng)環(huán)境下垂直搜索引擎[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
2 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
3 汪秉宏;;網(wǎng)絡(luò)交通流中的路由搜索策略及相變[A];第四屆全國網(wǎng)絡(luò)科學(xué)學(xué)術(shù)論壇暨研究生暑期學(xué)校論文集[C];2008年
4 陶建華;蔡蓮紅;趙晟;;漢語語音合成中的文本分析和韻律處理[A];輝煌二十年——中國中文信息學(xué)會(huì)二十周年學(xué)術(shù)會(huì)議論文集[C];2001年
5 王典樂;任照峰;牟靈泉;;基于并行計(jì)算和網(wǎng)絡(luò)應(yīng)用的暖通空調(diào)CAD搜索策略應(yīng)用探討[A];全國暖通空調(diào)制冷2002年學(xué)術(shù)年會(huì)論文集[C];2002年
6 何偉;李慶忠;鄭永清;崔立真;;社區(qū)云計(jì)算環(huán)境中的一種數(shù)據(jù)分布及搜索策略[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年
7 李慧敏;鄔群勇;王欽敏;;Robot技術(shù)在空間信息服務(wù)搜索中的應(yīng)用研究[A];中國地理信息系統(tǒng)協(xié)會(huì)第四次會(huì)員代表大會(huì)暨第十一屆年會(huì)論文集[C];2007年
8 彭俊杰;盧正鼎;李瑞軒;;一種改進(jìn)的非結(jié)構(gòu)化P2P網(wǎng)絡(luò)搜索方法[A];2006年全國開放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集(一)[C];2006年
9 何立居;李啟華;;基于蟻群算法的航線自動(dòng)生成研究[A];中國航海科技優(yōu)秀論文集[C];2009年
10 高楚舒;丁于思;;因特網(wǎng)中文文本信息分析[A];計(jì)算機(jī)模擬與信息技術(shù)會(huì)議論文集[C];2001年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 王艷;垂直搜索引擎市場看好[N];中國旅游報(bào);2000年
2 賽迪網(wǎng) 方剛;不只是網(wǎng)站才垂直[N];中國計(jì)算機(jī)報(bào);2000年
3 王靖;賽迪網(wǎng)推出垂直搜索引擎[N];人民日報(bào)海外版;2000年
4 電子工業(yè)出版社 董婭 工業(yè)和信息化部電子科學(xué)技術(shù)情報(bào)研究所 周峻松;用開源軟件建垂直搜索引擎[N];計(jì)算機(jī)世界;2010年
5 ;BI和文本分析的強(qiáng)強(qiáng)聯(lián)手[N];網(wǎng)絡(luò)世界;2007年
6 李琨;IBM百度共拓企業(yè)搜索[N];中國計(jì)算機(jī)報(bào);2006年
7 戴清;燃燒的激情與虛幻的歷史[N];文藝報(bào);2002年
8 ;IBM提供概念搜索技術(shù)[N];計(jì)算機(jī)世界;2005年
9 王一川;聚焦于文本的愉悅[N];中國教育報(bào);2005年
10 何志鈞;創(chuàng)構(gòu)現(xiàn)代化精密化的當(dāng)代文藝學(xué)[N];中國文化報(bào);2003年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王曄;垂直搜索引擎若干問題研究[D];復(fù)旦大學(xué);2011年
2 吳羽;面向時(shí)間敏感對象的垂直搜索引擎關(guān)鍵技術(shù)研究[D];浙江大學(xué);2011年
3 胡宜敏;農(nóng)業(yè)垂直搜索引擎語義化若干問題的研究與實(shí)現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2012年
4 汲業(yè);面向圖像的垂直搜索引擎關(guān)鍵技術(shù)研究[D];大連海事大學(xué);2013年
5 趙磊;中華人民共和國對聯(lián)合國的外交政策[D];外交學(xué)院;2006年
6 蔡愛國;中國當(dāng)代歷史小說的敘事策略與文本分析[D];蘇州大學(xué);2006年
7 劉統(tǒng)霞;被表述的民俗藝術(shù)[D];中央民族大學(xué);2008年
8 郭偉宏;趙岐《孟子章句》研究[D];山東大學(xué);2008年
9 梅建新;基于支持向量機(jī)的高分辨率遙感影像的目標(biāo)檢測研究[D];武漢大學(xué);2004年
10 楊光;基于大型科學(xué)儀器工作站的屏幕圖像識別與壓縮技術(shù)研究[D];吉林大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉育蓮;手機(jī)產(chǎn)品垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2012年
2 李亞;垂直搜索引擎的研究與設(shè)計(jì)[D];武漢理工大學(xué);2010年
3 丁文;垂直搜索引擎在網(wǎng)絡(luò)購物系統(tǒng)中的研究與應(yīng)用[D];中國海洋大學(xué);2011年
4 東興;垂直搜索引擎關(guān)鍵技術(shù)研究[D];浙江理工大學(xué);2012年
5 林偉;垂直搜索引擎關(guān)鍵技術(shù)的研究與實(shí)現(xiàn)[D];華南理工大學(xué);2011年
6 關(guān)小敏;垂直搜索引擎的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2012年
7 黃書娟;基于Web的垂直搜索引擎的研究[D];武漢理工大學(xué);2012年
8 王延臣;基于高校信息垂直搜索引擎的研究與實(shí)現(xiàn)[D];沈陽建筑大學(xué);2012年
9 劉相琴;大豆主題垂直搜索引擎關(guān)鍵技術(shù)的研究與設(shè)計(jì)[D];東北農(nóng)業(yè)大學(xué);2013年
10 歐陽薇;歐洲風(fēng)險(xiǎn)溝通研究述評[D];蘭州大學(xué);2009年
,本文編號:974882
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/974882.html