弱鏈接文檔搜索引擎研究
本文關(guān)鍵詞:弱鏈接文檔搜索引擎研究
更多相關(guān)文章: 搜索引擎 聚類技術(shù) 弱鏈接文檔
【摘要】:聚類技術(shù)能將大規(guī)模數(shù)據(jù)按照數(shù)據(jù)的相似性劃分成用戶可迅速理解的簇,從而使用戶更快地了解大量文檔中所包含的內(nèi)容。因此,聚類技術(shù)成為搜索引擎中不可或缺的部分和研究熱點(diǎn)。Web上的AJAX應(yīng)用和PowerPoint文件等弱鏈接文檔由于缺乏足夠的超鏈接信息,導(dǎo)致搜索該類文檔時(shí),排序結(jié)果不佳。針對該問題,給出一個(gè)弱鏈接文檔的搜索引擎框架,并重點(diǎn)描述一個(gè)基于網(wǎng)頁搜索結(jié)果的弱鏈接文檔排序算法;诰垲惖娜蹑溄游臋n排序算法利用聚類算法從高質(zhì)量的網(wǎng)頁搜索結(jié)果中提取與查詢相關(guān)的主題,并根據(jù)主題的相關(guān)網(wǎng)頁的排名確定該主題的重要性,根據(jù)識別的帶權(quán)重的主題計(jì)算弱鏈接文檔的排序值。實(shí)驗(yàn)結(jié)果表明該算法能夠?yàn)槿蹑溄游臋n產(chǎn)生較好的排序結(jié)果。
【作者單位】: 商丘職業(yè)技術(shù)學(xué)院計(jì)算機(jī)系;
【關(guān)鍵詞】: 搜索引擎 聚類技術(shù) 弱鏈接文檔
【分類號】:TP391.3
【正文快照】: 0引言目前主流搜索引擎Google,Yahoo!等對網(wǎng)頁能產(chǎn)生很好的排序結(jié)果。在這些搜索引擎中,以PageRank[1]、HITS[2]為代表的基于鏈接分析的網(wǎng)頁排序算法利用網(wǎng)頁間的鏈入和鏈出鏈接信息來計(jì)算網(wǎng)頁的排序值。如果指向一個(gè)網(wǎng)頁的網(wǎng)頁越多,越重要,則該網(wǎng)頁的重要性也越大,即有較大
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 張乃洲;曹薇;陳珂銳;李石君;;一種基于時(shí)間感知的搜索引擎模型[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2013年11期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 ;第四屆全國搜索引擎和網(wǎng)上信息挖掘?qū)W術(shù)研討會(huì)(SEWM2006)在山東大學(xué)舉行[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2006年03期
2 那罡;;移動(dòng)搜索的“簡單”邏輯[J];中國計(jì)算機(jī)用戶;2006年26期
3 蔡建超;郭一平;王亮;;基于Lucene.Net校園網(wǎng)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2006年11期
4 ;網(wǎng)絡(luò)[J];電腦愛好者;2007年04期
5 ;使用搜索引擎的另類技巧[J];計(jì)算機(jī)與網(wǎng)絡(luò);2007年06期
6 孫成福;;網(wǎng)絡(luò)搜索引擎的技巧與使用[J];福建電腦;2008年02期
7 楊志;;元數(shù)據(jù)在中文搜索引擎的應(yīng)用研究[J];科技信息(科學(xué)教研);2008年09期
8 陳春陽;;對互聯(lián)網(wǎng)搜索引擎的初步認(rèn)識[J];硅谷;2009年10期
9 沈鑫;;如何“優(yōu)+”搜索引擎賬戶[J];成功營銷;2009年08期
10 鐘曉;;自動(dòng)分類在搜索引擎中的應(yīng)用[J];福建電腦;2009年10期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年
2 鄧長壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
3 倪俊峰;;基于黃頁搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年中國索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2005年
4 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2010年
5 陳援非;何哲;朱珍民;;基于普適計(jì)算的個(gè)性化搜索技術(shù)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第2屆中國普適計(jì)算學(xué)術(shù)會(huì)議(PCC'06)論文集[C];2006年
6 楊萌;李春麗;朱明;;網(wǎng)絡(luò)搜索技術(shù)下的編輯工作[A];學(xué)報(bào)編輯論叢(第十一集)[C];2003年
7 陳磊;茹立云;馬少平;;基于用戶日志挖掘的搜索引擎廣告效果分析[A];第四屆全國學(xué)生計(jì)算語言學(xué)研討會(huì)會(huì)議論文集[C];2008年
8 申琪君;;電子地圖搜索引擎比較[A];中國地理學(xué)會(huì)2007年學(xué)術(shù)年會(huì)論文摘要集[C];2007年
9 岑榮偉;劉奕群;張敏;茹立云;馬少平;;網(wǎng)絡(luò)搜索引擎用戶行為分析和研究[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
10 薩曉靜;;網(wǎng)絡(luò)化生存下的圖書館改革之路[A];福建省圖書館學(xué)會(huì)2008年學(xué)術(shù)年會(huì)論文集[C];2008年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 博文邋譯;你的隱私 搜索引擎知道[N];計(jì)算機(jī)世界;2007年
2 楊潔;搜索引擎營銷市場生變[N];中國計(jì)算機(jī)報(bào);2007年
3 劉文君;搜索引擎也在尋求創(chuàng)新[N];大眾科技報(bào);2007年
4 ;法國挑戰(zhàn)谷歌推出衛(wèi)星地圖搜索引擎[N];人民日報(bào);2006年
5 MirrorCity.net技術(shù)總監(jiān) 姚浩;讓搜索引擎回歸最初夢想[N];中國文化報(bào);2008年
6 本報(bào)記者 操秀英;國雙科技以技術(shù)加服務(wù)贏得市場[N];科技日報(bào);2009年
7 趙敏;“魚群理論”破解搜索營銷謎局[N];中國企業(yè)報(bào);2007年
8 本報(bào)記者 樊哲高;搜索引擎三國紛爭 中文市場兩軍對壘[N];中國電子報(bào);2009年
9 EndTo;優(yōu)化Meta討好搜索引擎[N];電腦報(bào);2009年
10 本報(bào)記者 馬文方;Yebol:從思維科學(xué)導(dǎo)出搜索引擎[N];中國計(jì)算機(jī)報(bào);2010年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 周,
本文編號:560175
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/560175.html