面向科學(xué)數(shù)據(jù)的PageRank排序算法
本文關(guān)鍵詞:面向科學(xué)數(shù)據(jù)的PageRank排序算法
更多相關(guān)文章: 科學(xué)數(shù)據(jù) 搜索引擎 鏈接提取 PageRank
【摘要】:隨著科學(xué)研究的發(fā)展,科學(xué)數(shù)據(jù)資源日益激增。在海量數(shù)據(jù)的情況下,數(shù)據(jù)檢索服務(wù)變得極其關(guān)鍵,傳統(tǒng)的科學(xué)數(shù)據(jù)檢索系統(tǒng)只進(jìn)行關(guān)鍵詞匹配,檢索結(jié)果的排序效果很差。為此,提出了針對結(jié)構(gòu)化的科學(xué)數(shù)據(jù)的鏈接提取技術(shù),并基于此把PageRank鏈接分析應(yīng)用于科學(xué)數(shù)據(jù)排序。該算法在排序階段考慮了各個科學(xué)數(shù)據(jù)資源的重要性以獲得更好的排序結(jié)果。在科學(xué)數(shù)據(jù)檢索系統(tǒng)Voovle中的實(shí)驗(yàn)結(jié)果表明,結(jié)合PageRank的科學(xué)數(shù)據(jù)排序更能滿足用戶的需求,排序結(jié)果更加合理。
【作者單位】: 中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心;中國科學(xué)院大學(xué);
【基金】:國家自然科學(xué)基金No.91224006 國家“十二五”科技支撐計(jì)劃No.2012BAK17B01-1 中國科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(xiàng)No.XDA06010202 中國科學(xué)院“十二五”信息化專項(xiàng)No.XXH12504~~
【分類號】:TP391.3
【正文快照】: 1引言數(shù)據(jù)是與自然資源、人力資源一樣重要的戰(zhàn)略資源,隱含著巨大的經(jīng)濟(jì)價值,已引起科技界和企業(yè)界的高度重視。如果能有效地組織和使用大數(shù)據(jù),將對經(jīng)濟(jì)發(fā)展產(chǎn)生巨大的推動作用,并帶來前所未有的機(jī)遇。數(shù)據(jù)根據(jù)其來源,可以粗略地分成兩大類[1]:一類來自物理世界;另一類來自人
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前3條
1 蔣永輝;吳洪麗;;新的PageRank優(yōu)化算法[J];計(jì)算機(jī)工程與應(yīng)用;2012年06期
2 方圓;杜祝平;周功業(yè);;基于對象存儲的新型元數(shù)據(jù)管理策略[J];計(jì)算機(jī)工程;2012年03期
3 韓春花;梁建峰;張俊明;殷汝廣;;大洋數(shù)據(jù)管理與共享平臺設(shè)計(jì)[J];計(jì)算機(jī)與現(xiàn)代化;2012年07期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前6條
1 洪穎;;基于Lucene的服裝領(lǐng)域?qū)I(yè)搜索引擎研究[J];北京服裝學(xué)院學(xué)報(bào)(自然科學(xué)版);2012年03期
2 趙福君;;數(shù)字城市地理空間框架元數(shù)據(jù)應(yīng)用系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];江西測繪;2012年03期
3 劉志明;萬亞平;蔣輝;陽小華;沙基昌;;一種基于興趣聚集的P2P元數(shù)據(jù)管理機(jī)制[J];計(jì)算機(jī)工程;2012年22期
4 唐敏;;一種改進(jìn)的基于最大流的PageRank算法研究[J];信息通信;2013年01期
5 魏小輝;;基于Web的內(nèi)容管理系統(tǒng)的研究[J];信息通信;2013年06期
6 王淼;漆鋒濱;;異構(gòu)多核代碼自動生成框架[J];計(jì)算機(jī)科學(xué)與探索;2013年06期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 范希賢;基于GPU的并行排序?qū)W習(xí)算法研究[D];哈爾濱工業(yè)大學(xué);2012年
2 胡珊珊;面向云存儲的非結(jié)構(gòu)化數(shù)據(jù)存儲研究與應(yīng)用[D];廣東工業(yè)大學(xué);2014年
3 繆志高;半監(jiān)督排序?qū)W習(xí)算法研究[D];中國科學(xué)技術(shù)大學(xué);2014年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張成成;李鋼;李成名;桂德竹;;測繪科學(xué)數(shù)據(jù)共享服務(wù)建設(shè)應(yīng)用研究[J];測繪與空間地理信息;2008年02期
2 宋國璽;張曉華;肖克炎;婁德波;李楠;顧燕;;基于ArcIMS和ArcSDE的全國固體礦產(chǎn)資源遠(yuǎn)景區(qū)帶數(shù)據(jù)共享平臺建設(shè)[J];地球物理學(xué)進(jìn)展;2009年03期
3 諸云強(qiáng);馮敏;宋佳;劉潤達(dá);;基于SOA的地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)[J];地球信息科學(xué)學(xué)報(bào);2009年01期
4 諸云強(qiáng);孫九林;廖順寶;楊雅萍;朱華忠;王卷樂;馮敏;宋佳;杜佳;;地球系統(tǒng)科學(xué)數(shù)據(jù)共享研究與實(shí)踐[J];地球信息科學(xué)學(xué)報(bào);2010年01期
5 王卷樂;諸云強(qiáng);謝傳節(jié);;地球系統(tǒng)科學(xué)數(shù)據(jù)共享網(wǎng)絡(luò)平臺的設(shè)計(jì)和開發(fā)[J];地學(xué)前緣;2006年03期
6 陳騰;;國土資源科學(xué)數(shù)據(jù)共享平臺的數(shù)據(jù)發(fā)布技術(shù)研究[J];河南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年01期
7 劉惠義;董志勇;;基于Power Extrapolation和Adaptive Method的網(wǎng)頁評估新算法[J];計(jì)算機(jī)工程與應(yīng)用;2006年15期
8 吳家麒;譚永基;;PageRank算法的優(yōu)化和改進(jìn)[J];計(jì)算機(jī)工程與應(yīng)用;2009年16期
9 錢大君;吳健平;余柏蒗;張沖;;上海市資源與環(huán)境數(shù)據(jù)共享平臺的實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2008年10期
10 劉群;馮丹;王芳;;高可靠性元數(shù)據(jù)服務(wù)器研究[J];計(jì)算機(jī)工程;2008年17期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 李登;分布式系統(tǒng)負(fù)載均衡策略研究[D];中南大學(xué);2002年
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 蔡建超;蔡明;;搜索引擎PageRank算法研究[J];計(jì)算機(jī)應(yīng)用與軟件;2008年09期
2 楊炳儒,李巖,陳新中,王霞;Web結(jié)構(gòu)挖掘[J];計(jì)算機(jī)工程;2003年20期
3 付真真;陸偉;;基于關(guān)鍵詞的搜索引擎優(yōu)化策略及效果分析[J];現(xiàn)代圖書情報(bào)技術(shù);2009年06期
4 張亞男;王鑫;;基于內(nèi)容管理的網(wǎng)站構(gòu)建系統(tǒng)的研究[J];硅谷;2010年23期
5 陳謙;;PageRank算法在孤立點(diǎn)檢測中的應(yīng)用[J];微型機(jī)與應(yīng)用;2010年24期
6 李長玲;翟雪梅;;基于PageRank的引文分析方法探討[J];情報(bào)理論與實(shí)踐;2007年01期
7 張毅;張冬梅;;搜索引擎PageRank算法的比較與改進(jìn)[J];科技創(chuàng)新導(dǎo)報(bào);2008年21期
8 馬海波;陳時勇;;基于網(wǎng)頁等級的PageRank算法改進(jìn)[J];大連交通大學(xué)學(xué)報(bào);2010年02期
9 宋聚平,王永成,尹中航,滕偉;對網(wǎng)頁P(yáng)ageRank算法的改進(jìn)[J];上海交通大學(xué)學(xué)報(bào);2003年03期
10 張佳;梁少華;;Web結(jié)構(gòu)挖掘與其基于超鏈接結(jié)構(gòu)的算法[J];科技信息;2007年02期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 藺繼國;徐錫山;;一種基于用戶點(diǎn)擊數(shù)據(jù)的個性化PageRank算法[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
2 陳小飛;王軼彤;馮小軍;;一種基于網(wǎng)頁質(zhì)量的PageRank算法改進(jìn)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
3 李文;李淼;張建;朱海;陳雷;;基于混淆網(wǎng)絡(luò)和PageRank的Nbest重排序[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年
4 劉建毅;王菁華;王樅;;基于語言網(wǎng)絡(luò)的關(guān)鍵詞抽取[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
5 劉菁菁;林鴻飛;楊志豪;;基于PageRank和錨文本的網(wǎng)頁排序研究[A];第三屆學(xué)生計(jì)算語言學(xué)研討會論文集[C];2006年
6 陸勇;侯漢清;;基于詞典注釋的漢語同義詞自動識別[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年
7 楊磊;束罡;牛振東;;基于引力模型的鏈接分析(英文)[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
8 劉強(qiáng)國;左志宏;董祥千;;基于WEB超鏈接分析算法的研究綜述[A];四川省通信學(xué)會2006年學(xué)術(shù)年會論文集(二)[C];2006年
9 馮迪;李晉宏;曹原;;基于網(wǎng)頁的數(shù)據(jù)挖掘研究[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會議論文集(上冊)[C];2007年
10 黃云平;孫樂;李文波;;基于上下文圖模型文本表示的文本分類研究[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 本報(bào)記者 馬文方;匠心在胸[N];中國計(jì)算機(jī)報(bào);2008年
2 喻寧;群雄逐鹿搜索經(jīng)濟(jì)[N];經(jīng)理日報(bào);2004年
3 文/大海;微軟亞研院“微妙轉(zhuǎn)向”[N];計(jì)算機(jī)世界;2004年
4 復(fù)旦大學(xué)國際政治系博士 沈逸;谷歌的權(quán)力與生意[N];東方早報(bào);2010年
5 本報(bào)記者 王翌;Google的左手[N];計(jì)算機(jī)世界;2004年
6 清華大學(xué)計(jì)算機(jī)系智能技術(shù)與系統(tǒng)國家重點(diǎn)實(shí)驗(yàn)室 張敏 金奕江;實(shí)驗(yàn)與實(shí)用系統(tǒng)[N];計(jì)算機(jī)世界;2003年
7 文/老鬼阿定;微軟搜索靈不靈?[N];計(jì)算機(jī)世界;2004年
8 本報(bào)實(shí)習(xí)記者 田嫻;三大搜索引擎角逐中國市場[N];通信信息報(bào);2004年
9 北京 竇芳芳;給IE加上Google搜索工具條[N];電腦報(bào);2001年
10 本報(bào)記者 顧洪文;大魚GOODLE面對問題[N];計(jì)算機(jī)世界;2003年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王菁華;文本中知識的獲取[D];北京郵電大學(xué);2008年
2 李方濤;基于產(chǎn)品評論的情感分析研究[D];清華大學(xué);2011年
3 張勇實(shí);基于鏈接相似性分析的WEB結(jié)構(gòu)挖掘方法研究[D];哈爾濱工程大學(xué);2012年
4 王永剛;以數(shù)據(jù)為中心的在線社會網(wǎng)絡(luò)若干安全問題研究[D];北京大學(xué);2013年
5 于紅;Web結(jié)構(gòu)挖掘與高維數(shù)據(jù)挖掘研究[D];大連理工大學(xué);2012年
6 張金松;基于引文上下文分析的文獻(xiàn)檢索技術(shù)研究[D];大連海事大學(xué);2013年
7 劉淇;基于用戶興趣建模的推薦方法及應(yīng)用研究[D];中國科學(xué)技術(shù)大學(xué);2013年
8 俞唯仁;普適的結(jié)構(gòu)相似度在大規(guī)模網(wǎng)絡(luò)中的計(jì)算優(yōu)化技術(shù)研究[D];東華大學(xué);2012年
9 陳浩;Web搜索的用戶興趣與智能優(yōu)化研究[D];中南大學(xué);2012年
10 孟佳娜;遷移學(xué)習(xí)在文本分類中的應(yīng)用研究[D];大連理工大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 姜sバ,
本文編號:1268167
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1268167.html