基于權(quán)重標準化SimRank方法的查詢擴展技術(shù)研究
[Abstract]:Query extension is an important technology in information retrieval. The traditional local analysis query expansion method uses pseudo-correlation documents as candidate word sets, but partial pseudo-correlation documents are not highly correlated. In this paper, the query click graph is established by using the real search engine query log, and the word item relation graph which can reflect the degree of correlation between words is obtained through the transformation of the structure of multiple graphs, and based on the similarity algorithm SimRank of the graph structure. An improved SimRank method based on weight standardization is proposed. By using the global and indirect relationships of the word items in the word term relational graph, the extended words associated with the original query can be effectively mined. At the same time, in order to reduce the computational complexity of the SimRank algorithm, the pruning strategy is used to optimize the algorithm, which greatly improves the computational efficiency. Experiments on the TREC standard data set show that the proposed method can effectively select the relative extension word .MAP index, which is 1.81% higher than that of the local analysis query extension method, and the effect is 5.44% and 3.73% higher in the evaluation of P10 and Papp20 indexes, respectively.
【作者單位】: 大連理工大學信息檢索研究室;
【基金】:國家自然科學基金資助項目(60673039,60973068) 國家社科基金資助項目(08BTQ025) 國家863高科技計劃資助項目(2006AA01Z151) 教育部留學回國人員科研啟動基金 高等學校博士學科點專項科研基金資助項目(20090041110002)
【分類號】:TP391.3
【相似文獻】
相關(guān)期刊論文 前10條
1 李文駿;崔志明;;基于搜索引擎的Deep Web數(shù)據(jù)源發(fā)現(xiàn)技術(shù)[J];計算機技術(shù)與發(fā)展;2008年08期
2 李莉;高慶獅;;一種基于語義單元的查詢擴展方法[J];計算機科學;2008年02期
3 裴飛;洪宇;孫常龍;姚建民;朱巧明;;基于Web的查詢擴展[J];電腦知識與技術(shù);2011年06期
4 馬云龍;林原;林鴻飛;;基于權(quán)重標準化SimRank方法的查詢擴展技術(shù)研究[J];中文信息學報;2011年01期
5 蔣輝;陽小華;;基于文檔與搜索結(jié)果上下文的查詢擴展方法[J];計算機應(yīng)用;2009年03期
6 牟力科;張蕾;張曉孿;;基于概念圖的用戶興趣查詢擴展模型的研究[J];計算機工程與應(yīng)用;2008年06期
7 熊桂喜;王開鋒;;基于語義的查詢擴展研究[J];微計算機信息;2008年30期
8 曹蓓蓓;信息檢索技術(shù)的設(shè)計探討[J];河北建筑科技學院學報;2005年03期
9 李小琳;陸汝占;;基于日志挖掘的查詢概念圖擴展[J];計算機應(yīng)用與軟件;2010年03期
10 黃曉冬;Invisible Web研究綜述[J];情報科學;2004年09期
相關(guān)會議論文 前10條
1 鄧長壽;郭景峰;楊焱林;鄧安遠;;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2001年
2 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學會第五屆學術(shù)年會論文集[C];2008年
3 羅偉;李陶深;;一種基于本體的個性化搜索引擎模型[A];廣西計算機學會2006年年會論文集[C];2006年
4 姚建民;孫俊;;基于搜索引擎查詢詞分類擴展的譯文挖掘[A];蘇州市自然科學優(yōu)秀學術(shù)論文匯編(2008-2009)[C];2010年
5 倪俊峰;;基于黃頁搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計與實現(xiàn)[A];2005年中國索引學會年會暨學術(shù)研討會論文集[C];2005年
6 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國索引學會年會暨學術(shù)研討會論文集[C];2010年
7 陳援非;何哲;朱珍民;;基于普適計算的個性化搜索技術(shù)[A];第二屆和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2006)——第2屆中國普適計算學術(shù)會議(PCC'06)論文集[C];2006年
8 楊萌;李春麗;朱明;;網(wǎng)絡(luò)搜索技術(shù)下的編輯工作[A];學報編輯論叢(第十一集)[C];2003年
9 陳磊;茹立云;馬少平;;基于用戶日志挖掘的搜索引擎廣告效果分析[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
10 張志強;孟慶海;謝曉芹;;個性化的社會標簽查詢擴展技術(shù)研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學術(shù)會議論文集A輯二[C];2010年
相關(guān)重要報紙文章 前10條
1 博文邋譯;你的隱私 搜索引擎知道[N];計算機世界;2007年
2 楊潔;搜索引擎營銷市場生變[N];中國計算機報;2007年
3 劉文君;搜索引擎也在尋求創(chuàng)新[N];大眾科技報;2007年
4 ;法國挑戰(zhàn)谷歌推出衛(wèi)星地圖搜索引擎[N];人民日報;2006年
5 MirrorCity.net技術(shù)總監(jiān) 姚浩;讓搜索引擎回歸最初夢想[N];中國文化報;2008年
6 本報記者 操秀英;國雙科技以技術(shù)加服務(wù)贏得市場[N];科技日報;2009年
7 趙敏;“魚群理論”破解搜索營銷謎局[N];中國企業(yè)報;2007年
8 本報記者 樊哲高;搜索引擎三國紛爭 中文市場兩軍對壘[N];中國電子報;2009年
9 EndTo;優(yōu)化Meta討好搜索引擎[N];電腦報;2009年
10 本報記者 馬文方;Yebol:從思維科學導(dǎo)出搜索引擎[N];中國計算機報;2010年
相關(guān)博士學位論文 前10條
1 仲兆滿;事件本體及其在查詢擴展中的應(yīng)用[D];上海大學;2011年
2 岑榮偉;基于用戶行為分析的搜索引擎評價研究[D];清華大學;2010年
3 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學;2011年
4 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學;2011年
5 劉佐達;分布協(xié)作式搜索引擎模型及算法研究[D];清華大學;2011年
6 陳旭毅;基于索引云的企業(yè)搜索引擎實現(xiàn)研究[D];武漢大學;2011年
7 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學;2012年
8 王樹梅;信息檢索相關(guān)技術(shù)研究[D];南京理工大學;2007年
9 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學技術(shù)大學;2011年
10 白玉琪;空間信息搜索引擎研究[D];中國科學院研究生院(遙感應(yīng)用研究所);2003年
相關(guān)碩士學位論文 前10條
1 盧葦;基于雙語翻譯搜索引擎的智能用戶接口的研究[D];武漢理工大學;2009年
2 王倩;基于概念格的個性化搜索引擎查詢擴展研究[D];北京郵電大學;2008年
3 張柯;基于概念格的語義相關(guān)度計算及應(yīng)用[D];河南大學;2007年
4 楊光偉;基于Lucene的個性化搜索引擎的研究與實現(xiàn)[D];內(nèi)蒙古大學;2009年
5 王水利;基于互信息的語義查詢擴展技術(shù)研究[D];河南科技大學;2011年
6 方勇;基于語義的信息檢索方法研究與應(yīng)用[D];浙江大學;2010年
7 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實現(xiàn)和優(yōu)化[D];吉林大學;2011年
8 崔琰;基于用戶興趣及術(shù)語關(guān)系的查詢擴展方法[D];河北大學;2011年
9 范丹;Web檢索中的查詢擴展及結(jié)果聚類技術(shù)研究[D];遼寧師范大學;2010年
10 周劍烽;基于語義本體的信息檢索方法的研究[D];杭州電子科技大學;2010年
,本文編號:2165660
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2165660.html