天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于用戶搜索行為的query-doc關聯(lián)挖掘

發(fā)布時間:2018-04-05 01:29

  本文選題:關聯(lián)關系 切入點:搜索行為 出處:《自動化學報》2014年08期


【摘要】:query和doc之間的關聯(lián)關系是搜索引擎期望獲取的一類有價值的信息.query和doc間準確的關聯(lián)分析不僅可以幫助搜索結果排序,也在query和doc之間的橋接中起到重要作用,以實現(xiàn)相關query和doc之間的信息傳遞,有利于更深入的query理解和doc理解,并在此基礎上開展相關應用.本文提出了一種基于用戶搜索行為的query和doc關聯(lián)關系挖掘算法,該方法首先對用戶搜索點擊日志中的數(shù)據(jù)進行整理與分析,構建query與doc間的二部圖,再通過采用馬爾可夫隨機游走模型對二部圖數(shù)據(jù)進行建模,挖掘二部圖中的點擊數(shù)據(jù)和session數(shù)據(jù),最終挖掘出點擊日志中用戶沒有點擊到的doc數(shù)據(jù),從而預測出query和doc間的隱含關聯(lián)關系,同時也可以利用該算法得到query和query潛在的關聯(lián)關系.基于以上理論基礎,我們實現(xiàn)了一套完整的日志挖掘系統(tǒng),通過大量的實驗對比,該系統(tǒng)在各方面均取得了優(yōu)異的表現(xiàn),其中對檢索結果相關性的性能提升可以達到71.23%,這充分表明,本文所提出的理論和算法能夠很好地解決query和doc之間的隱含關系挖掘問題,為提高搜索結果的召回率、實現(xiàn)查詢推薦和檢索結果聚類奠定了良好的前提基礎.
[Abstract]:The association relationship between query and doc is a kind of valuable information that search engine expects to obtain. Query and doc can not only help the search results ranking, but also play an important role in the bridge between query and doc.In order to realize the information transmission between the related query and doc, it is beneficial to the deeper understanding of query and doc, and on the basis of which the related applications are developed.This paper presents an association relation mining algorithm for query and doc based on user search behavior. Firstly, the data in the user search click log is sorted and analyzed, and the bipartite graph between query and doc is constructed.Then by using Markov random walk model to model the bipartite graph data, mining the click data and session data in the two graphs, finally mining the doc data that the user did not click in the click log.The implicit correlation between query and doc can be predicted, and the potential correlation between query and query can also be obtained by using this algorithm.Based on the above theoretical basis, we have implemented a complete log mining system, through a large number of experiments, the system has achieved excellent performance in all aspects.Among them, the performance improvement of retrieval result correlation can reach 71.23, which fully shows that the theory and algorithm presented in this paper can solve the hidden relationship mining problem between query and doc well, in order to improve the recall rate of search results.The realization of query recommendation and retrieval result clustering lays a good foundation.
【作者單位】: 吉林大學計算機科學與技術學院;吉林大學符號計算與知識工程教育部重點實驗室;
【基金】:國家自然科學基金(60973040,61300148) 中國博士后基金(2012M510879) 吉林省重點科技攻關項目(20130206051GX)資助~~
【分類號】:TP391.3

【相似文獻】

相關期刊論文 前10條

1 李金花;;在Excel中用Microsoft Query導入外部數(shù)據(jù)[J];中國管理信息化;2008年12期

2 楊蘭;利用QueryDef提高資料的快速存取[J];電腦編程技巧與維護;1994年05期

3 趙龍強;在EXCEL中掌握ODBC、Query的應用[J];上海會計;2003年10期

4 楊蘭;利用QueryDef提高資料的快速存取[J];電腦編程技巧與維護;1994年11期

5 ;活動模板庫(ATL)創(chuàng)建小型COM對象(二)[J];電腦編程技巧與維護;1999年04期

6 劉宏,吳江;分布式對象中間件技術[J];現(xiàn)代電子技術;2003年08期

7 廉育功;軟件:用VBA編制Access的查詢程序[J];電腦知識與技術;2000年S4期

8 韓亮;運用RLU和DB2/400 Query Manager在AS/400中設計報表文件[J];計算機系統(tǒng)應用;2000年06期

9 邱景華,韓X;淺談桌面數(shù)據(jù)庫在公文管理中的實際應用[J];廣東公安科技;2003年01期

10 廉育功;用VBA實現(xiàn)Access的查詢[J];多媒體世界;2000年12期

相關會議論文 前10條

1 顧先睿;李建中;楊艷;;數(shù)字圖書館中并行文檔數(shù)據(jù)加載算法(英文)[A];第十九屆全國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2002年

2 ;Variable and Index Processing in XML-QL Join[A];第十八屆全國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2001年

3 ;Data Query Using Short Domain Question in Natural Language[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年

4 蔡黎;趙軍;;Automatic Identification of User Intent Based on Click Through Data[A];第六屆全國信息檢索學術會議論文集[C];2010年

5 ;Research of Massive Heterogeneous Data Integration Based on Lucene and XQuery[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年

6 ;Design and Evaluation of a Parallel K-Nearest Neighbor Algorithm on CUDA-enabled GPU[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年

7 ;A Unified Query Model for Heterogeneous Data Resources[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年

8 Grace wai-yue Leung;;Databases as Virtual XML Documents:an Interoperable Approach[A];第十八屆全國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2001年

9 ;An Efficiency Hierarchy Indexing Method with Dynamic Clustering Algorithm for ROIBIR System[A];第十五屆全國圖象圖形學學術會議論文集[C];2010年

10 肖敏;丁宇新;高翔;;Learning to Rank Relational Objects Based on the Listwise Approach[A];第六屆全國信息檢索學術會議論文集[C];2010年

相關重要報紙文章 前10條

1 福建 曾曉萌;優(yōu)化你的 Delphi 程序[N];電腦報;2001年

2 江蘇 王鑫;Delphi控件使用點滴[N];電腦報;2002年

3 遼寧 謝艷敏 張濤;實現(xiàn)多表間的復雜查詢[N];中國電腦教育報;2000年

4 河南 張華貴;數(shù)據(jù)庫中參數(shù)化查詢的實現(xiàn)[N];電腦報;2001年

5 重慶 hero;初試Delphi和SQL Server相連[N];電腦報;2004年

6 主持人 李海;VB新手常見問題解答[N];中國電腦教育報;2000年

7 PALADIN;編程沙龍[N];電腦報;2003年

8 dwway 冷鵬;DSS在電子政務中的應用[N];中國計算機報;2002年

9 杭州商學院2000級研究生(310035) 徐建平;在ASP中實現(xiàn)購物小車[N];計算機世界;2001年

10 王昊鵬;一步一步學Borland Delphi 編寫數(shù)據(jù)庫程序要點(二)[N];中國電腦教育報;2004年

相關博士學位論文 前10條

1 張得天;時間依賴路網(wǎng)高效k最近鄰查詢混搭機制的研究[D];中國科學技術大學;2014年

2 Khalil Ahmed Saleh Al-mekhlafi;[D];大連理工大學;2011年

3 范佳;可證明安全的簽密相關公鑰密碼方案研究[D];西南交通大學;2011年

4 Mahmoud Sami Soliman;[D];中南大學;2010年

5 潘鵬;Deep Web查詢中的不確定性問題研究[D];山東大學;2010年

6 徐紅波;基于空間填充曲線高維空間查詢算法研究[D];哈爾濱理工大學;2010年

7 連莉;本體中非分類關系的理論體系研究[D];山東大學;2010年

8 李支成;時空數(shù)據(jù)庫復雜查詢方法研究[D];華中科技大學;2012年

9 劉潤濤;基于序的空間數(shù)據(jù)索引及查詢算法研究[D];哈爾濱理工大學;2009年

10 范平;路網(wǎng)中考慮運動狀態(tài)的連續(xù)K近鄰查詢算法研究[D];華中科技大學;2012年

相關碩士學位論文 前10條

1 闞長城;Query Engine的設計與實現(xiàn)[D];電子科技大學;2012年

2 朱亮;基于馬爾科夫隨機游走模型的query-doc關聯(lián)挖掘[D];吉林大學;2014年

3 唐國華;Query語義依存分析技術研究[D];哈爾濱工業(yè)大學;2012年

4 劉建柱;基于Query分析的中心詞與需求詞搭配關系的自動挖掘[D];東北大學;2008年

5 Clotilde Uwimana;[D];湖南大學;2010年

6 柳寶成;學生信息管理系統(tǒng)的研究與實現(xiàn)[D];吉林大學;2011年

7 NTAGWABIRA Lambert;[D];中南大學;2011年

8 黃勤;高等職業(yè)教育教學質(zhì)量評價系統(tǒng)的設計與實現(xiàn)[D];山東大學;2011年

9 劉佳;基于微博的金融資訊檢索平臺查詢優(yōu)化技術的研究和實現(xiàn)[D];北京郵電大學;2012年

10 張哲雨;山東圣翰財貿(mào)職業(yè)學院圖書館WEB系統(tǒng)的設計與實現(xiàn)[D];山東大學;2011年

,

本文編號:1712624

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1712624.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶1614c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com