天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

基于用戶(hù)搜索行為的query-doc關(guān)聯(lián)挖掘

發(fā)布時(shí)間:2018-04-05 01:29

  本文選題:關(guān)聯(lián)關(guān)系 切入點(diǎn):搜索行為 出處:《自動(dòng)化學(xué)報(bào)》2014年08期


【摘要】:query和doc之間的關(guān)聯(lián)關(guān)系是搜索引擎期望獲取的一類(lèi)有價(jià)值的信息.query和doc間準(zhǔn)確的關(guān)聯(lián)分析不僅可以幫助搜索結(jié)果排序,也在query和doc之間的橋接中起到重要作用,以實(shí)現(xiàn)相關(guān)query和doc之間的信息傳遞,有利于更深入的query理解和doc理解,并在此基礎(chǔ)上開(kāi)展相關(guān)應(yīng)用.本文提出了一種基于用戶(hù)搜索行為的query和doc關(guān)聯(lián)關(guān)系挖掘算法,該方法首先對(duì)用戶(hù)搜索點(diǎn)擊日志中的數(shù)據(jù)進(jìn)行整理與分析,構(gòu)建query與doc間的二部圖,再通過(guò)采用馬爾可夫隨機(jī)游走模型對(duì)二部圖數(shù)據(jù)進(jìn)行建模,挖掘二部圖中的點(diǎn)擊數(shù)據(jù)和session數(shù)據(jù),最終挖掘出點(diǎn)擊日志中用戶(hù)沒(méi)有點(diǎn)擊到的doc數(shù)據(jù),從而預(yù)測(cè)出query和doc間的隱含關(guān)聯(lián)關(guān)系,同時(shí)也可以利用該算法得到query和query潛在的關(guān)聯(lián)關(guān)系.基于以上理論基礎(chǔ),我們實(shí)現(xiàn)了一套完整的日志挖掘系統(tǒng),通過(guò)大量的實(shí)驗(yàn)對(duì)比,該系統(tǒng)在各方面均取得了優(yōu)異的表現(xiàn),其中對(duì)檢索結(jié)果相關(guān)性的性能提升可以達(dá)到71.23%,這充分表明,本文所提出的理論和算法能夠很好地解決query和doc之間的隱含關(guān)系挖掘問(wèn)題,為提高搜索結(jié)果的召回率、實(shí)現(xiàn)查詢(xún)推薦和檢索結(jié)果聚類(lèi)奠定了良好的前提基礎(chǔ).
[Abstract]:The association relationship between query and doc is a kind of valuable information that search engine expects to obtain. Query and doc can not only help the search results ranking, but also play an important role in the bridge between query and doc.In order to realize the information transmission between the related query and doc, it is beneficial to the deeper understanding of query and doc, and on the basis of which the related applications are developed.This paper presents an association relation mining algorithm for query and doc based on user search behavior. Firstly, the data in the user search click log is sorted and analyzed, and the bipartite graph between query and doc is constructed.Then by using Markov random walk model to model the bipartite graph data, mining the click data and session data in the two graphs, finally mining the doc data that the user did not click in the click log.The implicit correlation between query and doc can be predicted, and the potential correlation between query and query can also be obtained by using this algorithm.Based on the above theoretical basis, we have implemented a complete log mining system, through a large number of experiments, the system has achieved excellent performance in all aspects.Among them, the performance improvement of retrieval result correlation can reach 71.23, which fully shows that the theory and algorithm presented in this paper can solve the hidden relationship mining problem between query and doc well, in order to improve the recall rate of search results.The realization of query recommendation and retrieval result clustering lays a good foundation.
【作者單位】: 吉林大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;吉林大學(xué)符號(hào)計(jì)算與知識(shí)工程教育部重點(diǎn)實(shí)驗(yàn)室;
【基金】:國(guó)家自然科學(xué)基金(60973040,61300148) 中國(guó)博士后基金(2012M510879) 吉林省重點(diǎn)科技攻關(guān)項(xiàng)目(20130206051GX)資助~~
【分類(lèi)號(hào)】:TP391.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李金花;;在Excel中用Microsoft Query導(dǎo)入外部數(shù)據(jù)[J];中國(guó)管理信息化;2008年12期

2 楊蘭;利用QueryDef提高資料的快速存取[J];電腦編程技巧與維護(hù);1994年05期

3 趙龍強(qiáng);在EXCEL中掌握ODBC、Query的應(yīng)用[J];上海會(huì)計(jì);2003年10期

4 楊蘭;利用QueryDef提高資料的快速存取[J];電腦編程技巧與維護(hù);1994年11期

5 ;活動(dòng)模板庫(kù)(ATL)創(chuàng)建小型COM對(duì)象(二)[J];電腦編程技巧與維護(hù);1999年04期

6 劉宏,吳江;分布式對(duì)象中間件技術(shù)[J];現(xiàn)代電子技術(shù);2003年08期

7 廉育功;軟件:用VBA編制Access的查詢(xún)程序[J];電腦知識(shí)與技術(shù);2000年S4期

8 韓亮;運(yùn)用RLU和DB2/400 Query Manager在AS/400中設(shè)計(jì)報(bào)表文件[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2000年06期

9 邱景華,韓X;淺談桌面數(shù)據(jù)庫(kù)在公文管理中的實(shí)際應(yīng)用[J];廣東公安科技;2003年01期

10 廉育功;用VBA實(shí)現(xiàn)Access的查詢(xún)[J];多媒體世界;2000年12期

相關(guān)會(huì)議論文 前10條

1 顧先睿;李建中;楊艷;;數(shù)字圖書(shū)館中并行文檔數(shù)據(jù)加載算法(英文)[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年

2 ;Variable and Index Processing in XML-QL Join[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2001年

3 ;Data Query Using Short Domain Question in Natural Language[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年

4 蔡黎;趙軍;;Automatic Identification of User Intent Based on Click Through Data[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年

5 ;Research of Massive Heterogeneous Data Integration Based on Lucene and XQuery[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年

6 ;Design and Evaluation of a Parallel K-Nearest Neighbor Algorithm on CUDA-enabled GPU[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年

7 ;A Unified Query Model for Heterogeneous Data Resources[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年

8 Grace wai-yue Leung;;Databases as Virtual XML Documents:an Interoperable Approach[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2001年

9 ;An Efficiency Hierarchy Indexing Method with Dynamic Clustering Algorithm for ROIBIR System[A];第十五屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2010年

10 肖敏;丁宇新;高翔;;Learning to Rank Relational Objects Based on the Listwise Approach[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年

相關(guān)重要報(bào)紙文章 前10條

1 福建 曾曉萌;優(yōu)化你的 Delphi 程序[N];電腦報(bào);2001年

2 江蘇 王鑫;Delphi控件使用點(diǎn)滴[N];電腦報(bào);2002年

3 遼寧 謝艷敏 張濤;實(shí)現(xiàn)多表間的復(fù)雜查詢(xún)[N];中國(guó)電腦教育報(bào);2000年

4 河南 張華貴;數(shù)據(jù)庫(kù)中參數(shù)化查詢(xún)的實(shí)現(xiàn)[N];電腦報(bào);2001年

5 重慶 hero;初試Delphi和SQL Server相連[N];電腦報(bào);2004年

6 主持人 李海;VB新手常見(jiàn)問(wèn)題解答[N];中國(guó)電腦教育報(bào);2000年

7 PALADIN;編程沙龍[N];電腦報(bào);2003年

8 dwway 冷鵬;DSS在電子政務(wù)中的應(yīng)用[N];中國(guó)計(jì)算機(jī)報(bào);2002年

9 杭州商學(xué)院2000級(jí)研究生(310035) 徐建平;在ASP中實(shí)現(xiàn)購(gòu)物小車(chē)[N];計(jì)算機(jī)世界;2001年

10 王昊鵬;一步一步學(xué)Borland Delphi 編寫(xiě)數(shù)據(jù)庫(kù)程序要點(diǎn)(二)[N];中國(guó)電腦教育報(bào);2004年

相關(guān)博士學(xué)位論文 前10條

1 張得天;時(shí)間依賴(lài)路網(wǎng)高效k最近鄰查詢(xún)混搭機(jī)制的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年

2 Khalil Ahmed Saleh Al-mekhlafi;[D];大連理工大學(xué);2011年

3 范佳;可證明安全的簽密相關(guān)公鑰密碼方案研究[D];西南交通大學(xué);2011年

4 Mahmoud Sami Soliman;[D];中南大學(xué);2010年

5 潘鵬;Deep Web查詢(xún)中的不確定性問(wèn)題研究[D];山東大學(xué);2010年

6 徐紅波;基于空間填充曲線高維空間查詢(xún)算法研究[D];哈爾濱理工大學(xué);2010年

7 連莉;本體中非分類(lèi)關(guān)系的理論體系研究[D];山東大學(xué);2010年

8 李支成;時(shí)空數(shù)據(jù)庫(kù)復(fù)雜查詢(xún)方法研究[D];華中科技大學(xué);2012年

9 劉潤(rùn)濤;基于序的空間數(shù)據(jù)索引及查詢(xún)算法研究[D];哈爾濱理工大學(xué);2009年

10 范平;路網(wǎng)中考慮運(yùn)動(dòng)狀態(tài)的連續(xù)K近鄰查詢(xún)算法研究[D];華中科技大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 闞長(zhǎng)城;Query Engine的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2012年

2 朱亮;基于馬爾科夫隨機(jī)游走模型的query-doc關(guān)聯(lián)挖掘[D];吉林大學(xué);2014年

3 唐國(guó)華;Query語(yǔ)義依存分析技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2012年

4 劉建柱;基于Query分析的中心詞與需求詞搭配關(guān)系的自動(dòng)挖掘[D];東北大學(xué);2008年

5 Clotilde Uwimana;[D];湖南大學(xué);2010年

6 柳寶成;學(xué)生信息管理系統(tǒng)的研究與實(shí)現(xiàn)[D];吉林大學(xué);2011年

7 NTAGWABIRA Lambert;[D];中南大學(xué);2011年

8 黃勤;高等職業(yè)教育教學(xué)質(zhì)量評(píng)價(jià)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];山東大學(xué);2011年

9 劉佳;基于微博的金融資訊檢索平臺(tái)查詢(xún)優(yōu)化技術(shù)的研究和實(shí)現(xiàn)[D];北京郵電大學(xué);2012年

10 張哲雨;山東圣翰財(cái)貿(mào)職業(yè)學(xué)院圖書(shū)館WEB系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];山東大學(xué);2011年

,

本文編號(hào):1712624

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1712624.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)1614c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com