天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

基于二分圖的查詢推薦算法

發(fā)布時(shí)間:2018-04-28 21:03

  本文選題:加權(quán)二分圖 + 查詢推薦 ; 參考:《安徽大學(xué)》2014年碩士論文


【摘要】:當(dāng)前,互聯(lián)網(wǎng)已經(jīng)成為全世界最大的一個(gè)知識(shí)庫(kù),蘊(yùn)含著海量的信息,人們可以獲取的網(wǎng)絡(luò)信息與日俱增。用戶在面對(duì)大規(guī)模的網(wǎng)絡(luò)信息時(shí),卻往往茫然于如何更快更準(zhǔn)確地找到所需要的信息。搜索引擎可以幫助人們從海量數(shù)據(jù)中獲取信息,已經(jīng)成為用戶獲取網(wǎng)絡(luò)信息的最主要甚至必不可少的工具之一。但目前的搜索引擎與用戶的交互方式仍然是主要通過(guò)用戶根據(jù)信息需求自主輸入查詢關(guān)鍵詞進(jìn)行檢索,搜索引擎返回查詢結(jié)果。由于輸入的查詢?cè)~一般較為簡(jiǎn)短,并且查詢?cè)~自身存在歧義性和多義性,搜索引擎并不能準(zhǔn)確理解用戶真實(shí)的搜索意圖;诖朔N背景下,查詢推薦技術(shù)如今已經(jīng)被搜索引擎普遍采用,幫助搜索引擎更準(zhǔn)確地了解用戶真實(shí)的查詢意圖以及幫助用戶構(gòu)造更加完善的查詢。 本文主要研究了一種基于二分圖的查詢推薦算法。采用搜狗查詢?nèi)罩咀鳛閷?shí)驗(yàn)數(shù)據(jù)集,對(duì)該數(shù)據(jù)集進(jìn)行分析與預(yù)處理之后,抽取31萬(wàn)條用戶歷史點(diǎn)擊數(shù)據(jù)作為實(shí)驗(yàn)用數(shù)據(jù)。將用戶點(diǎn)擊URL在搜索引擎返回結(jié)果列表中的排序號(hào)和用戶點(diǎn)擊該URL的順序號(hào)考慮到二分圖連接邊的權(quán)重計(jì)算公式中,利用TF-IDF思想計(jì)算邊的權(quán)重,得到Query-URL加權(quán)二分圖。利用用戶點(diǎn)擊的URL集合構(gòu)造向量來(lái)表示對(duì)應(yīng)的查詢,然后使用余弦相似度方法計(jì)算任意兩個(gè)不同查詢間的相似度,最后構(gòu)建一個(gè)描述查詢間相關(guān)度的查詢關(guān)系網(wǎng)絡(luò)圖。對(duì)一個(gè)輸入查詢推薦N個(gè)候選查詢的過(guò)程是:首先在查詢關(guān)系網(wǎng)絡(luò)圖上找到該輸入查詢所在節(jié)點(diǎn)的鄰居節(jié)點(diǎn)構(gòu)成初始候選查詢集合H。若集合H中查詢的數(shù)目不小于N,直接選取前N個(gè)與輸入查詢相關(guān)度得分較高的候選查詢進(jìn)行推薦;若集合H中查詢的數(shù)目小于N,則將和輸入查詢節(jié)點(diǎn)間接連接的h-hop范圍內(nèi)節(jié)點(diǎn)也加入集合H中,利用k-means算法對(duì)集合H中的查詢進(jìn)行聚類,最后對(duì)包含輸入查詢的簇進(jìn)行排序,推薦前N個(gè)與輸入查詢相關(guān)度得分較高的候選查詢。實(shí)驗(yàn)結(jié)果表明,本文研究的查詢推薦算法具有良好的推薦效果和一定的應(yīng)用價(jià)值。
[Abstract]:At present, the Internet has become the world's largest knowledge base, containing a large amount of information, people can get more and more network information. In the face of large-scale network information, users are often confused about how to find the needed information more quickly and accurately. Search engine can help people to obtain information from massive data and has become one of the most important and even indispensable tools for users to obtain information on the network. However, the interaction between search engines and users is still mainly based on the information needs of users to input query keywords for retrieval, search engines return query results. Because the inputted query words are generally short, and the query words themselves are ambiguous and ambiguous, the search engine can not accurately understand the users' real search intention. Based on this background, query recommendation technology has been widely used by search engines, which helps search engines understand users' real query intention more accurately and help users to construct more perfect queries. This paper mainly studies a query recommendation algorithm based on bipartite graph. Sogou query log is used as experimental data set. After analyzing and preprocessing the data set, 310000 user history click data are extracted as experimental data. The sorting number of user clicking URL in the search engine return result list and the order number of user clicking on the URL are taken into account in the calculation formula of the weight of the connection edge of the bipartite graph, and the weight of the edge is calculated by using the idea of TF-IDF, and the weighted bipartite graph of Query-URL is obtained. The URL set is used to construct the vector to represent the corresponding query. Then the similarity between any two different queries is calculated by using the cosine similarity method. Finally, a query relational network graph is constructed to describe the correlation between the queries. The process of recommending N candidate queries for an input query is as follows: firstly, the neighbor nodes of the node where the input query is located are found on the query relational network diagram to form the initial candidate query set H. If the number of queries in the set H is not less than N, we directly select the first N candidate queries with high correlation score to recommend. If the number of queries in the set H is less than N, then the nodes in the range of h-hop that are indirectly connected with the input query nodes are added to the set H, and the query in the set H is clustered by using the k-means algorithm. Finally, the clusters containing input queries are sorted. The first N candidate queries with high correlation with input queries are recommended. Experimental results show that the query recommendation algorithm studied in this paper has good recommendation effect and certain application value.
【學(xué)位授予單位】:安徽大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP391.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 夏敬華,陸寶春,葛紅宇,張世琪;一種多因素指標(biāo)下基于模糊特征表示的匹配方法[J];計(jì)算機(jī)工程與科學(xué);1999年06期

2 李昂,羅漢文,陳強(qiáng);基于置信傳播的LDPC碼譯碼算法[J];計(jì)算機(jī)工程;2005年20期

3 郝水俠;李凡長(zhǎng);;構(gòu)建一種多agent并行計(jì)算模型[J];計(jì)算機(jī)技術(shù)與發(fā)展;2006年05期

4 林馨;;二部圖網(wǎng)絡(luò)信息傳輸?shù)淖疃虝r(shí)間[J];數(shù)字技術(shù)與應(yīng)用;2010年05期

5 聞斌;姜偉;張立;歐衛(wèi)華;;構(gòu)造消環(huán)的LDPC碼[J];常熟理工學(xué)院學(xué)報(bào);2011年02期

6 常庭懋,韓中庚;用“匈牙利算法”求解一類最優(yōu)化問(wèn)題[J];信息工程大學(xué)學(xué)報(bào);2004年01期

7 張旭堂,劉文劍;基于二分圖的裝配體檢索研究[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2005年09期

8 林雪紅,吳偉陵;LDPC碼的并行譯碼算法[J];北京郵電大學(xué)學(xué)報(bào);2005年05期

9 花曉菲;李旭;;基于圖論的頻率規(guī)劃算法分析與仿真[J];西安郵電學(xué)院學(xué)報(bào);2007年01期

10 安曉東;;基于蟻群算法的電子化考試考場(chǎng)座位編排方法[J];中北大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年03期

相關(guān)會(huì)議論文 前10條

1 楊楠;丁暉;劉悅;;Web社區(qū)緊密核的抽取方法[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年

2 劉永山;朱銳;徐友云;蔡躍明;;衰減因子在LDPC碼置信算法中的應(yīng)用及性能分析[A];江蘇省通信學(xué)會(huì)2004年學(xué)術(shù)年會(huì)論文集[C];2004年

3 鐘茂生;劉慧;劉磊;;詞匯間語(yǔ)義相關(guān)關(guān)系量化計(jì)算方法[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

4 趙玉虎;;一種編碼跳時(shí)超寬帶系統(tǒng)性能分析[A];浙江省電子學(xué)會(huì)第七次會(huì)員代表大會(huì)暨2007學(xué)術(shù)年會(huì)論文集[C];2007年

5 王繼存;;有限元節(jié)點(diǎn)編號(hào)的優(yōu)化方法[A];土木工程中計(jì)算機(jī)應(yīng)用文集——中國(guó)土木工程學(xué)會(huì)計(jì)算機(jī)應(yīng)用學(xué)會(huì)成立大會(huì)暨第一次學(xué)術(shù)交流會(huì)論文集[C];1981年

6 趙海建;林宏;;數(shù)字電視中LDPC碼構(gòu)造方法的研究[A];中國(guó)電子學(xué)會(huì)第十五屆信息論學(xué)術(shù)年會(huì)暨第一屆全國(guó)網(wǎng)絡(luò)編碼學(xué)術(shù)年會(huì)論文集(下冊(cè))[C];2008年

7 宋曉云;汪一鳴;;LDPC碼在UWB上的應(yīng)用[A];第十二屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2005)論文集[C];2005年

8 周星宇;賀仲雄;;Vague匹配決策支持系統(tǒng)及其在人才調(diào)配中應(yīng)用[A];2003年中國(guó)智能自動(dòng)化會(huì)議論文集(下冊(cè))[C];2003年

9 張磊;馬軍;;描述短時(shí)資源混雜占用型任務(wù)調(diào)度的數(shù)學(xué)模型與算法[A];2005年全國(guó)理論計(jì)算機(jī)科學(xué)學(xué)術(shù)年會(huì)論文集[C];2005年

10 劉惠;李曉軍;杜軍朝;張熒俊;張?jiān)茡P(yáng);;基于LT噴泉碼的無(wú)線傳感器網(wǎng)絡(luò)信息分發(fā)協(xié)議性能評(píng)價(jià)[A];2010年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集[C];2010年

相關(guān)博士學(xué)位論文 前10條

1 吳宏偉;社會(huì)網(wǎng)絡(luò)數(shù)據(jù)發(fā)布中的隱私匿名技術(shù)研究[D];哈爾濱工程大學(xué);2013年

2 卞秋菊;關(guān)于圖的因子與分?jǐn)?shù)因子的若干結(jié)果[D];山東大學(xué);2005年

3 劉小同;接近仙農(nóng)限碼的研究及VLSI設(shè)計(jì)[D];同濟(jì)大學(xué);2007年

4 徐秀蓮;合作—競(jìng)爭(zhēng)網(wǎng)和交連網(wǎng)的研究[D];揚(yáng)州大學(xué);2010年

5 劉輝;基因調(diào)控網(wǎng)絡(luò)的建模與學(xué)習(xí)研究[D];復(fù)旦大學(xué);2009年

6 曹海燕;無(wú)線通信系統(tǒng)中的LDPC碼、Turbo碼和空時(shí)編碼的研究[D];華南理工大學(xué);2006年

7 林競(jìng)力;低密度校驗(yàn)碼的構(gòu)造及其應(yīng)用研究[D];電子科技大學(xué);2009年

8 王劍;果樹(shù)枝干三維重建關(guān)鍵技術(shù)研究[D];中國(guó)農(nóng)業(yè)科學(xué)院;2009年

9 張斌武;哈明距離下的逆優(yōu)化問(wèn)題及多物品的制造與分配問(wèn)題[D];浙江大學(xué);2005年

10 黃曉慧;Internet服務(wù)故障管理[D];北京郵電大學(xué);2006年

相關(guān)碩士學(xué)位論文 前10條

1 朱瑯;基于二分圖的查詢推薦算法[D];安徽大學(xué);2014年

2 何峰;二分圖頂點(diǎn)覆蓋問(wèn)題的求解及應(yīng)用[D];昆明理工大學(xué);2002年

3 蔡瑩瑩;基于二分圖的應(yīng)急預(yù)案體系有效性研究[D];大連理工大學(xué);2012年

4 魯富榮;二分圖的因子[D];山西大學(xué);2007年

5 陳勇帆;集成電路自動(dòng)測(cè)試設(shè)備接口板網(wǎng)表生成方法研究[D];華南理工大學(xué);2012年

6 張林;基于蟻群算法的排課系統(tǒng)研究與設(shè)計(jì)[D];安徽大學(xué);2005年

7 王芳;低密度奇偶校驗(yàn)碼的研究及其應(yīng)用[D];大連海事大學(xué);2006年

8 惠偉;基于社會(huì)網(wǎng)絡(luò)的集團(tuán)人員構(gòu)成研究[D];山東師范大學(xué);2009年

9 王志紅;RoboCup中型組足球機(jī)器人決策系統(tǒng)的研究[D];山東大學(xué);2007年

10 張國(guó)棟;低密度校驗(yàn)碼的理論分析及在圖像傳輸中的應(yīng)用研究[D];山東大學(xué);2005年

,

本文編號(hào):1816854

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1816854.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶11177***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
日韩欧美好看的剧情片免费| 欧美中文字幕日韩精品| 精品人妻一区二区三区免费看| 最近最新中文字幕免费| 亚洲专区一区中文字幕| 偷拍洗澡一区二区三区| 亚洲一区二区三区在线中文字幕| 国产成人亚洲综合色就色| 国产精品午夜性色视频| 亚洲高清中文字幕一区二三区| 久久人妻人人澡人人妻| 亚洲第一区欧美日韩在线| 超薄丝袜足一区二区三区| 日本加勒比在线播放一区| 欧美整片精品日韩综合| 人妻精品一区二区三区视频免精| 大香蕉网国产在线观看av| 日韩人妻免费视频一专区| 在线观看免费视频你懂的| 中文字幕人妻av不卡| 午夜福利视频六七十路熟女| 亚洲中文字幕视频在线观看| 午夜视频在线观看日韩| 日韩精品视频一二三区| 中文人妻精品一区二区三区四区| 日韩一级毛一欧美一级乱| 久久精品福利在线观看| 国内九一激情白浆发布| 国产中文字幕一二三区| 欧美日韩一区二区午夜| 亚洲一区二区三区精选| 激情中文字幕在线观看| 国产传媒欧美日韩成人精品| 日韩精品中文字幕亚洲| 成人亚洲国产精品一区不卡| 正在播放国产又粗又长| 成人三级视频在线观看不卡| 久久这里只精品免费福利| 91日韩欧美中文字幕| 天堂热东京热男人天堂| 制服丝袜美腿美女一区二区|