天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于查詢偏好的個(gè)性化搜索引擎的研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2018-02-24 08:01

  本文關(guān)鍵詞: 搜索引擎 查詢推薦 樸素貝葉斯 點(diǎn)擊預(yù)測(cè) 相似計(jì)算 出處:《江南大學(xué)》2016年碩士論文 論文類型:學(xué)位論文


【摘要】:如今,高速發(fā)展的因特網(wǎng)為用戶的生活提供便捷的同時(shí),也不可避免的出現(xiàn)讓用戶難以獲得所需信息的煩惱。對(duì)此,搜索引擎的產(chǎn)生為用戶查詢信息的方式帶來了極大改變。作為一種常用的網(wǎng)絡(luò)信息檢索方式,搜索引擎已經(jīng)發(fā)展為每個(gè)用戶上網(wǎng)都離不開的重要工具,它的出現(xiàn)得到人們的廣泛關(guān)注和使用。然而,傳統(tǒng)信息檢索工具也存在諸多不足之處。主要因?yàn)閭鹘y(tǒng)搜索引擎采用關(guān)鍵詞匹配的全文檢索方法,缺乏有效的對(duì)用戶本身個(gè)性化信息的挖掘,從而不能有針對(duì)性的為用戶提供個(gè)性化查詢服務(wù)。所以在考慮和分析不同用戶的信息需求的基礎(chǔ)上,個(gè)性化搜索系統(tǒng)應(yīng)運(yùn)而生,它的出現(xiàn)能夠在一定程度上滿足用戶的個(gè)性化信息需求。本文借鑒了電子商務(wù)網(wǎng)站中廣泛采用的信息推薦技術(shù),提出了較為可行的個(gè)性化信息推薦方案,即在用戶搜索中使用查詢推薦技術(shù),以實(shí)現(xiàn)個(gè)性化搜索推薦。相關(guān)研究表明,用戶的查詢點(diǎn)擊歷史反應(yīng)了用戶的搜索習(xí)慣和查詢偏好,所以本文對(duì)用戶的歷史查詢數(shù)據(jù)進(jìn)行深入分析,提出了用戶點(diǎn)擊模型,預(yù)測(cè)用戶查詢相關(guān)性并最終給出推薦。文中的研究主要集中在查詢推薦上,首先根據(jù)用戶的搜索點(diǎn)擊歷史數(shù)據(jù),使用樸素貝葉斯理論訓(xùn)練出一個(gè)用戶點(diǎn)擊模型,根據(jù)這個(gè)點(diǎn)擊模型對(duì)用戶當(dāng)前提交的查詢進(jìn)行分析,預(yù)測(cè)查詢與鏈接的點(diǎn)擊率,然后根據(jù)反向點(diǎn)擊圖模型將預(yù)測(cè)的值分配給相應(yīng)查詢,據(jù)此對(duì)查詢進(jìn)行相關(guān)度排序,將前k個(gè)最高預(yù)測(cè)值的查詢推薦給用戶。其次,本文在單個(gè)用戶歷史數(shù)據(jù)的基礎(chǔ)上,對(duì)其進(jìn)行補(bǔ)充,提出協(xié)同相似計(jì)算的用戶查詢推薦技術(shù),將具有相同搜索行為的用戶數(shù)據(jù)匯集到目標(biāo)用戶。該方法可以解決目標(biāo)用戶數(shù)據(jù)量不足的情況,另外還可以為用戶提供一定的查詢推薦的擴(kuò)展性和新穎性。在用戶的相似計(jì)算中,將每個(gè)用戶的歷史查詢?nèi)罩菊蠟橐黄臋n,使用余弦向量模型計(jì)算文檔間的相似性;再使用推薦系統(tǒng)中的協(xié)同推薦理論,將用戶對(duì)每個(gè)鏈接的點(diǎn)擊頻率比作為相關(guān)偏好評(píng)分,基于這些點(diǎn)擊評(píng)分,使用改進(jìn)后的歐氏距離計(jì)算用戶間的相似度;最后將兩種相似計(jì)算方法采用線性加權(quán)的方式整合,計(jì)算出目標(biāo)用戶的相似用戶集,最終將采用點(diǎn)擊模型進(jìn)行查詢推薦。本文最后基于查詢推薦的分析,實(shí)現(xiàn)了一個(gè)簡(jiǎn)易的個(gè)性化搜索引擎系統(tǒng)。在本系統(tǒng)中,將相關(guān)查詢推薦算法引入到了系統(tǒng)中,并將用戶點(diǎn)擊模型應(yīng)用到網(wǎng)頁(yè)排序上,實(shí)現(xiàn)了個(gè)性化的查詢推薦和網(wǎng)頁(yè)排序功能。
[Abstract]:Today, the rapid development of the Internet not only provides convenience for users, but also inevitably makes it difficult for users to obtain the information they need. The generation of search engines has brought great changes to the way users query information. As a common way of information retrieval, search engine has developed into an important tool that every user can not access the Internet without. However, traditional information retrieval tools also have many shortcomings, mainly because traditional search engines use keyword matching full-text retrieval methods. There is a lack of effective mining of personalized information for users, so it can not provide personalized query services for users. Therefore, on the basis of considering and analyzing the information needs of different users, the personalized search system emerges as the times require. It can meet the individual information needs of users to some extent. This paper draws lessons from the widely used information recommendation technology in e-commerce websites, and puts forward a more feasible personalized information recommendation scheme. In other words, query recommendation technology is used in user search to realize personalized search recommendation. Related research shows that the user's query click history reflects the user's search habit and preference. So this paper deeply analyzes the historical query data of users, puts forward the user click model, predicts the relevance of user query and finally gives the recommendation. The research in this paper is mainly focused on query recommendation. First of all, a user click model is trained by using naive Bayes theory according to the user's search click history data. According to this click model, the query submitted by the user is analyzed, and the click rate of the query and link is predicted. Then, according to the reverse click graph model, the predicted values are assigned to the corresponding query, according to which the correlation degree of the query is sorted, and the first k queries with the highest predictive value are recommended to the user. Secondly, based on the historical data of a single user, In addition, a recommendation technology of user query based on collaborative similar computing is proposed, which gathers user data with the same search behavior to target user. This method can solve the problem that the data quantity of target user is insufficient. In addition, it can provide users with certain expansibility and novelty of query recommendation. In the similarity calculation of users, the history query log of each user is integrated into a document, and the similarity between documents is calculated by using cosine vector model. Then using the cooperative recommendation theory in the recommendation system, the user's click frequency ratio to each link is taken as the relevant preference score. Based on these click scores, the improved Euclidean distance is used to calculate the similarity between users. Finally, the two similar computing methods are integrated in a linear weighted way, and the similar user sets of target users are calculated. Finally, the click model is used for query recommendation. Finally, based on the analysis of query recommendation, A simple personalized search engine system is implemented. In this system, the related query recommendation algorithm is introduced into the system, and the user click model is applied to the web page sorting, and the personalized query recommendation and web page sorting functions are realized.
【學(xué)位授予單位】:江南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 朱松巖;;網(wǎng)頁(yè)設(shè)計(jì)之特性分析[J];山東省農(nóng)業(yè)管理干部學(xué)院學(xué)報(bào);2009年03期

2 安琳;;國(guó)外網(wǎng)頁(yè)信息存檔項(xiàng)目及相關(guān)問題研究[J];圖書館建設(shè);2009年12期

3 蔣桂梅;;網(wǎng)頁(yè)設(shè)計(jì)的藝術(shù)性[J];電腦知識(shí)與技術(shù);2010年05期

4 龍正義;;網(wǎng)頁(yè)長(zhǎng)期保存的策略與方法研究[J];檔案管理;2010年03期

5 李志義;梁士金;;國(guó)內(nèi)網(wǎng)頁(yè)去重技術(shù)研究:現(xiàn)狀與總結(jié)[J];圖書情報(bào)工作;2011年07期

6 王爍;;美國(guó)網(wǎng)頁(yè)歸檔項(xiàng)目——Internet Archive發(fā)展研究[J];蘭臺(tái)世界;2012年17期

7 栗勇兵;韓平;董啟雄;;網(wǎng)頁(yè)信息自動(dòng)提取的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2012年18期

8 何立波;周世波;;網(wǎng)頁(yè)設(shè)計(jì)中的藝術(shù)研究[J];考試周刊;2011年25期

9 秦永平;網(wǎng)頁(yè)信息共享技術(shù)[J];計(jì)算機(jī)應(yīng)用;2000年02期

10 項(xiàng)鎮(zhèn);網(wǎng)頁(yè)設(shè)計(jì)新概念[J];江西教育學(xué)院學(xué)報(bào)(自然科學(xué));2001年06期

相關(guān)會(huì)議論文 前10條

1 吳建軍;;談網(wǎng)頁(yè)設(shè)計(jì)的藝術(shù)性表現(xiàn)[A];經(jīng)天緯地——全國(guó)測(cè)繪科技信息網(wǎng)中南分網(wǎng)第十九次學(xué)術(shù)交流會(huì)優(yōu)秀論文選編[C];2005年

2 韓近強(qiáng);趙靜;楊冬青;唐世渭;姚小波;;基于領(lǐng)域知識(shí)的網(wǎng)頁(yè)篩選系統(tǒng)[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年

3 昝紅英;蘇玉梅;孫斌;俞士汶;;基于淺層分析的網(wǎng)頁(yè)相關(guān)度研究[A];語(yǔ)言計(jì)算與基于內(nèi)容的文本處理——全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年

4 孫靜;劉正捷;奚小玲;王慧;;幫助盲人理解網(wǎng)頁(yè)信息的一種網(wǎng)頁(yè)結(jié)構(gòu)劃分方法[A];第一屆建立和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2005)論文集[C];2005年

5 曹淮;晁丁丁;;3D元素在網(wǎng)頁(yè)信息傳達(dá)中的應(yīng)用研究[A];2006年中國(guó)機(jī)械工程學(xué)會(huì)年會(huì)暨中國(guó)工程院機(jī)械與運(yùn)載工程學(xué)部首屆年會(huì)論文集[C];2006年

6 唐超;劉辰;楊正球;;使用多層迭代分析和分類網(wǎng)頁(yè)文檔的方法[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)會(huì)議論文集(上冊(cè))[C];2008年

7 馬驍;王曉龍;王軒;卜永忠;;基于網(wǎng)頁(yè)信息結(jié)構(gòu)的網(wǎng)頁(yè)體裁聚類分析[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

8 羅陽(yáng);季鐸;張桂平;王瑩瑩;;面向單一網(wǎng)頁(yè)的雙語(yǔ)資源挖掘方法[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年

9 于滿泉;譚松波;許洪波;;網(wǎng)頁(yè)內(nèi)部結(jié)構(gòu)挖掘技術(shù)研究[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年

10 王宇;黃煒;肖艷芹;任建立;李天柱;;ORBASE用于基于內(nèi)容的Web查詢[A];第十七屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2000年

相關(guān)重要報(bào)紙文章 前10條

1 本報(bào)記者 曾居仁 通訊員 郝金榮;貴州“萬村千鄉(xiāng)”網(wǎng)頁(yè)工程開辟為農(nóng)服務(wù)新渠道[N];中國(guó)氣象報(bào);2012年

2 壯壯;批量保存網(wǎng)頁(yè)信息[N];電腦報(bào);2004年

3 羅震宇 嚴(yán)小斌;一種新型WEB開發(fā)技術(shù)的探討[N];中國(guó)冶金報(bào);2011年

4 錢鵬;網(wǎng)盡Web頁(yè)中的好東東[N];電腦報(bào);2004年

5 星之海洋;邁出網(wǎng)頁(yè)制作的第一步[N];電腦報(bào);2004年

6 河南 張金貴;FrontPage2000組件詳解(四)[N];電腦報(bào);2001年

7 楓爾;網(wǎng)站瀏覽提速的五大秘方[N];中國(guó)證券報(bào);2004年

8 飄零劍客;網(wǎng)絡(luò)監(jiān)控利器——AnyView[N];中國(guó)電腦教育報(bào);2004年

9 八戒;眨眼之間 答案立現(xiàn)[N];電腦報(bào);2013年

10 ;網(wǎng)絡(luò)應(yīng)用 天龍八“步” 申請(qǐng)上網(wǎng)賬號(hào)[N];電腦報(bào);2002年

相關(guān)博士學(xué)位論文 前10條

1 陳潔;基于概念融合的網(wǎng)頁(yè)篩選技術(shù)研究[D];北京郵電大學(xué);2013年

2 龔昌盛;基于語(yǔ)義標(biāo)注的網(wǎng)頁(yè)廣告加載模型研究[D];武漢大學(xué);2010年

3 孫建濤;Web挖掘中的降維和分類方法研究[D];清華大學(xué);2005年

4 黃華軍;網(wǎng)頁(yè)信息隱藏與隱秘信息檢測(cè)研究[D];湖南大學(xué);2007年

5 徐晴陽(yáng);基于關(guān)系子群發(fā)現(xiàn)算法的聚焦爬行技術(shù)[D];吉林大學(xué);2008年

6 曹魯慧;Web個(gè)人信息集成問題研究[D];山東大學(xué);2012年

7 劉馨月;Web挖掘中的鏈接分析與話題檢測(cè)研究[D];大連理工大學(xué);2012年

8 羅娜;基于本體的主題爬行技術(shù)研究[D];吉林大學(xué);2009年

9 張勇實(shí);基于鏈接相似性分析的WEB結(jié)構(gòu)挖掘方法研究[D];哈爾濱工程大學(xué);2012年

10 宗校軍;中文網(wǎng)頁(yè)定題采集及分類研究[D];華中科技大學(xué);2006年

相關(guān)碩士學(xué)位論文 前10條

1 敖志敏;基于網(wǎng)頁(yè)相似度的搜索算法改進(jìn)的研究[D];上海師范大學(xué);2015年

2 楊尋;地域文化的視覺元素在旅游網(wǎng)頁(yè)設(shè)計(jì)中的應(yīng)用研究[D];西南交通大學(xué);2015年

3 張W,

本文編號(hào):1529469


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/1529469.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d2fbf***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
中文字幕乱子论一区二区三区| 精品高清美女精品国产区| 亚洲国产一区精品一区二区三区色| 色偷偷偷拍视频在线观看| 日韩精品第一区二区三区| 欧美胖熟妇一区二区三区| 欧美一二三区高清不卡| 日本少妇三级三级三级| 日本深夜福利在线播放| 国产丝袜女优一区二区三区| 精品一区二区三区三级视频| 两性色午夜天堂免费视频| 中文字幕人妻一区二区免费| 国产a天堂一区二区专区| 国产极品粉嫩尤物一区二区| 精品欧美日韩一区二区三区| 国产免费人成视频尤物| 夜夜躁狠狠躁日日躁视频黑人| 一区二区三区日韩中文| 日韩欧美黄色一级视频| 久久精品少妇内射毛片| 日韩精品视频香蕉视频| 尹人大香蕉一级片免费看| 国产老熟女超碰一区二区三区| 国产一区二区不卡在线视频| 久久国产精品热爱视频| 亚洲深夜精品福利一区| 人妻精品一区二区三区视频免精 | 国产精品九九九一区二区 | 色偷偷亚洲女人天堂观看| 国产精品超碰在线观看| 日本欧美一区二区三区在线播| 好骚国产99在线中文| 加勒比系列一区二区在线观看| 成人午夜免费观看视频| 正在播放玩弄漂亮少妇高潮| 绝望的校花花间淫事2| 免费国产成人性生活生活片| 久久福利视频在线观看| 黄色三级日本在线观看| 亚洲国产一级片在线观看|