基于RBM的搜索引擎論文.pdf
本文關鍵詞:基于RBM的搜索引擎,由筆耕文化傳播整理發(fā)布。
杭州電子科技大學
碩士學位論文
基于RBM的搜索引擎
姓名:陳瑋
申請學位級別:碩士
專業(yè):計算機軟件與理論
指導教師:陳勤
201112
杭州電子科技大學碩士學位論文
摘
要
隨著互聯(lián)網(wǎng)及移動互聯(lián)網(wǎng)技術的不斷發(fā)展,一方面是用戶和互聯(lián)網(wǎng)交互的程
度不斷加深,越來越多的用戶反饋了相當多的數(shù)據(jù),可以從中洞悉到用戶體驗、
商業(yè)營銷、個人偏好和通常所說的人類行為,從而提供更有針對性的服務。而另
一方面,隨著信息日益豐富,如何能夠使用戶通過搜索引擎更為準確、快速的檢
索到需要的信息就成了人們普遍關注的焦點,針對搜索引擎的網(wǎng)頁排序算法的研
究就是其中的熱點之一。傳統(tǒng)的搜索引擎是基于網(wǎng)頁內(nèi)容排序,一些人為了能提
高網(wǎng)站排名,達到吸引更多用戶的目的,增加很多無效的內(nèi)容或者使用其它的方
式作弊。如何有效的利用用戶反饋的數(shù)據(jù)來改善搜索引擎的頁面排序、防止作弊、
提供更為優(yōu)質(zhì)的服務,就成了本文研究的重點。論文主要研究工作如下:
1 針對傳統(tǒng)的網(wǎng)頁排序算法中出現(xiàn)的作弊問題,研究提出一種基于受限波
Boltzmann
爾茲曼機 RestrictedMachines,簡記為RBM 的網(wǎng)頁排序算法。該算法
有機結(jié)合了RBM模型的模式識別能力,利用之前用戶反饋的信息完成學習,,調(diào)
整關鍵詞與頁面的相關系數(shù),通過相關系數(shù)的高低完成網(wǎng)頁排序。實驗結(jié)果表明:
基于RBM的網(wǎng)頁排序算法不僅能夠合理地根據(jù)之前的用戶反饋數(shù)據(jù)為新的檢索
請求返回相關性高的檢索結(jié)果,該算法還能夠?qū)ξ礄z索
本文關鍵詞:基于RBM的搜索引擎,由筆耕文化傳播整理發(fā)布。
本文編號:143155
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/143155.html