基于RBM的搜索引擎論文.pdf
本文關(guān)鍵詞:基于RBM的搜索引擎,由筆耕文化傳播整理發(fā)布。
杭州電子科技大學(xué)
碩士學(xué)位論文
基于RBM的搜索引擎
姓名:陳瑋
申請(qǐng)學(xué)位級(jí)別:碩士
專業(yè):計(jì)算機(jī)軟件與理論
指導(dǎo)教師:陳勤
201112
杭州電子科技大學(xué)碩士學(xué)位論文
摘
要
隨著互聯(lián)網(wǎng)及移動(dòng)互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,一方面是用戶和互聯(lián)網(wǎng)交互的程
度不斷加深,越來越多的用戶反饋了相當(dāng)多的數(shù)據(jù),可以從中洞悉到用戶體驗(yàn)、
商業(yè)營銷、個(gè)人偏好和通常所說的人類行為,從而提供更有針對(duì)性的服務(wù)。而另
一方面,隨著信息日益豐富,如何能夠使用戶通過搜索引擎更為準(zhǔn)確、快速的檢
索到需要的信息就成了人們普遍關(guān)注的焦點(diǎn),針對(duì)搜索引擎的網(wǎng)頁排序算法的研
究就是其中的熱點(diǎn)之一。傳統(tǒng)的搜索引擎是基于網(wǎng)頁內(nèi)容排序,一些人為了能提
高網(wǎng)站排名,達(dá)到吸引更多用戶的目的,增加很多無效的內(nèi)容或者使用其它的方
式作弊。如何有效的利用用戶反饋的數(shù)據(jù)來改善搜索引擎的頁面排序、防止作弊、
提供更為優(yōu)質(zhì)的服務(wù),就成了本文研究的重點(diǎn)。論文主要研究工作如下:
1 針對(duì)傳統(tǒng)的網(wǎng)頁排序算法中出現(xiàn)的作弊問題,研究提出一種基于受限波
Boltzmann
爾茲曼機(jī) RestrictedMachines,簡記為RBM 的網(wǎng)頁排序算法。該算法
有機(jī)結(jié)合了RBM模型的模式識(shí)別能力,利用之前用戶反饋的信息完成學(xué)習(xí),,調(diào)
整關(guān)鍵詞與頁面的相關(guān)系數(shù),通過相關(guān)系數(shù)的高低完成網(wǎng)頁排序。實(shí)驗(yàn)結(jié)果表明:
基于RBM的網(wǎng)頁排序算法不僅能夠合理地根據(jù)之前的用戶反饋數(shù)據(jù)為新的檢索
請(qǐng)求返回相關(guān)性高的檢索結(jié)果,該算法還能夠?qū)ξ礄z索
本文關(guān)鍵詞:基于RBM的搜索引擎,由筆耕文化傳播整理發(fā)布。
本文編號(hào):143155
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/143155.html