基于模糊粗糙集的個性化搜索引擎研究
發(fā)布時間:2019-11-06 10:56
【摘要】:隨著因特網(wǎng)技術(shù)在人類社會活動中的應(yīng)用越來越廣泛,因特網(wǎng)中信息的規(guī)模越來越大。龐大的信息數(shù)量使得大部分人難以自己檢索需要的信息,而只能通過搜索引擎幫助檢索。但現(xiàn)有的搜索引擎針對不同的用戶返回的是相同的結(jié)果,沒有考慮用戶之間的個性差異,這導(dǎo)致在查詢二義詞時,必然有一部分用戶的體驗比其它用戶差。而根據(jù)調(diào)查,中國的用戶通常只對第一頁的信息感興趣,這就要求搜索引擎需要根據(jù)用戶的興趣將符合其興趣的搜索結(jié)果盡量靠前。但另一方面,搜索引擎返回的搜索結(jié)果本身已經(jīng)考慮到了大部分用戶的興趣、習(xí)慣,同時用戶也可能會對其它領(lǐng)域也產(chǎn)生臨時興趣,所以完全否定搜索引擎現(xiàn)有排序也是不可取的,可能會過度適應(yīng)用戶的興趣,導(dǎo)致其只能看到某個領(lǐng)域的內(nèi)容。 本文提出一種基于模糊粗糙集的個性化搜索引擎重排序算法,在百度搜索引擎原始搜索數(shù)據(jù)的基礎(chǔ)上,通過重排序,實現(xiàn)個性化搜索服務(wù)。首先,,本文闡述了個性化搜索引擎的一些相關(guān)知識;然后提出了一種兩級用戶興趣模型,將一級興趣視為模糊粗糙集的上近似集,二級興趣視為下近似集;接著提出一種基于模糊粗糙集相似度的重排序算法,計算百度搜索引擎返回結(jié)果和用戶興趣模型的相似度,然后結(jié)合進百度原有排名;最后,本文列舉了實驗的結(jié)果,并對實驗的結(jié)果進行了分析,表明可以滿足個性化的需求。
【圖文】:
第 2 章 個性化搜索引擎相關(guān)知識引擎主要是指能夠根據(jù)不同用戶的不同需求,針對索引擎。如,搜索“火箭”這個詞的時候,喜歡籃的結(jié)果應(yīng)該是不一樣的。這需要實現(xiàn)對不同用戶的和收集,用戶模型的建立。然后和數(shù)據(jù)庫里面的網(wǎng)個性化的搜索結(jié)果。除此之外,個性化還包括搜索的搜索引擎已經(jīng)開始了個性化的嘗試,推出了形形歌推出了個人主頁,用戶可以自己定制谷歌主頁。”欄目,提供個性化服務(wù),如圖 2.1。但這些服務(wù)基的推送上,并沒有涉及到核心業(yè)務(wù)——搜索引擎的
圖 4.1 下近似集相似度測試結(jié)果百度原排名權(quán)重百度的權(quán)重時,除了平均排名上升以外,那些符合用戶記錄,也是考察結(jié)果好壞的一個標(biāo)準(zhǔn),所以還要考察排程度。下近似度權(quán)重為 0.6,然后分別測試百度權(quán)重為 0,0,由下圖可知選擇 0.2 時,排名變化下降達到頂峰,,此時效果較好。
【學(xué)位授予單位】:華僑大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP391.3
本文編號:2556678
【圖文】:
第 2 章 個性化搜索引擎相關(guān)知識引擎主要是指能夠根據(jù)不同用戶的不同需求,針對索引擎。如,搜索“火箭”這個詞的時候,喜歡籃的結(jié)果應(yīng)該是不一樣的。這需要實現(xiàn)對不同用戶的和收集,用戶模型的建立。然后和數(shù)據(jù)庫里面的網(wǎng)個性化的搜索結(jié)果。除此之外,個性化還包括搜索的搜索引擎已經(jīng)開始了個性化的嘗試,推出了形形歌推出了個人主頁,用戶可以自己定制谷歌主頁。”欄目,提供個性化服務(wù),如圖 2.1。但這些服務(wù)基的推送上,并沒有涉及到核心業(yè)務(wù)——搜索引擎的
圖 4.1 下近似集相似度測試結(jié)果百度原排名權(quán)重百度的權(quán)重時,除了平均排名上升以外,那些符合用戶記錄,也是考察結(jié)果好壞的一個標(biāo)準(zhǔn),所以還要考察排程度。下近似度權(quán)重為 0.6,然后分別測試百度權(quán)重為 0,0,由下圖可知選擇 0.2 時,排名變化下降達到頂峰,,此時效果較好。
【學(xué)位授予單位】:華僑大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP391.3
【參考文獻】
相關(guān)期刊論文 前4條
1 曹軍;Google的PageRank技術(shù)剖析[J];情報雜志;2002年10期
2 胡可云,陸玉昌,石純一;粗糙集理論及其應(yīng)用進展[J];清華大學(xué)學(xué)報(自然科學(xué)版);2001年01期
3 劉悅,楊志峰,程學(xué)旗,王斌;利用鏈接分析技術(shù)提高搜索引擎查找質(zhì)量的研究[J];微電子學(xué)與計算機;2002年05期
4 張延紅;搜索引擎PageRank算法的改進[J];浙江萬里學(xué)院學(xué)報;2005年04期
本文編號:2556678
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2556678.html
最近更新
教材專著