元搜索引擎結(jié)果個性化排序的研究與實現(xiàn).pdf 全文 文檔投稿網(wǎng)
本文關(guān)鍵詞:元搜索引擎結(jié)果個性化排序的研究與實現(xiàn),由筆耕文化傳播整理發(fā)布。
中國石油大學(華東)
碩士學位論文
元搜索引擎結(jié)果個性化排序的研究與實現(xiàn)
姓名:孫鑫
申請學位級別:碩士
專業(yè):計算機應用技術(shù)
指導教師:索紅光
20080501摘 要
目前,搜索引擎存在著冗余信息過載和索引數(shù)據(jù)庫信息覆蓋率低的問題,發(fā)展個性
化的元搜索引擎是解決這兩個問題的一個重要途徑,由于元搜索引擎可以同時調(diào)用多個
獨立搜索引擎,提高了搜索引擎的查全率;面對數(shù)量眾多的檢索結(jié)果,采用個性化的結(jié)
果處理方法,可以提高用戶檢索的效率和返回結(jié)果的質(zhì)量。
本文研究并設(shè)計了一個針對元搜索引擎返回結(jié)果的個性化排序算法。算法的主要思
路是將元搜索引擎返回的結(jié)果網(wǎng)頁預處理后,通過聚類的方法,將結(jié)果網(wǎng)頁集合劃分為
不同的類別。計算每個類別與用戶興趣模型的相似度,根據(jù)相似度對類別進行宏觀排序,
從而確定用戶的興趣類別,并對興趣類別中的結(jié)果進行基于查詢關(guān)鍵詞與結(jié)果內(nèi)容相關(guān)
性的微觀排序。文章中同時也給出了建立用戶興趣模型的方法和步驟。
在個性化排序算法的結(jié)果預處理步驟中采用了一種改進的基于超鏈接文本分析的
網(wǎng)頁正文提取方法;在排序步驟中提出了宏觀排序和微觀排序的概念,給出了兩種排序
的具體實現(xiàn)方法;在聚類處理中,為了提高算法的性能,采用了一種改進的聚類算法。
根據(jù)元搜索引擎結(jié)果個性化排序算法,本文設(shè)計了一個基于客戶端的個性化元搜索
引擎系統(tǒng),系統(tǒng)采用了模塊化的設(shè)計,具有友好的人機交互界面。文中給出了系
統(tǒng)的測試數(shù)據(jù),并對數(shù)據(jù)進行了分析和處理。實驗表明,本文的基于個性化排序算法的
個性化元搜索引擎系統(tǒng)具有理想的查全率與查準率,能夠達到方便用戶檢索和提
供高質(zhì)量檢索結(jié)果的目的,同時該系統(tǒng)也存在著很多不足之處,有待于進一步的
本文關(guān)鍵詞:元搜索引擎結(jié)果個性化排序的研究與實現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號:93001
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/93001.html