天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于用戶習(xí)慣的網(wǎng)頁排序算法研究

發(fā)布時間:2022-01-23 20:36
  在當(dāng)今信息化的時代,互聯(lián)網(wǎng)已經(jīng)成為了人們獲得信息的重要途徑,搜索引擎的普及運用,使得搜索引擎成為了在互聯(lián)網(wǎng)上進(jìn)行全文檢索的重要工具。根據(jù)對用戶使用習(xí)慣的調(diào)查發(fā)現(xiàn),用戶通常只會點擊搜索引擎返回最前面的幾個網(wǎng)頁地址,因此對搜索得到的網(wǎng)頁進(jìn)行排序以及排序結(jié)果是否能夠滿足用戶的需求變得至關(guān)重要。著名的網(wǎng)頁排序算法PageRank算法幫助Google成為了世界上最大的商業(yè)搜索引擎公司。PageRank算法利用鏈接型模型對每一個網(wǎng)頁的權(quán)重值進(jìn)行迭代計算,很大程度上提高了對網(wǎng)頁權(quán)重程度計算上的精確度。在學(xué)術(shù)領(lǐng)域,與PageRank算法同樣著名的HITS算法同樣在網(wǎng)頁排名算法領(lǐng)域占有一席之地。另外,基于詞頻位置加權(quán)排序算法也是一種十分優(yōu)秀的網(wǎng)頁排序算法,是在學(xué)術(shù)研究中經(jīng)常會被用到的算法。雖然上述這些著名的網(wǎng)頁排序算法對搜索引擎的發(fā)展做出了很大的貢獻(xiàn),但它們分別有各自的不足之處。本文提出了基于用戶習(xí)慣的主題敏感的PageRank算法(BUHP算法)。該算法可有效地解決PageRank算法存在的主題漂移問題,并且可依據(jù)不同用戶的不同習(xí)慣和個性,返回符合該用戶習(xí)慣的搜索結(jié)果,可提高對搜索引擎的滿意程度和搜索... 

【文章來源】:大連交通大學(xué)遼寧省

【文章頁數(shù)】:56 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
Abstract
第一章 緒論
    1.1 課題研究背景和意義
    1.2 國內(nèi)外研究現(xiàn)狀
    1.3 論文的研究意義和主要內(nèi)容
第二章 經(jīng)典網(wǎng)頁排序算法分析
    2.1 PageRank算法
        2.1.1 PageRank算法的基本原理
        2.1.2 PageRank算法的優(yōu)點及缺陷
    2.2 超鏈接分析主題搜索算法(HITS)
        2.2.1 算法原理
        2.2.2 算法計算公式
        2.2.3 算法的優(yōu)點及缺陷
    2.3 對超鏈接分析主題搜索算法的改進(jìn)工作
        2.3.1 自動資源整合算法(ARC算法)
        2.3.2 改進(jìn)的HITS算法
    本章小結(jié)
第三章 基于用戶習(xí)慣算法(BUHP算法)的提出
    3.1 BUHP算法提出的背景
    3.2 開放目錄項目(ODP)主題劃分研究
    3.3 詞頻位置的加權(quán)網(wǎng)頁排序方法(TF-IDF)方法介紹
        3.3.1 詞頻位置的加權(quán)網(wǎng)頁排序方法(TF-IDF)方法原理
        3.3.2 詞頻位置的加權(quán)網(wǎng)頁排序方法(TF-IDF)方法的操作步驟
    3.4 文本相似度算法研究
    3.5 BUHP算法原理
    3.6 BUHP算法用戶習(xí)慣信息的提取
    3.7 BUHP算法用戶信息的數(shù)據(jù)化
    3.8 BUHP算法公式
    本章小結(jié)
第四章 實驗驗證BUHP算法
    4.1 實驗平臺介紹
        4.1.1 開源項目介紹
        4.1.2 Lucene介紹
        4.1.3 Nutch介紹
    4.2 實驗平臺的搭建
    4.3 實驗數(shù)據(jù)驗證BUHP算法
        4.3.1 樣本網(wǎng)頁數(shù)據(jù)處理
        4.3.2 用戶習(xí)慣信息處理
        4.3.3 BUHP算法計算結(jié)果
    4.4 實驗結(jié)果分析及實驗結(jié)論
    本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文
致謝


【參考文獻(xiàn)】:
期刊論文
[1]改進(jìn)的非平均傳遞權(quán)值PageRank算法[J]. 王春花,朱俊平.  計算機(jī)工程與設(shè)計. 2010(10)
[2]PageRank算法中主題漂移的研究[J]. 高琪,張永平.  微計算機(jī)信息. 2010(09)
[3]語義相似的PageRank改進(jìn)算法[J]. 何明,周軍,李樹友.  計算機(jī)工程與應(yīng)用. 2009(27)
[4]基于主題相似度模型的TS-PageRank算法[J]. 黃德才,戚華春,錢能.  小型微型計算機(jī)系統(tǒng). 2007(03)
[5]基于改進(jìn)的互信息特征選擇的文本分類[J]. 伍建軍,康耀紅.  計算機(jī)應(yīng)用. 2006(S2)
[6]具有時間反饋的PageRank改進(jìn)算法[J]. 戚華春,黃德才,鄭月鋒.  浙江工業(yè)大學(xué)學(xué)報. 2005(03)
[7]加速評估算法:一種提高Web結(jié)構(gòu)挖掘質(zhì)量的新方法[J]. 張嶺,馬范援.  計算機(jī)研究與發(fā)展. 2004(01)
[8]搜索引擎的幾種常用排序算法[J]. 常璐,夏祖奇.  圖書情報工作. 2003(06)
[9]有序概念格與WWW用戶訪問模式的增量挖掘[J]. 金陽,左萬利.  計算機(jī)研究與發(fā)展. 2003(05)
[10]對網(wǎng)頁P(yáng)ageRank算法的改進(jìn)[J]. 宋聚平,王永成,尹中航,滕偉.  上海交通大學(xué)學(xué)報. 2003(03)

博士論文
[1]網(wǎng)頁排序中的隨機(jī)模型及算法[D]. 劉玉婷.北京交通大學(xué) 2009

碩士論文
[1]基于Nutch的Web結(jié)構(gòu)挖掘算法研究[D]. 文軍艦.天津財經(jīng)大學(xué) 2011
[2]基于Lucene的全文檢索系統(tǒng)的研究與應(yīng)用[D]. 岳莉.西安電子科技大學(xué) 2010
[3]中文聚類搜索引擎中主要技術(shù)的研究[D]. 陳平.吉林大學(xué) 2009
[4]基于Lucene的企業(yè)搜索引擎[D]. 王波.北京郵電大學(xué) 2009
[5]LUCENE實現(xiàn)的基于RSS的博客搜索引擎[D]. 劉雙林.哈爾濱工程大學(xué) 2009
[6]專業(yè)搜索引擎的排序算法研究[D]. 徐金雷.南京師范大學(xué) 2007
[7]基于Nutch的主題爬蟲研究與實現(xiàn)[D]. 蘇曉珂.昆明理工大學(xué) 2007



本文編號:3605107

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3605107.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶34c1d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com