天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于元搜索引擎的排序算法研究

發(fā)布時(shí)間:2023-10-31 08:50
    在大數(shù)據(jù)時(shí)代,大量信息涌現(xiàn)在用戶面前,人們大多通過網(wǎng)絡(luò)獲取信息。而搜索引擎的出現(xiàn)則是在互聯(lián)網(wǎng)與用戶之間搭起了一座橋梁,幫助用戶獲取信息。但是,單一的搜索引擎因?yàn)榈途取⒌驼倩芈实仍驅(qū)е掠脩舻臐M意度較低。因此,調(diào)用多個(gè)成員搜索引擎的元搜索引擎被提出,有助于擴(kuò)大信息檢索的覆蓋面,提升召回率。元搜索引擎最關(guān)鍵的技術(shù)在于對(duì)結(jié)果的合成和重新排序,排序結(jié)果的好壞將直接影響整個(gè)元搜索引擎的性能,F(xiàn)在的元搜索引擎很少關(guān)注網(wǎng)頁信息的質(zhì)量以及網(wǎng)頁正文的內(nèi)容和信息量。本文通過對(duì)網(wǎng)頁信息質(zhì)量進(jìn)行評(píng)估,進(jìn)一步考慮網(wǎng)頁正文關(guān)鍵詞信息對(duì)搜索結(jié)果進(jìn)行重新排序,本文的主要工作有:(1)本文提出了一種基于網(wǎng)頁信息質(zhì)量評(píng)價(jià)模型的排序算法。針對(duì)現(xiàn)有搜索引擎很少關(guān)注網(wǎng)頁信息質(zhì)量的問題,本文基于網(wǎng)頁的標(biāo)題、網(wǎng)頁的摘要、網(wǎng)頁的來源計(jì)算出網(wǎng)頁信息質(zhì)量的評(píng)分。根據(jù)網(wǎng)頁信息質(zhì)量的評(píng)分對(duì)網(wǎng)頁進(jìn)行重新排序。本文通過實(shí)驗(yàn),驗(yàn)證了基于網(wǎng)頁信息質(zhì)量評(píng)價(jià)算法的元搜索引擎提升了搜索精度,并且用戶的滿意度也明顯優(yōu)于現(xiàn)有的搜索引擎。(2)本文在第一個(gè)工作的基礎(chǔ)上進(jìn)一步提出了融合網(wǎng)頁正文關(guān)鍵詞信息評(píng)價(jià)模型的排序算法。針對(duì)現(xiàn)有搜索引擎只返回大量相關(guān)主題頁面,并不評(píng)價(jià)網(wǎng)頁正文內(nèi)容的問題,對(duì)于信息類查詢本文首先通過網(wǎng)頁正文抽取算法抓取網(wǎng)頁正文部分內(nèi)容。再通過正文關(guān)鍵詞提取算法獲得網(wǎng)頁正文的關(guān)鍵詞以及權(quán)重。最后通過網(wǎng)頁正文關(guān)鍵詞信息評(píng)價(jià)算法計(jì)算出網(wǎng)頁正文內(nèi)容評(píng)價(jià)得分。根據(jù)得分進(jìn)一步優(yōu)化元搜索引擎的排序。經(jīng)過實(shí)驗(yàn)驗(yàn)證,該方法對(duì)于尖端網(wǎng)頁的排序更加合理,平均查準(zhǔn)率高達(dá)94%。(3)本文基于提出的元搜索引擎的重排序算法設(shè)計(jì)并實(shí)現(xiàn)了原型系統(tǒng)。對(duì)元搜索引擎系統(tǒng)的流程和整體框架進(jìn)行了說明,對(duì)系統(tǒng)界面進(jìn)行了展示。本系統(tǒng)通過一個(gè)友好簡(jiǎn)潔的界面與用戶進(jìn)行交互,幫助用戶在更短的時(shí)間獲取更多有效的信息,并且提供相關(guān)搜索與當(dāng)下搜索熱點(diǎn)推薦,以提升用戶的滿意度。
 
【學(xué)位級(jí)別】:碩士
 
頁數(shù):58
 
文章目錄
 
摘要
abstract
第一章 緒論
    1.1 研究背景及意義
    1.2 研究現(xiàn)狀
    1.3 本文研究內(nèi)容
    1.4 本文組織結(jié)構(gòu)
第二章 元搜索引擎相關(guān)理論技術(shù)研究
    2.1 搜索引擎概述
        2.1.1 搜索引擎的發(fā)展
        2.1.2 搜索引擎的技術(shù)架構(gòu)
        2.1.3 搜索引擎存在的問題
    2.2 元搜索引擎概述
        2.2.1 元搜索引擎的原理
        2.2.2 元搜索引擎的分類
        2.2.3 元搜索引擎和搜索引擎的區(qū)別
    2.3 搜索質(zhì)量評(píng)價(jià)技術(shù)
        2.3.1 Cranfield評(píng)價(jià)體系
        2.3.2 評(píng)價(jià)指標(biāo)
    2.4 本章小結(jié)
第三章 基于網(wǎng)頁信息質(zhì)量評(píng)價(jià)模型的排序算法
    3.1 網(wǎng)頁信息質(zhì)量評(píng)價(jià)模型
        3.1.1 相關(guān)定義
        3.1.2 網(wǎng)頁信息質(zhì)量評(píng)價(jià)框架
    3.2 基于網(wǎng)頁信息質(zhì)量評(píng)價(jià)模型的排序算法
        3.2.1 數(shù)據(jù)清洗預(yù)處理
        3.2.2 指標(biāo)計(jì)算方法
        3.2.3 網(wǎng)頁信息質(zhì)量評(píng)價(jià)算法
    3.3 實(shí)驗(yàn)和分析
        3.3.1 實(shí)驗(yàn)數(shù)據(jù)和評(píng)價(jià)標(biāo)準(zhǔn)
        3.3.2 權(quán)重確定
        3.3.3 實(shí)驗(yàn)設(shè)計(jì)與實(shí)驗(yàn)結(jié)果
        3.3.4 實(shí)驗(yàn)分析
    3.4 本章小結(jié)
第四章 融合網(wǎng)頁正文關(guān)鍵詞信息評(píng)價(jià)模型的排序算法
    4.1 網(wǎng)頁正文關(guān)鍵詞信息評(píng)價(jià)模型
        4.1.1 相關(guān)定義
        4.1.2 方法框架
    4.2 融合網(wǎng)頁正文關(guān)鍵詞信息評(píng)價(jià)模型的排序算法
        4.2.1 網(wǎng)頁正文的獲取方法
        4.2.2 動(dòng)態(tài)頁面正文抽取
        4.2.3 正文關(guān)鍵詞提取算法
        4.2.4 網(wǎng)頁正文關(guān)鍵詞信息評(píng)價(jià)算法
    4.3 實(shí)驗(yàn)和分析
        4.3.1 實(shí)驗(yàn)數(shù)據(jù)和評(píng)價(jià)標(biāo)準(zhǔn)
        4.3.2 實(shí)驗(yàn)設(shè)計(jì)與實(shí)驗(yàn)結(jié)果
        4.3.3 實(shí)驗(yàn)分析
    4.4 本章小結(jié)
第五章 原型系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
    5.1 系統(tǒng)開發(fā)環(huán)境
    5.2 系統(tǒng)流程
    5.3 相關(guān)技術(shù)
        5.3.1 網(wǎng)絡(luò)爬蟲技術(shù)
        5.3.2 分詞技術(shù)
        5.3.3 服務(wù)器端動(dòng)態(tài)網(wǎng)頁開發(fā)技術(shù)
    5.4 系統(tǒng)整體框架
        5.4.1 用戶接口模塊
        5.4.2 檢索請(qǐng)求模塊
        5.4.3 成員搜索引擎調(diào)度模塊
        5.4.4 結(jié)果處理模塊
    5.5 系統(tǒng)功能與展示
        5.5.1 數(shù)據(jù)集成功能
        5.5.2 信息查詢與推薦功能
        5.5.3 系統(tǒng)界面
        5.5.4 查詢結(jié)果展示
    5.6 本章小結(jié)
第六章 工作總結(jié)與展望
    6.1 研究成果總結(jié)
    6.2 未來工作展望
參考文獻(xiàn)
在學(xué)期間取得的科研成果和科研情況說明
致謝


本文編號(hào):61325

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/61325.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶76eab***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com