天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

網(wǎng)絡搜索引擎與專家檢索系統(tǒng)框架和模型研究

發(fā)布時間:2016-08-24 06:27

  本文關鍵詞:網(wǎng)絡搜索引擎與專家檢索系統(tǒng)框架和模型研究,由筆耕文化傳播整理發(fā)布。


《北京郵電大學》 2009年

網(wǎng)絡搜索引擎與專家檢索系統(tǒng)框架和模型研究

李晨  

【摘要】: 伴隨著網(wǎng)絡的不斷發(fā)展,搜索引擎的發(fā)展也在不斷的前進之中,并且日趨的成為了網(wǎng)絡中的最重要的信息檢索工具和一種至關重要的網(wǎng)絡應用。搜索引擎的框架和檢索模型是搜索引擎中的最核心技術(shù),本文主要是對搜索引擎的框架和檢索模型進行研究和改進,然后將其應用到專家檢索系統(tǒng)中,最終為基于對象的規(guī)則化搜索引擎的設計做鋪墊。 本文的主要工作體現(xiàn)在一下幾個方面: 第一,本文介紹了應用最廣泛的基于全文檢索的搜索引擎的框架和檢索模型。然后對最經(jīng)典和最常用的檢索模型進行了評價實驗,在此基礎上研究了統(tǒng)計語言模型在不同平滑方法下的不同表現(xiàn)。 第二,針對專家檢索任務的要求和特點,使用兩階段檢索模型和專家窗口模型作為解決方案來完成專家檢索任務。兩階段檢索模型是在針對新檢索任務時采用的一種新的檢索方法,它是在利用一般的檢索模型的基礎上對檢索的過程進行了一種新的改進嘗試。當然這種嘗試繼承了一般的檢索模型,這里作者將之前提及的檢索模型根據(jù)具體的情況以優(yōu)化的形式融入到兩階段模型中,在專家檢索中獲得了較好的檢索效果。 第三,對專家檢索的的第二個方法——專家窗口,本文也進行了多模型的實驗,并與兩階段的檢索方法進行對比,選擇出較好的檢索解決方案作為校園對象搜索引擎的檢索模型。 第四,利用專家檢索系統(tǒng)的檢索模型來實現(xiàn)基于校園網(wǎng)內(nèi)容的對象搜索引擎。該引擎不僅可以和普通搜索引擎一樣返回文檔的檢索結(jié)果,還能返回和查詢詞相關的從語料中處理出來的相關對象,即以一種結(jié)構(gòu)化的信息作為返回結(jié)果。 在論文的最后總結(jié)全文,指出課題中有待進一步深入研究的問題。

【關鍵詞】:
【學位授予單位】:北京郵電大學
【學位級別】:碩士
【學位授予年份】:2009
【分類號】:TP391.3
【目錄】:

  • 摘要4-5
  • ABSTRACT5-10
  • 第一章 緒論10-16
  • 1.1 研究背景10-12
  • 1.2 研究現(xiàn)狀12-13
  • 1.3 論文課題來源13
  • 1.4 論文的貢獻和主要創(chuàng)新點13-14
  • 1.5 論文組織14-16
  • 第二章 基于全文檢索技術(shù)的網(wǎng)絡搜索引擎框架介紹16-23
  • 2.1 網(wǎng)絡搜索引擎的分類16-17
  • 2.2 基于全文檢索的網(wǎng)絡搜索引擎的框架17-22
  • 2.2.1 簡單化的搜索引擎結(jié)構(gòu)18-20
  • 2.2.2 細化的搜索引擎的結(jié)構(gòu)20-22
  • 2.3 本章小結(jié)22-23
  • 第三章 網(wǎng)絡搜索引擎的檢索模型介紹23-40
  • 3.1 基于集合的檢索模型23-24
  • 3.2 基于代數(shù)集的檢索模型24-27
  • 3.2.1 向量空間模型24-25
  • 3.2.2 融入tf-idf因子的向量空間模型25-27
  • 3.3 基于概率統(tǒng)計的檢索模型27-30
  • 3.3.1 經(jīng)典概率模型——二元獨立模型和經(jīng)典的BM25公式27-30
  • 3.3.2 其他的常用概率模型——雙Poisson分布模型30
  • 3.4 基于統(tǒng)計語言的檢索模型30-39
  • 3.4.1 查詢似然模型31-35
  • 3.4.2 查詢似然模型中的平滑技術(shù)35-38
  • 3.4.2.1 Jelinek-Mercer平滑35-37
  • 3.4.2.2 Absolute-Discounting平滑37-38
  • 3.4.2.3 Bayesian-Dirichlet平滑38
  • 3.4.3 其他的統(tǒng)計語言模型38-39
  • 3.5 其他檢索模型39
  • 3.6 本章小結(jié)39-40
  • 第四章 檢索結(jié)果的評價和模型實驗比較40-48
  • 4.1 檢索結(jié)果的評判標準40-41
  • 4.2 模型的比較實驗41-43
  • 4.2.1 實驗數(shù)據(jù)介紹和相關的預處理工作41-42
  • 4.2.2 不同模型的實驗和結(jié)果對比42-43
  • 4.3 平滑方法參數(shù)變化對語言模型檢索結(jié)果的影響43-47
  • 4.3.1 Byesian-Dirichlet平滑43-44
  • 4.3.2 Jelinek-Mercer平滑44-46
  • 4.3.3 Absolute—Discount平滑46-47
  • 4.4 本章工作總結(jié)47-48
  • 第五章 專家檢索系統(tǒng)48-64
  • 5.1 專家檢索任務介紹48-50
  • 5.1.1 專家檢索的任務48
  • 5.1.2 專家檢索問題的研究48-50
  • 5.1.2.1 文檔中專家的確定48-49
  • 5.1.2.2 專家和檢索詞相關度的確定49-50
  • 5.2 專家檢索系統(tǒng)50-58
  • 5.2.1 基于兩階段檢索的專家檢索系統(tǒng)50-56
  • 5.2.1.1 兩階段檢索框架——兩索引的檢索方法51-54
  • 5.2.1.2 兩階段檢索核心——第二階段檢索模型的選擇54-56
  • 5.2.2 基于專家窗口的專家檢索系統(tǒng)56-58
  • 5.3 專家檢索系統(tǒng)的實驗對比58-63
  • 5.3.1 基于兩階段檢索的專家檢索系統(tǒng)實驗58-61
  • 5.3.2 基于專家窗口的專家檢索系統(tǒng)實驗61-62
  • 5.3.3 綜合比較兩種方法的專家檢索系統(tǒng)62-63
  • 5.4 本章工作總結(jié)63-64
  • 第六章 校園對象搜索引擎64-68
  • 6.1 校園對象搜索引擎介紹64-65
  • 6.2 校園對象搜索引擎框架65-66
  • 6.3 校園對象搜索引擎運行效果66-68
  • 第七章 結(jié)束語68-69
  • 參考文獻69-71
  • 致謝71-72
  • 作者攻讀學位期間發(fā)表的學術(shù)論文目錄72
  • 下載全文 更多同類文獻

    CAJ全文下載

    (如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)

    CAJViewer閱讀器支持CAJ、PDF文件格式


    【相似文獻】

    中國期刊全文數(shù)據(jù)庫 前10條

    1 顧小林;卞藝杰;浦徐進;;基于改進KS方法的食品安全追溯信息檢索模型[J];軟科學;2011年08期

    2 楊為民;李龍澍;;基于場論的高精度信息檢索研究[J];計算機工程;2011年15期

    3 江瀟俊;李善平;劉思屹;;基于本體的關聯(lián)知識可視化檢索模型[J];計算機工程;2011年16期

    4 涂俊翔;朱曉林;;協(xié)同企業(yè)產(chǎn)品生命周期管理系統(tǒng)信息的檢索[J];中國工程機械學報;2011年02期

    5 楊艷;朱戈;范文彬;;一種基于文檔拓撲的相似性搜索算法[J];計算機工程與應用;2011年26期

    6 李廣原;雷鴻;;一種新的CAI設計與開發(fā)平臺SnPCAIP[J];計算機時代;2011年07期

    7 李琦;;本體用于信息檢索的研究淺析[J];情報探索;2011年07期

    8 王宏生;張敏;;一種基于語義網(wǎng)的相似度計算模型[J];微計算機信息;2011年07期

    9 程慧平;陳永超;;國內(nèi)知識檢索研究進展[J];圖書情報工作;2011年10期

    10 李剛;錢省三;葉春明;;基于Jena的知識檢索系統(tǒng)的優(yōu)化研究[J];微計算機信息;2011年08期

    中國重要會議論文全文數(shù)據(jù)庫 前10條

    1 楊小銳;林磊;孫承杰;劉秉權(quán);;基于結(jié)構(gòu)挖掘的論壇檢索模型[A];第六屆全國信息檢索學術(shù)會議論文集[C];2010年

    2 沈水榮;;建立計算機知識點檢索模型探索語義自動識別的相關問題——關于“人民金典”語義自動識別系列產(chǎn)品研發(fā)的理論思考[A];中國新聞技術(shù)工作者聯(lián)合會2011年學術(shù)年會論文集(上篇)[C];2011年

    3 申展;王建會;吳愛華;胡運發(fā);;互關聯(lián)后繼樹模型——一種新穎的全文檢索模型[A];第二十屆全國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2003年

    4 朱治國;孫長嵩;;一個異構(gòu)構(gòu)件庫群聯(lián)合檢索模型[A];2006北京地區(qū)高校研究生學術(shù)交流會——通信與信息技術(shù)會議論文集(下)[C];2006年

    5 孫斌;呂學強;蘇祺;;義項矩陣模型SMM簡介[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2004年

    6 李廣原;馮嘉禮;;基于屬性坐標的文本信息檢索模型[A];廣西計算機學會2005年學術(shù)年會論文集[C];2005年

    7 梅放;林鴻飛;;基于社會化標簽的移動音樂檢索[A];第五屆全國信息檢索學術(shù)會議論文集[C];2009年

    8 李勇;邵世煌;;利用神經(jīng)網(wǎng)絡建立產(chǎn)品零件功能設計的分類檢索模型[A];1995年中國控制會議論文集(下)[C];1995年

    9 汪明;熊璋;吳晶;;基于LDAP的多語言概念檢索模型的研究[A];第一屆建立和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2005)論文集[C];2005年

    10 王秉卿;黃萱菁;;基于線性模型的查詢擴展方法[A];第五屆全國信息檢索學術(shù)會議論文集[C];2009年

    中國重要報紙全文數(shù)據(jù)庫 前4條

    1 清華大學計算機系智能技術(shù)與系統(tǒng)國家重點實驗室 張敏 金奕江;[N];計算機世界;2003年

    2 中國科學院計算技術(shù)研究所 王 斌;[N];計算機世界;2004年

    3 清華大學計算機系智能技術(shù)與系統(tǒng)國家重點實驗室 張敏 金奕江;[N];計算機世界;2003年

    4 本報駐昆山首席記者 姚喜新;[N];蘇州日報;2010年

    中國博士學位論文全文數(shù)據(jù)庫 前10條

    1 陳圣兵;基于商空間理論的海量信息檢索模型的研究[D];安徽大學;2010年

    2 胡熠;面向信息檢索的文本內(nèi)容分析[D];上海交通大學;2007年

    3 梁作鵬;面向Web的XML檢索關鍵技術(shù)研究[D];東南大學;2005年

    4 郭永明;XML文檔交互式信息檢索技術(shù)研究[D];東華大學;2010年

    5 茹昭;企業(yè)信息檢索中的對象檢索方法研究[D];北京郵電大學;2008年

    6 王珂;支持快速設計的CBR技術(shù)及其應用研究[D];南京航空航天大學;2007年

    7 劉念;DAS模型中的數(shù)據(jù)庫加密與密文檢索研究[D];北京郵電大學;2010年

    8 張靜;視頻信息檢索研究[D];復旦大學;2006年

    9 喬林;基于多關鍵詞檢索的企業(yè)競爭情報搜集方法研究[D];中國科學技術(shù)大學;2006年

    10 唐彬;基于本體的構(gòu)件檢索研究[D];復旦大學;2007年

    中國碩士學位論文全文數(shù)據(jù)庫 前10條

    1 李晨;網(wǎng)絡搜索引擎與專家檢索系統(tǒng)框架和模型研究[D];北京郵電大學;2009年

    2 朱瑩婷;基于遷移學習理論的Markov檢索模型[D];江西師范大學;2010年

    3 田晉坤;基于本體術(shù)語關系的SBN檢索模型擴展[D];河北大學;2011年

    4 王立政;基于本體的知識檢索模型優(yōu)化研究[D];吉林大學;2011年

    5 紀明奎;基于語義網(wǎng)的個性化信息檢索模型研究[D];黑龍江大學;2007年

    6 袁亮;一個基于WEB的信息組織與檢索模型(WIORS)研究[D];武漢大學;2005年

    7 徐坤;基于關系數(shù)據(jù)庫搜索引擎的研究[D];長春理工大學;2008年

    8 曹立勇;基于本體的檢索模型的研究[D];安徽大學;2010年

    9 孔世明;基于自然語言識別的智能檢索研究與實現(xiàn)[D];重慶大學;2006年

    10 邱曉俊;面向特殊主題的排序與檢索算法研究[D];江西理工大學;2012年


      本文關鍵詞:網(wǎng)絡搜索引擎與專家檢索系統(tǒng)框架和模型研究,,由筆耕文化傳播整理發(fā)布。



    本文編號:101587

    資料下載
    論文發(fā)表

    本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/101587.html


    Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

    版權(quán)申明:資料由用戶7d304***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com