天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于描述復(fù)雜性的信息檢索理論與若干模型研究

發(fā)布時間:2022-02-15 13:56
  我們在文中討論了幾種模型:基于kolmogorov complexity的NID(NCD)理論的幾種模型(第二章、第三章),圖模型(第四章),簡單關(guān)聯(lián)模型(第五章),設(shè)計(jì)程序進(jìn)行了實(shí)驗(yàn)驗(yàn)證,和經(jīng)典的向量空間模型做了對比。并且從兩個方面力圖解決信息檢索理論和經(jīng)驗(yàn)上的ad hoc問題:從普遍理論導(dǎo)出檢索模型,用普遍理論解釋經(jīng)驗(yàn)?zāi)P。此外,探討了信息檢索結(jié)果等價的形式化分析、向量空間模型假設(shè)的形式化分析及其前綴復(fù)雜性表示。 一,在NCD理論和模型方面做的工作主要有三:信息檢索的NCD解釋、NCD模型近似實(shí)現(xiàn)和試驗(yàn)、經(jīng)驗(yàn)?zāi)P秃蚇CD模型的比較和解釋。 1:信息檢索的NCD理論(第二章)。我們從算法信息(描述復(fù)雜性)的角度討論了信息檢索的NCD理論。NCD從理論方面給出了解決信息檢索理論上一直存在的ad hoc問題的途徑。由Kolmogorov complexity定義出來的NCD在理論上證明為一切有意義的距離中最優(yōu)的。如果信息檢索必須含有評分和排序,并且將相關(guān)度等同于評分函數(shù)所得到的評分,依照評分來排序文檔,那么,理論上NCD應(yīng)該是最優(yōu)的檢索模型。但是由于NCD不可計(jì)算,因此只提供... 

【文章來源】:北京語言大學(xué)北京市教育部直屬院校

【文章頁數(shù)】:132 頁

【學(xué)位級別】:博士

【文章目錄】:
關(guān)于學(xué)位論文使用授權(quán)的說明
摘要
Abstract
第一章 信息檢索概述
    1.1 引言
    1.2 四種基本的信息檢索模型
        1.2.1 基于集合論的模型
            1.2.1.1 布爾模型
            1.2.1.2 布爾模型的幾種變體
            1.2.1.3 MMM模型
            1.2.1.4 Paice模型
            1.2.1.5 P-norm模型
        1.2.2 代數(shù)模型
            1.2.2.1 向量空間模型
            1.2.2.2 廣義向量空間模型
            1.2.2.3 潛在語義標(biāo)引模型(latent semantics indexing model,LSI)
            1.2.2.4 神經(jīng)網(wǎng)絡(luò)模型(Neural Network Model)
        1.2.3 概率模型
            1.2.3.1 貝葉斯網(wǎng)絡(luò)(bayesian)
        1.2.4 語言模型
            1.2.4.1 一元語法模型
            1.2.4.2 隱馬爾科夫模型(HMM)
            1.2.4.3 統(tǒng)計(jì)語言翻譯模型
            1.2.4.4 信息檢索的語言模型和貝葉斯決策理論
    1.3 檢索模型評價與評測組織
        1.3.1 模型評價
        1.3.2 TREC簡介
    1.4 模型的基礎(chǔ)理論研究以及理論研究上的ad hoc問題
    1.5 各種模型的實(shí)現(xiàn)
        1.5.1 一般信息檢索系統(tǒng)的架構(gòu)
        1.5.2 幾個信息檢索軟件簡介
            1.5.2.1 smart
            1.5.2.2 lemur
第二章 信息檢索的NID(NCD)距離與由此導(dǎo)出的模型
    2.1 描述復(fù)雜性理論(Kolmogorov's complexity)
        2.1.1 任意性或隨機(jī)性與不可計(jì)算性或非遞歸性
        2.1.2 描述復(fù)雜性(Kolmogorov's complexity)
        2.1.3 準(zhǔn)測度,描述概率和推理概率
        2.1.4 描述復(fù)雜性(Kolmogorov's comptexity)和距離
    2.2 描述復(fù)雜性(Kolmogorov's complexity),歸一化絕對距離和信息檢索
        2.2.1 歸一化絕對距離
        2.2.2 壓縮概述,有損壓縮,無損壓縮與信息檢索
            2.2.2.1 通用壓縮算法概述
            2.2.2.2 非通用壓縮-多媒體數(shù)據(jù)的壓縮
            2.2.2.3 壓縮算法和技術(shù)目前和將來的發(fā)展
            2.2.2.4 有損壓縮,無損壓縮和信息檢索
    2.3 信息檢索的NCD模型
        2.3.1 信息檢索的NCD模型的實(shí)現(xiàn)
    2.4 信息檢索的NCD模型的zlib近似實(shí)現(xiàn)和實(shí)驗(yàn)
        2.4.1 實(shí)驗(yàn)1
            2.4.1.1 實(shí)驗(yàn)1的設(shè)定
            2.4.1.2 實(shí)驗(yàn)1的結(jié)果
            2.4.1.3 實(shí)驗(yàn)1的分析
        2.4.2 實(shí)驗(yàn)2
            2.4.2.1 實(shí)驗(yàn)2的設(shè)定
            2.4.2.2 實(shí)驗(yàn)2的結(jié)果
            2.4.2.3 實(shí)驗(yàn)2的分析
        2.4.3 實(shí)驗(yàn)3
            2.4.3.1 實(shí)驗(yàn)3的設(shè)定
            2.4.3.2 實(shí)驗(yàn)3的結(jié)果
            2.4.3.3 實(shí)驗(yàn)3的分析
        2.4.4 實(shí)驗(yàn)4
            2.4.4.1 實(shí)驗(yàn)4的設(shè)定
            2.4.4.2 實(shí)驗(yàn)4的結(jié)果
            2.4.4.3 實(shí)驗(yàn)4的分析
        2.4.5 實(shí)驗(yàn)5
            2.4.5.1 實(shí)驗(yàn)5的設(shè)定
            2.4.5.2 實(shí)驗(yàn)5的結(jié)果
            2.4.5.3 實(shí)驗(yàn)5的分析
        2.4.6 實(shí)驗(yàn)6
            2.4.6.1 實(shí)驗(yàn)6的設(shè)定
            2.4.6.2 實(shí)驗(yàn)6的結(jié)果
            2.4.6.3 實(shí)驗(yàn)6的分析
        2.4.7 zlib試驗(yàn)分析
    2.5 ncd的bzip近似模型與實(shí)驗(yàn)
        2.5.1 bzip近似模型的壓縮算法
        2.5.2 實(shí)驗(yàn)7
            2.5.2.1 實(shí)驗(yàn)7的設(shè)定
            2.5.2.2 實(shí)驗(yàn)7的結(jié)果
            2.5.2.3 實(shí)驗(yàn)7的分析
        2.5.3 實(shí)驗(yàn)8
            2.5.3.1 實(shí)驗(yàn)8的設(shè)定
            2.5.3.2 實(shí)驗(yàn)8的結(jié)果
            2.5.3.3 實(shí)驗(yàn)8的分析
        2.5.4 實(shí)驗(yàn)9
            2.5.4.1 實(shí)驗(yàn)9的設(shè)定
            2.5.4.2 實(shí)驗(yàn)9的結(jié)果
            2.5.4.3 實(shí)驗(yàn)9的分析
        2.5.5 bzip試驗(yàn)分析
    2.6 NCD模型一個簡單的近似實(shí)現(xiàn)
        2.6.1 實(shí)驗(yàn)10
            2.6.1.1 實(shí)驗(yàn)10的設(shè)定
            2.6.1.2 實(shí)驗(yàn)10的結(jié)果
            2.6.1.3 實(shí)驗(yàn)10的分析
        2.6.2 實(shí)驗(yàn)11
            2.6.2.1 實(shí)驗(yàn)11的設(shè)定
            2.6.2.2 實(shí)驗(yàn)11的結(jié)果
            2.6.2.3 實(shí)驗(yàn)11的分析
    2.7 結(jié)論與將來的工作
        2.7.1 信息檢索的NCD理論
        2.7.2 NCD模型依照壓縮算法的近似實(shí)現(xiàn)和試驗(yàn)
            2.7.2.1 NCD模型依照LZ,BWT的近似實(shí)現(xiàn)和試驗(yàn)
            2.7.2.2 NCD模型以單詞為單位進(jìn)行壓縮的LZ簡單實(shí)現(xiàn)和試驗(yàn)
        2.7.3 信息檢索NCD模型將來的進(jìn)一步工作
第三章 信息檢索的經(jīng)驗(yàn)?zāi)P?NCD距離與NCD距離模型探討
    3.1 信息檢索的形式定義與若干性質(zhì)
        3.1.1 信息檢索的形式描述
    3.2 向量空間模型與其他經(jīng)驗(yàn)?zāi)P偷谋容^,向量空間模型的假設(shè)
        3.2.1 語言模型和向量空間模型的比較
        3.2.2 向量空間模型的假設(shè)
        3.2.3 一個典型的向量空間模型的表示函數(shù)與評分函數(shù)
    3.3 歸一化絕對距離在VSM兩個假設(shè)之下導(dǎo)出的模型與實(shí)驗(yàn)驗(yàn)證
        3.3.1 歸一化絕對距離在向量空間模型的兩個假設(shè)之下導(dǎo)出的模型
        3.3.2 實(shí)驗(yàn)1
            3.3.2.1 實(shí)驗(yàn)1的設(shè)定
            3.3.2.2 實(shí)驗(yàn)1的結(jié)果
            3.3.2.3 實(shí)驗(yàn)1的分析
        3.3.3 實(shí)驗(yàn)2
            3.3.3.1 實(shí)驗(yàn)2的設(shè)定
            3.3.3.2 實(shí)驗(yàn)2的結(jié)果
            3.3.3.3 實(shí)驗(yàn)2的分析
    3.4 向量空間模型與歸一化絕對距離的比較
        3.4.1 向量空間模型與歸一化絕對距離
    3.5 結(jié)論和將來的工作
        3.5.1 信息檢索結(jié)果等價的形式化分析、向量空間模型假設(shè)的形式化分析及其前綴復(fù)雜性表示
        3.5.2 NCD模型在VSM假設(shè)之下的近似實(shí)現(xiàn)和試驗(yàn)
        3.5.3 NCD模型中近似取得詞語的算法信息或前綴復(fù)雜度的方法
        3.5.4 經(jīng)驗(yàn)?zāi)P?VSM)和NCD模型的比較和解釋
第四章 信息檢索的文檔圖模型
    4.1 文檔圖模型與相關(guān)的工作
        4.1.1 文檔圖模型
        4.1.2 我們的圖模型和其他機(jī)構(gòu)一些相關(guān)的工作
    4.2 離散馬爾可夫鏈、圖模型、對閱讀過程的建模(詞之間,句子之間的連接關(guān)系)
    4.3 圖模型試驗(yàn)
        4.3.1 實(shí)驗(yàn)1
            4.3.1.1 實(shí)驗(yàn)1的設(shè)定
            4.3.1.2 實(shí)驗(yàn)1的結(jié)果
            4.3.1.3 實(shí)驗(yàn)1的分析
    4.4 結(jié)論和將來的工作
第五章 關(guān)聯(lián)模型:簡化的實(shí)現(xiàn)和試驗(yàn)
    5.1 簡單關(guān)聯(lián)模型
    5.2 簡單關(guān)聯(lián)模型試驗(yàn)一
        5.2.1 實(shí)驗(yàn)設(shè)定
        5.2.2 實(shí)驗(yàn)結(jié)果
        5.2.3 實(shí)驗(yàn)分析
    5.3 簡單關(guān)聯(lián)模型試驗(yàn)二
        5.3.1 實(shí)驗(yàn)設(shè)定
        5.3.2 實(shí)驗(yàn)結(jié)果
        5.3.3 實(shí)驗(yàn)分析
    5.4 簡單關(guān)聯(lián)模型試驗(yàn)三:混合簡單關(guān)聯(lián)模型和向量空間模型
        5.4.1 實(shí)驗(yàn)設(shè)定
        5.4.2 實(shí)驗(yàn)結(jié)果
        5.4.3 實(shí)驗(yàn)分析
    5.5 混合實(shí)驗(yàn)對應(yīng)的簡單向量空間模型實(shí)驗(yàn)
        5.5.1 實(shí)驗(yàn)設(shè)定
        5.5.2 實(shí)驗(yàn)結(jié)果
        5.5.3 實(shí)驗(yàn)分析
    5.6 簡單關(guān)聯(lián)模型結(jié)論和將來進(jìn)一步的工作
第六章 經(jīng)典信息檢索模型的相關(guān)實(shí)驗(yàn)
    6.1 經(jīng)典信息檢索模型的軟件實(shí)現(xiàn)
        6.1.1 簡單的經(jīng)典模型檢索
        6.1.2 帶反饋的經(jīng)典模型檢索
        6.1.3 rerank檢索
        6.1.4 評測
    6.2 信息檢索的向量空間,okapi,lm模型的檢索實(shí)驗(yàn)
        6.2.1 實(shí)驗(yàn)1
            6.2.1.1 實(shí)驗(yàn)1的設(shè)定
            6.2.1.2 實(shí)驗(yàn)1的結(jié)果
        6.2.2 實(shí)驗(yàn)2
            6.2.2.1 實(shí)驗(yàn)2的設(shè)定
            6.2.2.2 實(shí)驗(yàn)2的結(jié)果
        6.2.3 實(shí)驗(yàn)3
            6.2.3.1 實(shí)驗(yàn)3的設(shè)定
            6.2.3.2 實(shí)驗(yàn)3的結(jié)果
    6.3 反饋試驗(yàn)
        6.3.1 實(shí)驗(yàn)4
            6.3.1.1 實(shí)驗(yàn)4的設(shè)定
            6.3.1.2 實(shí)驗(yàn)4的結(jié)果
        6.3.2 實(shí)驗(yàn)5
            6.3.2.1 實(shí)驗(yàn)5的設(shè)定
            6.3.2.2 實(shí)驗(yàn)5的結(jié)果
    6.4 信息檢索模型的rerank實(shí)驗(yàn)
        6.4.1 實(shí)驗(yàn)6
            6.4.1.1 實(shí)驗(yàn)6的設(shè)定
            6.4.1.2 實(shí)驗(yàn)6的結(jié)果
            6.4.1.3 實(shí)驗(yàn)6的分析
        6.4.2 實(shí)驗(yàn)7
            6.4.2.1 實(shí)驗(yàn)7的設(shè)定
            6.4.2.2 實(shí)驗(yàn)7的結(jié)果
        6.4.3 實(shí)驗(yàn)8
            6.4.3.1 實(shí)驗(yàn)8的設(shè)定
            6.4.3.2 實(shí)驗(yàn)8的結(jié)果
第七章 結(jié)論
    7.1 基于kolmogorov complexity的NCD模型,理論和經(jīng)驗(yàn)?zāi)P偷慕忉?br>        7.1.1 信息檢索的NCD理論
        7.1.2 基于kolmogorov complexity的NCD模型的近似實(shí)現(xiàn)和試驗(yàn)
            7.1.2.1 NCD模型依照壓縮算法的近似實(shí)現(xiàn)和試驗(yàn)
            7.1.2.2 NCD模型在VSM假設(shè)之下的近似實(shí)現(xiàn)和試驗(yàn)
        7.1.3 VSM諸經(jīng)驗(yàn)摸型和NCD模型的比較和解釋
            7.1.3.1 近似取得詞語的算法信息或前綴復(fù)雜度的方法
            7.1.3.2 經(jīng)驗(yàn)?zāi)P?VSM)和NCD模型的比較和解釋
    7.2 信息檢索結(jié)果等價,VSM假設(shè)的形式化分析和VSM假設(shè)的前綴復(fù)雜性表示
        7.2.1 信息檢索結(jié)果等價的形式化分析
        7.2.2 向量空間模型假設(shè)的形式化分析和前綴復(fù)雜性表示
    7.3 圖模型
    7.4 簡單關(guān)聯(lián)模型
參考文獻(xiàn)
致謝
聲明
附錄A 相關(guān)數(shù)學(xué)概念,定理,公式和證明
    A.1 隨機(jī)性和有效測試的有關(guān)概念和定理
個人簡歷、在學(xué)期間的研究成果及發(fā)表的論文


【參考文獻(xiàn)】:
期刊論文
[1]基于領(lǐng)域本體的個性化文本信息檢索[J]. 魏桂英,高學(xué)東,武森.  遼寧工程技術(shù)大學(xué)學(xué)報(自然科學(xué)版). 2011(02)

博士論文
[1]全文檢索與GIS一體化及在應(yīng)急管理中的應(yīng)用研究[D]. 周科松.華東師范大學(xué) 2009



本文編號:3626749

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/3626749.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶99a71***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com