天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于概念的信息檢索模型研究

發(fā)布時(shí)間:2020-07-16 23:59
【摘要】:隨著互聯(lián)網(wǎng)的快速普及以及廉價(jià)大容量存儲(chǔ)設(shè)備的不斷出現(xiàn),人類社會(huì)已經(jīng)產(chǎn)生了海量的數(shù)字化文檔信息。這些數(shù)量驚人的數(shù)字化文檔可謂是人類知識(shí)的一個(gè)重要的寶庫,同時(shí)也使得人們?cè)絹碓揭蕾囆畔z索系統(tǒng)來找到所需要的信息。在傳統(tǒng)的信息檢索模型中,通常使用“詞袋”模型來表征文檔和查詢。然而,人類的自然語言是一個(gè)異常復(fù)雜的符號(hào)系統(tǒng),詞語之間存在包括同義、歧義、語義相關(guān)等錯(cuò)綜復(fù)雜的關(guān)系。簡(jiǎn)單的“詞袋”模型忽視了詞語之間的豐富的語義關(guān)系,遠(yuǎn)遠(yuǎn)不能夠表征自然語言中所蘊(yùn)含的復(fù)雜的語義信息。 本文中的概念是指描述意義的一個(gè)基本單元。人類理解自然語言的過程是一個(gè)語義概念的聯(lián)想和關(guān)聯(lián)的過程,這種功能是由人類大腦中幾百億個(gè)神經(jīng)元構(gòu)成的復(fù)雜生理組織所提供的。把和文本主題相關(guān)的概念中所蘊(yùn)含的語義知識(shí)融合到文檔和查詢表征模型將是構(gòu)建基于語義的信息檢索模型的一個(gè)途徑,這也是本文重點(diǎn)要解決的問題。本文針對(duì)基于概念的文本信息檢索系統(tǒng)的各個(gè)方面進(jìn)行了系統(tǒng)的研究,包括文本的概念標(biāo)注的構(gòu)建、概念的語義表征模型、基于概念的文檔和查詢模型平滑方法以及基于概念間語義相關(guān)性的檢索模型。主要研究工作和研究成果概括如下: 一、提出了構(gòu)建文本的概念標(biāo)注的方法。根據(jù)所處理文本對(duì)象的不同,提出了幾種不同概念標(biāo)注方法。針對(duì)某些專業(yè)領(lǐng)域文檔集合,可以直接利用其中專家標(biāo)注的概念。在通常情況下,文檔中沒有直接可以利用的概念標(biāo)注。我們提出了一種利用維基百科文檔建立通用概念庫,并利用基于排序?qū)W習(xí)的方法來實(shí)現(xiàn)文檔的維基百科概念自動(dòng)標(biāo)注的方法。另外,中文維基百科的質(zhì)量和數(shù)量均難以滿足通用概念庫的要求,上面提出基于維基百科概念的方法難以應(yīng)用于中文文本集,因此我們還提出了一種自動(dòng)概念抽取的方法為中文文本標(biāo)注概念。 二、提出了構(gòu)建概念的語義表征模型的方法。針對(duì)不同類型的概念系統(tǒng),分別提出了不同的解決方法。針對(duì)專業(yè)辭典中的概念,提出了一種基于互信息的概念表征方法。針對(duì)維基百科概念,提出了一種基于混合模型的表征方法和一種基于互信息的概念表征方法。針對(duì)中文文本中自動(dòng)抽取的概念,提出一種基于概念間語義關(guān)聯(lián)度的方法。 三、提出了一種新的基于概念的文檔模型平滑方法。通過把概念的語義信息有機(jī)的整合到基于“詞袋”的文檔模型,建立基于語義平滑的文檔表征模型。為了驗(yàn)證方法的有效性,在包括專業(yè)領(lǐng)域文獻(xiàn)和新聞文本的幾種標(biāo)準(zhǔn)信息檢索測(cè)試集上進(jìn)行了測(cè)試。實(shí)驗(yàn)表明,相對(duì)于傳統(tǒng)的語言模型方法,這種方法的檢索效果有了顯著的提高。 四、提出了一種新的基于概念的查詢模型平滑方法。在為查詢標(biāo)注相關(guān)概念的過程中,分別提出了兩種不同的方法:基于偽相關(guān)反饋文檔中標(biāo)注的概念來建立查詢的概念表征模型的方法,以及基于交互式信息檢索的概念選擇的方法。在包括專業(yè)領(lǐng)域文獻(xiàn)和新聞文本的幾種標(biāo)準(zhǔn)信息檢索測(cè)試集上進(jìn)行的測(cè)試表明,相對(duì)于傳統(tǒng)的語言模型方法,這種方法的檢索效果有了顯著的提高,進(jìn)一步驗(yàn)證了這種方法的有效性。 五、提出了一種利用概念間語義關(guān)系的中文檢索模型。利用排序?qū)W習(xí)方法有機(jī)地整合包括概念間語義相關(guān)度等各種特征項(xiàng),建立更加有效的信息檢索模型。在包含不同來源新聞報(bào)道的國際標(biāo)準(zhǔn)中文文本信息檢索測(cè)試集NTCIR上的三個(gè)子集上進(jìn)行了測(cè)試。實(shí)驗(yàn)結(jié)果表明,相對(duì)于傳統(tǒng)的基于BM25模型的方法,這種方法的檢索效果有了顯著的提高。
【學(xué)位授予單位】:華中師范大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2012
【分類號(hào)】:G252.7

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 馮茜蘆;潘金貴;;一種基于句子的信息檢索模型研究[J];計(jì)算機(jī)應(yīng)用與軟件;2010年03期

2 吳丹;齊和慶;;信息檢索模型及其在跨語言信息檢索中的應(yīng)用進(jìn)展[J];現(xiàn)代情報(bào);2009年07期

3 楊金龍;曾夢(mèng)玲;劉千里;;2000年以來我國信息檢索模型研究綜述[J];圖書情報(bào)導(dǎo)刊;2019年04期

4 董屹;李佳;王昆鵬;;基于數(shù)據(jù)前端分析的圖書管理信息檢索模型[J];科技信息;2013年14期

5 張小芳;;幾種常見信息檢索模型的分析與評(píng)價(jià)[J];情報(bào)雜志;2008年03期

6 孫坦;周靜怡;;近幾年來國外信息檢索模型研究進(jìn)展[J];圖書館建設(shè);2008年03期

7 周竹榮;黃果;周亭;;一種混合的文本信息檢索模型研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2007年11期

8 金光赫;王興偉;曲大鵬;蔣定德;;一種基于相關(guān)反饋的信息檢索模型[J];計(jì)算機(jī)科學(xué);2012年07期

9 張艷;;信息檢索模型的比較研究[J];電腦知識(shí)與技術(shù);2009年08期

10 熊忠陽;李春玲;張玉芳;;一種基于領(lǐng)域本體的混合信息檢索模型[J];計(jì)算機(jī)工程;2008年21期

相關(guān)會(huì)議論文 前10條

1 梅偉;劉惟一;;基于可信度的信息檢索模型[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年

2 黃名選;嚴(yán)小衛(wèi);張師超;;基于完全加權(quán)關(guān)聯(lián)規(guī)則挖掘的信息檢索模型[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

3 黃國斌;王明文;葉浩;;一種新的基于中間語義的跨語言信息檢索模型[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

4 張文雅;宋大為;趙曉朝;張鵬;李競(jìng)飛;;基于可讀性的信息檢索模型研究[A];需將論文集名稱修改為“第十二屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議(NCMMSC2013)論文集[C];2013年

5 吳晨;張全;繆建明;韋向峰;;自然語言語義理解下的信息檢索模型[A];第三屆學(xué)生計(jì)算語言學(xué)研討會(huì)論文集[C];2006年

6 李廣原;馮嘉禮;;基于屬性坐標(biāo)的文本信息檢索模型[A];廣西計(jì)算機(jī)學(xué)會(huì)2005年學(xué)術(shù)年會(huì)論文集[C];2005年

7 普東航;唐常杰;元昌安;廖勇;張?zhí)鞈c;于中華;;一種基于相鄰地址的信息檢索模型AAM[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年

8 盛俊;王明文;余俊英;;一種基于潛在語義的Markov網(wǎng)絡(luò)信息檢索模型[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年

9 韓詠;齊浩亮;楊沐昀;李生;;基于回歸支持向量機(jī)的信息檢索[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年

10 張玉連;陳琳娜;陳金森;;基于本體的個(gè)性化服務(wù)用戶模型研究[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第2屆中國普適計(jì)算學(xué)術(shù)會(huì)議(PCC'06)論文集[C];2006年

相關(guān)重要報(bào)紙文章 前1條

1 清華大學(xué)計(jì)算機(jī)系智能技術(shù)與系統(tǒng)國家重點(diǎn)實(shí)驗(yàn)室 張敏 金奕江;尋“寶”有術(shù)[N];計(jì)算機(jī)世界;2003年

相關(guān)博士學(xué)位論文 前10條

1 涂新輝;基于概念的信息檢索模型研究[D];華中師范大學(xué);2012年

2 梁作鵬;面向Web的XML檢索關(guān)鍵技術(shù)研究[D];東南大學(xué);2005年

3 楊為民;基于場(chǎng)論的信息檢索模型的研究[D];安徽大學(xué);2007年

4 高琰;基于多特征的Web社區(qū)發(fā)現(xiàn)關(guān)鍵技術(shù)研究[D];中南大學(xué);2007年

5 崔金棟;基于本體的網(wǎng)格信息檢索模型研究[D];吉林大學(xué);2011年

6 徐建民;基于術(shù)語關(guān)系的貝葉斯網(wǎng)絡(luò)信息檢索模型擴(kuò)展研究[D];天津大學(xué);2007年

7 陳圣兵;基于商空間理論的海量信息檢索模型的研究[D];安徽大學(xué);2010年

8 程凡;基于排序?qū)W習(xí)的信息檢索模型研究[D];中國科學(xué)技術(shù)大學(xué);2012年

9 左家莉;信息檢索中Markov網(wǎng)絡(luò)圖模型研究[D];江西財(cái)經(jīng)大學(xué);2011年

10 王瑞琴;基于語義處理技術(shù)的信息檢索模型研究[D];浙江大學(xué);2009年

相關(guān)碩士學(xué)位論文 前10條

1 馬路佳;蒙漢跨語言信息檢索模型研究[D];中央民族大學(xué);2018年

2 王天舒;基于量子弱測(cè)量理論的信息檢索模型[D];天津大學(xué);2018年

3 黃果;文本信息檢索模型研究[D];西南大學(xué);2007年

4 張東偉;中英文跨語言信息檢索模型研究[D];黑龍江大學(xué);2006年

5 張文雅;基于可讀性的信息檢索模型研究[D];天津大學(xué);2016年

6 李皓;基于認(rèn)知觀的信息檢索模型及實(shí)證研究[D];河北大學(xué);2012年

7 王慶華;用戶個(gè)性化信息檢索模型的設(shè)計(jì)與實(shí)現(xiàn)[D];大連理工大學(xué);2004年

8 李春玲;基于領(lǐng)域本體的語義檢索研究[D];重慶大學(xué);2008年

9 謝玉宇;基于本體和多Agent的信息檢索模型的研究[D];江蘇大學(xué);2009年

10 廖亞男;基于多層Markov網(wǎng)絡(luò)的信息檢索模型[D];江西師范大學(xué);2014年



本文編號(hào):2758686

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/2758686.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c22b4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com