基于潛在語(yǔ)義關(guān)系的偽相關(guān)反饋查詢擴(kuò)展技術(shù)研究
發(fā)布時(shí)間:2021-05-07 12:57
偽相關(guān)反饋與查詢擴(kuò)展作為信息檢索領(lǐng)域的關(guān)鍵技術(shù),能極大地提高信息檢索系統(tǒng)的性能,一直以來(lái)深受國(guó)內(nèi)外信息檢索領(lǐng)域?qū)W者的重視。在偽相關(guān)反饋的過(guò)程中,對(duì)原始查詢進(jìn)行擴(kuò)展是非常重要的一個(gè)環(huán)節(jié)。在選取擴(kuò)展詞項(xiàng)的時(shí)候,傳統(tǒng)的偽相關(guān)反饋方法大都聚焦于評(píng)估候選擴(kuò)展詞項(xiàng)在偽相關(guān)文檔中的詞頻重要性和顯著性,往往會(huì)遺漏候選擴(kuò)展詞項(xiàng)與查詢?cè)~項(xiàng)之間潛在語(yǔ)義關(guān)系。本文結(jié)合經(jīng)典的偽相關(guān)反饋查詢擴(kuò)展方法,圍繞候選擴(kuò)展詞項(xiàng)的語(yǔ)義捕獲與表示,提出了若干個(gè)具有不同語(yǔ)義特征的偽相關(guān)反饋查詢擴(kuò)展方法。實(shí)驗(yàn)結(jié)果表明這些方法能夠優(yōu)化擴(kuò)展詞項(xiàng)的質(zhì)量,提高信息檢索的效果。主要的研究工作和創(chuàng)新點(diǎn)包含以下幾個(gè)方面:(1)本文提出了一種基于詞項(xiàng)超空間語(yǔ)義的偽相關(guān)反饋模型HRoc。該模型采用一種改進(jìn)的超空間模擬語(yǔ)言算法度量查詢?cè)~項(xiàng)與候選擴(kuò)展詞項(xiàng)之間的潛在語(yǔ)義關(guān)系,并在傳統(tǒng)的Rocchio模型中融入這一語(yǔ)義關(guān)系完成查詢擴(kuò)展。在此基礎(chǔ)上,本文為HRoc模型設(shè)計(jì)了三種不同的歸一化策略。這些策略可以用來(lái)協(xié)調(diào)由不同特征生成的候選擴(kuò)展詞項(xiàng)的權(quán)重。最后,本文還引入了一個(gè)自適應(yīng)函數(shù)來(lái)代替HRoc模型中的參數(shù)D,它可以根據(jù)文檔長(zhǎng)度自動(dòng)選擇窗口大小。在PMC20...
【文章來(lái)源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:109 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景
1.2 研究意義
1.3 研究?jī)?nèi)容
1.4 本文的組織結(jié)構(gòu)
第二章 偽相關(guān)反饋技術(shù)研究現(xiàn)狀
2.1 信息檢索與偽相關(guān)反饋發(fā)展簡(jiǎn)述
2.1.1 信息檢索技術(shù)
2.1.2 相關(guān)反饋與查詢擴(kuò)展技術(shù)
2.1.3 偽相關(guān)反饋技術(shù)
2.2 偽相關(guān)反饋技術(shù)相關(guān)研究概述
2.2.1 基于向量空間模型的偽相關(guān)反饋技術(shù)
2.2.2 基于語(yǔ)言模型的偽相關(guān)反饋技術(shù)
2.2.3 基于位置信息的偽相關(guān)反饋技術(shù)
2.2.4 基于深度學(xué)習(xí)模型的偽相關(guān)反饋技術(shù)
2.2.5 基于其他方法的偽相關(guān)反饋技術(shù)
2.3 本章小結(jié)
第三章 基于詞項(xiàng)超空間語(yǔ)義的偽相關(guān)反饋查詢擴(kuò)展研究
3.1 引言
3.2 語(yǔ)義空間
3.3 超空間模擬語(yǔ)言
3.4 Rocchio偽相關(guān)反饋框架
3.5 基于詞項(xiàng)超空間語(yǔ)義的偽相關(guān)反饋
3.5.1 詞項(xiàng)超空間語(yǔ)義權(quán)重
3.5.2 融入詞項(xiàng)超空間語(yǔ)義的偽相關(guān)反饋模型
3.5.3 歸一化方法
3.6 實(shí)驗(yàn)相關(guān)設(shè)置
3.6.1 實(shí)驗(yàn)數(shù)據(jù)集及評(píng)價(jià)標(biāo)準(zhǔn)
3.6.2 基線模型
3.6.3 參數(shù)設(shè)置
3.7 實(shí)驗(yàn)結(jié)果和討論
3.7.1 與基線模型比較
3.7.2 與其他偽相關(guān)反饋模型比較
3.7.3 歸一化函數(shù)的對(duì)比分析
3.7.4 動(dòng)態(tài)自適應(yīng)窗口值分析
3.7.5 實(shí)驗(yàn)結(jié)果與討論
3.7.6 局限性
3.8 本章小結(jié)
第四章 基于核函數(shù)詞項(xiàng)共現(xiàn)語(yǔ)義的偽相關(guān)反饋查詢擴(kuò)展研究
4.1 引言
4.2 基于核函數(shù)詞項(xiàng)共現(xiàn)的偽相關(guān)反饋方法
4.2.1 傳統(tǒng)的PRF模型框架
4.2.2 核函數(shù)詞項(xiàng)共現(xiàn)語(yǔ)義權(quán)重
4.2.3 基于核函數(shù)的詞項(xiàng)共現(xiàn)語(yǔ)義框架
4.3 實(shí)驗(yàn)設(shè)置
4.3.1 數(shù)據(jù)集和評(píng)價(jià)標(biāo)準(zhǔn)
4.3.2 基線模型和其他相關(guān)對(duì)比模型介紹
4.3.3 參數(shù)設(shè)置
4.4 實(shí)驗(yàn)設(shè)計(jì)、結(jié)果與分析
4.4.1 基準(zhǔn)實(shí)驗(yàn)
4.4.2 與強(qiáng)基線模型比較
4.4.3 與重要的偽相關(guān)反饋模型比較
4.4.4 參數(shù)敏感性
4.4.5 分析和討論
4.5 本章小結(jié)
第五章 基于BERT模型句子潛在語(yǔ)義的偽相關(guān)反饋查詢擴(kuò)展研究
5.1 引言
5.2 句子語(yǔ)義
5.2.1 句子向量
5.2.2 句子的向量表示
5.2.3 句子語(yǔ)義相似度計(jì)算—BERT模型
5.3 基于BERT模型句子語(yǔ)義相似度的偽相關(guān)反饋方法
5.3.1 基于BERT的句子語(yǔ)義特征
5.3.2 融入句子語(yǔ)義特征到Rocchio模型
5.4 實(shí)驗(yàn)設(shè)置和結(jié)果分析
5.4.1 實(shí)驗(yàn)設(shè)置
5.4.2 與強(qiáng)基線模型比較
5.4.3 與其他經(jīng)典的模型比較
5.4.4 參數(shù)敏感性
5.5 本章小結(jié)
第六章 總結(jié)和展望
6.1 全文總結(jié)
6.2 未來(lái)工作
參考文獻(xiàn)
研究成果及參與的科研項(xiàng)目
研究成果
已發(fā)表的科研論文
已投的科研論文
國(guó)家發(fā)明專利
軟件著作權(quán)
參與的科研項(xiàng)目
致謝
【參考文獻(xiàn)】:
期刊論文
[1]一種基于Hownet的詞向量表示方法[J]. 陳洋,羅智勇. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(01)
[2]基于詞語(yǔ)關(guān)系的詞向量模型[J]. 蔣振超,李麗雙,黃德根. 中文信息學(xué)報(bào). 2017(03)
[3]相關(guān)反饋在信息檢索中的研究綜述[J]. 于瑩瑩,陳燕,張金松. 情報(bào)理論與實(shí)踐. 2016(12)
[4]基于檢索結(jié)果排序的偽相關(guān)反饋[J]. 閆蓉,高光來(lái). 計(jì)算機(jī)應(yīng)用. 2016(08)
[5]基于分類模型的查詢擴(kuò)展方法[J]. 李維銀,石玉龍,陳杰,施重陽(yáng). 計(jì)算機(jī)科學(xué). 2015(06)
[6]醫(yī)學(xué)信息檢索中一種基于概念的查詢相關(guān)模型[J]. 李綱,毛進(jìn),蘆昆. 情報(bào)學(xué)報(bào). 2014 (03)
[7]雙語(yǔ)主題跨語(yǔ)言偽相關(guān)反饋[J]. 王序文,王小捷,孫月萍. 北京郵電大學(xué)學(xué)報(bào). 2013(04)
[8]基于Markov網(wǎng)絡(luò)團(tuán)的查詢意圖識(shí)別[J]. 蔡桂秀,王明文,揭安全,王曉慶. 江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(04)
[9]基于矩陣加權(quán)關(guān)聯(lián)規(guī)則挖掘的偽相關(guān)反饋查詢擴(kuò)展[J]. 黃名選,嚴(yán)小衛(wèi),張師超. 軟件學(xué)報(bào). 2009(07)
[10]信息檢索中的相關(guān)反饋技術(shù)綜述[J]. 嚴(yán)華云,劉其平,肖良軍. 計(jì)算機(jī)應(yīng)用研究. 2009(01)
博士論文
[1]正負(fù)相關(guān)反饋與查詢擴(kuò)展技術(shù)的研究[D]. 王俊義.內(nèi)蒙古大學(xué) 2012
碩士論文
[1]基于EHR電子健康記錄的臨床醫(yī)學(xué)文獻(xiàn)檢索研究[D]. 張悅.華中師范大學(xué) 2018
[2]個(gè)性化受限域問答系統(tǒng)研究[D]. 趙興.昆明理工大學(xué) 2012
[3]全文檢索及相關(guān)技術(shù)研究[D]. 林義明.遼寧科技大學(xué) 2012
本文編號(hào):3173430
【文章來(lái)源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:109 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景
1.2 研究意義
1.3 研究?jī)?nèi)容
1.4 本文的組織結(jié)構(gòu)
第二章 偽相關(guān)反饋技術(shù)研究現(xiàn)狀
2.1 信息檢索與偽相關(guān)反饋發(fā)展簡(jiǎn)述
2.1.1 信息檢索技術(shù)
2.1.2 相關(guān)反饋與查詢擴(kuò)展技術(shù)
2.1.3 偽相關(guān)反饋技術(shù)
2.2 偽相關(guān)反饋技術(shù)相關(guān)研究概述
2.2.1 基于向量空間模型的偽相關(guān)反饋技術(shù)
2.2.2 基于語(yǔ)言模型的偽相關(guān)反饋技術(shù)
2.2.3 基于位置信息的偽相關(guān)反饋技術(shù)
2.2.4 基于深度學(xué)習(xí)模型的偽相關(guān)反饋技術(shù)
2.2.5 基于其他方法的偽相關(guān)反饋技術(shù)
2.3 本章小結(jié)
第三章 基于詞項(xiàng)超空間語(yǔ)義的偽相關(guān)反饋查詢擴(kuò)展研究
3.1 引言
3.2 語(yǔ)義空間
3.3 超空間模擬語(yǔ)言
3.4 Rocchio偽相關(guān)反饋框架
3.5 基于詞項(xiàng)超空間語(yǔ)義的偽相關(guān)反饋
3.5.1 詞項(xiàng)超空間語(yǔ)義權(quán)重
3.5.2 融入詞項(xiàng)超空間語(yǔ)義的偽相關(guān)反饋模型
3.5.3 歸一化方法
3.6 實(shí)驗(yàn)相關(guān)設(shè)置
3.6.1 實(shí)驗(yàn)數(shù)據(jù)集及評(píng)價(jià)標(biāo)準(zhǔn)
3.6.2 基線模型
3.6.3 參數(shù)設(shè)置
3.7 實(shí)驗(yàn)結(jié)果和討論
3.7.1 與基線模型比較
3.7.2 與其他偽相關(guān)反饋模型比較
3.7.3 歸一化函數(shù)的對(duì)比分析
3.7.4 動(dòng)態(tài)自適應(yīng)窗口值分析
3.7.5 實(shí)驗(yàn)結(jié)果與討論
3.7.6 局限性
3.8 本章小結(jié)
第四章 基于核函數(shù)詞項(xiàng)共現(xiàn)語(yǔ)義的偽相關(guān)反饋查詢擴(kuò)展研究
4.1 引言
4.2 基于核函數(shù)詞項(xiàng)共現(xiàn)的偽相關(guān)反饋方法
4.2.1 傳統(tǒng)的PRF模型框架
4.2.2 核函數(shù)詞項(xiàng)共現(xiàn)語(yǔ)義權(quán)重
4.2.3 基于核函數(shù)的詞項(xiàng)共現(xiàn)語(yǔ)義框架
4.3 實(shí)驗(yàn)設(shè)置
4.3.1 數(shù)據(jù)集和評(píng)價(jià)標(biāo)準(zhǔn)
4.3.2 基線模型和其他相關(guān)對(duì)比模型介紹
4.3.3 參數(shù)設(shè)置
4.4 實(shí)驗(yàn)設(shè)計(jì)、結(jié)果與分析
4.4.1 基準(zhǔn)實(shí)驗(yàn)
4.4.2 與強(qiáng)基線模型比較
4.4.3 與重要的偽相關(guān)反饋模型比較
4.4.4 參數(shù)敏感性
4.4.5 分析和討論
4.5 本章小結(jié)
第五章 基于BERT模型句子潛在語(yǔ)義的偽相關(guān)反饋查詢擴(kuò)展研究
5.1 引言
5.2 句子語(yǔ)義
5.2.1 句子向量
5.2.2 句子的向量表示
5.2.3 句子語(yǔ)義相似度計(jì)算—BERT模型
5.3 基于BERT模型句子語(yǔ)義相似度的偽相關(guān)反饋方法
5.3.1 基于BERT的句子語(yǔ)義特征
5.3.2 融入句子語(yǔ)義特征到Rocchio模型
5.4 實(shí)驗(yàn)設(shè)置和結(jié)果分析
5.4.1 實(shí)驗(yàn)設(shè)置
5.4.2 與強(qiáng)基線模型比較
5.4.3 與其他經(jīng)典的模型比較
5.4.4 參數(shù)敏感性
5.5 本章小結(jié)
第六章 總結(jié)和展望
6.1 全文總結(jié)
6.2 未來(lái)工作
參考文獻(xiàn)
研究成果及參與的科研項(xiàng)目
研究成果
已發(fā)表的科研論文
已投的科研論文
國(guó)家發(fā)明專利
軟件著作權(quán)
參與的科研項(xiàng)目
致謝
【參考文獻(xiàn)】:
期刊論文
[1]一種基于Hownet的詞向量表示方法[J]. 陳洋,羅智勇. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(01)
[2]基于詞語(yǔ)關(guān)系的詞向量模型[J]. 蔣振超,李麗雙,黃德根. 中文信息學(xué)報(bào). 2017(03)
[3]相關(guān)反饋在信息檢索中的研究綜述[J]. 于瑩瑩,陳燕,張金松. 情報(bào)理論與實(shí)踐. 2016(12)
[4]基于檢索結(jié)果排序的偽相關(guān)反饋[J]. 閆蓉,高光來(lái). 計(jì)算機(jī)應(yīng)用. 2016(08)
[5]基于分類模型的查詢擴(kuò)展方法[J]. 李維銀,石玉龍,陳杰,施重陽(yáng). 計(jì)算機(jī)科學(xué). 2015(06)
[6]醫(yī)學(xué)信息檢索中一種基于概念的查詢相關(guān)模型[J]. 李綱,毛進(jìn),蘆昆. 情報(bào)學(xué)報(bào). 2014 (03)
[7]雙語(yǔ)主題跨語(yǔ)言偽相關(guān)反饋[J]. 王序文,王小捷,孫月萍. 北京郵電大學(xué)學(xué)報(bào). 2013(04)
[8]基于Markov網(wǎng)絡(luò)團(tuán)的查詢意圖識(shí)別[J]. 蔡桂秀,王明文,揭安全,王曉慶. 江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(04)
[9]基于矩陣加權(quán)關(guān)聯(lián)規(guī)則挖掘的偽相關(guān)反饋查詢擴(kuò)展[J]. 黃名選,嚴(yán)小衛(wèi),張師超. 軟件學(xué)報(bào). 2009(07)
[10]信息檢索中的相關(guān)反饋技術(shù)綜述[J]. 嚴(yán)華云,劉其平,肖良軍. 計(jì)算機(jī)應(yīng)用研究. 2009(01)
博士論文
[1]正負(fù)相關(guān)反饋與查詢擴(kuò)展技術(shù)的研究[D]. 王俊義.內(nèi)蒙古大學(xué) 2012
碩士論文
[1]基于EHR電子健康記錄的臨床醫(yī)學(xué)文獻(xiàn)檢索研究[D]. 張悅.華中師范大學(xué) 2018
[2]個(gè)性化受限域問答系統(tǒng)研究[D]. 趙興.昆明理工大學(xué) 2012
[3]全文檢索及相關(guān)技術(shù)研究[D]. 林義明.遼寧科技大學(xué) 2012
本文編號(hào):3173430
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3173430.html
最近更新
教材專著