基于圖結(jié)構(gòu)的多關(guān)鍵字檢索研究
發(fā)布時(shí)間:2021-05-24 02:16
信息技術(shù)的發(fā)展極大地改變了人們獲取資源的方式。其中,圖上關(guān)鍵字查詢技術(shù)引起了越來(lái)越多的關(guān)注;趫D結(jié)構(gòu)的多關(guān)鍵字檢索是在數(shù)據(jù)圖上找到能夠所有包含查詢關(guān)鍵字的子圖。很多文獻(xiàn)都是返回子樹(shù)的形式,如最小代價(jià)生成樹(shù)。最近有研究也提出查找子圖的算法,啟發(fā)性算法就是其中的一種,但是它的查找過(guò)程是基于邊的權(quán)重,而沒(méi)有優(yōu)先考慮節(jié)點(diǎn)和關(guān)鍵字之間的相似度,所以現(xiàn)有的算法并不能表現(xiàn)出兩個(gè)節(jié)點(diǎn)之間最好的連接關(guān)系。同時(shí),現(xiàn)有的方法在top-k結(jié)果的排序上也有一定的局限性,在計(jì)算邊的權(quán)重時(shí)只是單純的考慮兩端節(jié)點(diǎn)的權(quán)重求平均,沒(méi)有考慮每個(gè)查詢關(guān)鍵字的影響,造成排序結(jié)果不理想。本文提出了一種新的圖上多關(guān)鍵字檢索方法,采用新的方式計(jì)算節(jié)點(diǎn)權(quán)重,并基于節(jié)點(diǎn)內(nèi)容設(shè)計(jì)出一種搜索子圖的算法,首先得到每個(gè)關(guān)鍵字對(duì)應(yīng)的節(jié)點(diǎn)集合,然后根據(jù)節(jié)點(diǎn)的內(nèi)容相關(guān)度依次選擇節(jié)點(diǎn)加入結(jié)果集,最后計(jì)算結(jié)果邊集的過(guò)程中考慮了hub節(jié)點(diǎn)的影響,克服了直接計(jì)算兩兩節(jié)點(diǎn)之間最短路徑的弊端。最終試圖返回結(jié)構(gòu)關(guān)系更為緊密和無(wú)冗余的結(jié)果。本文同時(shí)提出一種新的計(jì)算方式來(lái)對(duì)每個(gè)結(jié)果子圖進(jìn)行打分排序,充分考慮了每個(gè)關(guān)鍵字對(duì)節(jié)點(diǎn)內(nèi)容相關(guān)度的貢獻(xiàn),從而返回最優(yōu)的top-k...
【文章來(lái)源】:南京郵電大學(xué)江蘇省
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景和意義
1.2 論文的主要工作
1.3 論文的結(jié)構(gòu)安排
第二章 相關(guān)背景知識(shí)介紹
2.1 信息檢索相關(guān)研究
2.1.1 TF-IDF算法
2.1.2 PageRank算法
2.1.3 HITS算法
2.2 關(guān)鍵字查詢技術(shù)研究
2.2.1 xml文檔關(guān)鍵字查詢
2.2.2 關(guān)系數(shù)據(jù)庫(kù)上關(guān)鍵字查詢
2.2.3 圖上關(guān)鍵字查詢技術(shù)研究
第三章 基于節(jié)點(diǎn)內(nèi)容的啟發(fā)性搜索算法研究
3.1 問(wèn)題描述
3.2 概念定義
3.3 算法描述
3.3.1 HMNC搜索算法
3.3.2 生成結(jié)果邊集
3.4 本章小結(jié)
第四章 基于集合表示的排序算法研究
4.1 引言
4.2 問(wèn)題描述
4.3 GSS排序算法
4.4 本章小結(jié)
第五章 實(shí)驗(yàn)與分析
5.1 實(shí)驗(yàn)數(shù)據(jù)
5.2 實(shí)驗(yàn)結(jié)果效率評(píng)價(jià)方法
5.3 評(píng)估實(shí)驗(yàn)結(jié)果的標(biāo)準(zhǔn)
5.3.1 DCG評(píng)估標(biāo)準(zhǔn)
5.3.2 NRR評(píng)價(jià)方法
5.4 本章小結(jié)
第六章 總結(jié)與展望
附錄1 攻讀碩士學(xué)位期間撰寫(xiě)的論文
附錄2 攻讀碩士學(xué)位期間申請(qǐng)的專利
附錄3 攻讀碩士學(xué)位期間參加的科研項(xiàng)目
致謝
參考文獻(xiàn)
本文編號(hào):3203374
【文章來(lái)源】:南京郵電大學(xué)江蘇省
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景和意義
1.2 論文的主要工作
1.3 論文的結(jié)構(gòu)安排
第二章 相關(guān)背景知識(shí)介紹
2.1 信息檢索相關(guān)研究
2.1.1 TF-IDF算法
2.1.2 PageRank算法
2.1.3 HITS算法
2.2 關(guān)鍵字查詢技術(shù)研究
2.2.1 xml文檔關(guān)鍵字查詢
2.2.2 關(guān)系數(shù)據(jù)庫(kù)上關(guān)鍵字查詢
2.2.3 圖上關(guān)鍵字查詢技術(shù)研究
第三章 基于節(jié)點(diǎn)內(nèi)容的啟發(fā)性搜索算法研究
3.1 問(wèn)題描述
3.2 概念定義
3.3 算法描述
3.3.1 HMNC搜索算法
3.3.2 生成結(jié)果邊集
3.4 本章小結(jié)
第四章 基于集合表示的排序算法研究
4.1 引言
4.2 問(wèn)題描述
4.3 GSS排序算法
4.4 本章小結(jié)
第五章 實(shí)驗(yàn)與分析
5.1 實(shí)驗(yàn)數(shù)據(jù)
5.2 實(shí)驗(yàn)結(jié)果效率評(píng)價(jià)方法
5.3 評(píng)估實(shí)驗(yàn)結(jié)果的標(biāo)準(zhǔn)
5.3.1 DCG評(píng)估標(biāo)準(zhǔn)
5.3.2 NRR評(píng)價(jià)方法
5.4 本章小結(jié)
第六章 總結(jié)與展望
附錄1 攻讀碩士學(xué)位期間撰寫(xiě)的論文
附錄2 攻讀碩士學(xué)位期間申請(qǐng)的專利
附錄3 攻讀碩士學(xué)位期間參加的科研項(xiàng)目
致謝
參考文獻(xiàn)
本文編號(hào):3203374
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3203374.html
最近更新
教材專著