學(xué)術(shù)知識圖譜的構(gòu)建及系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時間:2023-02-19 20:07
學(xué)術(shù)知識圖譜可以應(yīng)用于科學(xué)語義檢索、文獻(xiàn)推薦和學(xué)術(shù)知識問答等場景。本文采取自底向上的方式構(gòu)建了學(xué)術(shù)知識圖譜SchKG(Scholar Knowledge Graph),SchKG結(jié)構(gòu)上是一種異構(gòu)網(wǎng)絡(luò),節(jié)點(diǎn)表示文獻(xiàn)、作者、關(guān)鍵詞短語等多種類型的實(shí)體,邊表示實(shí)體之間的關(guān)系。學(xué)術(shù)知識圖譜的構(gòu)建需要解決信息抽取、作者消歧、指代消解等問題,本文側(cè)重邏輯架構(gòu)設(shè)計(jì)、學(xué)術(shù)信息抽取和學(xué)術(shù)知識推理。首先設(shè)計(jì)圖譜的邏輯架構(gòu),從公開的文獻(xiàn)數(shù)據(jù)集中抽取學(xué)術(shù)信息形成基本圖譜,然后通過學(xué)術(shù)知識推理豐富圖譜內(nèi)容。具體工作總結(jié)如下:(1)SchKG邏輯架構(gòu)設(shè)計(jì):SchKG邏輯架構(gòu)包括模式層和數(shù)據(jù)層。模式層位于數(shù)據(jù)層之上,通過定義圖譜中的學(xué)術(shù)實(shí)體和關(guān)系類別等學(xué)術(shù)概念以規(guī)范圖譜中的數(shù)據(jù);數(shù)據(jù)層利用原生多模型數(shù)據(jù)庫ArangoDB存儲學(xué)術(shù)知識圖譜,設(shè)計(jì)了多頂點(diǎn)多節(jié)點(diǎn)集合的存儲模式。(2)學(xué)術(shù)信息抽取:本文圖譜的主要內(nèi)容來自學(xué)術(shù)信息抽取,抽取工作包括兩個部分。利用反序列化和規(guī)則從半結(jié)構(gòu)化的文獻(xiàn)元數(shù)據(jù)中抽取文獻(xiàn)、作者、摘要等基本學(xué)術(shù)信息;基于BiLSTM-BiLSTM-CRF模型從非結(jié)構(gòu)化的文獻(xiàn)摘要中抽取關(guān)鍵詞短語以表達(dá)文獻(xiàn)主題...
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第二章 相關(guān)技術(shù)
2.1 詞的分布式表示
2.2 信息抽取
2.2.1 半結(jié)構(gòu)化數(shù)據(jù)的信息抽取
2.2.2 非結(jié)構(gòu)化文本的命名實(shí)體識別
2.3 文檔表示
2.3.1 詞袋模型
2.3.2 主題模型
2.4 知識圖譜表示學(xué)習(xí)
2.5 原生多模型數(shù)據(jù)庫ArangoDB
2.6 本章小結(jié)
第三章 SchKG邏輯架構(gòu)設(shè)計(jì)及學(xué)術(shù)信息抽取
3.1 SchKG邏輯架構(gòu)設(shè)計(jì)
3.1.1 模式層的設(shè)計(jì)
3.1.2 數(shù)據(jù)層的設(shè)計(jì)
3.2 文獻(xiàn)元數(shù)據(jù)的學(xué)術(shù)信息抽取
3.3 文獻(xiàn)摘要的關(guān)鍵詞短語抽取
3.3.1 文獻(xiàn)摘要預(yù)處理
3.3.2 詞的字符特征表示
3.3.3 詞的上下文特征表示
3.3.4 序列標(biāo)注
3.4 本章小結(jié)
第四章 學(xué)術(shù)知識推理
4.1 文獻(xiàn)主題分布生成
4.1.1 文獻(xiàn)摘要預(yù)處理
4.1.2 基于Online LDA的文獻(xiàn)主題分布生成
4.2 引用文獻(xiàn)的相似關(guān)系推理
4.3 學(xué)術(shù)知識表示
4.3.1 正負(fù)樣本的構(gòu)造
4.3.2 基于TransH的學(xué)術(shù)知識表示
4.4 學(xué)術(shù)知識推理
4.4.1 作者協(xié)同寫作關(guān)系推理
4.4.2 文獻(xiàn)相似關(guān)系推理
4.4.3 作者研究領(lǐng)域相似關(guān)系推理
4.5 本章小結(jié)
第五章 系統(tǒng)的設(shè)計(jì)實(shí)現(xiàn)與性能測試
5.1 系統(tǒng)需求分析
5.2 系統(tǒng)架構(gòu)設(shè)計(jì)
5.3 數(shù)據(jù)集
5.4 系統(tǒng)環(huán)境
5.5 系統(tǒng)模塊的設(shè)計(jì)與實(shí)現(xiàn)
5.5.1 學(xué)術(shù)知識存儲模塊的設(shè)計(jì)與實(shí)現(xiàn)
5.5.2 學(xué)術(shù)信息抽取模塊的設(shè)計(jì)與實(shí)現(xiàn)
5.5.3 學(xué)術(shù)知識推理模塊的設(shè)計(jì)與實(shí)現(xiàn)
5.6 系統(tǒng)性能測試
5.6.1 關(guān)鍵詞短語抽取性能測試
5.6.2 學(xué)術(shù)知識推理性能測試
5.6.3 查詢性能測試
5.7 系統(tǒng)展示
5.7.1 學(xué)術(shù)知識圖譜數(shù)據(jù)統(tǒng)計(jì)
5.7.2 學(xué)術(shù)知識圖譜可視化展示
5.7.3 查詢展示
5.8 本章小結(jié)
第六章 總結(jié)和展望
致謝
參考文獻(xiàn)
作者簡介
本文編號:3746874
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第二章 相關(guān)技術(shù)
2.1 詞的分布式表示
2.2 信息抽取
2.2.1 半結(jié)構(gòu)化數(shù)據(jù)的信息抽取
2.2.2 非結(jié)構(gòu)化文本的命名實(shí)體識別
2.3 文檔表示
2.3.1 詞袋模型
2.3.2 主題模型
2.4 知識圖譜表示學(xué)習(xí)
2.5 原生多模型數(shù)據(jù)庫ArangoDB
2.6 本章小結(jié)
第三章 SchKG邏輯架構(gòu)設(shè)計(jì)及學(xué)術(shù)信息抽取
3.1 SchKG邏輯架構(gòu)設(shè)計(jì)
3.1.1 模式層的設(shè)計(jì)
3.1.2 數(shù)據(jù)層的設(shè)計(jì)
3.2 文獻(xiàn)元數(shù)據(jù)的學(xué)術(shù)信息抽取
3.3 文獻(xiàn)摘要的關(guān)鍵詞短語抽取
3.3.1 文獻(xiàn)摘要預(yù)處理
3.3.2 詞的字符特征表示
3.3.3 詞的上下文特征表示
3.3.4 序列標(biāo)注
3.4 本章小結(jié)
第四章 學(xué)術(shù)知識推理
4.1 文獻(xiàn)主題分布生成
4.1.1 文獻(xiàn)摘要預(yù)處理
4.1.2 基于Online LDA的文獻(xiàn)主題分布生成
4.2 引用文獻(xiàn)的相似關(guān)系推理
4.3 學(xué)術(shù)知識表示
4.3.1 正負(fù)樣本的構(gòu)造
4.3.2 基于TransH的學(xué)術(shù)知識表示
4.4 學(xué)術(shù)知識推理
4.4.1 作者協(xié)同寫作關(guān)系推理
4.4.2 文獻(xiàn)相似關(guān)系推理
4.4.3 作者研究領(lǐng)域相似關(guān)系推理
4.5 本章小結(jié)
第五章 系統(tǒng)的設(shè)計(jì)實(shí)現(xiàn)與性能測試
5.1 系統(tǒng)需求分析
5.2 系統(tǒng)架構(gòu)設(shè)計(jì)
5.3 數(shù)據(jù)集
5.4 系統(tǒng)環(huán)境
5.5 系統(tǒng)模塊的設(shè)計(jì)與實(shí)現(xiàn)
5.5.1 學(xué)術(shù)知識存儲模塊的設(shè)計(jì)與實(shí)現(xiàn)
5.5.2 學(xué)術(shù)信息抽取模塊的設(shè)計(jì)與實(shí)現(xiàn)
5.5.3 學(xué)術(shù)知識推理模塊的設(shè)計(jì)與實(shí)現(xiàn)
5.6 系統(tǒng)性能測試
5.6.1 關(guān)鍵詞短語抽取性能測試
5.6.2 學(xué)術(shù)知識推理性能測試
5.6.3 查詢性能測試
5.7 系統(tǒng)展示
5.7.1 學(xué)術(shù)知識圖譜數(shù)據(jù)統(tǒng)計(jì)
5.7.2 學(xué)術(shù)知識圖譜可視化展示
5.7.3 查詢展示
5.8 本章小結(jié)
第六章 總結(jié)和展望
致謝
參考文獻(xiàn)
作者簡介
本文編號:3746874
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3746874.html
最近更新
教材專著