面向熱點話題的因果事理圖譜構(gòu)建及應用研究
發(fā)布時間:2023-12-02 10:49
隨著互聯(lián)網(wǎng)的高速發(fā)展及移動設備的普及,人們獲取熱點話題的途徑越來越多,每隔一段時間都會發(fā)生當下討論度最高的話題。各個平臺的報道消息使得人們檢索話題中關鍵信息的時間增加,對于一起事件的前因后果及防護措施沒有一個直觀的表達。話題事件是實時的動態(tài)數(shù)據(jù),會隨著時間、地點、人物等因素下會觸發(fā)不同的事件結(jié)果,研究事件間的因果邏輯是自然文本處理的一項難題。近些年知識圖譜技術得到了廣泛的研究,但著重解決的是靜態(tài)數(shù)據(jù)問題。對于動態(tài)數(shù)據(jù)的研究提出了事理圖譜概念,它是一種事理邏輯知識庫,描述事件間的演化規(guī)律。針對以上問題,本文面向熱點話題構(gòu)建因果事理圖譜,利用事件抽取技術抽取出事件的元素,利用事件關系抽取技術獲得事件間的邏輯關系,在此基礎上實現(xiàn)話題查詢與智能問答功能,主要完成工作如下:提出了熱點話題的事理圖譜構(gòu)建框架,首先數(shù)據(jù)源的獲取采用Scrapy爬蟲框架,以時間降序排序;跓狳c話題標題采用Kmeans無監(jiān)督算法將數(shù)據(jù)源分為幾類話題。定義事件的元素由事件參與者、事件觸發(fā)詞、事件發(fā)生地點、事件發(fā)生時間、事件發(fā)生程度組成。其次采用序列標注方法,將事件抽取研究轉(zhuǎn)化為序列標注任務,實現(xiàn)從熱點話題事件中抽取事件元...
【文章頁數(shù)】:58 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 知識圖譜的研究現(xiàn)狀
1.2.2 事理圖譜的研究現(xiàn)狀
1.2.3 知識圖譜與事理圖譜
1.3 論文的研究內(nèi)容
1.4 論文的組織架構(gòu)
第二章 相關理論與技術
2.1 信息抽取
2.1.1 命名實體識別
2.1.2 事件抽取
2.1.3 事件關系抽取
2.2 詞向量模型
2.2.1 Word2Vec模型
2.2.2 BERT模型
2.3 循環(huán)神經(jīng)網(wǎng)絡
2.3.1 RNN循環(huán)神經(jīng)網(wǎng)絡
2.3.2 長短時記憶神經(jīng)網(wǎng)絡
2.3.3 流形的LSTM神經(jīng)網(wǎng)絡
2.4 本章小結(jié)
第三章 基于熱點話題的事件抽取研究
3.1 事件語料庫構(gòu)建
3.1.1 數(shù)據(jù)來源
3.1.2 數(shù)據(jù)聚類
3.1.3 數(shù)據(jù)標注方法
3.2 事件抽取研究方案
3.2.1 基于CRF抽取模型
3.2.2 基于BERT+Bi-LSTM+CRF抽取模型
3.2.3 基于BERT+Bi-LSTM+Attention+CRF抽取模型
3.3 實驗結(jié)果與分析
3.3.1 數(shù)據(jù)集劃分
3.3.2 評價指標
3.3.3 實驗結(jié)果
3.4 本章小結(jié)
第四章 基于熱點話題的事件因果關系抽取研究
4.1 顯式事件因果關系抽取
4.1.1 關聯(lián)詞知識庫
4.1.2 基于依存句法分析的事件表示
4.2 事件句的隱式事件因果關系抽取
4.2.1 數(shù)據(jù)標注方法
4.2.2 基于BERT+Bi-LSTM+Attention+CRF抽取模型
4.3 事件對的隱式事件因果關系抽取
4.3.1 候選事件對
4.3.2 事件間規(guī)則特征
4.3.3 結(jié)合事件間規(guī)則特征和Bi-GRU抽取模型
4.4 因果事件相似度計算
4.5 實驗結(jié)果與分析
4.6 本章小結(jié)
第五章 事理圖譜的存儲及應用系統(tǒng)設計
5.1 事理圖譜的存儲
5.1.1 NoSQL數(shù)據(jù)庫介紹
5.1.2 Neo4j圖數(shù)據(jù)庫
5.1.3 事理圖譜的存儲方案設計
5.2 事理圖譜應用系統(tǒng)設計
5.2.1 應用系統(tǒng)設計
5.2.2 系統(tǒng)的框架設計
5.2.3 數(shù)據(jù)查詢層設計
5.2.4 業(yè)務邏輯層設計
5.3 事理圖譜應用功能實現(xiàn)
5.3.1 系統(tǒng)功能介紹
5.3.2 熱點話題查詢
5.3.3 智能問答功能
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 工作總結(jié)
6.2 研究展望
參考文獻
攻讀學位期間的研究成果
致謝
本文編號:3869514
【文章頁數(shù)】:58 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 知識圖譜的研究現(xiàn)狀
1.2.2 事理圖譜的研究現(xiàn)狀
1.2.3 知識圖譜與事理圖譜
1.3 論文的研究內(nèi)容
1.4 論文的組織架構(gòu)
第二章 相關理論與技術
2.1 信息抽取
2.1.1 命名實體識別
2.1.2 事件抽取
2.1.3 事件關系抽取
2.2 詞向量模型
2.2.1 Word2Vec模型
2.2.2 BERT模型
2.3 循環(huán)神經(jīng)網(wǎng)絡
2.3.1 RNN循環(huán)神經(jīng)網(wǎng)絡
2.3.2 長短時記憶神經(jīng)網(wǎng)絡
2.3.3 流形的LSTM神經(jīng)網(wǎng)絡
2.4 本章小結(jié)
第三章 基于熱點話題的事件抽取研究
3.1 事件語料庫構(gòu)建
3.1.1 數(shù)據(jù)來源
3.1.2 數(shù)據(jù)聚類
3.1.3 數(shù)據(jù)標注方法
3.2 事件抽取研究方案
3.2.1 基于CRF抽取模型
3.2.2 基于BERT+Bi-LSTM+CRF抽取模型
3.2.3 基于BERT+Bi-LSTM+Attention+CRF抽取模型
3.3 實驗結(jié)果與分析
3.3.1 數(shù)據(jù)集劃分
3.3.2 評價指標
3.3.3 實驗結(jié)果
3.4 本章小結(jié)
第四章 基于熱點話題的事件因果關系抽取研究
4.1 顯式事件因果關系抽取
4.1.1 關聯(lián)詞知識庫
4.1.2 基于依存句法分析的事件表示
4.2 事件句的隱式事件因果關系抽取
4.2.1 數(shù)據(jù)標注方法
4.2.2 基于BERT+Bi-LSTM+Attention+CRF抽取模型
4.3 事件對的隱式事件因果關系抽取
4.3.1 候選事件對
4.3.2 事件間規(guī)則特征
4.3.3 結(jié)合事件間規(guī)則特征和Bi-GRU抽取模型
4.4 因果事件相似度計算
4.5 實驗結(jié)果與分析
4.6 本章小結(jié)
第五章 事理圖譜的存儲及應用系統(tǒng)設計
5.1 事理圖譜的存儲
5.1.1 NoSQL數(shù)據(jù)庫介紹
5.1.2 Neo4j圖數(shù)據(jù)庫
5.1.3 事理圖譜的存儲方案設計
5.2 事理圖譜應用系統(tǒng)設計
5.2.1 應用系統(tǒng)設計
5.2.2 系統(tǒng)的框架設計
5.2.3 數(shù)據(jù)查詢層設計
5.2.4 業(yè)務邏輯層設計
5.3 事理圖譜應用功能實現(xiàn)
5.3.1 系統(tǒng)功能介紹
5.3.2 熱點話題查詢
5.3.3 智能問答功能
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 工作總結(jié)
6.2 研究展望
參考文獻
攻讀學位期間的研究成果
致謝
本文編號:3869514
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3869514.html
最近更新
教材專著