基于框架的科技文獻中事件知識抽取
發(fā)布時間:2023-08-08 19:43
數(shù)字圖書館作為學(xué)術(shù)成果的知識庫,其保存的海量科技文獻作為人類的知識寶藏,成為人們補給知識的重要途徑,用戶可以不受時空限制及時獲取所需知識。然而,隨著知識經(jīng)濟時代的到來,人們對知識的需求日益迫切化、專業(yè)化、微觀化和精準化。目前,傳統(tǒng)的以篇章為單位的知識服務(wù)導(dǎo)致用戶不得不花費大量的時間定位所需知識;并且在深入文獻內(nèi)容研究方面,文本內(nèi)容劃分模糊,最終也會導(dǎo)致知識服務(wù)產(chǎn)生了模糊。因此,為滿足知識經(jīng)濟時代人們新的知識需求,迎接大數(shù)據(jù)對數(shù)字圖書館科技文獻知識服務(wù)的影響和挑戰(zhàn),解決科技文獻存在的服務(wù)粒度過大、內(nèi)容劃分邊界模糊等問題,本研究將科技文獻知識服務(wù)的單位由文獻單元深入到文獻內(nèi)容本身,并對它們進行整理、篩選、分析乃至評價等,從而將最相關(guān)的知識以最精簡的方式提供給用戶,滿足用戶的知識需求。事件知識作為人類認識和理解世界的基本的單元,是人們進行思維活動的基本單元。基于上述分析,本研究以數(shù)字圖書館館藏科技文獻中的事件知識為研究對象,運用多種相關(guān)理論和研究方法,首先,基于描述規(guī)則抽取科技文獻中的元事件;然后,對元事件數(shù)據(jù)集進行聚類分析,識別每一個類簇的表示框架,即事件知識表示框架;最后,基于事件知識表...
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstrad
1 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 事件內(nèi)涵研究現(xiàn)狀
1.2.2 事件知識表示研究現(xiàn)狀
1.2.3 事件抽取方法研究現(xiàn)狀
1.2.4 研究述評
1.3 研究內(nèi)容和研究思路
1.3.1 研究內(nèi)容
1.3.2 研究思路
1.4 研究創(chuàng)新點
1.5 論文結(jié)構(gòu)
2 相關(guān)理論與關(guān)鍵技術(shù)
2.1 事件知識相關(guān)概念
2.2 知識表示
2.2.1 符號的知識表示方法
2.2.2 基于符號的事件知識表示
2.3 聚類分析
2.3.1 基于劃分的聚類
2.3.2 基于層次的聚類
2.3.3 譜聚類
2.3.4 性能分析
2.4 文本預(yù)處理
2.4.1 詞法分析
2.4.2 依存句法分析
2.4.3 語義依存分析
2.4.4 文本預(yù)處理工具
3 科技文獻中元事件的抽取
3.1 元事件初始描述規(guī)則的生成
3.1.1 語料庫的解析
3.1.2 目標句式結(jié)構(gòu)的識別
3.1.3 句式結(jié)構(gòu)的規(guī)范
3.2 元事件的抽取與描述規(guī)則的自動更新
3.2.1 基于描述規(guī)則的元事件抽取
3.2.2 基于prefixspan算法的元事件描述規(guī)則自動更新
3.3 元事件描述規(guī)則總結(jié)
3.3.1 靜態(tài)的陳述型元事件描述規(guī)則
3.3.2 動態(tài)的程序型元事件描述規(guī)則
4 科技文獻中事件知識的抽取
4.1 科技文獻中事件知識的框架識別
4.1.1 事件主題的識別
4.1.2 事件知識框架的識別
4.2 基于框架的構(gòu)件值抽取
4.2.1 主題標識
4.2.2 內(nèi)部屬性值的識別
4.2.3 情境屬性值的識別
4.2.4 外部屬性關(guān)聯(lián)的識別
5 實證
5.1 元事件抽取實證分析
5.1.1 測試語料的選取
5.1.2 實驗結(jié)果
5.1.3 測試評價
5.1.4 抽取結(jié)果比較與分析
5.2 事件知識抽取實證分析
5.2.1 測試評價
5.2.2 結(jié)果分析
6 總結(jié)與展望
6.1 研究總結(jié)
6.2 展望
參考文獻
攻讀學(xué)位期間完成的論文
致謝
本文編號:3840369
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstrad
1 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 事件內(nèi)涵研究現(xiàn)狀
1.2.2 事件知識表示研究現(xiàn)狀
1.2.3 事件抽取方法研究現(xiàn)狀
1.2.4 研究述評
1.3 研究內(nèi)容和研究思路
1.3.1 研究內(nèi)容
1.3.2 研究思路
1.4 研究創(chuàng)新點
1.5 論文結(jié)構(gòu)
2 相關(guān)理論與關(guān)鍵技術(shù)
2.1 事件知識相關(guān)概念
2.2 知識表示
2.2.1 符號的知識表示方法
2.2.2 基于符號的事件知識表示
2.3 聚類分析
2.3.1 基于劃分的聚類
2.3.2 基于層次的聚類
2.3.3 譜聚類
2.3.4 性能分析
2.4 文本預(yù)處理
2.4.1 詞法分析
2.4.2 依存句法分析
2.4.3 語義依存分析
2.4.4 文本預(yù)處理工具
3 科技文獻中元事件的抽取
3.1 元事件初始描述規(guī)則的生成
3.1.1 語料庫的解析
3.1.2 目標句式結(jié)構(gòu)的識別
3.1.3 句式結(jié)構(gòu)的規(guī)范
3.2 元事件的抽取與描述規(guī)則的自動更新
3.2.1 基于描述規(guī)則的元事件抽取
3.2.2 基于prefixspan算法的元事件描述規(guī)則自動更新
3.3 元事件描述規(guī)則總結(jié)
3.3.1 靜態(tài)的陳述型元事件描述規(guī)則
3.3.2 動態(tài)的程序型元事件描述規(guī)則
4 科技文獻中事件知識的抽取
4.1 科技文獻中事件知識的框架識別
4.1.1 事件主題的識別
4.1.2 事件知識框架的識別
4.2 基于框架的構(gòu)件值抽取
4.2.1 主題標識
4.2.2 內(nèi)部屬性值的識別
4.2.3 情境屬性值的識別
4.2.4 外部屬性關(guān)聯(lián)的識別
5 實證
5.1 元事件抽取實證分析
5.1.1 測試語料的選取
5.1.2 實驗結(jié)果
5.1.3 測試評價
5.1.4 抽取結(jié)果比較與分析
5.2 事件知識抽取實證分析
5.2.1 測試評價
5.2.2 結(jié)果分析
6 總結(jié)與展望
6.1 研究總結(jié)
6.2 展望
參考文獻
攻讀學(xué)位期間完成的論文
致謝
本文編號:3840369
本文鏈接:http://sikaile.net/tushudanganlunwen/3840369.html
最近更新
教材專著