創(chuàng)業(yè)領域文獻知識圖譜構建與應用研究
發(fā)布時間:2022-11-08 19:24
隨著知識圖譜的發(fā)展,目前已經出現(xiàn)很多優(yōu)秀的學術知識圖譜,比較知名的有Aminer平臺、微軟學術圖譜等,旨在對不同的學術數(shù)據(jù)進行集成,為科研人員提供更多學術搜索上的幫助。但這些學術圖譜建立的是面向通用領域的知識庫,在對實體的抽取上只考慮了論文、期刊、學者等通用實體,大量的語義信息沒有被挖掘出來,本質的科學問題缺少對于文獻實體深度的定義和分析,本文通過定義文獻中隱含的語義實體,使用Text CNN分類算法關聯(lián)研究方法與論文實體,融合語義信息借助隨機森林算法梳理其語義模式,構建多語義屬性的實體模型,搭建基于語義信息的多維度知識圖譜,為科研人員提供多維度的語義檢索方式,幫助其快速理解文獻深層內容。本文選取分析的文獻領域為創(chuàng)業(yè)領域,該領域的研究從1980年左右興起,并迅速進入研究高潮得到研究學者們的青睞,文獻內容詳實,領域特征明顯且論文數(shù)量處于快速增長階段,現(xiàn)有的通用實體類型已不能很好地滿足對數(shù)據(jù)的多維度信息搜索。本文利用知識圖譜技術,以創(chuàng)業(yè)領域中常見且重要的研究方法這一語義信息為例,構建概念實體,在實體識別的過程中,利用Text CNN實現(xiàn)對文本的分類和定位,并對這一實體在摘要中的語義模式進行...
【文章頁數(shù)】:74 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景和意義
1.2 研究現(xiàn)狀
1.3 本文的主要工作
1.4 本文的組織結構
第2章 相關研究綜述
2.1 學術知識圖譜的概述
2.2 傳統(tǒng)文本的分類方法概述
2.3 深度學習的文本分類方法概述
2.4 本章小結
第3章 基于TextCNN算法的語義實體抽取
3.1 學術知識圖譜的構建流程
3.2 數(shù)據(jù)模式定義
3.3 基于TextCNN的算法設計
3.3.1 任務概述
3.3.2 算法的框架設計
3.4 實驗結果與分析
3.4.1 數(shù)據(jù)準備
3.4.2 數(shù)據(jù)文本向量化
3.4.3與基線算法的分類對比實驗
3.4.4 實驗結果
3.5 本章小結
第4章 針對語義實體關系屬性的語句抽取
4.1 任務概述
4.2 子分類特征詞匹配實驗
4.3 基于機器學習的抽取實驗
4.4 實驗結果及對比分析
4.4.1 基于邏輯回歸的實驗
4.4.2 基于決策樹的實驗
4.4.3 基于隨機森林的實驗
4.4.4 結果對比與分析
4.5 本章小結
第5章 面向創(chuàng)業(yè)領域學術論文的推薦系統(tǒng)
5.1 知識圖譜的存儲
5.2 系統(tǒng)的設計和實現(xiàn)
5.2.1 前端框架的搭建
5.2.2 后端功能的實現(xiàn)
5.3 系統(tǒng)展示
5.4 本章小結
第6章 總結與展望
6.1 研究總結
6.2 研究展望
參考文獻
作者簡介及在學期間所取得的科研成果
致謝
【參考文獻】:
期刊論文
[1]大規(guī)模知識圖譜及其應用研究[J]. 孫雨生,常凱月,朱禮軍. 情報理論與實踐. 2018(11)
[2]科技論文檢索工作中SCI數(shù)據(jù)庫的使用探究[J]. 夏冬,任波,謝黎. 圖書情報導刊. 2016(12)
[3]基于Neo4j的領域本體存儲方法研究[J]. 王紅,張青青,蔡偉偉,姜洋. 計算機應用研究. 2017(08)
[4]知識圖譜構建技術綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計算機研究與發(fā)展. 2016(03)
[5]為何非精英群體能在海外成功創(chuàng)業(yè)?——基于對佛羅倫薩溫商的實證研究[J]. 周歡懷,朱沛. 管理世界. 2014(02)
[6]搜索引擎學術研究知識圖譜[J]. 劉陽,宋余慶. 圖書情報知識. 2010(06)
[7]科學知識圖譜研究綜述[J]. 梁秀娟. 圖書館雜志. 2009(06)
[8]基于本體的關系數(shù)據(jù)庫語義檢索[J]. 王珊,張俊,彭朝暉,戰(zhàn)疆,杜小勇. 計算機科學與探索. 2007(01)
[9]本體論研究綜述[J]. 李善平,尹奇韡,胡玉杰,郭鳴,付相君. 計算機研究與發(fā)展. 2004(07)
[10]元數(shù)據(jù)開發(fā)應用的標準化框架[J]. 張曉林. 現(xiàn)代圖書情報技術. 2001(02)
本文編號:3704419
【文章頁數(shù)】:74 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景和意義
1.2 研究現(xiàn)狀
1.3 本文的主要工作
1.4 本文的組織結構
第2章 相關研究綜述
2.1 學術知識圖譜的概述
2.2 傳統(tǒng)文本的分類方法概述
2.3 深度學習的文本分類方法概述
2.4 本章小結
第3章 基于TextCNN算法的語義實體抽取
3.1 學術知識圖譜的構建流程
3.2 數(shù)據(jù)模式定義
3.3 基于TextCNN的算法設計
3.3.1 任務概述
3.3.2 算法的框架設計
3.4 實驗結果與分析
3.4.1 數(shù)據(jù)準備
3.4.2 數(shù)據(jù)文本向量化
3.4.3與基線算法的分類對比實驗
3.4.4 實驗結果
3.5 本章小結
第4章 針對語義實體關系屬性的語句抽取
4.1 任務概述
4.2 子分類特征詞匹配實驗
4.3 基于機器學習的抽取實驗
4.4 實驗結果及對比分析
4.4.1 基于邏輯回歸的實驗
4.4.2 基于決策樹的實驗
4.4.3 基于隨機森林的實驗
4.4.4 結果對比與分析
4.5 本章小結
第5章 面向創(chuàng)業(yè)領域學術論文的推薦系統(tǒng)
5.1 知識圖譜的存儲
5.2 系統(tǒng)的設計和實現(xiàn)
5.2.1 前端框架的搭建
5.2.2 后端功能的實現(xiàn)
5.3 系統(tǒng)展示
5.4 本章小結
第6章 總結與展望
6.1 研究總結
6.2 研究展望
參考文獻
作者簡介及在學期間所取得的科研成果
致謝
【參考文獻】:
期刊論文
[1]大規(guī)模知識圖譜及其應用研究[J]. 孫雨生,常凱月,朱禮軍. 情報理論與實踐. 2018(11)
[2]科技論文檢索工作中SCI數(shù)據(jù)庫的使用探究[J]. 夏冬,任波,謝黎. 圖書情報導刊. 2016(12)
[3]基于Neo4j的領域本體存儲方法研究[J]. 王紅,張青青,蔡偉偉,姜洋. 計算機應用研究. 2017(08)
[4]知識圖譜構建技術綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計算機研究與發(fā)展. 2016(03)
[5]為何非精英群體能在海外成功創(chuàng)業(yè)?——基于對佛羅倫薩溫商的實證研究[J]. 周歡懷,朱沛. 管理世界. 2014(02)
[6]搜索引擎學術研究知識圖譜[J]. 劉陽,宋余慶. 圖書情報知識. 2010(06)
[7]科學知識圖譜研究綜述[J]. 梁秀娟. 圖書館雜志. 2009(06)
[8]基于本體的關系數(shù)據(jù)庫語義檢索[J]. 王珊,張俊,彭朝暉,戰(zhàn)疆,杜小勇. 計算機科學與探索. 2007(01)
[9]本體論研究綜述[J]. 李善平,尹奇韡,胡玉杰,郭鳴,付相君. 計算機研究與發(fā)展. 2004(07)
[10]元數(shù)據(jù)開發(fā)應用的標準化框架[J]. 張曉林. 現(xiàn)代圖書情報技術. 2001(02)
本文編號:3704419
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3704419.html
最近更新
教材專著