支持語義推理的學科知識庫設計與實現(xiàn)
發(fā)布時間:2022-10-19 14:10
2018年,據美國國家科學基金會(NSF)的統(tǒng)計數(shù)據顯示,中國科學出版物的總量首次超過了美國,作為創(chuàng)新能力最有代表性的指標,其反應了一個國家經濟發(fā)展和社會繁榮的主要驅動力?焖僭鲩L的數(shù)據,準確地識別出其對應的學科領域,無論是知識類別劃分,還是高效率檢索,都具有極大的戰(zhàn)略意義。知識庫系統(tǒng)不僅能夠在效率上極大地節(jié)省檢索到相關學科知識的時間,同時在未來也具有不可低估的商業(yè)潛力。本知識庫提供論文的全文檢索服務,并支持學科的自動分類,根據知識庫構建流程可劃分為六個核心模塊,分別是數(shù)據支撐模塊,學科分類模塊,知識信息檢索模塊,統(tǒng)計分析模塊,語義推理模塊,日志監(jiān)控模塊。本人完成的工作如下所示:(1)數(shù)據采集,使用億級數(shù)據集結合爬蟲數(shù)據作為知識庫數(shù)據基礎,在此基礎上進行有效的數(shù)據清洗,并入庫搜索引擎,提供全文檢索功能。(2)學科分類,使用詞向量結合卷積神經網絡進行模型的訓練,并對比FastText,對數(shù)據文本進行學科分類。(3)知識信息檢索,實現(xiàn)多種檢索方式,包含簡單檢索,高級檢索,領域檢索等,提供不同排序方式排序檢索結果,導出等多種功能。(4)統(tǒng)計分析,提供豐富的可視化顯示,其中包括全局統(tǒng)計分析以及...
【文章頁數(shù)】:80 頁
【學位級別】:碩士
【文章目錄】:
致謝
摘要
ABSTRACT
1 緒論
1.1 項目背景
1.2 國內外研究現(xiàn)狀
1.2.1 國內研究現(xiàn)狀
1.2.2 國外研究現(xiàn)狀
1.3 研究內容
1.4 論文結構
2 相關理論及關鍵技術
2.1 Elasticsearch
2.2 現(xiàn)有學科分類體系
2.2.1 中華人民共和國學科分類與代碼標準(GBT13745-2009)
2.2.2 CJCR(中國科技期刊引證報告)
2.2.3 中科院JCR分區(qū)
2.2.4 Microsoft Academic Graph(MAG)分類
2.3 Esrally
2.4 DevCloud
2.5 Selenium
2.6 Scrapy
2.7 本章小結
3 數(shù)據集
3.1 數(shù)據集
3.1.1 簡介
3.1.2 數(shù)據描述
3.1.3 爬蟲
3.2 Elasticsearch
3.2.1 索引設計
3.2.2 數(shù)據導入
3.2.3 數(shù)據清洗
3.2.4 參數(shù)調整
3.2.5 性能調優(yōu)設計
3.3 異構系統(tǒng)的數(shù)據交換
3.4 本章小結
4 知識庫系統(tǒng)需求分析
4.1 需求分析綜述
4.2 知識庫系統(tǒng)功能需求
4.2.1 數(shù)據支撐
4.2.2 學科分類功能
4.2.3 知識信息查詢功能
4.2.4 統(tǒng)計分析功能
4.2.5 語義推理功能
4.2.6 日志監(jiān)控功能
4.3 知識庫系統(tǒng)非功能性需求
4.4 本章小結
5 知識庫系統(tǒng)設計及實現(xiàn)
5.1 知識庫系統(tǒng)概要設計
5.1.1 系統(tǒng)總體架構設計
5.1.2 系統(tǒng)功能架構設計
5.2 知識庫系統(tǒng)詳細設計和實現(xiàn)
5.2.1 學科分類模型的訓練過程
5.2.2 知識信息查詢模塊
5.2.3 統(tǒng)計分析模塊
5.2.4 語義推理模塊
5.2.5 日志監(jiān)控模塊
5.3 本章小結
6 測試
6.1 環(huán)境與工具依賴
6.2 功能性測試
6.2.1 知識信息查詢功能測試
6.2.2 統(tǒng)計分析功能測試
6.2.3 日志監(jiān)控功能測試
6.3 非功能性測試
6.4 本章小結
7 總結與展望
7.1 總結
7.2 展望
參考文獻
作者簡歷及攻讀碩士/博士學位期間取得的研究成果
學位論文數(shù)據集
【參考文獻】:
期刊論文
[1]知識圖譜研究綜述[J]. 李涓子,侯磊. 山西大學學報(自然科學版). 2017(03)
[2]知識圖譜研究進展[J]. 漆桂林,高桓,吳天星. 情報工程. 2017(01)
[3]國內外知識庫研究現(xiàn)狀述評與比較[J]. 張斌,魏扣,郝琦. 圖書情報知識. 2016(03)
[4]軟件測試概論和方法[J]. 王佩多. 數(shù)字通信世界. 2015(08)
[5]Word2vec的工作原理及應用探究[J]. 周練. 科技情報開發(fā)與經濟. 2015(02)
[6]基于知識庫的動態(tài)蟻群算法[J]. 孫勇,李妮,龔光紅,韓亮. 北京工業(yè)大學學報. 2012(03)
[7]基于本體的知識建模技術[J]. 張梅,郝佳,閻艷,李波. 北京理工大學學報. 2010(12)
[8]淺析黑盒測試與白盒測試[J]. 胡靜. 衡水學院學報. 2008(01)
[9]技術整合中知識庫的構建研究[J]. 張平 ,藍海林 ,黃文彥. 科學學與科學技術管理. 2004(01)
[10]基于知識庫的知識發(fā)現(xiàn)(KDK)的結構模型與挖掘算法研究[J]. 楊炳儒,申江濤,陳泓婕. 中國工程科學. 2003(06)
博士論文
[1]知識融合中若干關鍵技術研究[D]. 緱錦.浙江大學 2005
本文編號:3693509
【文章頁數(shù)】:80 頁
【學位級別】:碩士
【文章目錄】:
致謝
摘要
ABSTRACT
1 緒論
1.1 項目背景
1.2 國內外研究現(xiàn)狀
1.2.1 國內研究現(xiàn)狀
1.2.2 國外研究現(xiàn)狀
1.3 研究內容
1.4 論文結構
2 相關理論及關鍵技術
2.1 Elasticsearch
2.2 現(xiàn)有學科分類體系
2.2.1 中華人民共和國學科分類與代碼標準(GBT13745-2009)
2.2.2 CJCR(中國科技期刊引證報告)
2.2.3 中科院JCR分區(qū)
2.2.4 Microsoft Academic Graph(MAG)分類
2.3 Esrally
2.4 DevCloud
2.5 Selenium
2.6 Scrapy
2.7 本章小結
3 數(shù)據集
3.1 數(shù)據集
3.1.1 簡介
3.1.2 數(shù)據描述
3.1.3 爬蟲
3.2 Elasticsearch
3.2.1 索引設計
3.2.2 數(shù)據導入
3.2.3 數(shù)據清洗
3.2.4 參數(shù)調整
3.2.5 性能調優(yōu)設計
3.3 異構系統(tǒng)的數(shù)據交換
3.4 本章小結
4 知識庫系統(tǒng)需求分析
4.1 需求分析綜述
4.2 知識庫系統(tǒng)功能需求
4.2.1 數(shù)據支撐
4.2.2 學科分類功能
4.2.3 知識信息查詢功能
4.2.4 統(tǒng)計分析功能
4.2.5 語義推理功能
4.2.6 日志監(jiān)控功能
4.3 知識庫系統(tǒng)非功能性需求
4.4 本章小結
5 知識庫系統(tǒng)設計及實現(xiàn)
5.1 知識庫系統(tǒng)概要設計
5.1.1 系統(tǒng)總體架構設計
5.1.2 系統(tǒng)功能架構設計
5.2 知識庫系統(tǒng)詳細設計和實現(xiàn)
5.2.1 學科分類模型的訓練過程
5.2.2 知識信息查詢模塊
5.2.3 統(tǒng)計分析模塊
5.2.4 語義推理模塊
5.2.5 日志監(jiān)控模塊
5.3 本章小結
6 測試
6.1 環(huán)境與工具依賴
6.2 功能性測試
6.2.1 知識信息查詢功能測試
6.2.2 統(tǒng)計分析功能測試
6.2.3 日志監(jiān)控功能測試
6.3 非功能性測試
6.4 本章小結
7 總結與展望
7.1 總結
7.2 展望
參考文獻
作者簡歷及攻讀碩士/博士學位期間取得的研究成果
學位論文數(shù)據集
【參考文獻】:
期刊論文
[1]知識圖譜研究綜述[J]. 李涓子,侯磊. 山西大學學報(自然科學版). 2017(03)
[2]知識圖譜研究進展[J]. 漆桂林,高桓,吳天星. 情報工程. 2017(01)
[3]國內外知識庫研究現(xiàn)狀述評與比較[J]. 張斌,魏扣,郝琦. 圖書情報知識. 2016(03)
[4]軟件測試概論和方法[J]. 王佩多. 數(shù)字通信世界. 2015(08)
[5]Word2vec的工作原理及應用探究[J]. 周練. 科技情報開發(fā)與經濟. 2015(02)
[6]基于知識庫的動態(tài)蟻群算法[J]. 孫勇,李妮,龔光紅,韓亮. 北京工業(yè)大學學報. 2012(03)
[7]基于本體的知識建模技術[J]. 張梅,郝佳,閻艷,李波. 北京理工大學學報. 2010(12)
[8]淺析黑盒測試與白盒測試[J]. 胡靜. 衡水學院學報. 2008(01)
[9]技術整合中知識庫的構建研究[J]. 張平 ,藍海林 ,黃文彥. 科學學與科學技術管理. 2004(01)
[10]基于知識庫的知識發(fā)現(xiàn)(KDK)的結構模型與挖掘算法研究[J]. 楊炳儒,申江濤,陳泓婕. 中國工程科學. 2003(06)
博士論文
[1]知識融合中若干關鍵技術研究[D]. 緱錦.浙江大學 2005
本文編號:3693509
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3693509.html