基于圖書的概念—描述詞知識網(wǎng)絡的構建及應用
本文關鍵詞:基于圖書的概念—描述詞知識網(wǎng)絡的構建及應用
【摘要】:隨著信息技術的普及和互聯(lián)網(wǎng)技術的飛速發(fā)展,人類積累的數(shù)據(jù)量正在以指數(shù)的速度迅速增長。在數(shù)字圖書館領域,CADAL已經(jīng)積累大量的數(shù)字圖書,并提供了相應的圖書閱讀服務。顯然,每一本圖書都包含有大量的知識片段,如果能將這些資源進行分解、關聯(lián)和再組織,形成按照一定目標、主題組織的內容,將會產(chǎn)生更大的價值。鑒于此,本論文在基于CADAL數(shù)字圖書館中的海量圖書資源的基礎上,從圖書中構建概念-描述詞知識網(wǎng)絡,完成對圖書知識的抽取和分解;然后在知識網(wǎng)絡的基礎上生成概念百科,完成對知識的關聯(lián)和組織。論文的主要工作如下:(1)基于數(shù)字圖書構建了概念-描述詞知識網(wǎng)絡。首先,本文給出了知識網(wǎng)絡的原型。隨后,提出了一種基于詞嵌入(word embedding)匹配的算法用來解決目錄的短語抽取問題,并訓練分類器將目錄短語分類成概念和描述詞,從而構建得到概念-描述詞知識網(wǎng)絡。(2)本文提出基于Learning to Rank算法的百科詞條目錄生成算法,對從概念-描述詞知識網(wǎng)絡得到的候選描述詞進行排序,使得詞條目錄反映知識闡述的前后順序。(3)基于短語抽取、短語分類、描述詞排序等算法實現(xiàn)了基于概念-描述詞知識網(wǎng)絡的概念百科生成系統(tǒng)。
【關鍵詞】:知識服務 知識圖譜 組塊標注 詞嵌入
【學位授予單位】:浙江大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.1
【目錄】:
- 摘要4-5
- Abstract5-11
- 第1章 緒論11-15
- 1.1 課題背景11
- 1.2 課題意義11-13
- 1.3 本文的主要工作13
- 1.4 本文的組織結構13-14
- 1.5 本章小結14-15
- 第2章 相關研究綜述15-27
- 2.1 知識圖譜15-17
- 2.1.1 谷歌知識圖譜16
- 2.1.2 搜狗知立方16-17
- 2.1.3 百度知心17
- 2.2 組塊標注17-21
- 2.2.1 基于支持向量機的組塊標注18
- 2.2.2 基于隱馬爾科夫模型的組塊標注18-19
- 2.2.3 基于條件隨機場的組塊標注19-21
- 2.3 詞嵌入21-25
- 2.3.1 詞嵌入的訓練22-24
- 2.3.2 詞嵌入訓練工具24-25
- 2.4 排序學習算法25-26
- 2.5 本章小結26-27
- 第3章 概念-描述詞知識網(wǎng)絡構建關鍵技術27-42
- 3.1 概念-描述詞知識網(wǎng)絡概述27-28
- 3.2 基于詞嵌入匹配的短語抽取算法28-35
- 3.2.1 算法總體設計29-31
- 3.2.2 特征設計31-32
- 3.2.3 模型求解32-35
- 3.3 目錄短語分類35-38
- 3.3.1 分類算法選擇36
- 3.3.2 特征設計36-38
- 3.4 基于排序學習的描述詞排序38-41
- 3.4.1 模型選擇38-39
- 3.4.2 特征設計39-41
- 3.5 本章小結41-42
- 第4章 概念百科生成系統(tǒng)的設計與實現(xiàn)42-55
- 4.1 概念百科生成系統(tǒng)的需求分析42-43
- 4.2 概念百科生成系統(tǒng)的架構設計43-44
- 4.3 概念百科生成系統(tǒng)的模塊設計與實現(xiàn)44-51
- 4.3.1 目錄預處理模塊44-46
- 4.3.2 概念-描述詞知識網(wǎng)絡的構建模塊46-47
- 4.3.3 知識網(wǎng)絡存儲模塊47-48
- 4.3.4 概念詞條目錄生成模塊48-50
- 4.3.5 概念詞條章節(jié)內容生成模塊50-51
- 4.4 系統(tǒng)展示51-54
- 4.5 本章小結54-55
- 第5章 實驗及結果分析55-68
- 5.1 實驗數(shù)據(jù)集55
- 5.2 詞嵌入匹配算法相關實驗55-64
- 5.2.1 評測標準55-56
- 5.2.2 組塊標注實驗56-58
- 5.2.3 目錄短語抽取實驗58-64
- 5.3 短語分類實驗64-65
- 5.4 描述詞排序實驗65-67
- 5.4.1 評測標準65-66
- 5.4.2 實驗過程及分析66-67
- 5.5 本章小結67-68
- 第6章 總結與展望68-70
- 6.1 總結68
- 6.2 展望68-70
- 參考文獻70-74
- 致謝74
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 肖冬平;劉淑銀;;知識網(wǎng)絡中節(jié)點的結構位置及其測度——基于社會網(wǎng)絡的分析[J];圖書情報工作;2010年10期
2 王濤;顧新;;知識網(wǎng)絡組織之間相互信任的建立過程分析[J];情報雜志;2011年04期
3 程慧平;孫建軍;;社會網(wǎng)絡與知識網(wǎng)絡之比較[J];情報資料工作;2011年01期
4 任慧;;企業(yè)知識網(wǎng)絡內涵述評[J];情報理論與實踐;2013年10期
5 顧龍翔;;國外衛(wèi)星電視知識網(wǎng)絡[J];電子技術;1985年10期
6 鄭士貴;知識網(wǎng)絡[J];管理科學文摘;1997年01期
7 袁劍;;文化遭遇與知識網(wǎng)絡[J];讀書;2011年11期
8 李丹,俞竹超,樊治平;知識網(wǎng)絡的構建過程分析[J];科學學研究;2002年06期
9 馬德輝;包昌火;;企業(yè)知識網(wǎng)絡探析[J];情報理論與實踐;2007年06期
10 王眾托;;無處不在的網(wǎng)絡社會中的知識網(wǎng)絡[J];信息系統(tǒng)學報;2007年01期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 陳曉宇;王國紅;;基于知識網(wǎng)絡的企業(yè)技術學習模式研究[A];中國企業(yè)運籌學[C];2006年
2 陳曉榮;丁th;韓麗川;;知識網(wǎng)絡連接機制對知識擴散的影響[A];第九屆中國管理科學學術年會論文集[C];2007年
3 王海龍;肖劍杰;;半導體產(chǎn)業(yè)模塊化知識網(wǎng)絡對發(fā)明效用的影響研究[A];第九屆中國科技政策與管理學術年會論文集[C];2013年
4 Noshir S.Contractor;;知識網(wǎng)絡的共同發(fā)展與21世紀的組織形式(英文)[A];北京論壇(2004)文明的和諧與共同繁榮:“IT產(chǎn)業(yè)與現(xiàn)代文明傳播”信息傳播分論壇論文或摘要集[C];2004年
5 方德英;陳建斌;徐凱波;;IT服務外包中復雜知識網(wǎng)絡協(xié)同演化概念模型研究[A];第六屆(2011)中國管理學年會——商務智能分會場論文集[C];2011年
中國重要報紙全文數(shù)據(jù)庫 前6條
1 商報記者 錢秀中;浙古社舉辦國學知識網(wǎng)絡大賽[N];中國圖書商報;2011年
2 于冬雪;ETS托福知識網(wǎng)絡競賽啟動[N];南方日報;2008年
3 劉壽坤;閩西開通首家CNKI知識網(wǎng)絡服務站[N];福建郵電報;2000年
4 余江 繆雙妍;從“嵌入全球制造網(wǎng)絡”到“撬動國際知識網(wǎng)絡”[N];科技日報;2013年
5 本報記者 苗野;網(wǎng)絡游戲成稅法宣傳新形式[N];財會信報;2008年
6 黃委黃河水利科學研究院院長 時明立;全面強化責任 夯實洽黃科研安全防線[N];黃河報;2014年
中國博士學位論文全文數(shù)據(jù)庫 前7條
1 李江;基于知識網(wǎng)絡的企業(yè)網(wǎng)絡化創(chuàng)新能力研究[D];天津大學;2008年
2 李文博;企業(yè)知識網(wǎng)絡復雜系統(tǒng)的結構與演化:產(chǎn)業(yè)集群情境下的實證研究[D];浙江工商大學;2009年
3 陽志梅;基于知識網(wǎng)絡與企業(yè)知識能力的高技術集群企業(yè)成長研究[D];中南大學;2010年
4 代風;面向復雜產(chǎn)品研發(fā)過程的知識網(wǎng)絡理論及集成應用研究[D];浙江大學;2015年
5 徐蕾;知識網(wǎng)絡雙重嵌入對集群企業(yè)創(chuàng)新能力提升的機理研究[D];浙江大學;2012年
6 辛晴;知識網(wǎng)絡對企業(yè)創(chuàng)新的影響[D];山東大學;2011年
7 全利平;基于知識網(wǎng)絡的科研團隊知識及任務管理研究[D];復旦大學;2012年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 江丁丁;開放式協(xié)同創(chuàng)新知識網(wǎng)絡的若干關鍵技術研究[D];浙江大學;2015年
2 白亭亭;我國區(qū)域知識網(wǎng)絡結構演化的多尺度比較研究[D];南京師范大學;2015年
3 王友文;基于知識網(wǎng)絡嵌入的集群企業(yè)核心能力成長機理研究[D];南京財經(jīng)大學;2014年
4 林智同;知識網(wǎng)絡嵌入性影響研發(fā)團隊創(chuàng)造力的作用機制[D];中國計量學院;2015年
5 王艷剛;超地方知識網(wǎng)絡與企業(yè)外部知識集成關系研究[D];河北科技大學;2015年
6 龔軍;基于圖書的概念—描述詞知識網(wǎng)絡的構建及應用[D];浙江大學;2016年
7 丁th;復雜知識網(wǎng)絡的結構特征對知識流動的影響[D];上海交通大學;2009年
8 肖劍杰;半導體產(chǎn)業(yè)知識網(wǎng)絡模塊化測度及其影響研究[D];大連理工大學;2013年
9 舒剛;基于知識網(wǎng)絡的企業(yè)知識管理研究[D];武漢理工大學;2008年
10 吳莎;互聯(lián)網(wǎng)大規(guī)模協(xié)作知識網(wǎng)絡演化機理與仿真[D];湖南大學;2010年
,本文編號:619257
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/619257.html