基于深度學(xué)習(xí)的商業(yè)領(lǐng)域知識圖譜構(gòu)建
本文關(guān)鍵詞:基于深度學(xué)習(xí)的商業(yè)領(lǐng)域知識圖譜構(gòu)建,,由筆耕文化傳播整理發(fā)布。
【摘要】:知識圖譜是一種以可視化的方式展示信息中包含的知識要點、核心結(jié)構(gòu)、整體知識架構(gòu)的技術(shù)。近年來隨著科技創(chuàng)新,商業(yè)領(lǐng)域開始青睞知識圖譜這一圖形化展示方法。然而目前知識圖譜在商業(yè)領(lǐng)域的應(yīng)用主要局限于搜索引擎和問答系統(tǒng)等方面,通過分析百科知識或知識庫中包含的知識實體來為使用者提供知識服務(wù)。其他方面并沒有得到廣泛應(yīng)用。究其原因,主要在于非結(jié)構(gòu)化文本的知識抽取和知識圖譜繪制這兩方面的技術(shù)難點。其中,尤以非結(jié)構(gòu)化文化的知識抽取最為關(guān)鍵,本文將著眼于知識圖譜的知識抽取這一關(guān)鍵環(huán)節(jié),擬采用深度學(xué)習(xí)算法解決知識圖譜中的知識抽取這一關(guān)鍵問題,并引入圖形數(shù)據(jù)庫,為知識圖譜的繪制提供一種新的思路。深度學(xué)習(xí)是近年來機(jī)器學(xué)習(xí)領(lǐng)域中的一個熱點,相對于以往的淺層學(xué)習(xí)模型,它能夠更好地模擬人腦的學(xué)習(xí)方式,以達(dá)到更好的學(xué)習(xí)效果。深度學(xué)習(xí)算法一般具有較多的層次結(jié)構(gòu),利用深層且非線性的學(xué)習(xí)結(jié)構(gòu),它可以實現(xiàn)對復(fù)雜函數(shù)的逼近。本論文將廣泛應(yīng)用于學(xué)科領(lǐng)域的知識圖譜概念延伸到商業(yè)領(lǐng)域中,通過引入機(jī)器學(xué)習(xí)中的深度學(xué)習(xí)算法,搭建基于深度學(xué)習(xí)的商業(yè)領(lǐng)域知識圖譜構(gòu)建框架,采用深度置信網(wǎng)絡(luò)算法自動提取非結(jié)構(gòu)化商業(yè)文本中蘊(yùn)含的知識單元及單元之間的關(guān)系,以此解決商業(yè)領(lǐng)域知識單元提取這一難點,提高知識單元提取的準(zhǔn)確率。此外,本論文還將引入圖形數(shù)據(jù)庫,實現(xiàn)知識單元的存儲和知識圖譜的繪制,為商業(yè)知識圖譜的繪制提供一種新的思路。
【關(guān)鍵詞】:知識圖譜 深度學(xué)習(xí) 深度置信網(wǎng)絡(luò) 圖形數(shù)據(jù)庫
【學(xué)位授予單位】:華東師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:G350
【目錄】:
- 摘要6-7
- ABSTRACT7-10
- 1 緒論10-22
- 1.1 選題背景及現(xiàn)實意義10-11
- 1.2 知識圖譜相關(guān)研究綜述11-18
- 1.2.1 知識圖譜類型11-12
- 1.2.2 知識圖譜構(gòu)建方法12-14
- 1.2.3 知識圖譜構(gòu)建流程14-17
- 1.2.4 知識圖譜在商業(yè)領(lǐng)域的應(yīng)用17-18
- 1.3 論文的基本內(nèi)容18-19
- 1.4 論文的創(chuàng)新點19-20
- 1.5 論文的基本框架20-22
- 2 相關(guān)理論介紹22-33
- 2.1 深度學(xué)習(xí)理論22-29
- 2.1.1 淺層學(xué)習(xí)與深度學(xué)習(xí)22-23
- 2.1.2 受限玻爾茲曼機(jī)23-26
- 2.1.3 反向傳播網(wǎng)絡(luò)26-28
- 2.1.4 深度置信網(wǎng)絡(luò)28-29
- 2.2 圖形數(shù)據(jù)庫理論與方法29-32
- 2.2.1 圖形數(shù)據(jù)庫概念29-30
- 2.2.2 Neo4j圖形數(shù)據(jù)庫30-32
- 2.3 本章小結(jié)32-33
- 3 基于深度學(xué)習(xí)算法的商業(yè)領(lǐng)域知識圖譜構(gòu)建(BKG-DL)框架33-44
- 3.1 BKG-DL框架的流程33-35
- 3.2 基于深度置信網(wǎng)絡(luò)的中文知識實體識別35-38
- 3.2.1 知識實體識別35-36
- 3.2.2 特征選擇36-38
- 3.3 基于深度置信網(wǎng)絡(luò)的中文實體關(guān)系識別38-42
- 3.3.1 實體關(guān)系識別38-40
- 3.3.2 特征選擇40-42
- 3.4 知識圖譜的繪制42-43
- 3.4.1 知識圖譜繪制流程42-43
- 3.4.2 知識圖譜繪制方法43
- 3.5 本章小結(jié)43-44
- 4 移動互聯(lián)網(wǎng)領(lǐng)域在線新聞的知識圖譜構(gòu)建實證44-58
- 4.1 數(shù)據(jù)來源45
- 4.2 分詞45-47
- 4.2.1 構(gòu)造分詞詞典46-47
- 4.2.2 基于詞典進(jìn)行分詞47
- 4.3 知識實體識別47-51
- 4.3.1 數(shù)據(jù)預(yù)處理48-49
- 4.3.2 特征選擇49-50
- 4.3.3 實驗與分析50-51
- 4.4 實體關(guān)系識別51-54
- 4.4.1 數(shù)據(jù)預(yù)處理51-52
- 4.4.2 特征選擇52-53
- 4.4.3 實驗與分析53-54
- 4.5 知識圖譜的繪制54-55
- 4.5.1 數(shù)據(jù)入庫54
- 4.5.2 圖形繪制54-55
- 4.6 知識圖譜的應(yīng)用55-57
- 4.6.1 領(lǐng)域發(fā)展現(xiàn)狀分析56-57
- 4.6.2 領(lǐng)域高層流動分析57
- 4.7 本章小結(jié)57-58
- 5 基于深度學(xué)習(xí)的商業(yè)領(lǐng)域知識圖譜應(yīng)用實例58-63
- 5.1 醫(yī)療知識圖譜58-60
- 5.1.1 背景介紹58
- 5.1.2 數(shù)據(jù)來源58
- 5.1.3 構(gòu)建知識圖譜58-59
- 5.1.4 知識圖譜分析59-60
- 5.2 人才發(fā)現(xiàn)與人才培養(yǎng)60-62
- 5.2.1 背景介紹60
- 5.2.2 數(shù)據(jù)來源60
- 5.2.3 構(gòu)建知識圖譜60-61
- 5.2.4 知識圖譜分析61-62
- 5.3 本章小結(jié)62-63
- 6 結(jié)論63-65
- 6.1 總結(jié)63
- 6.2 展望63-65
- 參考文獻(xiàn)65-69
- 后記69
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 鄧擘;鄭彥寧;傅繼彬;;漢語實體關(guān)系模式的自動獲取研究[J];計算機(jī)科學(xué);2010年02期
2 車萬翔,劉挺,李生;實體關(guān)系自動抽取[J];中文信息學(xué)報;2005年02期
3 朱鴻宇;劉瑰;陳左寧;唐福華;;實體關(guān)系識別中長距離依賴問題的研究[J];小型微型計算機(jī)系統(tǒng);2008年02期
4 牟晉娟;包宏;;中文實體關(guān)系抽取研究[J];計算機(jī)工程與設(shè)計;2009年15期
5 朱姍;;基于規(guī)則和本體的實體關(guān)系抽取系統(tǒng)研究[J];情報雜志;2010年S2期
6 周利娟;林鴻飛;羅文華;;基于實體關(guān)系的犯罪網(wǎng)絡(luò)識別機(jī)制[J];計算機(jī)應(yīng)用研究;2011年03期
7 董靜;孫樂;馮元勇;黃瑞紅;;中文實體關(guān)系抽取中的特征選擇研究[J];中文信息學(xué)報;2007年04期
8 徐健;張智雄;吳振新;;實體關(guān)系抽取的技術(shù)方法綜述[J];現(xiàn)代圖書情報技術(shù);2008年08期
9 黃晨;錢龍華;周國棟;朱巧明;;基于卷積樹核的無指導(dǎo)中文實體關(guān)系抽取研究[J];中文信息學(xué)報;2010年04期
10 李小紅;錢龍華;;基于自舉的弱指導(dǎo)中文實體關(guān)系抽取研究[J];高科技與產(chǎn)業(yè)化;2010年09期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 車萬翔;劉挺;李生;;實體關(guān)系自動抽取[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年
2 莊成龍;錢龍華;周國棟;;基于樹核函數(shù)的實體關(guān)系抽取方法研究[A];第四屆全國學(xué)生計算語言學(xué)研討會會議論文集[C];2008年
3 徐芬;王挺;陳火旺;;基于SVM方法的中文實體關(guān)系抽取[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 張奇;信息抽取中實體關(guān)系識別研究[D];中國科學(xué)技術(shù)大學(xué);2010年
2 張宏濤;面向生物文本的實體關(guān)系自動抽取問題研究[D];清華大學(xué);2012年
3 張素香;信息抽取中關(guān)鍵技術(shù)的研究[D];北京郵電大學(xué);2007年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉龍;音樂領(lǐng)域全局實體關(guān)系抽取研究[D];哈爾濱工業(yè)大學(xué);2010年
2 雷春雅;領(lǐng)域?qū)嶓w關(guān)系自動抽取研究[D];昆明理工大學(xué);2011年
3 劉安安;開放式中文實體關(guān)系抽取研究[D];哈爾濱工業(yè)大學(xué);2013年
4 陳超;基于互聯(lián)網(wǎng)的二元實體關(guān)系抽取研究[D];華東師范大學(xué);2013年
5 周藍(lán)s
本文編號:265439
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/265439.html