基于深度學(xué)習(xí)的商業(yè)領(lǐng)域知識(shí)圖譜構(gòu)建
本文關(guān)鍵詞:基于深度學(xué)習(xí)的商業(yè)領(lǐng)域知識(shí)圖譜構(gòu)建,,由筆耕文化傳播整理發(fā)布。
【摘要】:知識(shí)圖譜是一種以可視化的方式展示信息中包含的知識(shí)要點(diǎn)、核心結(jié)構(gòu)、整體知識(shí)架構(gòu)的技術(shù)。近年來隨著科技創(chuàng)新,商業(yè)領(lǐng)域開始青睞知識(shí)圖譜這一圖形化展示方法。然而目前知識(shí)圖譜在商業(yè)領(lǐng)域的應(yīng)用主要局限于搜索引擎和問答系統(tǒng)等方面,通過分析百科知識(shí)或知識(shí)庫中包含的知識(shí)實(shí)體來為使用者提供知識(shí)服務(wù)。其他方面并沒有得到廣泛應(yīng)用。究其原因,主要在于非結(jié)構(gòu)化文本的知識(shí)抽取和知識(shí)圖譜繪制這兩方面的技術(shù)難點(diǎn)。其中,尤以非結(jié)構(gòu)化文化的知識(shí)抽取最為關(guān)鍵,本文將著眼于知識(shí)圖譜的知識(shí)抽取這一關(guān)鍵環(huán)節(jié),擬采用深度學(xué)習(xí)算法解決知識(shí)圖譜中的知識(shí)抽取這一關(guān)鍵問題,并引入圖形數(shù)據(jù)庫,為知識(shí)圖譜的繪制提供一種新的思路。深度學(xué)習(xí)是近年來機(jī)器學(xué)習(xí)領(lǐng)域中的一個(gè)熱點(diǎn),相對于以往的淺層學(xué)習(xí)模型,它能夠更好地模擬人腦的學(xué)習(xí)方式,以達(dá)到更好的學(xué)習(xí)效果。深度學(xué)習(xí)算法一般具有較多的層次結(jié)構(gòu),利用深層且非線性的學(xué)習(xí)結(jié)構(gòu),它可以實(shí)現(xiàn)對復(fù)雜函數(shù)的逼近。本論文將廣泛應(yīng)用于學(xué)科領(lǐng)域的知識(shí)圖譜概念延伸到商業(yè)領(lǐng)域中,通過引入機(jī)器學(xué)習(xí)中的深度學(xué)習(xí)算法,搭建基于深度學(xué)習(xí)的商業(yè)領(lǐng)域知識(shí)圖譜構(gòu)建框架,采用深度置信網(wǎng)絡(luò)算法自動(dòng)提取非結(jié)構(gòu)化商業(yè)文本中蘊(yùn)含的知識(shí)單元及單元之間的關(guān)系,以此解決商業(yè)領(lǐng)域知識(shí)單元提取這一難點(diǎn),提高知識(shí)單元提取的準(zhǔn)確率。此外,本論文還將引入圖形數(shù)據(jù)庫,實(shí)現(xiàn)知識(shí)單元的存儲(chǔ)和知識(shí)圖譜的繪制,為商業(yè)知識(shí)圖譜的繪制提供一種新的思路。
【關(guān)鍵詞】:知識(shí)圖譜 深度學(xué)習(xí) 深度置信網(wǎng)絡(luò) 圖形數(shù)據(jù)庫
【學(xué)位授予單位】:華東師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:G350
【目錄】:
- 摘要6-7
- ABSTRACT7-10
- 1 緒論10-22
- 1.1 選題背景及現(xiàn)實(shí)意義10-11
- 1.2 知識(shí)圖譜相關(guān)研究綜述11-18
- 1.2.1 知識(shí)圖譜類型11-12
- 1.2.2 知識(shí)圖譜構(gòu)建方法12-14
- 1.2.3 知識(shí)圖譜構(gòu)建流程14-17
- 1.2.4 知識(shí)圖譜在商業(yè)領(lǐng)域的應(yīng)用17-18
- 1.3 論文的基本內(nèi)容18-19
- 1.4 論文的創(chuàng)新點(diǎn)19-20
- 1.5 論文的基本框架20-22
- 2 相關(guān)理論介紹22-33
- 2.1 深度學(xué)習(xí)理論22-29
- 2.1.1 淺層學(xué)習(xí)與深度學(xué)習(xí)22-23
- 2.1.2 受限玻爾茲曼機(jī)23-26
- 2.1.3 反向傳播網(wǎng)絡(luò)26-28
- 2.1.4 深度置信網(wǎng)絡(luò)28-29
- 2.2 圖形數(shù)據(jù)庫理論與方法29-32
- 2.2.1 圖形數(shù)據(jù)庫概念29-30
- 2.2.2 Neo4j圖形數(shù)據(jù)庫30-32
- 2.3 本章小結(jié)32-33
- 3 基于深度學(xué)習(xí)算法的商業(yè)領(lǐng)域知識(shí)圖譜構(gòu)建(BKG-DL)框架33-44
- 3.1 BKG-DL框架的流程33-35
- 3.2 基于深度置信網(wǎng)絡(luò)的中文知識(shí)實(shí)體識(shí)別35-38
- 3.2.1 知識(shí)實(shí)體識(shí)別35-36
- 3.2.2 特征選擇36-38
- 3.3 基于深度置信網(wǎng)絡(luò)的中文實(shí)體關(guān)系識(shí)別38-42
- 3.3.1 實(shí)體關(guān)系識(shí)別38-40
- 3.3.2 特征選擇40-42
- 3.4 知識(shí)圖譜的繪制42-43
- 3.4.1 知識(shí)圖譜繪制流程42-43
- 3.4.2 知識(shí)圖譜繪制方法43
- 3.5 本章小結(jié)43-44
- 4 移動(dòng)互聯(lián)網(wǎng)領(lǐng)域在線新聞的知識(shí)圖譜構(gòu)建實(shí)證44-58
- 4.1 數(shù)據(jù)來源45
- 4.2 分詞45-47
- 4.2.1 構(gòu)造分詞詞典46-47
- 4.2.2 基于詞典進(jìn)行分詞47
- 4.3 知識(shí)實(shí)體識(shí)別47-51
- 4.3.1 數(shù)據(jù)預(yù)處理48-49
- 4.3.2 特征選擇49-50
- 4.3.3 實(shí)驗(yàn)與分析50-51
- 4.4 實(shí)體關(guān)系識(shí)別51-54
- 4.4.1 數(shù)據(jù)預(yù)處理51-52
- 4.4.2 特征選擇52-53
- 4.4.3 實(shí)驗(yàn)與分析53-54
- 4.5 知識(shí)圖譜的繪制54-55
- 4.5.1 數(shù)據(jù)入庫54
- 4.5.2 圖形繪制54-55
- 4.6 知識(shí)圖譜的應(yīng)用55-57
- 4.6.1 領(lǐng)域發(fā)展現(xiàn)狀分析56-57
- 4.6.2 領(lǐng)域高層流動(dòng)分析57
- 4.7 本章小結(jié)57-58
- 5 基于深度學(xué)習(xí)的商業(yè)領(lǐng)域知識(shí)圖譜應(yīng)用實(shí)例58-63
- 5.1 醫(yī)療知識(shí)圖譜58-60
- 5.1.1 背景介紹58
- 5.1.2 數(shù)據(jù)來源58
- 5.1.3 構(gòu)建知識(shí)圖譜58-59
- 5.1.4 知識(shí)圖譜分析59-60
- 5.2 人才發(fā)現(xiàn)與人才培養(yǎng)60-62
- 5.2.1 背景介紹60
- 5.2.2 數(shù)據(jù)來源60
- 5.2.3 構(gòu)建知識(shí)圖譜60-61
- 5.2.4 知識(shí)圖譜分析61-62
- 5.3 本章小結(jié)62-63
- 6 結(jié)論63-65
- 6.1 總結(jié)63
- 6.2 展望63-65
- 參考文獻(xiàn)65-69
- 后記69
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 鄧擘;鄭彥寧;傅繼彬;;漢語實(shí)體關(guān)系模式的自動(dòng)獲取研究[J];計(jì)算機(jī)科學(xué);2010年02期
2 車萬翔,劉挺,李生;實(shí)體關(guān)系自動(dòng)抽取[J];中文信息學(xué)報(bào);2005年02期
3 朱鴻宇;劉瑰;陳左寧;唐福華;;實(shí)體關(guān)系識(shí)別中長距離依賴問題的研究[J];小型微型計(jì)算機(jī)系統(tǒng);2008年02期
4 牟晉娟;包宏;;中文實(shí)體關(guān)系抽取研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2009年15期
5 朱姍;;基于規(guī)則和本體的實(shí)體關(guān)系抽取系統(tǒng)研究[J];情報(bào)雜志;2010年S2期
6 周利娟;林鴻飛;羅文華;;基于實(shí)體關(guān)系的犯罪網(wǎng)絡(luò)識(shí)別機(jī)制[J];計(jì)算機(jī)應(yīng)用研究;2011年03期
7 董靜;孫樂;馮元勇;黃瑞紅;;中文實(shí)體關(guān)系抽取中的特征選擇研究[J];中文信息學(xué)報(bào);2007年04期
8 徐健;張智雄;吳振新;;實(shí)體關(guān)系抽取的技術(shù)方法綜述[J];現(xiàn)代圖書情報(bào)技術(shù);2008年08期
9 黃晨;錢龍華;周國棟;朱巧明;;基于卷積樹核的無指導(dǎo)中文實(shí)體關(guān)系抽取研究[J];中文信息學(xué)報(bào);2010年04期
10 李小紅;錢龍華;;基于自舉的弱指導(dǎo)中文實(shí)體關(guān)系抽取研究[J];高科技與產(chǎn)業(yè)化;2010年09期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前3條
1 車萬翔;劉挺;李生;;實(shí)體關(guān)系自動(dòng)抽取[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
2 莊成龍;錢龍華;周國棟;;基于樹核函數(shù)的實(shí)體關(guān)系抽取方法研究[A];第四屆全國學(xué)生計(jì)算語言學(xué)研討會(huì)會(huì)議論文集[C];2008年
3 徐芬;王挺;陳火旺;;基于SVM方法的中文實(shí)體關(guān)系抽取[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 張奇;信息抽取中實(shí)體關(guān)系識(shí)別研究[D];中國科學(xué)技術(shù)大學(xué);2010年
2 張宏濤;面向生物文本的實(shí)體關(guān)系自動(dòng)抽取問題研究[D];清華大學(xué);2012年
3 張素香;信息抽取中關(guān)鍵技術(shù)的研究[D];北京郵電大學(xué);2007年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉龍;音樂領(lǐng)域全局實(shí)體關(guān)系抽取研究[D];哈爾濱工業(yè)大學(xué);2010年
2 雷春雅;領(lǐng)域?qū)嶓w關(guān)系自動(dòng)抽取研究[D];昆明理工大學(xué);2011年
3 劉安安;開放式中文實(shí)體關(guān)系抽取研究[D];哈爾濱工業(yè)大學(xué);2013年
4 陳超;基于互聯(lián)網(wǎng)的二元實(shí)體關(guān)系抽取研究[D];華東師范大學(xué);2013年
5 周藍(lán)s
本文編號(hào):265439
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/265439.html