基于本體的行業(yè)知識圖譜構(gòu)建技術(shù)的研究與實現(xiàn)
發(fā)布時間:2020-12-07 11:27
正是因為有獲取和形成知識的能力,人類才可以不斷進步。而知識對于人工智能的重要價值就是在于讓機器具備認知能力,去理解這個世界,理解應(yīng)用的行業(yè)或者領(lǐng)域。知識圖譜的結(jié)構(gòu)類似于人類大腦組織知識的結(jié)構(gòu),有助于機器模擬以人的思維模式和知識結(jié)構(gòu)來進行語言理解、視覺場景解析和決策分析。因此,知識圖譜作為人工智能的支撐基礎(chǔ),是實現(xiàn)真正的類人智能的必經(jīng)之路。近年來,不少企業(yè)愈加重視行業(yè)+知識圖譜。行業(yè)知識圖譜在金融、農(nóng)業(yè)、醫(yī)療、電商等領(lǐng)域已經(jīng)有了很好的應(yīng)用。對于企業(yè)來說,行業(yè)知識圖譜可以幫助行業(yè)人員解答關(guān)于行業(yè)的任務(wù)型需求,輔助各種復(fù)雜的分析應(yīng)用或決策支持,構(gòu)建行業(yè)壁壘。一個行之有效的行業(yè)知識圖譜構(gòu)建系統(tǒng)可以保證知識庫的質(zhì)量與規(guī)模、可擴張性和推理能力。但是不同行業(yè)數(shù)據(jù)模式不同,業(yè)務(wù)需求差異化使得目前沒有統(tǒng)一的行業(yè)知識圖譜構(gòu)建系統(tǒng)。本文針對特定的行業(yè)數(shù)據(jù),但是旨在搭建一個通用型的行業(yè)知識圖譜構(gòu)建系統(tǒng)。首先,本文研究了知識圖譜的相關(guān)技術(shù),包括知識圖譜架構(gòu)、知識表示、知識抽取、知識存儲和基于知識圖譜的問答系統(tǒng)五部分。針對每一部分,詳細介紹了其定義、關(guān)鍵技術(shù)與難點。為本課題算法設(shè)計和實現(xiàn)部分打下理論基礎(chǔ)。其次,本...
【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1三元組表示??主語->謂語->賓語的格式能夠使主語通過謂語和任何賓語聯(lián)系起來,其中的??
??鉍??圖2-2?TransE示意圖??受到該現(xiàn)象的啟發(fā),Bordes等人[7]提出了?TmnsE模型。如圖2-2所示,對??于三元組(h,r,t),?TransE將實體&和尾實體^之間的平移向量作為關(guān)系r的向量??Zr,即:??lh?+?lr?^?lt?(2-4)??TransE希望M?+?^和^越接近越好,因此損失函數(shù)如下:??=?\lh?+?lr?—?lt\?(2-5)??7??
人工標注的大量的語料庫產(chǎn)生的特征進行訓(xùn)練。Guillaume?Lample等人提出了??LSTM-CRF?(Long?Short-Term?Memory-Conditional?Random?Field)模型來解決??這個問題[1()]。圖2-4為模型整體的框架。??圖2-4?LSTM-CRF模型結(jié)構(gòu)圖[1W??該模型為端到端的判別式模型,輸入為單詞,輸出為識別出的實體標簽。圖??2-4中的字嵌入層(word?embedding),是按照語句順序,依次輸入每個單詞的??向量表示。雙向的LSTM,正向讀入(圖中的菱形I),獲得每個單詞及其左面的??上下文信息,反向讀入(圖中的菱形r),獲得單詞及其右面上下文信息,兩個??模型參數(shù)不同。之后,將正向和反向的信息組合起來構(gòu)成某個單詞上下文單詞(圖??中的菱形c),此時的輸出為...,xn),其中&表示語句中第i個單??詞所包含的上下文信息的向量表示。最頂層的CRF,輸入為X,輸出為Y?=??(yi
【參考文獻】:
期刊論文
[1]知識圖譜技術(shù)綜述[J]. 徐增林,盛泳潘,賀麗榮,王雅芳. 電子科技大學(xué)學(xué)報. 2016(04)
[2]垂直知識圖譜的構(gòu)建與應(yīng)用研究[J]. 阮彤,王夢婕,王昊奮,胡芳槐. 知識管理論壇. 2016(03)
[3]知識圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計算機研究與發(fā)展. 2016(03)
[4]知識表示學(xué)習(xí)研究進展[J]. 劉知遠,孫茂松,林衍凱,謝若冰. 計算機研究與發(fā)展. 2016(02)
[5]知識表示方法比較[J]. 劉建煒,燕路峰. 計算機系統(tǒng)應(yīng)用. 2011(03)
本文編號:2903162
【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1三元組表示??主語->謂語->賓語的格式能夠使主語通過謂語和任何賓語聯(lián)系起來,其中的??
??鉍??圖2-2?TransE示意圖??受到該現(xiàn)象的啟發(fā),Bordes等人[7]提出了?TmnsE模型。如圖2-2所示,對??于三元組(h,r,t),?TransE將實體&和尾實體^之間的平移向量作為關(guān)系r的向量??Zr,即:??lh?+?lr?^?lt?(2-4)??TransE希望M?+?^和^越接近越好,因此損失函數(shù)如下:??=?\lh?+?lr?—?lt\?(2-5)??7??
人工標注的大量的語料庫產(chǎn)生的特征進行訓(xùn)練。Guillaume?Lample等人提出了??LSTM-CRF?(Long?Short-Term?Memory-Conditional?Random?Field)模型來解決??這個問題[1()]。圖2-4為模型整體的框架。??圖2-4?LSTM-CRF模型結(jié)構(gòu)圖[1W??該模型為端到端的判別式模型,輸入為單詞,輸出為識別出的實體標簽。圖??2-4中的字嵌入層(word?embedding),是按照語句順序,依次輸入每個單詞的??向量表示。雙向的LSTM,正向讀入(圖中的菱形I),獲得每個單詞及其左面的??上下文信息,反向讀入(圖中的菱形r),獲得單詞及其右面上下文信息,兩個??模型參數(shù)不同。之后,將正向和反向的信息組合起來構(gòu)成某個單詞上下文單詞(圖??中的菱形c),此時的輸出為...,xn),其中&表示語句中第i個單??詞所包含的上下文信息的向量表示。最頂層的CRF,輸入為X,輸出為Y?=??(yi
【參考文獻】:
期刊論文
[1]知識圖譜技術(shù)綜述[J]. 徐增林,盛泳潘,賀麗榮,王雅芳. 電子科技大學(xué)學(xué)報. 2016(04)
[2]垂直知識圖譜的構(gòu)建與應(yīng)用研究[J]. 阮彤,王夢婕,王昊奮,胡芳槐. 知識管理論壇. 2016(03)
[3]知識圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計算機研究與發(fā)展. 2016(03)
[4]知識表示學(xué)習(xí)研究進展[J]. 劉知遠,孫茂松,林衍凱,謝若冰. 計算機研究與發(fā)展. 2016(02)
[5]知識表示方法比較[J]. 劉建煒,燕路峰. 計算機系統(tǒng)應(yīng)用. 2011(03)
本文編號:2903162
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2903162.html
最近更新
教材專著