垂直領(lǐng)域知識(shí)圖譜構(gòu)建的關(guān)鍵技術(shù)研究
發(fā)布時(shí)間:2021-06-03 20:29
知識(shí)圖譜(Knowledge Graph)是Google于2012年提出的一種高效的知識(shí)表達(dá)模型。它使用一系列字符串符號(hào)映射于真實(shí)世界中存在的各種實(shí)體或概念中,然后以這些實(shí)體或概念間的關(guān)聯(lián)關(guān)系為連接符,將不同類型的信息連接在一起,從而構(gòu)成一張巨大的語義網(wǎng)絡(luò)圖。與傳統(tǒng)的信息管理方式相比,知識(shí)圖譜能夠幫助人們更快速有效地獲取所需的知識(shí)間的邏輯關(guān)系,有利于知識(shí)間智能推理的實(shí)現(xiàn)。其中,垂直領(lǐng)域知識(shí)圖譜面向特定的行業(yè)領(lǐng)域,能夠被應(yīng)用于搜索引擎、智能問答、知識(shí)挖掘和決策支持等業(yè)務(wù)中。因此,其構(gòu)建技術(shù)的研究具有重要意義。本文在調(diào)研和分析現(xiàn)有知識(shí)圖譜構(gòu)建方法的基礎(chǔ)上,研究基于多種數(shù)據(jù)源構(gòu)建中文垂直領(lǐng)域知識(shí)圖譜,并對(duì)一些已有的知識(shí)圖譜構(gòu)建關(guān)鍵技術(shù)提出改進(jìn)方案。論文的主要貢獻(xiàn)包括:1.對(duì)于知識(shí)抽取中的中文垂直領(lǐng)域命名實(shí)體識(shí)別任務(wù),本文在經(jīng)典的字粒度Bi-LSTM-CRF命名實(shí)體識(shí)別模型基礎(chǔ)上,針對(duì)中文垂直領(lǐng)域特點(diǎn),提出了創(chuàng)新性的改進(jìn)方案。其中,基于注意力的中文詞信息增強(qiáng)模型能夠通過注意力機(jī)制訓(xùn)練出字所屬的每個(gè)詞對(duì)字義的貢獻(xiàn)程度比,將詞向量信息按其語義貢獻(xiàn)比例加入字粒度的命名實(shí)體識(shí)別模型中。另外,還針對(duì)漢字...
【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:67 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-3?Dm模型[16]??
循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
圖2-5基于CNN的文本分類模型結(jié)構(gòu)圖_??
【參考文獻(xiàn)】:
期刊論文
[1]基于GRU的命名實(shí)體識(shí)別方法[J]. 王潔,張瑞東,吳晨生. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(09)
[2]面向知識(shí)圖譜的知識(shí)推理研究進(jìn)展[J]. 官賽萍,靳小龍,賈巖濤,王元卓,程學(xué)旗. 軟件學(xué)報(bào). 2018(10)
[3]知識(shí)表示學(xué)習(xí)研究進(jìn)展[J]. 劉知遠(yuǎn),孫茂松,林衍凱,謝若冰. 計(jì)算機(jī)研究與發(fā)展. 2016(02)
本文編號(hào):3211201
【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:67 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-3?Dm模型[16]??
循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
圖2-5基于CNN的文本分類模型結(jié)構(gòu)圖_??
【參考文獻(xiàn)】:
期刊論文
[1]基于GRU的命名實(shí)體識(shí)別方法[J]. 王潔,張瑞東,吳晨生. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(09)
[2]面向知識(shí)圖譜的知識(shí)推理研究進(jìn)展[J]. 官賽萍,靳小龍,賈巖濤,王元卓,程學(xué)旗. 軟件學(xué)報(bào). 2018(10)
[3]知識(shí)表示學(xué)習(xí)研究進(jìn)展[J]. 劉知遠(yuǎn),孫茂松,林衍凱,謝若冰. 計(jì)算機(jī)研究與發(fā)展. 2016(02)
本文編號(hào):3211201
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3211201.html
最近更新
教材專著