知識圖譜中的邏輯關(guān)系抽取技術(shù)研究
發(fā)布時間:2022-01-07 01:32
知識圖譜作為人工智能技術(shù)的重要分支,通過構(gòu)建大規(guī)模語義網(wǎng)絡(luò)為互聯(lián)網(wǎng)時代的知識獲取和信息處理提供了便捷。隨著人工智能技術(shù)的不斷推進(jìn)和應(yīng)用,知識圖譜的研究工作也發(fā)揮了重要價值。知識圖譜構(gòu)建過程包括了信息抽取、知識融合、知識加工等子過程。關(guān)系抽取是信息抽取的子任務(wù),旨在從無結(jié)構(gòu)化文本中抽取實體對之間的關(guān)系,形成結(jié)構(gòu)化數(shù)據(jù)。本文針對少樣本數(shù)據(jù)的關(guān)系抽取問題進(jìn)行研究,提出了基于遷移學(xué)習(xí)和深度學(xué)習(xí)模型結(jié)合的關(guān)系抽取方法,解決了少樣本數(shù)據(jù)條件下的關(guān)系抽取問題。主要研究成果如下:1.針對少樣本領(lǐng)域關(guān)系抽取問題,提出了一種基于分段卷積神經(jīng)網(wǎng)絡(luò)和遷移學(xué)習(xí)的關(guān)系抽取方法。該方法結(jié)合了遷移學(xué)習(xí)方法和深度學(xué)習(xí)模型,利用源域數(shù)據(jù)在模型中的預(yù)訓(xùn)練參數(shù),目標(biāo)域數(shù)據(jù)重訓(xùn)練的方式完成關(guān)系抽取任務(wù)。首先,將文本進(jìn)行詞向量表示,作為網(wǎng)絡(luò)結(jié)構(gòu)的輸入,同時考慮到加入不同特征對于最終關(guān)系抽。ǚ诸悾┙Y(jié)果的影響,本文在文本表示中加入了詞嵌入、位置嵌入、詞性特征和句法特征。然后將源域數(shù)據(jù)在模型中進(jìn)行預(yù)訓(xùn)練并保留卷積層參數(shù),最后對卷積層參數(shù)進(jìn)行遷移,并將目標(biāo)域數(shù)據(jù)在網(wǎng)絡(luò)中進(jìn)行重訓(xùn)練,以提高目標(biāo)數(shù)據(jù)最終關(guān)系分類結(jié)果的準(zhǔn)確性。同時使用多粒度...
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【部分圖文】:
關(guān)系抽取任務(wù)示例
重慶郵電大學(xué)碩士學(xué)位論文第1章緒論31.2國內(nèi)外研究現(xiàn)狀為了探究關(guān)系抽取任務(wù)的研究重要性,本文調(diào)研了與之緊密相關(guān)的四個研究領(lǐng)域,它們分別是,知識圖譜,信息抽取,遷移學(xué)習(xí)及深度學(xué)習(xí)。本節(jié)將針對這四個研究方向詳細(xì)介紹其研究現(xiàn)狀。1.2.1知識圖譜近年來,人工智能的發(fā)展和應(yīng)用遍布世界的各個領(lǐng)域,而知識圖譜以其強大的信息組織能力和語義理解能力連同大數(shù)據(jù)處理等前沿技術(shù)共同推動人工智能產(chǎn)業(yè)的蓬勃發(fā)展。關(guān)于知識圖譜的構(gòu)建與應(yīng)用等研究課題也逐漸受到研究者的關(guān)注。其實,知識圖譜并不是全新的研究任務(wù),早在上世紀(jì)70年代,專家系統(tǒng)(ExpertSystems)已經(jīng)成為人工智能的重要分支。它通過人類專家提供知識,并將其映射存儲到知識庫中進(jìn)行推理。早期的知識圖譜利用領(lǐng)域?qū)<胰斯?gòu)建知識庫,實現(xiàn)了較高的準(zhǔn)確率,但是其構(gòu)建過程耗時費力且無法廣泛覆蓋。1998年,萬維網(wǎng)之父TimBernersLee提出語義網(wǎng)(SemanticWeb)[6]的概念,使其通過數(shù)據(jù)構(gòu)成的網(wǎng)絡(luò),為用戶提供經(jīng)過加工和推理的知識。2012年,谷歌正式提出知識圖譜這一概念,從全新的角度為信息檢索問題提供了智能化的發(fā)展方向。圖1.2Google搜索示例
重慶郵電大學(xué)碩士學(xué)位論文第2章相關(guān)理論技術(shù)基礎(chǔ)11包括實體抽取,關(guān)系抽取和屬性抽齲所涉及的抽取方法包括,基于啟發(fā)式算法和人工編寫規(guī)則的信息抽取方法,基于統(tǒng)計機器學(xué)習(xí)的信息抽取方法,基于深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的信息抽取方法,面向開放域的信息抽取方法等。知識融合的目的是消除概念歧義,剔除冗余及錯誤概念,提高知識的準(zhǔn)確性。知識融合包含實體鏈接和知識合并。實體鏈接將文本中抽取的實體對象,進(jìn)行實體消歧,共指消解操作,然后鏈接到知識庫中的對應(yīng)實體。另外通過第三方知識庫或已有結(jié)構(gòu)化知識完成知識合并。外部世界獲取的事實并非知識,通過知識加工可以最終形成結(jié)構(gòu)化的知識體系。知識加工包含本體構(gòu)建,知識推理和質(zhì)量評估。知識推理算法主要分為基于邏輯的推理,基于圖的推理和基于深度學(xué)習(xí)的推理等。知識圖譜的構(gòu)建過程隨著信息的發(fā)展和變化也在不斷進(jìn)行更新迭代。圖2.1知識圖譜技術(shù)架構(gòu)示例2.2關(guān)系抽取知識圖譜構(gòu)建過程涉及了信息抽取,知識融合和知識加工等步驟,關(guān)系抽取是信息抽取環(huán)節(jié)中基礎(chǔ)且重要的研究課題。目前關(guān)系抽取問題研究已經(jīng)取得了較好的科研成果,本節(jié)主要介紹關(guān)系抽取相關(guān)技術(shù)并比較其優(yōu)缺點。關(guān)系抽取,旨在抽取句子中已標(biāo)記實體對之間的語義關(guān)系,形成結(jié)構(gòu)化數(shù)據(jù)以便開展后續(xù)工作。在本文中,關(guān)系抽取任務(wù)的目的是判斷一個句子中所包含的實體對屬于哪一種關(guān)系,亦或稱為關(guān)系分類問題。該任務(wù)將關(guān)系抽取任務(wù)轉(zhuǎn)化為多分類問題。下面詳細(xì)介紹目前的關(guān)系抽取相關(guān)技術(shù)并做對比分析。
【參考文獻(xiàn)】:
期刊論文
[1]Relation Classification via Recurrent Neural Network with Attention and Tensor Layers[J]. Runyan Zhang,Fanrong Meng,Yong Zhou,Bing Liu. Big Data Mining and Analytics. 2018(03)
[2]知識圖譜研究綜述[J]. 李涓子,侯磊. 山西大學(xué)學(xué)報(自然科學(xué)版). 2017(03)
[3]知識圖譜研究進(jìn)展[J]. 漆桂林,高桓,吳天星. 情報工程. 2017(01)
[4]基于詞形規(guī)則模板的術(shù)語層次關(guān)系抽取方法[J]. 韓紅旗,徐碩,桂婕,喬曉東,朱禮軍,安小米. 情報學(xué)報. 2013 (07)
[5]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽明,王正. 計算機應(yīng)用研究. 2012(08)
[6]信息抽取研究綜述[J]. 李保利,陳玉忠,俞士汶. 計算機工程與應(yīng)用. 2003(10)
碩士論文
[1]無監(jiān)督的中文實體關(guān)系抽取研究[D]. 王晶.華東師范大學(xué) 2012
[2]無監(jiān)督關(guān)系抽取方法研究[D]. 張志田.哈爾濱工業(yè)大學(xué) 2007
[3]基于條件隨機場的中文命名實體識別[D]. 向曉雯.廈門大學(xué) 2006
本文編號:3573543
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【部分圖文】:
關(guān)系抽取任務(wù)示例
重慶郵電大學(xué)碩士學(xué)位論文第1章緒論31.2國內(nèi)外研究現(xiàn)狀為了探究關(guān)系抽取任務(wù)的研究重要性,本文調(diào)研了與之緊密相關(guān)的四個研究領(lǐng)域,它們分別是,知識圖譜,信息抽取,遷移學(xué)習(xí)及深度學(xué)習(xí)。本節(jié)將針對這四個研究方向詳細(xì)介紹其研究現(xiàn)狀。1.2.1知識圖譜近年來,人工智能的發(fā)展和應(yīng)用遍布世界的各個領(lǐng)域,而知識圖譜以其強大的信息組織能力和語義理解能力連同大數(shù)據(jù)處理等前沿技術(shù)共同推動人工智能產(chǎn)業(yè)的蓬勃發(fā)展。關(guān)于知識圖譜的構(gòu)建與應(yīng)用等研究課題也逐漸受到研究者的關(guān)注。其實,知識圖譜并不是全新的研究任務(wù),早在上世紀(jì)70年代,專家系統(tǒng)(ExpertSystems)已經(jīng)成為人工智能的重要分支。它通過人類專家提供知識,并將其映射存儲到知識庫中進(jìn)行推理。早期的知識圖譜利用領(lǐng)域?qū)<胰斯?gòu)建知識庫,實現(xiàn)了較高的準(zhǔn)確率,但是其構(gòu)建過程耗時費力且無法廣泛覆蓋。1998年,萬維網(wǎng)之父TimBernersLee提出語義網(wǎng)(SemanticWeb)[6]的概念,使其通過數(shù)據(jù)構(gòu)成的網(wǎng)絡(luò),為用戶提供經(jīng)過加工和推理的知識。2012年,谷歌正式提出知識圖譜這一概念,從全新的角度為信息檢索問題提供了智能化的發(fā)展方向。圖1.2Google搜索示例
重慶郵電大學(xué)碩士學(xué)位論文第2章相關(guān)理論技術(shù)基礎(chǔ)11包括實體抽取,關(guān)系抽取和屬性抽齲所涉及的抽取方法包括,基于啟發(fā)式算法和人工編寫規(guī)則的信息抽取方法,基于統(tǒng)計機器學(xué)習(xí)的信息抽取方法,基于深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的信息抽取方法,面向開放域的信息抽取方法等。知識融合的目的是消除概念歧義,剔除冗余及錯誤概念,提高知識的準(zhǔn)確性。知識融合包含實體鏈接和知識合并。實體鏈接將文本中抽取的實體對象,進(jìn)行實體消歧,共指消解操作,然后鏈接到知識庫中的對應(yīng)實體。另外通過第三方知識庫或已有結(jié)構(gòu)化知識完成知識合并。外部世界獲取的事實并非知識,通過知識加工可以最終形成結(jié)構(gòu)化的知識體系。知識加工包含本體構(gòu)建,知識推理和質(zhì)量評估。知識推理算法主要分為基于邏輯的推理,基于圖的推理和基于深度學(xué)習(xí)的推理等。知識圖譜的構(gòu)建過程隨著信息的發(fā)展和變化也在不斷進(jìn)行更新迭代。圖2.1知識圖譜技術(shù)架構(gòu)示例2.2關(guān)系抽取知識圖譜構(gòu)建過程涉及了信息抽取,知識融合和知識加工等步驟,關(guān)系抽取是信息抽取環(huán)節(jié)中基礎(chǔ)且重要的研究課題。目前關(guān)系抽取問題研究已經(jīng)取得了較好的科研成果,本節(jié)主要介紹關(guān)系抽取相關(guān)技術(shù)并比較其優(yōu)缺點。關(guān)系抽取,旨在抽取句子中已標(biāo)記實體對之間的語義關(guān)系,形成結(jié)構(gòu)化數(shù)據(jù)以便開展后續(xù)工作。在本文中,關(guān)系抽取任務(wù)的目的是判斷一個句子中所包含的實體對屬于哪一種關(guān)系,亦或稱為關(guān)系分類問題。該任務(wù)將關(guān)系抽取任務(wù)轉(zhuǎn)化為多分類問題。下面詳細(xì)介紹目前的關(guān)系抽取相關(guān)技術(shù)并做對比分析。
【參考文獻(xiàn)】:
期刊論文
[1]Relation Classification via Recurrent Neural Network with Attention and Tensor Layers[J]. Runyan Zhang,Fanrong Meng,Yong Zhou,Bing Liu. Big Data Mining and Analytics. 2018(03)
[2]知識圖譜研究綜述[J]. 李涓子,侯磊. 山西大學(xué)學(xué)報(自然科學(xué)版). 2017(03)
[3]知識圖譜研究進(jìn)展[J]. 漆桂林,高桓,吳天星. 情報工程. 2017(01)
[4]基于詞形規(guī)則模板的術(shù)語層次關(guān)系抽取方法[J]. 韓紅旗,徐碩,桂婕,喬曉東,朱禮軍,安小米. 情報學(xué)報. 2013 (07)
[5]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽明,王正. 計算機應(yīng)用研究. 2012(08)
[6]信息抽取研究綜述[J]. 李保利,陳玉忠,俞士汶. 計算機工程與應(yīng)用. 2003(10)
碩士論文
[1]無監(jiān)督的中文實體關(guān)系抽取研究[D]. 王晶.華東師范大學(xué) 2012
[2]無監(jiān)督關(guān)系抽取方法研究[D]. 張志田.哈爾濱工業(yè)大學(xué) 2007
[3]基于條件隨機場的中文命名實體識別[D]. 向曉雯.廈門大學(xué) 2006
本文編號:3573543
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3573543.html
最近更新
教材專著