基于深度學(xué)習(xí)的實(shí)體鏈接方法與系統(tǒng)
發(fā)布時(shí)間:2021-03-03 06:53
實(shí)體鏈接(Entity linking)旨在將文本中的實(shí)體指稱詞映射到已有知識庫中對應(yīng)的正確實(shí)體上。作為自然語言處理中的子任務(wù),它能消除自然語言中的歧義,是幫助計(jì)算機(jī)實(shí)現(xiàn)自然語言理解的核心技術(shù)之一。當(dāng)前主流的實(shí)體鏈接方法利用外部知識庫為指稱詞的候選實(shí)體構(gòu)造子圖,然后將在該子圖上抽取的全局特征與本地特征結(jié)合對候選實(shí)體進(jìn)行排序,進(jìn)而將排序在前的候選實(shí)體作為最終實(shí)體。該類方法雖然有效利用了候選實(shí)體之間的關(guān)系信息,鏈接性能好,但其運(yùn)算量較大而且沒有利用到文檔中的指稱詞之間文本的語義信息。為此,本文在上述工作基礎(chǔ)上,利用深度學(xué)習(xí)技術(shù)研究指稱詞間文本的語義信息對候選實(shí)體排序位置的影響,進(jìn)而提出了詞向量與實(shí)體向量聯(lián)合訓(xùn)練的學(xué)習(xí)方法與指稱詞間語義關(guān)系增強(qiáng)的實(shí)體消歧模型,并構(gòu)建了基于該模型的實(shí)體鏈接系統(tǒng),該系統(tǒng)能夠以可視化的方式顯示鏈接結(jié)果,具體成果如下:1、提出了一種詞向量與實(shí)體向量的聯(lián)合訓(xùn)練方法。在基于深度學(xué)習(xí)的實(shí)體鏈接方法中,詞與實(shí)體都需要使用向量進(jìn)行表示,而且指稱詞上下文與候選實(shí)體要進(jìn)行交互以計(jì)算指稱詞與候選實(shí)體的相似程度?紤]到已有詞向量與實(shí)體向量聯(lián)合學(xué)習(xí)方法參數(shù)復(fù)雜、較難調(diào)參的問題,該方法將...
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院人工智能學(xué)院)北京市
【文章頁數(shù)】:89 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1.3搜索引擎智能問答實(shí)例??Fiure?1.3?An?examle?of?intellientuestion?answerinon?search?engine??
深度學(xué)習(xí)協(xié)同方法??深度學(xué)習(xí)協(xié)同方法%531使用深度學(xué)習(xí)方法抽取指稱詞的上下文特征,利用了??整篇文檔的語義信息,在同一篇文檔里,很有可能相同的指稱詞指代不同的實(shí)體,??而一些方法會將文檔里的相同指稱詞都鏈接到同一實(shí)體上。為了克服上述問題,??深度學(xué)習(xí)協(xié)同方法更重視整篇文章中包含的重要信息,而不僅僅只關(guān)注某個指稱??詞的上下文特征,這種方法能夠考慮到每個指稱詞與目標(biāo)實(shí)體的關(guān)系,提高實(shí)體??鏈接的準(zhǔn)確率。2018年劉知遠(yuǎn)等[55]使用圖卷積神經(jīng)網(wǎng)絡(luò)來進(jìn)行集體實(shí)體鏈接,其??模型框架如圖2.2所示,首先將一篇文檔中的所有指稱詞的候選實(shí)體通過知識庫??中的關(guān)系構(gòu)建一個子圖,然后將子圖中抽取的圖的特征信息與本地特征同時(shí)作為??圖卷積神經(jīng)網(wǎng)絡(luò)的輸入,經(jīng)過編碼與解碼后,得到每個候選實(shí)體的概率大小,該??方法在AIDA數(shù)據(jù)集上取得了?80%的F值。MenggeXue[55]利用了外部知識庫為??候選實(shí)體構(gòu)建子圖,然后使用循環(huán)隨機(jī)游走網(wǎng)絡(luò)學(xué)習(xí)候選實(shí)體間的相關(guān)度,最后??得到每個候選實(shí)體的概率,該方法在AIDA取得了?92.36%的F值。??基于深度學(xué)習(xí)的協(xié)同實(shí)體鏈接方法利用到了候選實(shí)體間的語義關(guān)系等全局??特征,該類方法在測試數(shù)據(jù)集上證明了該方法的有效性,但是深度學(xué)習(xí)協(xié)同實(shí)體??鏈接系列方法計(jì)算復(fù)雜度較高,部分方法中需要借助外部知識庫等資源通過人工??構(gòu)建特征,此外該類模型在運(yùn)行效率方面還有一些提升的空間。??_?_.?yorkshire?/U,_】?Feature?Extraction?Neural?Mode!??…Hussain.?????-'fcCT??,struck?158.???」??his?first?I
?基于深度學(xué)習(xí)的實(shí)體鏈接方法和系統(tǒng)???功能介紹?功能滇示?應(yīng)用場思?技術(shù)特色?產(chǎn)品定價(jià)拒關(guān)推薦??買了個班為??實(shí)體?實(shí)體所屬概念?實(shí)體描述??翅企業(yè)松同?瞞公司??m?文字詞in?中國漢字??勃?lkik&公司?有限公司??圖2.?6百度實(shí)例鏈接服務(wù)"??Figure?2.6?Entity?linking?serv?ice?of?Baidu?12??2.6小結(jié)??本章首先簡單介紹了實(shí)體鏈接的發(fā)展與基本概念,然后介紹了實(shí)體鏈接相關(guān)??流程及其對應(yīng)技術(shù)的國內(nèi)外發(fā)展現(xiàn)狀,同時(shí)本文還對國內(nèi)外知名的實(shí)體鏈接評測??任務(wù)進(jìn)行了調(diào)研與統(tǒng)計(jì),本章還簡要介紹了實(shí)體鏈接過程中的常用技術(shù),包括文??本表示方法與實(shí)體鏈接的常用特征等,最后本章對國內(nèi)外知名的實(shí)體鏈接相關(guān)產(chǎn)??品與平臺進(jìn)行了調(diào)研與介紹,以反映實(shí)體鏈接技術(shù)的發(fā)展現(xiàn)狀。??11?lutps://ai.haidu.com/tech/cognitive/entity_annotation??24??
本文編號:3060824
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院人工智能學(xué)院)北京市
【文章頁數(shù)】:89 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1.3搜索引擎智能問答實(shí)例??Fiure?1.3?An?examle?of?intellientuestion?answerinon?search?engine??
深度學(xué)習(xí)協(xié)同方法??深度學(xué)習(xí)協(xié)同方法%531使用深度學(xué)習(xí)方法抽取指稱詞的上下文特征,利用了??整篇文檔的語義信息,在同一篇文檔里,很有可能相同的指稱詞指代不同的實(shí)體,??而一些方法會將文檔里的相同指稱詞都鏈接到同一實(shí)體上。為了克服上述問題,??深度學(xué)習(xí)協(xié)同方法更重視整篇文章中包含的重要信息,而不僅僅只關(guān)注某個指稱??詞的上下文特征,這種方法能夠考慮到每個指稱詞與目標(biāo)實(shí)體的關(guān)系,提高實(shí)體??鏈接的準(zhǔn)確率。2018年劉知遠(yuǎn)等[55]使用圖卷積神經(jīng)網(wǎng)絡(luò)來進(jìn)行集體實(shí)體鏈接,其??模型框架如圖2.2所示,首先將一篇文檔中的所有指稱詞的候選實(shí)體通過知識庫??中的關(guān)系構(gòu)建一個子圖,然后將子圖中抽取的圖的特征信息與本地特征同時(shí)作為??圖卷積神經(jīng)網(wǎng)絡(luò)的輸入,經(jīng)過編碼與解碼后,得到每個候選實(shí)體的概率大小,該??方法在AIDA數(shù)據(jù)集上取得了?80%的F值。MenggeXue[55]利用了外部知識庫為??候選實(shí)體構(gòu)建子圖,然后使用循環(huán)隨機(jī)游走網(wǎng)絡(luò)學(xué)習(xí)候選實(shí)體間的相關(guān)度,最后??得到每個候選實(shí)體的概率,該方法在AIDA取得了?92.36%的F值。??基于深度學(xué)習(xí)的協(xié)同實(shí)體鏈接方法利用到了候選實(shí)體間的語義關(guān)系等全局??特征,該類方法在測試數(shù)據(jù)集上證明了該方法的有效性,但是深度學(xué)習(xí)協(xié)同實(shí)體??鏈接系列方法計(jì)算復(fù)雜度較高,部分方法中需要借助外部知識庫等資源通過人工??構(gòu)建特征,此外該類模型在運(yùn)行效率方面還有一些提升的空間。??_?_.?yorkshire?/U,_】?Feature?Extraction?Neural?Mode!??…Hussain.?????-'fcCT??,struck?158.???」??his?first?I
?基于深度學(xué)習(xí)的實(shí)體鏈接方法和系統(tǒng)???功能介紹?功能滇示?應(yīng)用場思?技術(shù)特色?產(chǎn)品定價(jià)拒關(guān)推薦??買了個班為??實(shí)體?實(shí)體所屬概念?實(shí)體描述??翅企業(yè)松同?瞞公司??m?文字詞in?中國漢字??勃?lkik&公司?有限公司??圖2.?6百度實(shí)例鏈接服務(wù)"??Figure?2.6?Entity?linking?serv?ice?of?Baidu?12??2.6小結(jié)??本章首先簡單介紹了實(shí)體鏈接的發(fā)展與基本概念,然后介紹了實(shí)體鏈接相關(guān)??流程及其對應(yīng)技術(shù)的國內(nèi)外發(fā)展現(xiàn)狀,同時(shí)本文還對國內(nèi)外知名的實(shí)體鏈接評測??任務(wù)進(jìn)行了調(diào)研與統(tǒng)計(jì),本章還簡要介紹了實(shí)體鏈接過程中的常用技術(shù),包括文??本表示方法與實(shí)體鏈接的常用特征等,最后本章對國內(nèi)外知名的實(shí)體鏈接相關(guān)產(chǎn)??品與平臺進(jìn)行了調(diào)研與介紹,以反映實(shí)體鏈接技術(shù)的發(fā)展現(xiàn)狀。??11?lutps://ai.haidu.com/tech/cognitive/entity_annotation??24??
本文編號:3060824
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3060824.html
最近更新
教材專著