天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

融合結(jié)構(gòu)信息的小樣本關(guān)系抽取技術(shù)研究

發(fā)布時(shí)間:2021-08-11 16:23
  互聯(lián)網(wǎng)上存在著大量具有重要價(jià)值的非結(jié)構(gòu)化文本數(shù)據(jù),需要使用信息抽取技術(shù)將其轉(zhuǎn)換為結(jié)構(gòu)化知識(shí)。關(guān)系抽取是信息抽取技術(shù)的基礎(chǔ)任務(wù)之一。關(guān)系抽取任務(wù)旨在將非結(jié)構(gòu)化的自然語(yǔ)言文本轉(zhuǎn)化為結(jié)構(gòu)化的三元組,以便于人們使用計(jì)算機(jī)進(jìn)行高效地處理、存儲(chǔ)和檢索;谟斜O(jiān)督學(xué)習(xí)的關(guān)系抽取方法要求具有足夠多且完全標(biāo)注的訓(xùn)練數(shù)據(jù),但現(xiàn)實(shí)中往往缺乏大量人工標(biāo)注數(shù)據(jù)。盡管遠(yuǎn)程監(jiān)督模型可以通過(guò)對(duì)齊知識(shí)庫(kù)獲取大量數(shù)據(jù),其依然無(wú)法從本質(zhì)上解決樣本分布的長(zhǎng)尾問(wèn)題。針對(duì)上述挑戰(zhàn),本文在小樣本場(chǎng)景的設(shè)定下,從兩個(gè)角度分別提出了兩種方法進(jìn)行研究:(1)融合結(jié)構(gòu)信息的小樣本關(guān)系抽取方法。為了解決真實(shí)場(chǎng)景中樣本分布的長(zhǎng)尾問(wèn)題,針對(duì)小樣本場(chǎng)景的特點(diǎn),此模型使用一種非參數(shù)估計(jì)方法。該非參數(shù)估計(jì)方法認(rèn)為每個(gè)類(lèi)都存在一個(gè)類(lèi)原型,并通過(guò)預(yù)先定義的度量函數(shù)來(lái)計(jì)算查詢(xún)樣本與類(lèi)原型之間的相似度。由于通用的特征提取方式往往會(huì)忽略句子的結(jié)構(gòu)信息,此模型對(duì)句子的依存關(guān)系樹(shù)進(jìn)行建模,利用圖卷積網(wǎng)絡(luò)從依存關(guān)系樹(shù)中提取結(jié)構(gòu)信息,并將該結(jié)構(gòu)信息融合到小樣本關(guān)系抽取模型中。(2)基于動(dòng)態(tài)度量的小樣本關(guān)系抽取方法。由于非參數(shù)估計(jì)方法中的度量函數(shù)是人為規(guī)定的,該方法并不... 

【文章來(lái)源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:81 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

融合結(jié)構(gòu)信息的小樣本關(guān)系抽取技術(shù)研究


圖2.1關(guān)系抽取的前導(dǎo)任務(wù)??

框架圖,小節(jié),框架,方法


__殖:辨位論文?第2#國(guó)內(nèi)外研究現(xiàn)犾??程監(jiān)督方法則通過(guò)自動(dòng)對(duì)齊知識(shí)庫(kù)獲取大暈有標(biāo)簽訓(xùn)練數(shù)據(jù);??(2)單詞的向:量表示:對(duì)有標(biāo)餐句子進(jìn)行分詞處理,并將每個(gè)單詞映射成一個(gè)??詞向量>?有時(shí)會(huì)考慮單詞與句子中實(shí)體對(duì)之間的相對(duì)距離,也就是說(shuō),將??相對(duì)距離作為一種位置向量,并與詞向量組合到一起,形成單詞最終的向??量表.示;??(3)特征提取:將一個(gè)旬子中:所有單詞的向暈表示組.合到一起,餐.到句_子的向??_表示,接著輸入到神經(jīng)網(wǎng)絡(luò)中,利用神經(jīng)網(wǎng)絡(luò)模型提取句子特征,最終??訓(xùn)練得到一個(gè)特征提取器;??(4)關(guān)系分類(lèi):根據(jù)預(yù)先定義好的封閉關(guān)系集合,將提取的句子特征向量作為??非線(xiàn)性層的輸入,進(jìn)行關(guān)系分類(lèi),抽取實(shí)體對(duì)之間的關(guān)系類(lèi)別;??(5)性能評(píng)估:最后,利用相關(guān)評(píng)測(cè)指標(biāo)對(duì)模型性能進(jìn)行評(píng)估。??基?步纖5:性能評(píng)估??于??^?步驟4:關(guān)系分類(lèi)??學(xué)??步驟3:特征提取??系??#?步驟2.:?jiǎn)卧~的向慧讓示??取??框??*?步驟:h有標(biāo)簽數(shù)據(jù)??圖2.2?_于深_度學(xué)洶的關(guān)系抽取框架??接下來(lái),本小節(jié)將依次介紹近年來(lái)基于深度學(xué)習(xí)的關(guān)系抽取方法,包括基于??卷積神經(jīng)網(wǎng)絡(luò)的方法、基于循環(huán)神經(jīng)網(wǎng)絡(luò)的方法和其他方法。??2.2.1基于卷積神經(jīng)網(wǎng)絡(luò)的方法??對(duì)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional?Neural?Network,CNN)的研究始于20世紀(jì)??8??

融合結(jié)構(gòu)信息的小樣本關(guān)系抽取技術(shù)研究


圖2.3_循環(huán)神■網(wǎng)'絡(luò)示纛國(guó)_??


本文編號(hào):3336491

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3336491.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)1e3b5***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com