基于多任務(wù)的元學(xué)習(xí)方法在細(xì)粒度實(shí)體分類中的研究
發(fā)布時(shí)間:2021-02-08 01:40
互聯(lián)網(wǎng)發(fā)展至今,每時(shí)每刻都會產(chǎn)生海量的非結(jié)構(gòu)化信息數(shù)據(jù),需要利用信息抽取技術(shù)自動(dòng)地將其轉(zhuǎn)化為結(jié)構(gòu)化知識數(shù)據(jù)存儲并利用。細(xì)粒度實(shí)體分類任務(wù)是信息抽取研究關(guān)鍵性的基礎(chǔ)任務(wù)之一,為知識圖譜、知識庫的構(gòu)建提供了關(guān)鍵性的技術(shù)支撐。細(xì)粒度實(shí)體分類領(lǐng)域高質(zhì)量數(shù)據(jù)資源匱乏,人工標(biāo)注成本高,數(shù)據(jù)成為了模型的瓶頸。如何利用已有資源數(shù)據(jù),獲得更好的模型泛化能力,以及如何在少樣本領(lǐng)域,有效地利用新標(biāo)注的資源,都是亟待解決的問題。本文針對上述挑戰(zhàn),提出了兩種方法,一種是針對整合現(xiàn)有數(shù)據(jù)集的多任務(wù)學(xué)習(xí)方法,另一種則是針對少樣本領(lǐng)域的多任務(wù)元學(xué)習(xí)方法。(1)基于多任務(wù)的細(xì)粒度實(shí)體分類的方法。本文設(shè)計(jì)了基于多任務(wù)學(xué)習(xí)的硬參數(shù)共享機(jī)制,通過整合多個(gè)現(xiàn)有數(shù)據(jù)集和自主創(chuàng)建的數(shù)據(jù)集,得到一個(gè)通用型模型。此模型借助實(shí)體類型的層級信息,構(gòu)建了實(shí)體類型的嵌入式表達(dá);并通過共享特征抽取層,隱式地增加了訓(xùn)練數(shù)據(jù),提高了網(wǎng)絡(luò)的學(xué)習(xí)能力;在任務(wù)層方面,增強(qiáng)了與任務(wù)相關(guān)的信息,使得共享層的輸出能夠更加貼合任務(wù)本身,進(jìn)一步提升模型擬合能力。實(shí)驗(yàn)結(jié)果證明,不論是數(shù)據(jù)集還是多任務(wù)學(xué)習(xí)的方法,對于細(xì)粒度實(shí)體分類任務(wù)都有較強(qiáng)的提升效果,最佳的模型在原...
【文章來源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:85 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景
1.2 研究目的和本文主要工作
1.3 論文組織結(jié)構(gòu)
1.4 本章小結(jié)
第2章 國內(nèi)外研究現(xiàn)狀
2.1 細(xì)粒度實(shí)體分類方法
2.1.1 基于手工特征的傳統(tǒng)細(xì)粒度實(shí)體分類方法
2.1.2 基于深度學(xué)習(xí)的細(xì)粒度實(shí)體分類方法
2.2 元學(xué)習(xí)
2.2.1 基于模型的元學(xué)習(xí)算法
2.2.2 基于優(yōu)化方法的元學(xué)習(xí)算法
2.2.3 基于矩陣度量的元學(xué)習(xí)算法
2.3 多任務(wù)學(xué)習(xí)
2.4 其他技術(shù)
2.4.1 遷移學(xué)習(xí)
2.4.2 小樣本學(xué)習(xí)
2.5 本章小結(jié)
第3章 基于多任務(wù)的細(xì)粒度實(shí)體分類方法
3.1 引言
3.2 多任務(wù)實(shí)體分類模型設(shè)計(jì)
3.2.1 共享層模型設(shè)計(jì)
3.2.2 任務(wù)層模型設(shè)計(jì)
3.2.3 總體模型設(shè)計(jì)
3.3 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
3.3.1 數(shù)據(jù)集介紹
3.3.2 模型參數(shù)
3.3.3 評測指標(biāo)和損失函數(shù)
3.3.4 實(shí)驗(yàn)結(jié)果與分析
3.4 本章小結(jié)
第4章 基于多任務(wù)的元學(xué)習(xí)細(xì)粒度實(shí)體分類方法
4.1 引言
4.2 基于多任務(wù)的元學(xué)習(xí)細(xì)粒度實(shí)體分類模型
4.2.1 實(shí)體分類模型共享層
4.2.2 基于梯度下降的元學(xué)習(xí)算法
4.2.3 基于原型網(wǎng)絡(luò)的元學(xué)習(xí)算法
4.3 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
4.3.1 實(shí)驗(yàn)環(huán)境
4.3.2 數(shù)據(jù)集介紹
4.3.3 模型參數(shù)
4.3.4 評測指標(biāo)
4.3.5 結(jié)果與分析
4.4 本章小結(jié)
第5章 細(xì)粒度實(shí)體分類系統(tǒng)應(yīng)用
5.1 細(xì)粒度實(shí)體分類在知識圖譜構(gòu)建中的應(yīng)用
5.1.1 TAC-KBP2019 子任務(wù)要求
5.1.2 任務(wù)結(jié)果
5.2 細(xì)粒度實(shí)體分類在中國工程科技知識中心建設(shè)項(xiàng)目的應(yīng)用
5.2.1 工程知識中心項(xiàng)目與知識計(jì)算平臺引擎介紹
5.2.2 在知識計(jì)算引擎平臺中的應(yīng)用
5.3 本章小結(jié)
第6章 總結(jié)與展望
6.1 全文總結(jié)
6.2 未來研究方向
參考文獻(xiàn)
攻讀碩士學(xué)位期間主要的研究成果
致謝
本文編號:3023167
【文章來源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:85 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景
1.2 研究目的和本文主要工作
1.3 論文組織結(jié)構(gòu)
1.4 本章小結(jié)
第2章 國內(nèi)外研究現(xiàn)狀
2.1 細(xì)粒度實(shí)體分類方法
2.1.1 基于手工特征的傳統(tǒng)細(xì)粒度實(shí)體分類方法
2.1.2 基于深度學(xué)習(xí)的細(xì)粒度實(shí)體分類方法
2.2 元學(xué)習(xí)
2.2.1 基于模型的元學(xué)習(xí)算法
2.2.2 基于優(yōu)化方法的元學(xué)習(xí)算法
2.2.3 基于矩陣度量的元學(xué)習(xí)算法
2.3 多任務(wù)學(xué)習(xí)
2.4 其他技術(shù)
2.4.1 遷移學(xué)習(xí)
2.4.2 小樣本學(xué)習(xí)
2.5 本章小結(jié)
第3章 基于多任務(wù)的細(xì)粒度實(shí)體分類方法
3.1 引言
3.2 多任務(wù)實(shí)體分類模型設(shè)計(jì)
3.2.1 共享層模型設(shè)計(jì)
3.2.2 任務(wù)層模型設(shè)計(jì)
3.2.3 總體模型設(shè)計(jì)
3.3 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
3.3.1 數(shù)據(jù)集介紹
3.3.2 模型參數(shù)
3.3.3 評測指標(biāo)和損失函數(shù)
3.3.4 實(shí)驗(yàn)結(jié)果與分析
3.4 本章小結(jié)
第4章 基于多任務(wù)的元學(xué)習(xí)細(xì)粒度實(shí)體分類方法
4.1 引言
4.2 基于多任務(wù)的元學(xué)習(xí)細(xì)粒度實(shí)體分類模型
4.2.1 實(shí)體分類模型共享層
4.2.2 基于梯度下降的元學(xué)習(xí)算法
4.2.3 基于原型網(wǎng)絡(luò)的元學(xué)習(xí)算法
4.3 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
4.3.1 實(shí)驗(yàn)環(huán)境
4.3.2 數(shù)據(jù)集介紹
4.3.3 模型參數(shù)
4.3.4 評測指標(biāo)
4.3.5 結(jié)果與分析
4.4 本章小結(jié)
第5章 細(xì)粒度實(shí)體分類系統(tǒng)應(yīng)用
5.1 細(xì)粒度實(shí)體分類在知識圖譜構(gòu)建中的應(yīng)用
5.1.1 TAC-KBP2019 子任務(wù)要求
5.1.2 任務(wù)結(jié)果
5.2 細(xì)粒度實(shí)體分類在中國工程科技知識中心建設(shè)項(xiàng)目的應(yīng)用
5.2.1 工程知識中心項(xiàng)目與知識計(jì)算平臺引擎介紹
5.2.2 在知識計(jì)算引擎平臺中的應(yīng)用
5.3 本章小結(jié)
第6章 總結(jié)與展望
6.1 全文總結(jié)
6.2 未來研究方向
參考文獻(xiàn)
攻讀碩士學(xué)位期間主要的研究成果
致謝
本文編號:3023167
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3023167.html
最近更新
教材專著