基于關系映射的遷移模型研究及應用
發(fā)布時間:2022-08-13 15:16
隨著機器學習的不斷發(fā)展,遷移學習也受到越來越多的研究者的關注。遷移學習之所以受到重視是因為在提高算法的自適應能力,解決領域數(shù)據(jù)不足的問題,減少算法的訓練時間等方面都可以發(fā)揮重要的作用。遷移學習在解決原始問題時引入源領域,借助源領域的知識來幫助解決目標領域的問題,這個目標領域就是原始問題對應的領域。遷移學習的源領域和目標領域可以是同構(gòu)的,也就是源領域與目標領域的數(shù)據(jù)分布、特征空間和輸出空間都相同,反之,如果不是都相同,則被認為是異構(gòu)的。這意味著異構(gòu)遷移學習打破了傳統(tǒng)機器學習的獨立同分布假設,因此學習起來將更為困難。本文研究的是異構(gòu)領域的遷移模型,我們利用關系映射的思想進行遷移,其本質(zhì)是構(gòu)造源領域與目標領域之間的關系,然后借助這種關系進行遷移。我們將關系映射的遷移學習思想與兩種不同的機器學習方法相結(jié)合,得到了基于謂詞映射的馬爾科夫邏輯網(wǎng)絡遷移模型和基于雙向關系映射的遷移強化學習模型,分別解決了領域數(shù)據(jù)不足和算法訓練時間過長的問題。馬爾科夫邏輯網(wǎng)絡是一種依靠邏輯關系進行推理的機器學習模型,我們利用源領域和目標領域一階邏輯公式之間的關系,使用謂詞映射構(gòu)造目標領域的一階邏輯公式,并利用規(guī)則篩選、...
【文章頁數(shù)】:77 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究背景和意義
1.1.1 課題研究背景
1.1.2 課題研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 遷移學習研究現(xiàn)狀
1.2.2 馬爾科夫邏輯網(wǎng)絡的遷移研究
1.2.3 強化學習的遷移研究
1.3 主要研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 本文相關技術
2.1 馬爾科夫邏輯網(wǎng)絡的遷移
2.1.1 馬爾科夫邏輯網(wǎng)絡
2.1.2 謂詞映射
2.1.3 單實體為中心的實例
2.2 強化學習的遷移
2.1.1 Keepaway測試平臺
2.1.2 強化學習
2.1.3 Tile編碼
2.3 本章小結(jié)
第3章 基于謂詞映射的MLN遷移模型
3.1 研究問題描述
3.2 基于謂詞映射的遷移算法設計
3.2.1 邏輯公式的謂詞映射
3.2.2 邏輯公式的數(shù)據(jù)驗證
3.2.3 邏輯公式的規(guī)則篩選
3.2.4 MLN模型的謂詞覆蓋
3.3 評估方法和數(shù)據(jù)
3.4 實驗結(jié)果及分析
3.4.1 實驗結(jié)果
3.4.2 實驗分析
3.5 輿情數(shù)據(jù)實驗
3.5.1 特征和數(shù)據(jù)的謂詞化
3.5.2 源領域MLN模型的建立
3.5.3 遷移效果評估
3.6 本章小結(jié)
第4章 基于雙向關系映射的TRL模型
4.1 研究問題描述
4.2 基于雙向關系映射的遷移算法
4.2.1 雙向關系映射遷移框架的描述
4.2.2 Keepaway問題建模
4.2.3 基于遷移框架的遷移算法設計
4.3 實驗過程及分析
4.3.1 源領域的訓練周期
4.3.2 DMap-Multi的指導周期
4.3.3 DMap-Best的指導周期
4.4 實驗結(jié)果對比
4.5 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其它成果
致謝
本文編號:3677274
【文章頁數(shù)】:77 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究背景和意義
1.1.1 課題研究背景
1.1.2 課題研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 遷移學習研究現(xiàn)狀
1.2.2 馬爾科夫邏輯網(wǎng)絡的遷移研究
1.2.3 強化學習的遷移研究
1.3 主要研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 本文相關技術
2.1 馬爾科夫邏輯網(wǎng)絡的遷移
2.1.1 馬爾科夫邏輯網(wǎng)絡
2.1.2 謂詞映射
2.1.3 單實體為中心的實例
2.2 強化學習的遷移
2.1.1 Keepaway測試平臺
2.1.2 強化學習
2.1.3 Tile編碼
2.3 本章小結(jié)
第3章 基于謂詞映射的MLN遷移模型
3.1 研究問題描述
3.2 基于謂詞映射的遷移算法設計
3.2.1 邏輯公式的謂詞映射
3.2.2 邏輯公式的數(shù)據(jù)驗證
3.2.3 邏輯公式的規(guī)則篩選
3.2.4 MLN模型的謂詞覆蓋
3.3 評估方法和數(shù)據(jù)
3.4 實驗結(jié)果及分析
3.4.1 實驗結(jié)果
3.4.2 實驗分析
3.5 輿情數(shù)據(jù)實驗
3.5.1 特征和數(shù)據(jù)的謂詞化
3.5.2 源領域MLN模型的建立
3.5.3 遷移效果評估
3.6 本章小結(jié)
第4章 基于雙向關系映射的TRL模型
4.1 研究問題描述
4.2 基于雙向關系映射的遷移算法
4.2.1 雙向關系映射遷移框架的描述
4.2.2 Keepaway問題建模
4.2.3 基于遷移框架的遷移算法設計
4.3 實驗過程及分析
4.3.1 源領域的訓練周期
4.3.2 DMap-Multi的指導周期
4.3.3 DMap-Best的指導周期
4.4 實驗結(jié)果對比
4.5 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其它成果
致謝
本文編號:3677274
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3677274.html
最近更新
教材專著