弱標記數(shù)據(jù)不確定性度量及特征選擇研究
發(fā)布時間:2021-04-15 21:09
處理多標記數(shù)據(jù)是機器學(xué)習(xí)和數(shù)據(jù)挖掘當中一個非常重要的任務(wù),它已經(jīng)引起了諸多學(xué)者的廣泛研究。然而,在實際應(yīng)用領(lǐng)域中,例如圖像識別、文本分類等場景下,想要獲得數(shù)據(jù)的完整標記來進行學(xué)習(xí)和訓(xùn)練通常是一件非常困難并且代價十分昂貴的事情。我們獲得的往往是部分標記的數(shù)據(jù)或者帶有缺失標記的多標記數(shù)據(jù),即弱標記數(shù)據(jù)。到目前為止,關(guān)于弱標記數(shù)據(jù)中不確定性度量問題的研究并不多。實際上,不確定性度量有助于我們發(fā)現(xiàn)蘊含在弱標記數(shù)據(jù)當中的潛在特征和更加實質(zhì)性的內(nèi)容。信息熵早已被用于評估和描述數(shù)據(jù)的不確定性,但是,它們往往針對的是單標記數(shù)據(jù),并不適用于多標記數(shù)據(jù),尤其是弱標記數(shù)據(jù)。因此,本文提出一種新形式的類似條件熵的度量來描述弱標記數(shù)據(jù)的不確定性,以期進一步挖掘弱標記數(shù)據(jù)的價值,助力弱標記數(shù)據(jù)的特征選擇等任務(wù)及應(yīng)用。本文緊密圍繞弱標記數(shù)據(jù)的不確定性度量和特征選擇展開研究,主要研究工作及貢獻如下:(1)本文提出了一種單調(diào)相容條件熵的形式來描述和度量弱標記數(shù)據(jù)的不確定性。這一新形式的不確定性度量主要是借助模糊粗糙集當中的相似類及相容類的概念分別處理特征空間和不完備的標記空間,結(jié)合條件熵完成新的定義使其更加適應(yīng)弱標記數(shù)...
【文章來源】:天津大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 多標記學(xué)習(xí)與特征選擇
1.2.2 粗糙集與不確定性度量
1.3 研究內(nèi)容與論文結(jié)構(gòu)
1.3.1 研究內(nèi)容
1.3.2 論文結(jié)構(gòu)
第2章 相關(guān)工作概述及基礎(chǔ)知識
2.1 相關(guān)工作
2.1.1 擴充的Pawlak近似精度度量
2.1.2 不完備決策系統(tǒng)中的不確定性度量
2.1.3 基于信息理論的多標記數(shù)據(jù)特征選擇
2.2 基礎(chǔ)知識
2.2.1 單標記決策表和弱標記系統(tǒng)
2.2.2 模糊相似關(guān)系和相容關(guān)系
2.2.3 信息熵理論
2.3 本章小結(jié)
第3章 弱標記數(shù)據(jù)的不確定性度量
3.1 引言
3.2 單調(diào)的相容條件熵
3.3 性質(zhì)及理論證明
3.4 實驗與分析
3.4.1 數(shù)據(jù)描述
3.4.2 結(jié)果與分析
3.5 本章小結(jié)
第4章 弱標記數(shù)據(jù)的特征選擇算法
4.1 引言
4.2 約簡和特征選擇算法
4.3 實驗及分析
4.3.1 數(shù)據(jù)描述
4.3.2 評價指標
4.3.3 對比算法
4.3.4 結(jié)果與分析
4.4 本章小結(jié)
第5章 結(jié)語
5.1 總結(jié)
5.2 展望
參考文獻
發(fā)表論文和參加科研情況說明
致謝
【參考文獻】:
期刊論文
[1]基于邊界域和知識粒度的粗糙集不確定性度量[J]. 黃國順,文翰. 控制與決策. 2016(06)
[2]基于決策粗糙集的多標記情緒分類[J]. 張志飛,苗奪謙,張紅云. 模式識別與人工智能. 2015(08)
本文編號:3140087
【文章來源】:天津大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 多標記學(xué)習(xí)與特征選擇
1.2.2 粗糙集與不確定性度量
1.3 研究內(nèi)容與論文結(jié)構(gòu)
1.3.1 研究內(nèi)容
1.3.2 論文結(jié)構(gòu)
第2章 相關(guān)工作概述及基礎(chǔ)知識
2.1 相關(guān)工作
2.1.1 擴充的Pawlak近似精度度量
2.1.2 不完備決策系統(tǒng)中的不確定性度量
2.1.3 基于信息理論的多標記數(shù)據(jù)特征選擇
2.2 基礎(chǔ)知識
2.2.1 單標記決策表和弱標記系統(tǒng)
2.2.2 模糊相似關(guān)系和相容關(guān)系
2.2.3 信息熵理論
2.3 本章小結(jié)
第3章 弱標記數(shù)據(jù)的不確定性度量
3.1 引言
3.2 單調(diào)的相容條件熵
3.3 性質(zhì)及理論證明
3.4 實驗與分析
3.4.1 數(shù)據(jù)描述
3.4.2 結(jié)果與分析
3.5 本章小結(jié)
第4章 弱標記數(shù)據(jù)的特征選擇算法
4.1 引言
4.2 約簡和特征選擇算法
4.3 實驗及分析
4.3.1 數(shù)據(jù)描述
4.3.2 評價指標
4.3.3 對比算法
4.3.4 結(jié)果與分析
4.4 本章小結(jié)
第5章 結(jié)語
5.1 總結(jié)
5.2 展望
參考文獻
發(fā)表論文和參加科研情況說明
致謝
【參考文獻】:
期刊論文
[1]基于邊界域和知識粒度的粗糙集不確定性度量[J]. 黃國順,文翰. 控制與決策. 2016(06)
[2]基于決策粗糙集的多標記情緒分類[J]. 張志飛,苗奪謙,張紅云. 模式識別與人工智能. 2015(08)
本文編號:3140087
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3140087.html
最近更新
教材專著