分布式半監(jiān)督學習算法研究
發(fā)布時間:2021-04-07 08:52
在大數(shù)據(jù)時代,隨著計算機技術的發(fā)展以及硬件水平的提高,獲取數(shù)據(jù)的途徑和存儲數(shù)據(jù)的硬件也變得越來越多,這使得我們經常要面臨數(shù)據(jù)由不同節(jié)點(站點)分布式地收集和存儲的情況。在此場景下,分布式信息處理應運而生。在分布式處理中,各節(jié)點能利用本地數(shù)據(jù)進行局部計算,同時又能與鄰居節(jié)點進行少量的信息交互。通過這樣的方式,各節(jié)點能在不直接傳遞原始數(shù)據(jù)的情況下,獲取了全局的信息,從而實現(xiàn)了完全去中心化而又具有全局意義的信息處理。在機器學習領域,近年來大量的分布式機器學習算法被相繼提出。然而,已有的算法大多采用有監(jiān)督的學習方式,它們通常需要足夠多的有標簽樣本以保證學習的性能。然而,在許多實際應用中,獲取大量高質量的有標簽數(shù)據(jù)需要耗費大量的人力物力,因而收集來的數(shù)據(jù)常常是無標簽的或是弱標簽的。此外,由于物理或人為的原因,收集來的數(shù)據(jù)常常存在屬性缺失。針對這些情況,本論文系統(tǒng)地開展了分布式場景下的半監(jiān)督學習研究,以期深度挖掘無標簽樣本信息,提高分布式學習的性能。本論文主要聚焦于網絡化系統(tǒng)中的流數(shù)據(jù)、多標簽數(shù)據(jù)、樣本屬性缺失以及帶有偏標簽數(shù)據(jù)四種情況開展了系統(tǒng)的研究。我們克服了分布式實現(xiàn)的難點,并提出了相應的分...
【文章來源】:浙江大學浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:134 頁
【學位級別】:博士
【文章目錄】:
致謝
摘要
Abstract
1 緒論
1.1 分布式信息處理
1.2 半監(jiān)督學習
1.3 本文研究內容和結構安排
2 分布式在線半監(jiān)督學習
2.1 引言
2.2 預備知識
2.3 面向水平劃分的分布式在線半監(jiān)督支持向量機
2.4 面向垂直劃分的分布式在線半監(jiān)督支持向量機
2.5 仿真實驗
2.6 本章小結
3 分布式半監(jiān)督督多標簽學習
3.1 引言
3.2 問題描述
3.3 基于信息論的分布式半監(jiān)督督多標簽學習算法
3.4 性能分析
3.5 仿真實驗
3.6 本章小結
4 帶缺失失數(shù)據(jù)的分布式半監(jiān)督學習
4.1 引言
4.2 問題描述
4.3 基于子空間學習的分布式半監(jiān)督缺失失數(shù)據(jù)分類算法
4.4 性能分析
4.5 仿真實驗
4.6 本章小結
5 分布式半監(jiān)督偏標簽學習
5.1 引言
5.2 問題描述
5.3 基于平均消歧的分布式半監(jiān)督偏標簽學習算法
5.4 性能分析
5.5 仿真實驗
5.6 本章小結
6 總結與展望
參考文獻
攻讀博士學位期間的研究成果
【參考文獻】:
期刊論文
[1]基于自訓練EM算法的半監(jiān)督文本分類[J]. 張博鋒,白冰,蘇金樹. 國防科技大學學報. 2007(06)
博士論文
[1]分布式信息論學習[D]. 沈鵬程.浙江大學 2016
碩士論文
[1]分布式異常檢測算法[D]. 苗雪丹.浙江大學 2018
[2]傳感器網絡中的分布式向量量化[D]. 羅奕梁.浙江大學 2015
本文編號:3123187
【文章來源】:浙江大學浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:134 頁
【學位級別】:博士
【文章目錄】:
致謝
摘要
Abstract
1 緒論
1.1 分布式信息處理
1.2 半監(jiān)督學習
1.3 本文研究內容和結構安排
2 分布式在線半監(jiān)督學習
2.1 引言
2.2 預備知識
2.3 面向水平劃分的分布式在線半監(jiān)督支持向量機
2.4 面向垂直劃分的分布式在線半監(jiān)督支持向量機
2.5 仿真實驗
2.6 本章小結
3 分布式半監(jiān)督督多標簽學習
3.1 引言
3.2 問題描述
3.3 基于信息論的分布式半監(jiān)督督多標簽學習算法
3.4 性能分析
3.5 仿真實驗
3.6 本章小結
4 帶缺失失數(shù)據(jù)的分布式半監(jiān)督學習
4.1 引言
4.2 問題描述
4.3 基于子空間學習的分布式半監(jiān)督缺失失數(shù)據(jù)分類算法
4.4 性能分析
4.5 仿真實驗
4.6 本章小結
5 分布式半監(jiān)督偏標簽學習
5.1 引言
5.2 問題描述
5.3 基于平均消歧的分布式半監(jiān)督偏標簽學習算法
5.4 性能分析
5.5 仿真實驗
5.6 本章小結
6 總結與展望
參考文獻
攻讀博士學位期間的研究成果
【參考文獻】:
期刊論文
[1]基于自訓練EM算法的半監(jiān)督文本分類[J]. 張博鋒,白冰,蘇金樹. 國防科技大學學報. 2007(06)
博士論文
[1]分布式信息論學習[D]. 沈鵬程.浙江大學 2016
碩士論文
[1]分布式異常檢測算法[D]. 苗雪丹.浙江大學 2018
[2]傳感器網絡中的分布式向量量化[D]. 羅奕梁.浙江大學 2015
本文編號:3123187
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3123187.html
最近更新
教材專著