基于Huber損失的非負(fù)矩陣分解算法在聚類中的研究
發(fā)布時(shí)間:2022-07-27 13:56
非負(fù)矩陣分解是一種經(jīng)典的數(shù)據(jù)分析工具被廣泛應(yīng)用于聚類任務(wù)中。它在保證對(duì)原始矩陣的良好近似前提下,為原始數(shù)據(jù)找到非負(fù)的、線性的矩陣表示。由于這種方法提取的特征都是非負(fù)的,符合現(xiàn)實(shí)數(shù)據(jù)的本質(zhì)特征,因此被用于處理圖像數(shù)據(jù)、光譜數(shù)據(jù)、基因表達(dá)數(shù)據(jù)。除了應(yīng)用領(lǐng)域,非負(fù)矩陣分解在科研領(lǐng)域也受到了大量的關(guān)注,如今已有眾多研究成果出現(xiàn)在視野中。在現(xiàn)有的研究方法和理論基礎(chǔ)上,本文進(jìn)一步分析算法的優(yōu)點(diǎn)和不足之處,進(jìn)行了相應(yīng)的改進(jìn)。論文的主要工作如下:(1)傳統(tǒng)的非負(fù)矩陣分解算法使用均方誤差函數(shù)來(lái)度量重建誤差,在處理含有較大噪聲的數(shù)據(jù)時(shí)模型的擬合效果很容易受到影響。Huber損失函數(shù)對(duì)較小的殘差執(zhí)行的懲罰與均方誤差損失函數(shù)相同,對(duì)較大的殘差執(zhí)行的懲罰是線性增長(zhǎng)的,因此與均方誤差損失函數(shù)相比,Huber損失函數(shù)具有更強(qiáng)的魯棒性;已有研究證明2,1范數(shù)稀疏正則項(xiàng)在機(jī)器學(xué)習(xí)的分類和聚類模型中具有特征選擇作用。結(jié)合二者優(yōu)點(diǎn)本文提出了一種基于Huber損失函數(shù)且融入2,1范數(shù)正則項(xiàng)的非負(fù)矩陣分解算法,并給出了基于投影梯度更新規(guī)則的優(yōu)化過(guò)程,在多組數(shù)據(jù)集上將所提算法與多種聚類...
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 主要研究?jī)?nèi)容
1.4 本文組織結(jié)構(gòu)
第二章 論文研究的整體思路與相關(guān)知識(shí)
2.1 論文研究的整體思路
2.2 相關(guān)知識(shí)
2.2.1 非負(fù)矩陣分解定義及性質(zhì)
2.2.2 投影梯度法
第三章 一種基于Huber損失的非負(fù)矩陣分解算法
3.1 模型建立
3.2 模型求解
3.2.1 計(jì)算W
3.2.2 計(jì)算H
3.2.3 迭代終止條件
3.3 時(shí)間復(fù)雜度分析
3.4 實(shí)驗(yàn)
3.4.1 評(píng)價(jià)指標(biāo)
3.4.2 對(duì)比算法
3.4.3 合成數(shù)據(jù)集的聚類結(jié)果
3.4.4 真實(shí)數(shù)據(jù)集的聚類結(jié)果
3.4.5 參數(shù)的選擇
3.5 本章小結(jié)
第四章 基于Huber損失的自表達(dá)非負(fù)矩陣分解算法
4.1 模型建立
4.2 模型求解
4.2.1 計(jì)算W
4.2.2 計(jì)算H
4.2.3 迭代終止條件
4.3 時(shí)間復(fù)雜度分析
4.4 實(shí)驗(yàn)
4.4.1 評(píng)價(jià)指標(biāo)
4.4.2 對(duì)比算法
4.4.3 合成數(shù)據(jù)集的聚類結(jié)果
4.4.4 真實(shí)數(shù)據(jù)集的聚類結(jié)果
4.4.5 參數(shù)的選擇
4.5 本章小結(jié)
第五章 總結(jié)
參考文獻(xiàn)
攻讀學(xué)位期間取得的研究成果
致謝
個(gè)人簡(jiǎn)況及聯(lián)系方式
【參考文獻(xiàn)】:
期刊論文
[1]稀疏約束圖正則非負(fù)矩陣分解[J]. 姜偉,李宏,余震國(guó),楊炳儒. 計(jì)算機(jī)科學(xué). 2013(01)
本文編號(hào):3665577
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 主要研究?jī)?nèi)容
1.4 本文組織結(jié)構(gòu)
第二章 論文研究的整體思路與相關(guān)知識(shí)
2.1 論文研究的整體思路
2.2 相關(guān)知識(shí)
2.2.1 非負(fù)矩陣分解定義及性質(zhì)
2.2.2 投影梯度法
第三章 一種基于Huber損失的非負(fù)矩陣分解算法
3.1 模型建立
3.2 模型求解
3.2.1 計(jì)算W
3.2.2 計(jì)算H
3.2.3 迭代終止條件
3.3 時(shí)間復(fù)雜度分析
3.4 實(shí)驗(yàn)
3.4.1 評(píng)價(jià)指標(biāo)
3.4.2 對(duì)比算法
3.4.3 合成數(shù)據(jù)集的聚類結(jié)果
3.4.4 真實(shí)數(shù)據(jù)集的聚類結(jié)果
3.4.5 參數(shù)的選擇
3.5 本章小結(jié)
第四章 基于Huber損失的自表達(dá)非負(fù)矩陣分解算法
4.1 模型建立
4.2 模型求解
4.2.1 計(jì)算W
4.2.2 計(jì)算H
4.2.3 迭代終止條件
4.3 時(shí)間復(fù)雜度分析
4.4 實(shí)驗(yàn)
4.4.1 評(píng)價(jià)指標(biāo)
4.4.2 對(duì)比算法
4.4.3 合成數(shù)據(jù)集的聚類結(jié)果
4.4.4 真實(shí)數(shù)據(jù)集的聚類結(jié)果
4.4.5 參數(shù)的選擇
4.5 本章小結(jié)
第五章 總結(jié)
參考文獻(xiàn)
攻讀學(xué)位期間取得的研究成果
致謝
個(gè)人簡(jiǎn)況及聯(lián)系方式
【參考文獻(xiàn)】:
期刊論文
[1]稀疏約束圖正則非負(fù)矩陣分解[J]. 姜偉,李宏,余震國(guó),楊炳儒. 計(jì)算機(jī)科學(xué). 2013(01)
本文編號(hào):3665577
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3665577.html
最近更新
教材專著