基于稀疏表示的高維數(shù)據(jù)無監(jiān)督挖掘研究
本文關(guān)鍵詞:基于稀疏表示的高維數(shù)據(jù)無監(jiān)督挖掘研究,由筆耕文化傳播整理發(fā)布。
《北京科技大學(xué)》 2015年
基于稀疏表示的高維數(shù)據(jù)無監(jiān)督挖掘研究
馮小東
【摘要】:數(shù)據(jù)挖掘是協(xié)助管理決策的重要工具之一,隨著數(shù)據(jù)挖掘的應(yīng)用范圍不斷擴(kuò)大,數(shù)據(jù)挖掘所處理的數(shù)據(jù)逐漸呈現(xiàn)出高維和未標(biāo)記的主要特點(diǎn),即高維未標(biāo)記數(shù)據(jù)。對(duì)該類數(shù)據(jù)的挖掘可以稱為高維數(shù)據(jù)無監(jiān)督挖掘,其中缺失數(shù)據(jù)填補(bǔ)、數(shù)據(jù)學(xué)習(xí)建模尤其大規(guī)模在線學(xué)習(xí)建模屬于其中的主要內(nèi)容。 本文針對(duì)高維數(shù)據(jù)無監(jiān)督挖掘的這些問題,研究基于稀疏表示的高維數(shù)據(jù)無監(jiān)督挖掘方法,具體研究包括以下內(nèi)容。 (1)針對(duì)高維數(shù)據(jù)無監(jiān)督挖掘的缺失數(shù)據(jù)填補(bǔ)問題,研究基于局部約束稀疏表示的缺失數(shù)據(jù)無監(jiān)督填補(bǔ)方法。提出局部約束稀疏表示(Locality Constrained Sparse Representation, LCSR)的優(yōu)化目標(biāo),給出優(yōu)化求解方法,其引入距離加權(quán)l(xiāng)1范數(shù)和l2范數(shù)正則化項(xiàng),在自動(dòng)選擇相似數(shù)據(jù)對(duì)象的同時(shí),保留局部結(jié)構(gòu)特征并避免過擬合;提出基于LCSR的高維缺失數(shù)據(jù)無監(jiān)督填補(bǔ)方法,并設(shè)計(jì)了三種字典構(gòu)造方法;利用真實(shí)高維基因和圖像數(shù)據(jù)的實(shí)驗(yàn)驗(yàn)證了該方法的有效性及參數(shù)選擇的低敏感性。 (2)針對(duì)高維數(shù)據(jù)無監(jiān)督挖掘的學(xué)習(xí)建模問題,研究基于近鄰加權(quán)稀疏表示的無監(jiān)督圖學(xué)習(xí)方法。提出近鄰加權(quán)稀疏表示(NEighborhood Weighted Sparse Representation, NESR)的優(yōu)化目標(biāo)及相應(yīng)的高維數(shù)據(jù)無監(jiān)督圖構(gòu)造方法,其利用稀疏約束和近鄰距離加權(quán)能同時(shí)保持高維數(shù)據(jù)的稀疏性和局部結(jié)構(gòu)特征,并能降低傳統(tǒng)的基于稀疏表示方法的時(shí)間復(fù)雜度;將提出的圖構(gòu)造方法融合到譜聚類、子空間學(xué)習(xí)及標(biāo)簽繁殖等高維數(shù)據(jù)挖掘任務(wù);在真實(shí)高維圖像和語音識(shí)別數(shù)據(jù)集上的實(shí)驗(yàn)驗(yàn)證了該算法在效果及計(jì)算效率上的優(yōu)勢(shì)。 (3)針對(duì)大規(guī)模在線高維數(shù)據(jù)無監(jiān)督挖掘的學(xué)習(xí)建模問題,研究基于多重超圖約束稀疏編碼的無監(jiān)督字典學(xué)習(xí)方法。提出多重超圖約束稀疏編碼(Multiple Hypergraph Consistent Sparse Coding, MultiHC_SC)的優(yōu)化目標(biāo)及交替優(yōu)化求解方法,其利用能有效描述高維數(shù)據(jù)多元流形關(guān)系的超圖模型及超圖拉普拉斯正則化約束,擴(kuò)展超圖矩陣對(duì)稀疏求解系數(shù)的一致性約束,增加字典學(xué)習(xí)的無監(jiān)督判別能力,并通過多重集成約束項(xiàng)實(shí)現(xiàn)最優(yōu)超圖的自動(dòng)選擇:通過實(shí)驗(yàn)驗(yàn)證了提出方法]MultiHC_SC同時(shí)在靜態(tài)圖像聚類和在線圖像聚類挖掘任務(wù)上的效果提高。
【關(guān)鍵詞】:
【學(xué)位授予單位】:北京科技大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP311.13
【目錄】:
下載全文 更多同類文獻(xiàn)
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前8條
1 陳建斌,宋翰濤;基于屬性分布相似度的超圖高維聚類算法研究[J];計(jì)算機(jī)工程與應(yīng)用;2004年34期
2 張蓉,彭宏;一種基于超圖模式的高維空間數(shù)據(jù)聚類方法[J];計(jì)算機(jī)工程;2002年07期
3 高媛,陳建斌,陳立潮;一種基于多層概圖的高維聚類算法研究[J];計(jì)算機(jī)應(yīng)用;2004年S1期
4 趙亞琴;周獻(xiàn)中;何新;王建宇;;一種有效的高屬性維稀疏數(shù)據(jù)聚類算法[J];模式識(shí)別與人工智能;2006年03期
5 武森;馮小東;單志廣;;基于不完備數(shù)據(jù)聚類的缺失數(shù)據(jù)填補(bǔ)方法[J];計(jì)算機(jī)學(xué)報(bào);2012年08期
6 李國杰;程學(xué)旗;;大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J];中國科學(xué)院院刊;2012年06期
7 劉星毅;檀大耀;曾春華;韋小鈴;;基于馬氏距離的缺失數(shù)據(jù)填充算法[J];微計(jì)算機(jī)信息;2010年09期
8 沙金;張翠肖;賈玉鋒;胡迎新;;HGHD:一種基于超圖的高維空間數(shù)據(jù)聚類算法[J];微電子學(xué)與計(jì)算機(jī);2006年06期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 呂蓬;;基于變精度粗糙集的齒輪故障診斷[J];華北電力大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年06期
2 趙曉霞;;一種粗糙模糊神經(jīng)網(wǎng)絡(luò)識(shí)別器及其應(yīng)用[J];中北大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年03期
3 齊光雅;杜云艷;曹峰;;基于粗糙集的南海中尺度渦旋時(shí)空關(guān)系抽取研究[J];海洋科學(xué)進(jìn)展;2010年04期
4 武志峰;陳冬霞;;基于粗糙集方法的知識(shí)發(fā)現(xiàn)[J];河北省科學(xué)院學(xué)報(bào);2006年04期
5 張春英;許廣利;劉保相;劉鳳春;;決策規(guī)則的加密通信與數(shù)字簽名方案[J];河北理工學(xué)院學(xué)報(bào);2006年04期
6 王晶;張春英;;關(guān)系學(xué)習(xí)中貝葉斯分類算法的比較研究[J];河北理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年01期
7 曾曉寧;崔勇;藺旭東;;基于粗糙集的視頻片段自動(dòng)分類方法[J];河北科技師范學(xué)院學(xué)報(bào);2009年01期
8 梁偉;肖愛平;錢樺;;粗糙集多傳感器融合理論在大棚噴霧機(jī)器人中的應(yīng)用[J];湖北農(nóng)業(yè)科學(xué);2011年03期
9 張誠一;張玉俊;;粗糙集運(yùn)算的表上作業(yè)方法及其應(yīng)用[J];河北師范大學(xué)學(xué)報(bào);2006年03期
10 高正科;夏新濤;陳龍;;發(fā)動(dòng)機(jī)軸承振動(dòng)的粗集分析[J];哈爾濱軸承;2008年01期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 王印松;馮康;;主汽溫調(diào)節(jié)系統(tǒng)性能評(píng)價(jià)的粗糙集實(shí)現(xiàn)方法[A];第二十七屆中國控制會(huì)議論文集[C];2008年
2 方煒煒;楊炳儒;彭珍;;一種基于粗糙集的啟發(fā)式屬性歸約的新算法[A];第二十七屆中國控制會(huì)議論文集[C];2008年
3 張紅梅;劉文蕊;;基于粗糙集和BP神經(jīng)網(wǎng)絡(luò)的信息產(chǎn)業(yè)上市公司財(cái)務(wù)預(yù)警研究[A];“中國視角的風(fēng)險(xiǎn)分析和危機(jī)反應(yīng)”——中國災(zāi)害防御協(xié)會(huì)風(fēng)險(xiǎn)分析專業(yè)委員會(huì)第四屆年會(huì)論文集[C];2010年
4 張志恒;花擁軍;;基于粗糙集的數(shù)據(jù)挖掘技術(shù)在企業(yè)財(cái)務(wù)危機(jī)預(yù)測(cè)中的應(yīng)用[A];全國第九屆企業(yè)信息化與工業(yè)工程學(xué)術(shù)會(huì)議論文集[C];2005年
5 張紅梅;劉玉芬;;基于粗集和熵值的卷煙消費(fèi)市場(chǎng)潛力評(píng)價(jià)[A];新機(jī)遇·新臺(tái)階·新跨越——數(shù)量經(jīng)濟(jì)學(xué)視野下貴州自我發(fā)展能力回顧與展望:2010年貴州省社會(huì)科學(xué)年會(huì)數(shù)量經(jīng)濟(jì)學(xué)會(huì)論文集[C];2010年
6 高永祥;劉偉華;;基于粗糙集與K-均值聚類的多光譜遙感影象分割[A];江蘇省測(cè)繪學(xué)會(huì)2007年學(xué)術(shù)年會(huì)論文集[C];2008年
7 郭永輝;吳保民;馬芳;王炳錫;;基于粗糙集的自然語言基本名詞短語識(shí)別[A];第一屆建立和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2005)論文集[C];2005年
8 周獻(xiàn)中;李華雄;;基于DTRS的風(fēng)險(xiǎn)偏好決策模型[A];江蘇省系統(tǒng)工程學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];2009年
9 朱梅梅;周獻(xiàn)中;;江蘇省省級(jí)學(xué)會(huì)考核指標(biāo)約簡(jiǎn)報(bào)告[A];江蘇省系統(tǒng)工程學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];2009年
10 張品佳;孫秋野;;基于粗糙集的配電系統(tǒng)故障診斷方法研究[A];2005中國控制與決策學(xué)術(shù)年會(huì)論文集(上)[C];2005年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 徐森;文本聚類集成關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2010年
2 殷志偉;基于統(tǒng)計(jì)學(xué)習(xí)理論的分類方法研究[D];哈爾濱工程大學(xué);2009年
3 李強(qiáng);數(shù)據(jù)挖掘中關(guān)聯(lián)分析算法研究[D];哈爾濱工程大學(xué);2010年
4 任家福;服務(wù)商選擇與備件備品庫存管理研究[D];電子科技大學(xué);2010年
5 張目;高技術(shù)企業(yè)信用風(fēng)險(xiǎn)影響因素及評(píng)價(jià)方法研究[D];電子科技大學(xué);2010年
6 黃光東;基于智能算法的滑坡穩(wěn)定性建模與分析[D];中國地質(zhì)大學(xué)(北京);2011年
7 孟佳娜;遷移學(xué)習(xí)在文本分類中的應(yīng)用研究[D];大連理工大學(xué);2011年
8 雷迎科;流形學(xué)習(xí)算法及其應(yīng)用研究[D];中國科學(xué)技術(shù)大學(xué);2011年
9 郝冀;中國國有企業(yè)競(jìng)爭(zhēng)力研究[D];中共中央黨校;2011年
10 解濱;信息系統(tǒng)中的知識(shí)獲取與不確定性度量的若干問題研究[D];河北師范大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉志強(qiáng);基于數(shù)據(jù)挖掘的客戶行為分析和預(yù)測(cè)研究[D];山東科技大學(xué);2010年
2 楊新忠;基于案例的地理時(shí)空過程表達(dá)模型研究[D];山東科技大學(xué);2010年
3 吳曉婷;基于流形學(xué)習(xí)的數(shù)據(jù)降維算法的研究[D];遼寧師范大學(xué);2010年
4 岳海亮;信息論在粗糙集連續(xù)屬性離散化中的應(yīng)用[D];遼寧師范大學(xué);2010年
5 王曉換;基于粗糙集和神經(jīng)網(wǎng)絡(luò)的故障診斷虛擬系統(tǒng)的研究[D];鄭州大學(xué);2010年
6 楊海陸;公路收費(fèi)系統(tǒng)數(shù)據(jù)分析與挖掘[D];哈爾濱工程大學(xué);2010年
7 周霞;基于粗糙集的電子商務(wù)交易知識(shí)獲取研究[D];哈爾濱工程大學(xué);2010年
8 馮為軍;基于粗糙集理論的數(shù)據(jù)挖掘算法的研究[D];哈爾濱工程大學(xué);2010年
9 王秀鋒;網(wǎng)絡(luò)環(huán)境下異構(gòu)日志信息獲取和預(yù)處理研究[D];哈爾濱工程大學(xué);2010年
10 李慧;基于粗糙集理論的連續(xù)屬性離散化算法研究[D];遼寧師范大學(xué);2010年
【二級(jí)參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前5條
1 張蓉,彭宏;一種基于超圖模式的高維空間數(shù)據(jù)聚類方法[J];計(jì)算機(jī)工程;2002年07期
2 張偉;廖曉峰;吳中福;;一種基于Rough集理論的不完備數(shù)據(jù)分析方法[J];模式識(shí)別與人工智能;2003年02期
3 谷峪;于戈;李曉靜;王義;;基于動(dòng)態(tài)概率路徑事件模型的RFID數(shù)據(jù)填補(bǔ)算法[J];軟件學(xué)報(bào);2010年03期
4 苗奪謙,王玨;粗糙集理論中概念與運(yùn)算的信息表示[J];軟件學(xué)報(bào);1999年02期
5 劉星毅;;GBNN-填充缺失屬性值算法[J];微計(jì)算機(jī)信息;2007年15期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 鄭軼;蔡體健;;稀疏表示的人臉識(shí)別及其優(yōu)化算法[J];華東交通大學(xué)學(xué)報(bào);2012年01期
2 段菲;章毓晉;;一種面向稀疏表示的最大間隔字典學(xué)習(xí)算法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年04期
3 李仲生;李仁發(fā);蔡則蘇;趙乘麟;;稀疏表示下的非監(jiān)督顯著對(duì)象提取[J];電子學(xué)報(bào);2012年06期
4 段菲;章毓晉;;基于多尺度稀疏表示的場(chǎng)景分類[J];計(jì)算機(jī)應(yīng)用研究;2012年10期
5 胡正平;李靜;白洋;;基于樣本-擴(kuò)展差分模板的聯(lián)合雙稀疏表示人臉識(shí)別[J];信號(hào)處理;2012年12期
6 姜芳芳;;稀疏表示理論在提高數(shù)字圖像質(zhì)量中的應(yīng)用[J];科技創(chuàng)新導(dǎo)報(bào);2012年36期
7 馬莉娜;;增強(qiáng)的兩階段測(cè)試樣本稀疏表示方法[J];福建電腦;2013年07期
8 尹學(xué)忠;樊甫華;;基于字典學(xué)習(xí)的超寬帶信號(hào)稀疏表示與降噪方法[J];計(jì)算機(jī)應(yīng)用研究;2014年06期
9 張佳宇;彭力;;基于聯(lián)合動(dòng)態(tài)稀疏表示方法的多圖像人臉識(shí)別算法[J];江南大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年03期
10 陳才扣;喻以明;史俊;;一種快速的基于稀疏表示分類器[J];南京大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年01期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前3條
1 何愛香;劉玉春;魏廣芬;;基于稀疏表示的煤矸界面識(shí)別研究[A];虛擬運(yùn)營與云計(jì)算——第十八屆全國青年通信學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2013年
2 樊亞翔;孫浩;周石琳;鄒煥新;;基于元樣本稀疏表示的多視角目標(biāo)識(shí)別[A];2013年中國智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第五分冊(cè))[C];2013年
3 葛鳳翔;任歲玲;郭鑫;郭良浩;孫波;;微弱信號(hào)處理及其研究進(jìn)展[A];中國聲學(xué)學(xué)會(huì)水聲學(xué)分會(huì)2013年全國水聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2013年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 李小薪;稀疏表示的分段匹配尋蹤方法[D];華南理工大學(xué);2009年
2 何艷敏;稀疏表示在圖像壓縮和去噪中的應(yīng)用研究[D];電子科技大學(xué);2011年
3 宋相法;基于稀疏表示和集成學(xué)習(xí)的若干分類問題研究[D];西安電子科技大學(xué);2013年
4 匡金駿;基于稀疏表示的圖像分類與目標(biāo)跟蹤研究[D];重慶大學(xué);2013年
5 李海山;基于稀疏表示理論的地震信號(hào)處理方法研究[D];中國石油大學(xué)(華東);2013年
6 鄧承志;圖像稀疏表示理論及其應(yīng)用研究[D];華中科技大學(xué);2008年
7 路錦正;基于稀疏表示的圖像超分辨率重構(gòu)技術(shù)研究[D];電子科技大學(xué);2013年
8 尹海濤;面向圖像融合和圖像復(fù)原的稀疏表示研究[D];湖南大學(xué);2012年
9 謝成軍;圖像稀疏表示模型在可視化追蹤中的應(yīng)用研究[D];合肥工業(yè)大學(xué);2014年
10 歐衛(wèi)華;基于稀疏表示和非負(fù)矩陣分解的部分遮擋人臉識(shí)別研究[D];華中科技大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張琨雨;在線字典訓(xùn)練及加權(quán)差異性稀疏表示的研究[D];大連理工大學(xué);2011年
2 王勇;基于稀疏表示的人臉識(shí)別研究[D];五邑大學(xué);2013年
3 李義真;基于詞包與稀疏表示的場(chǎng)景分類[D];華南理工大學(xué);2013年
4 孫麗花;基于稀疏表示的人臉識(shí)別方法研究[D];河南科技大學(xué);2013年
5 陳天嬌;基于分組稀疏和權(quán)重稀疏表示的人臉識(shí)別研究[D];安徽大學(xué);2014年
6 劉自成;基于稀疏表示的雷達(dá)目標(biāo)角度與距離估計(jì)[D];西安電子科技大學(xué);2014年
7 李立;基于稀疏表示的人臉圖像識(shí)別方法研究[D];南京理工大學(xué);2012年
8 滿江月;基于稀疏表示的代價(jià)敏感性人臉識(shí)別算法研究[D];南京郵電大學(xué);2012年
9 趙廣鑾;稀疏表示在圖像識(shí)別中的應(yīng)用[D];北京郵電大學(xué);2013年
10 羅燕龍;基于局部稀疏表示模型的在線字典學(xué)習(xí)跟蹤算法研究[D];廈門大學(xué);2014年
本文關(guān)鍵詞:基于稀疏表示的高維數(shù)據(jù)無監(jiān)督挖掘研究,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):217310
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/217310.html