天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

低秩稀疏屬性約簡及其在數(shù)據(jù)挖掘中的應(yīng)用

發(fā)布時間:2018-11-12 17:52
【摘要】:數(shù)據(jù)挖掘研究常用高維數(shù)據(jù)描述數(shù)據(jù)的特征。由于各種原因,例如數(shù)據(jù)多樣性等,高維數(shù)據(jù)常含有無關(guān)、冗余屬性。這些無關(guān)、冗余屬性通常增加儲存空間和計算時間,而且易導(dǎo)致維災(zāi)難等問題,最終降低數(shù)據(jù)挖掘的效率。屬性約簡通過降低屬性的維數(shù)從高維數(shù)據(jù)中選出重要屬性,已被顯示除了解決以上問題,還能提高分類器的性能,在數(shù)據(jù)挖掘領(lǐng)域已經(jīng)得到了廣泛的應(yīng)用,F(xiàn)有的屬性約簡方法包括屬性選擇和子空間學(xué)習(xí)兩類。屬性選擇在保證原始結(jié)構(gòu)的前提下選擇相關(guān)屬性子集。子空間學(xué)習(xí)把原始數(shù)據(jù)從高維度空間投影到低維度空間,保持?jǐn)?shù)據(jù)相關(guān)結(jié)構(gòu),同時能去除離群樣本和無關(guān)屬性。總之,屬性選擇比子空間學(xué)習(xí)更具有解釋性,而子空間學(xué)習(xí)比屬性選擇更具穩(wěn)定性。本文融合屬性選擇和子空間學(xué)習(xí)到同一個模型,針對高維數(shù)據(jù)秩由于噪音影響升高等特點,合理考慮低秩表示和稀疏重構(gòu)方法選取代表性的屬性子集,并應(yīng)用于單視圖數(shù)據(jù)和多視圖數(shù)據(jù)的分類研究和回歸預(yù)測等應(yīng)用。論文的主要內(nèi)容和創(chuàng)新點為:(1)基于自表達(dá)方法在分類方面具有良好效果,本文結(jié)合屬性自表達(dá)、低秩稀疏等技術(shù),提出了一種單視圖數(shù)據(jù)的無監(jiān)督屬性約簡模型——自表達(dá)的低秩屬性約簡算法(RS_FS算法)。RS_FS算法利用低秩約束和稀疏學(xué)習(xí),把單視圖無監(jiān)督分類轉(zhuǎn)成監(jiān)督分類問題。具體地,RS_FS算法首先假設(shè)無監(jiān)督數(shù)據(jù)含有潛在的類標(biāo)簽,即通過K-均值聚類方法得到類標(biāo)簽指示向量;然后利用屬性自表達(dá)方法充分考慮不同屬性間的自相似關(guān)系得到屬性自表達(dá)矩陣;并在目標(biāo)函數(shù)中對已得到的重構(gòu)系數(shù)矩陣做稀疏處理。在得到的目標(biāo)函數(shù)中,子空間學(xué)習(xí)方法保持?jǐn)?shù)據(jù)間的全局結(jié)構(gòu)使得在稀疏處理時確保最相關(guān)的若干樣本不被稀疏處理;低秩表示針對重構(gòu)系數(shù)矩陣進(jìn)行低秩約束并按重要性大小選取前r個特征值對應(yīng)的特征向量。通過跟對比算法在公開數(shù)據(jù)集的實驗比較,RS_FS對數(shù)據(jù)分類比對比算法有好的效果。(2)數(shù)據(jù)的多樣性導(dǎo)致多視圖數(shù)據(jù)應(yīng)運而生,論文提出了一種基于低秩稀疏的屬性約簡算法(SLR_FS)。SLR_FS算法首先對每個視圖數(shù)據(jù)進(jìn)行重構(gòu)獲取單視圖重構(gòu)系數(shù)矩陣;然后利用稀疏重構(gòu)技術(shù)對每個視圖重構(gòu)系數(shù)矩陣進(jìn)行稀疏處理,去除相應(yīng)的噪聲樣本和冗余屬性;接著利用低秩表示處理不同視圖之間相關(guān)性并保持不同視圖數(shù)據(jù)間的全局?jǐn)?shù)據(jù)結(jié)構(gòu),并對得到的每個視圖稀疏重構(gòu)系數(shù)矩陣進(jìn)行線性聯(lián)合。最后,結(jié)合子空間算法進(jìn)一步調(diào)整得到的重構(gòu)系數(shù)矩陣。經(jīng)與對比算法進(jìn)行的實驗驗證,SLR_FS算法在各種評價指標(biāo)上均取得了很好的回歸效果。本論文主要針對不同類型的高維數(shù)據(jù)(包括多視圖數(shù)據(jù)和單視圖數(shù)據(jù)),分析并設(shè)計了新穎的屬性約簡算法。具體地,本文以低秩表示理論和稀疏重構(gòu)方法為核心技術(shù),并針對單視圖數(shù)據(jù)和多視圖數(shù)據(jù)的特點及數(shù)據(jù)結(jié)構(gòu),結(jié)合相關(guān)技術(shù),提出代表性的屬性子集。同時,為驗證提出新算法的實效性,論文中所有算法均在同一個實驗環(huán)境進(jìn)行驗證和分析。而且本文結(jié)合分類和回歸作為實驗的檢驗途徑,并對每種途徑選取了三種評價指標(biāo)。在各類實驗結(jié)果和評價指標(biāo)方面,本文論文提出的新算法均優(yōu)于選取的現(xiàn)有算法。在未來的工作中,本人將考慮運用深度學(xué)習(xí)對提出的屬性約簡算法進(jìn)行進(jìn)一步的優(yōu)化。
[Abstract]:......
【學(xué)位授予單位】:廣西師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP311.13

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 黃源,張福炎;數(shù)據(jù)挖掘及其技術(shù)實現(xiàn)[J];計算機(jī)應(yīng)用與軟件;2001年12期

2 香麗蕓;淺談數(shù)據(jù)挖掘及其應(yīng)用[J];昌吉師專學(xué)報;2001年02期

3 鄭雪燕,張杰明,岳洋;數(shù)據(jù)挖掘語言[J];計算機(jī)時代;2001年11期

4 劉明晶;數(shù)據(jù)挖掘[J];華南金融電腦;2001年04期

5 張偉;劉勇國;彭軍;廖曉峰;吳中福;;數(shù)據(jù)挖掘發(fā)展研究[J];計算機(jī)科學(xué);2001年07期

6 鐘曉;馬少平;張鈸;俞瑞釗;;數(shù)據(jù)挖掘綜述[J];模式識別與人工智能;2001年01期

7 朱建平,張潤楚;數(shù)據(jù)挖掘的發(fā)展及其特點[J];統(tǒng)計與決策;2002年07期

8 傅嵐;在數(shù)據(jù)海洋中打撈信息數(shù)據(jù)挖掘[J];科技廣場;2002年11期

9 李峻;數(shù)據(jù)挖掘,企業(yè)洞察先機(jī)的“慧眼”[J];中國計算機(jī)用戶;2002年48期

10 羅可,蔡碧野,卜勝賢,謝中科;數(shù)據(jù)挖掘及其發(fā)展研究[J];計算機(jī)工程與應(yīng)用;2002年14期

相關(guān)會議論文 前10條

1 史東輝;蔡慶生;張春陽;;一種新的數(shù)據(jù)挖掘多策略方法研究[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2000年

2 張弦;;數(shù)據(jù)挖掘在農(nóng)業(yè)中的應(yīng)用[A];紀(jì)念中國農(nóng)業(yè)工程學(xué)會成立30周年暨中國農(nóng)業(yè)工程學(xué)會2009年學(xué)術(shù)年會(CSAE 2009)論文集[C];2009年

3 魏順平;;教育數(shù)據(jù)挖掘:現(xiàn)狀與趨勢[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計算機(jī)模擬與信息技術(shù)學(xué)術(shù)會議論文集[C];2011年

4 關(guān)清平;沉培輝;;概率網(wǎng)絡(luò)在數(shù)據(jù)挖掘上的應(yīng)用[A];科技、工程與經(jīng)濟(jì)社會協(xié)調(diào)發(fā)展——中國科協(xié)第五屆青年學(xué)術(shù)年會論文集[C];2004年

5 丁瑾;;基于Web數(shù)據(jù)挖掘的綜述[A];山西省科學(xué)技術(shù)情報學(xué)會學(xué)術(shù)年會論文集[C];2004年

6 聶茹;田森平;;Web數(shù)據(jù)挖掘及其在電子商務(wù)中的應(yīng)用[A];中南六。▍^(qū))自動化學(xué)會第24屆學(xué)術(shù)年會會議論文集[C];2006年

7 李菊;王軍;;數(shù)據(jù)挖掘在客戶關(guān)系管理的應(yīng)用[A];計算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國第18屆計算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會議論文集[C];2007年

8 肖陽;李啟賢;;數(shù)據(jù)挖掘在中國鋼鐵行業(yè)中的應(yīng)用[A];中國計量協(xié)會冶金分會2012年會暨能源計量與節(jié)能降耗經(jīng)驗交流會論文集[C];2012年

9 楊磊;王貴成;汪勇;張占勝;;SQL Server 2005在數(shù)據(jù)挖掘中的應(yīng)用[A];2009年中國智能自動化會議論文集(第二分冊)[C];2009年

10 謝中;邱玉輝;;面向商務(wù)網(wǎng)站有效性的數(shù)據(jù)挖掘方法[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2001年

相關(guān)重要報紙文章 前10條

1 本報記者褚寧;數(shù)據(jù)挖掘如“挖金”[N];解放日報;2002年

2 周蓉蓉;數(shù)據(jù)挖掘需要點想像力[N];計算機(jī)世界;2004年

3 □中國電信股份有限公司北京研究院 張舒博 □北京郵電大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院 牛琨;走出數(shù)據(jù)挖掘的誤區(qū)[N];人民郵電;2006年

4 《網(wǎng)絡(luò)世界》記者 王瑩;數(shù)據(jù)挖掘保險業(yè)的新藍(lán)海[N];網(wǎng)絡(luò)世界;2012年

5 劉俊麗;基于地理化的網(wǎng)絡(luò)數(shù)據(jù)挖掘與分析提升投資有效性[N];人民郵電;2014年

6 本報記者 連曉東;數(shù)據(jù)挖掘:金融信息化新熱點[N];中國電子報;2002年

7 本報記者 鳳小華 朱仁康;“數(shù)字挖掘軟件”引領(lǐng)中國信息化新浪潮[N];中國電子報;2003年

8 本報記者 史延廷;“成功企業(yè)數(shù)據(jù)挖掘暨數(shù)量化管理論壇”在京舉辦[N];中國旅游報;2002年

9 朱小寧;數(shù)據(jù)挖掘:信息化戰(zhàn)爭的基礎(chǔ)工程[N];解放軍報;2005年

10 本報記者 王小平;從“大集中”走向數(shù)據(jù)挖掘[N];金融時報;2002年

相關(guān)博士學(xué)位論文 前10條

1 于自強;海量流數(shù)據(jù)挖掘相關(guān)問題研究[D];山東大學(xué);2015年

2 張馨;全基因組SNP芯片應(yīng)用于CNV和L0H分析的軟件比對與數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年

3 彭計紅;基于數(shù)據(jù)挖掘的癡呆中醫(yī)證的研究[D];南京中醫(yī)藥大學(xué);2015年

4 李秋虹;基于MapReduce的大規(guī)模數(shù)據(jù)挖掘技術(shù)研究[D];復(fù)旦大學(xué);2013年

5 鄔文帥;基于多目標(biāo)決策的數(shù)據(jù)挖掘方法評估與應(yīng)用[D];電子科技大學(xué);2015年

6 謝邦彥;整合數(shù)據(jù)挖掘與TRIZ理論的質(zhì)量管理方法研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2010年

7 何偉全;云南高校學(xué)生意外傷害因素關(guān)聯(lián)規(guī)則挖掘及風(fēng)險管控體系研究[D];昆明理工大學(xué);2015年

8 段功豪;基于多結(jié)構(gòu)數(shù)據(jù)挖掘的滑坡災(zāi)害預(yù)測模型研究[D];中國地質(zhì)大學(xué);2016年

9 白曉明;基于數(shù)據(jù)挖掘的復(fù)合材料宏—細(xì)觀力學(xué)模型研究[D];哈爾濱工業(yè)大學(xué);2016年

10 藍(lán)永豪(LAM Wing Ho);基于數(shù)據(jù)挖掘技術(shù)分析當(dāng)代中醫(yī)名家痤瘡驗方經(jīng)驗研究[D];南京中醫(yī)藥大學(xué);2016年

相關(guān)碩士學(xué)位論文 前10條

1 林仁紅;基于數(shù)據(jù)挖掘的機(jī)遇識別與評價研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2007年

2 張彥俊;游戲運營中的數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年

3 焦亞召;基于多核函數(shù)FCM算法在數(shù)據(jù)挖掘聚類中的應(yīng)用研究[D];昆明理工大學(xué);2015年

4 王杰鋒;物聯(lián)網(wǎng)能耗數(shù)據(jù)智能分析及其應(yīng)用平臺設(shè)計[D];江南大學(xué);2015年

5 劉學(xué)建;數(shù)據(jù)挖掘在電子商務(wù)推薦系統(tǒng)中的應(yīng)用研究[D];昆明理工大學(xué);2015年

6 戴陽陽;基于數(shù)據(jù)挖掘的金融時間序列預(yù)測研究與應(yīng)用[D];江南大學(xué);2015年

7 石思優(yōu);基于主題模型的醫(yī)療數(shù)據(jù)挖掘研究[D];廣東技術(shù)師范學(xué)院;2015年

8 陳丹;移動互聯(lián)網(wǎng)信令挖掘?qū)崿F(xiàn)智慧營銷的設(shè)計與實現(xiàn)應(yīng)用研究[D];華南理工大學(xué);2015年

9 陳思;基于數(shù)據(jù)挖掘的大學(xué)生客戶識別模型的研究[D];昆明理工大學(xué);2015年

10 位長帥;基于客戶數(shù)據(jù)挖掘的電信客戶關(guān)系管理研究[D];西南交通大學(xué);2015年

,

本文編號:2327787

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2327787.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶90ee8***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com