超高維數(shù)據(jù)降維與Logistic廣義線性擬合分析
本文關(guān)鍵詞: 高維數(shù)據(jù) Logistic回歸 廣義線性模型 降維 TCS算法 出處:《統(tǒng)計(jì)與決策》2016年07期 論文類型:期刊論文
【摘要】:文章以美國威斯康星州的乳腺癌調(diào)查數(shù)據(jù)為例,分別采用SIS和TCS算法對高維數(shù)據(jù)進(jìn)行降維處理,嘗試將改進(jìn)的Logistic廣義線性模型對降維后的變量進(jìn)行擬合。再與傳統(tǒng)的一般線性模型、Logistic廣義線性模型相比,結(jié)果表明,基于算法降維后的Logistic廣義線性模型預(yù)測誤差更小,其中基于TCS算法降維后的廣義線性模型在擬合中要明顯優(yōu)于SIS算法降維后的廣義線性模型。
[Abstract]:Taking the breast cancer survey data of Wisconsin as an example, this paper uses SIS and TCS algorithms to reduce the dimension of high-dimensional data. The improved Logistic generalized linear model is used to fit the dimensionally reduced variables, and compared with the traditional general linear model and Logistic generalized linear model, the results show that. The prediction error of Logistic generalized linear model based on reduced dimension algorithm is smaller. The generalized linear model after dimension reduction based on TCS algorithm is obviously superior to the generalized linear model after dimension reduction by SIS algorithm in fitting.
【作者單位】: 南京信息工程大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院;
【基金】:國家社會科學(xué)基金資助項(xiàng)目(15BTJ019) 公益性行業(yè)科研專項(xiàng)(GYHY201506051) 教育部哲學(xué)社會科學(xué)發(fā)展報(bào)告項(xiàng)目(13JBG004) 氣候變化與公共政策研究院開放課題(14QHA020)
【分類號】:F224
【正文快照】: 0引言 降維是處理高維數(shù)據(jù)最有效的方法,總體可分為兩大類:線性降維和非線性降維。線性降維方法包括PCA、PP、LDA、MDS、ICA、LUP等;非線性降維技術(shù)有LLE、Is0map以及Laplacian Eigenmap等IM,此外DCT變換(離散余弦變換)121是主要用于圖像壓縮的一種數(shù)據(jù)降維方法。Fan和Lv(2
【相似文獻(xiàn)】
相關(guān)期刊論文 前5條
1 吳武清;汪成杰;蔣勇;陳敏;;高維數(shù)據(jù)選元:方法比較及其在納稅評估中的應(yīng)用[J];管理評論;2013年08期
2 郝媛;高學(xué)東;孟海東;;高維數(shù)據(jù)對象聚類算法效果分析[J];中國管理信息化;2012年08期
3 郭茜;朱杰;;高維數(shù)據(jù)挖掘技術(shù)在教學(xué)質(zhì)量監(jiān)控與評價的應(yīng)用研究[J];全國商情(理論研究);2010年11期
4 顧冬娟;戴浩;;改進(jìn)的基于密度和網(wǎng)格的高維聚類算法[J];科技創(chuàng)新導(dǎo)報(bào);2008年22期
5 ;[J];;年期
相關(guān)會議論文 前6條
1 周煜人;彭輝;桂衛(wèi)華;;基于映射的高維數(shù)據(jù)聚類方法[A];04'中國企業(yè)自動化和信息化建設(shè)論壇暨中南六省區(qū)自動化學(xué)會學(xué)術(shù)年會專輯[C];2004年
2 梁俊杰;楊澤新;馮玉才;;大規(guī)模高維數(shù)據(jù)庫索引結(jié)構(gòu)[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2006年
3 陳冠華;馬秀莉;楊冬青;唐世渭;帥猛;;面向高維數(shù)據(jù)的低冗余Top-k異常點(diǎn)發(fā)現(xiàn)方法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(A輯)[C];2009年
4 劉運(yùn)濤;鮑玉斌;吳丹;冷芳玲;孫煥良;于戈;;CBFrag-Cubing:一種基于壓縮位圖的高維數(shù)據(jù)立方創(chuàng)建算法(英文)[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2005年
5 劉文慧;;PCA與PLS用于高維數(shù)據(jù)分類的比較性研究[A];2011年中國衛(wèi)生統(tǒng)計(jì)學(xué)年會會議論文集[C];2011年
6 劉喜蘭;馮德益;王公恕;朱成喜;馮雯;;臉譜分析在中進(jìn)期地震跟蹤預(yù)報(bào)中的應(yīng)用[A];中國地震學(xué)會第四次學(xué)術(shù)大會論文摘要集[C];1992年
相關(guān)重要報(bào)紙文章 前1條
1 本報(bào)記者 李雙藝;引領(lǐng)高維數(shù)據(jù)分析先河[N];吉林日報(bào);2013年
相關(guān)博士學(xué)位論文 前10條
1 劉勝藍(lán);余弦度量下的高維數(shù)據(jù)降維及分類方法研究[D];大連理工大學(xué);2015年
2 黃曉輝;高維數(shù)據(jù)的若干聚類問題及算法研究[D];哈爾濱工業(yè)大學(xué);2015年
3 楊風(fēng)召;高維數(shù)據(jù)挖掘中若干關(guān)鍵問題的研究[D];復(fù)旦大學(xué);2003年
4 陳黎飛;高維數(shù)據(jù)的聚類方法研究與應(yīng)用[D];廈門大學(xué);2008年
5 吳慶耀;高維數(shù)據(jù)的若干分類問題及算法研究[D];哈爾濱工業(yè)大學(xué);2013年
6 樓巍;面向大數(shù)據(jù)的高維數(shù)據(jù)挖掘技術(shù)研究[D];上海大學(xué);2013年
7 黃健美;高維數(shù)據(jù)索引及其查詢處理技術(shù)研究[D];東北大學(xué);2009年
8 任亞洲;高維數(shù)據(jù)上的聚類方法研究[D];華南理工大學(xué);2014年
9 董道國;高維數(shù)據(jù)索引結(jié)構(gòu)研究[D];復(fù)旦大學(xué);2005年
10 于怡;高維數(shù)據(jù)變量選擇的幾點(diǎn)研究[D];復(fù)旦大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 沈江炎;基于軟子空間的高維數(shù)據(jù)樹形索引研究[D];昆明理工大學(xué);2015年
2 侯小麗;高維數(shù)據(jù)聚類中的神經(jīng)網(wǎng)絡(luò)降維方法研究[D];蘭州大學(xué);2015年
3 趙俊琴;基于Lasso的高維數(shù)據(jù)線性回歸模型統(tǒng)計(jì)推斷方法比較[D];山西醫(yī)科大學(xué);2015年
4 何熒;高維數(shù)據(jù)下的特征選擇與聚類方法研究[D];西南大學(xué);2015年
5 胡昌杰;基于Autoencoder的高維數(shù)據(jù)降維方法研究[D];蘭州大學(xué);2015年
6 楊代君;基于進(jìn)化算法的高維數(shù)據(jù)聚類研究[D];西安電子科技大學(xué);2014年
7 王宏霞;交通高維數(shù)據(jù)邏輯整合與降解研究[D];重慶交通大學(xué);2015年
8 楊庭庭;基于信息熵的高維數(shù)據(jù)流聚類及其應(yīng)用研究[D];重慶交通大學(xué);2015年
9 康永為;大數(shù)據(jù)環(huán)境下高維數(shù)據(jù)處理若干問題[D];廣西師范大學(xué);2013年
10 張曉;基于超網(wǎng)絡(luò)的高維數(shù)據(jù)聚類方法研究[D];山東師范大學(xué);2015年
,本文編號:1447124
本文鏈接:http://sikaile.net/jingjilunwen/hongguanjingjilunwen/1447124.html