聚類分析和主成分回歸在工業(yè)統(tǒng)計(jì)數(shù)據(jù)中的應(yīng)用
本文關(guān)鍵詞: 聚類分析 主成分分析 多元線性回歸 主成分回歸 出處:《吉林大學(xué)》2014年碩士論文 論文類型:學(xué)位論文
【摘要】:在當(dāng)前的大環(huán)境下,世界經(jīng)濟(jì)正在深度調(diào)整,國內(nèi)外的發(fā)展環(huán)境十分復(fù)雜。世界經(jīng)濟(jì)正在持續(xù)的走緩,而國家正在實(shí)行宏觀調(diào)控來實(shí)現(xiàn)經(jīng)濟(jì)的發(fā)展,工業(yè)在一個(gè)國家中起著關(guān)鍵的作用。工業(yè)是一個(gè)國家發(fā)展和騰飛的動(dòng)力,是一個(gè)國家重要的一部分經(jīng)濟(jì)基礎(chǔ)。 在今年,我國的工業(yè)發(fā)展有著重要的機(jī)遇,從當(dāng)前的經(jīng)濟(jì)形勢的指標(biāo)來看,我國的就業(yè)形勢基本平穩(wěn),價(jià)格的總水平也基本持平,經(jīng)濟(jì)在保持著穩(wěn)速的增長。 本文的選題數(shù)據(jù)來源于《2013年中國統(tǒng)計(jì)年鑒》,該年鑒統(tǒng)計(jì)了中國自改革開放以來三十多年的匯總多方面的經(jīng)濟(jì)數(shù)據(jù),并且按照時(shí)間、按照地區(qū)等多方面劃分來研究中國的經(jīng)濟(jì)數(shù)據(jù)。 數(shù)據(jù)挖掘是一門綜合性的研究學(xué)科,它綜合了數(shù)學(xué)知識、概率知識、數(shù)據(jù)庫知識、生物知識等各種學(xué)科的交叉學(xué)科,并且在當(dāng)前社會(huì)的經(jīng)濟(jì)、數(shù)學(xué)、生物、科學(xué)等多方面的領(lǐng)域里均有著廣泛的應(yīng)用。 通過研究《中國統(tǒng)計(jì)年鑒》中的工業(yè)統(tǒng)計(jì)數(shù)據(jù)和居民消費(fèi)數(shù)據(jù),本文主要建立了兩個(gè)模型。 第一個(gè)模型是聚類分析模型。 聚類分析是數(shù)據(jù)挖掘中常用的一種算法,K均值聚類分析是聚類分析中的經(jīng)典算法。本文使用K均值聚類研究2013年《中國統(tǒng)計(jì)年鑒》中的工業(yè)統(tǒng)計(jì)數(shù)據(jù),,并對全國31個(gè)省市自治區(qū)直轄市進(jìn)行聚類,得到聚類結(jié)果,并聯(lián)系實(shí)際情況分析我國不同地域的工業(yè)發(fā)展。 第二個(gè)模型是主成分回歸模型。 主成分分析是一種降維的辦法,是利用線性變換將多個(gè)變量轉(zhuǎn)化為少數(shù)主成分的過程,多元線性回歸是利用線性關(guān)系將因變量和多個(gè)自變量建立起回歸的模型的過程。本文將多元線性回歸和主成分分析兩者相結(jié)合起來,建立主成分回歸模型,并將這種模型應(yīng)用到中國統(tǒng)計(jì)年鑒中的數(shù)據(jù)中。工業(yè)發(fā)展對社會(huì)中的人均消費(fèi)水平有著一定的影響,主成分分析模型就是研究工業(yè)統(tǒng)計(jì)數(shù)據(jù)和人均消費(fèi)水平之間的關(guān)系。建立人均消費(fèi)水平和多個(gè)工業(yè)統(tǒng)計(jì)數(shù)據(jù)之間的主成分回歸模型,首先,將工業(yè)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行主成分分析,然后將人均消費(fèi)水平和主成分分析的結(jié)果建立多元線性回歸,得到主成分回歸的結(jié)果,并與其他回歸方法做比較,發(fā)現(xiàn)主成分回歸的效果比較好。
[Abstract]:Under the current large environment , the world economy is deeply adjusted , and the development environment at home and abroad is very complex . The world economy is continuously moving , and the state is implementing macro - control to realize the development of the economy . The industry plays a key role in a country . Industry is the power of national development and Tengfei , which is an important part of a country ' s economic foundation . This year , our country ' s industrial development has an important opportunity , from the current economic situation index , our country employment situation is basically stable , the overall level of the price is basically flat , the economy is maintaining steady growth . The data of this paper is derived from the Chinese Statistical Yearbook 2013 , which has counted more than 30 years of economic data in China since the reform and opening up , and studied China ' s economic data in terms of time and region . Data mining is a comprehensive research subject , which combines mathematics knowledge , probabilistic knowledge , database knowledge , biological knowledge and other disciplines , and has wide application in the fields of economy , mathematics , biology , science and so on . Based on the study of industrial statistics and consumer data in the Statistical Yearbook of China , two models have been established in this paper . The first model is a cluster analysis model . Cluster analysis is a commonly used algorithm in data mining , and K - means clustering analysis is a classical algorithm in cluster analysis . Using K - means clustering to study the industrial statistics in China Statistical Yearbook 2013 , clustering results are obtained for 31 provinces and municipalities directly under the Central Government , and the industrial development in different regions of our country is analyzed . The second model is the principal component regression model . The main component analysis is the process of converting a plurality of variables into a small number of principal components by linear transformation . The multivariate linear regression is the process of establishing a regression model by using linear relationship . The main component regression model is established by combining the multivariate linear regression and principal component analysis . The main component analysis model is to study the main component regression model between industrial statistics and industrial statistics .
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP311.13;F402.4
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 顧華詳;我國民族地區(qū)教育發(fā)展的現(xiàn)狀與對策[J];阿壩師范高等?茖W(xué)校學(xué)報(bào);2004年01期
2 付飛;李異;張健;;高齡老人戶外交往空間設(shè)計(jì)分析[J];四川建筑科學(xué)研究;2011年01期
3 張洪波;徐蘇寧;;全球氣候變化下低碳城市實(shí)現(xiàn)的規(guī)劃途徑[J];四川建筑科學(xué)研究;2011年06期
4 崔木花;;基于情景分析法的循環(huán)經(jīng)濟(jì)規(guī)劃研究——以安徽能源循環(huán)經(jīng)濟(jì)規(guī)劃為例[J];安徽大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2009年04期
5 汪少波;略論非合理性政府行為與政府成本剛性[J];安徽教育學(xué)院學(xué)報(bào);2004年02期
6 黃曉霓;;當(dāng)前我國分配領(lǐng)域的突出問題及其對策分析[J];合肥師范學(xué)院學(xué)報(bào);2010年05期
7 王守敬;;對我國居民消費(fèi)率過低的幾點(diǎn)思考[J];安徽職業(yè)技術(shù)學(xué)院學(xué)報(bào);2009年03期
8 孟祥健;;新農(nóng)村建設(shè)視域中的當(dāng)代中國馬克思主義大眾化[J];安徽職業(yè)技術(shù)學(xué)院學(xué)報(bào);2011年03期
9 鄭家歡;吳志祥;;安徽農(nóng)村留守兒童教育問題淺析[J];安徽農(nóng)學(xué)通報(bào)(上半月刊);2010年17期
10 余明江;;我國農(nóng)村反貧困機(jī)制的構(gòu)建——基于“政府—市場”雙導(dǎo)向視角的研究[J];安徽農(nóng)業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2010年05期
相關(guān)會(huì)議論文 前10條
1 胡建一;;長三角循環(huán)經(jīng)濟(jì)發(fā)展所面臨的主要挑戰(zhàn)[A];循環(huán)經(jīng)濟(jì)理論與實(shí)踐——長三角循環(huán)經(jīng)濟(jì)論壇暨2006年安徽博士科技論壇論文集[C];2006年
2 ;劬;;京津冀區(qū)域旅游文化產(chǎn)業(yè)合作研究[A];2011京津冀區(qū)域協(xié)作論壇論文集[C];2011年
3 滕吉文;阮小敏;張永謙;閆雅芬;;節(jié)能高效、減排低碳與責(zé)任和快速工業(yè)化及經(jīng)濟(jì)騰飛[A];中國科學(xué)院地質(zhì)與地球物理研究所第11屆(2011年度)學(xué)術(shù)年會(huì)論文集(上)[C];2012年
4 李毅;;民營房地產(chǎn)業(yè)發(fā)展報(bào)告[A];中國民營經(jīng)濟(jì)發(fā)展報(bào)告 No.1(2003)[C];2004年
5 王娜;邱琦;;我國生活垃圾分類回收的推廣與普及[A];2011中國環(huán)境科學(xué)學(xué)會(huì)學(xué)術(shù)年會(huì)論文集(第二卷)[C];2011年
6 唐海龍;徐玉新;蔣高明;劉沙沙;張Pr;鐘世霞;;化肥減施及秸稈過腹還田對土壤理化性質(zhì)的影響——以弘毅生態(tài)農(nóng)場為例[A];2011中國環(huán)境科學(xué)學(xué)會(huì)學(xué)術(shù)年會(huì)論文集(第二卷)[C];2011年
7 郭雪松;鄒娟;梁瀚文;劉俊新;;苕溪流域典型村落水污染特征調(diào)查研究[A];2011中國環(huán)境科學(xué)學(xué)會(huì)學(xué)術(shù)年會(huì)論文集(第四卷)[C];2011年
8 黃璜;;“積極老齡化”理論視角下的我國老齡旅游產(chǎn)業(yè)發(fā)展戰(zhàn)略[A];2012中國旅游科學(xué)年會(huì)論文集[C];2012年
9 汪清蓉;;城市旅游業(yè)能耗消耗、二氧化碳排放估算方法及深圳市實(shí)證分析[A];2012中國旅游科學(xué)年會(huì)論文集[C];2012年
10 李懷;韓瑞;;我國現(xiàn)行個(gè)人所得稅扣除額標(biāo)準(zhǔn)的法與經(jīng)濟(jì)學(xué)分析[A];2006年度(第四屆)中國法經(jīng)濟(jì)學(xué)論壇會(huì)議論文集[C];2006年
相關(guān)博士學(xué)位論文 前10條
1 杜熙茹;珠江三角洲城市職業(yè)女性體育生活方式研究[D];上海體育學(xué)院;2010年
2 胡雪梅;科學(xué)人才觀的理論內(nèi)涵與實(shí)踐應(yīng)用研究[D];江西師范大學(xué);2010年
3 汪慧玲;科技進(jìn)步對勞動(dòng)就業(yè)影響的實(shí)證研究[D];蘭州大學(xué);2010年
4 陳春常;轉(zhuǎn)型中的中國國家治理研究[D];華東師范大學(xué);2011年
5 董國強(qiáng);我國高校教師人力資本定價(jià)研究[D];西北大學(xué);2010年
6 李玉鳳;黑龍江省產(chǎn)業(yè)結(jié)構(gòu)優(yōu)化及仿真[D];哈爾濱理工大學(xué);2009年
7 劉林;高新技術(shù)產(chǎn)業(yè)可持續(xù)發(fā)展模式研究[D];哈爾濱理工大學(xué);2009年
8 羅力;信任和關(guān)系承諾對第三方物流整合與績效的影響[D];華南理工大學(xué);2010年
9 王耀鵬;中國糧食流通支持政策研究[D];北京林業(yè)大學(xué);2011年
10 閆俊;中國新型農(nóng)村社會(huì)養(yǎng)老保險(xiǎn)制度研究[D];北京林業(yè)大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 高曉輝;基于DEA方法的農(nóng)地利用效率差異研究[D];華中農(nóng)業(yè)大學(xué);2010年
2 閆恒超;棉花纖維發(fā)育伸長期和次生壁加厚期數(shù)字表達(dá)譜分析[D];華中農(nóng)業(yè)大學(xué);2010年
3 王旭;資源型城市生態(tài)經(jīng)濟(jì)系統(tǒng)可持續(xù)發(fā)展研究[D];河南理工大學(xué);2010年
4 劉鵬;煤粉永磁強(qiáng)磁濾器的研究[D];河南理工大學(xué);2010年
5 譚嘯;湘中南地區(qū)農(nóng)村初中學(xué)校體育發(fā)展的影響因素及對策研究[D];廣西師范學(xué)院;2010年
6 史玉巖;開發(fā)節(jié)地型居住小區(qū)的技術(shù)措施研究[D];鄭州大學(xué);2010年
7 畢圣潔;中國政治發(fā)展過程中的合法性構(gòu)成與獲取研究[D];華東政法大學(xué);2010年
8 陳偉;比較優(yōu)勢理論與我國出口制造業(yè)發(fā)展及產(chǎn)業(yè)結(jié)構(gòu)升級策略新析[D];華東政法大學(xué);2010年
9 商鵬鵬;我國個(gè)人破產(chǎn)制度之配套制度探究[D];華東政法大學(xué);2010年
10 瞿逸;我國經(jīng)濟(jì)轉(zhuǎn)軌期民工荒問題探析[D];華東政法大學(xué);2010年
本文編號:1498573
本文鏈接:http://sikaile.net/jingjilunwen/gongyejingjilunwen/1498573.html