二手車保值率影響因素分析
發(fā)布時間:2020-08-12 18:10
【摘要】:隨著經(jīng)濟的迅速發(fā)展,我國迎來了“互聯(lián)網(wǎng)+”和“萬眾創(chuàng)新”的發(fā)展浪潮,這也給二手車行業(yè)帶來了諸多發(fā)展機遇。本文針對瓜子二手車直賣網(wǎng)爬取6425條數(shù)據(jù)進行描述性統(tǒng)計分析,通過建立統(tǒng)計模型和算法模型研究了二手車保值率的影響因素,旨在為用戶提供一種評估二手車保值率的方法,幫助用戶做出更好的決策。本文的主要思路是建立logistic回歸、決策樹、隨機森林和XGBoost四個模型,根據(jù)混淆矩陣得出的分類預測準確率,對以上四個模型進行評估,選出準確率最高的模型為最優(yōu)模型,進而從此最優(yōu)模型出發(fā)得到影響二手車保值率的重要影響變量。具體工作概括如下:1.收集并整理數(shù)據(jù)。利用八爪魚采集器爬取二手車信息共6425條,包括二手車的原價與報價、使用狀況、基本屬性、動力情況、內(nèi)外部配置和故障排查等方面。對這些數(shù)據(jù)進行清洗和特征構(gòu)造,使之適應本文所選模型的建立。2.數(shù)據(jù)的描述性統(tǒng)計分析。從保值率、使用狀況、基本屬性、動力情況、內(nèi)外部配置和故障排查六個方面對二手車數(shù)據(jù)做描述性統(tǒng)計分析。通過對這些指標的描述性統(tǒng)計分析,了解其分布規(guī)律,初步探索各類指標與二手車保值率之間的關(guān)系。3.建立二手車保值率高低的logistic回歸模型。本文對保值率高低進行了定義,將保值率由高到低排列,選取排名前30%的保值率定義為高保值率,其他為低保值率,從而將連續(xù)型變量轉(zhuǎn)化為了0-1分類變量。進而采用logistic逐步回歸、BIC準則對影響因素進行變量選擇。通過全變量的回歸,繪制出混淆矩陣圖,由于準確率較高,說明選取模型適合。4.建立二手車保值率高低的分類算法模型。首先,采用CART算法建立決策樹模型;然后,在決策樹的基礎上,建立了隨機森林模型和XGBoost算法模型;最后,分別對三種模型編制混淆矩陣,判斷所建立的三種模型是否合適,并得出每種模型下的變量重要性排名。通過上述研究,發(fā)現(xiàn)選取的四種模型均可以用來研究二手車保值率的影響因素,其中隨機森林模型的分類預測準確率更高,效果更好,因此,隨機森林模型為最優(yōu)模型,進而從此模型出發(fā)可以得到二手車保值率的高低與上牌時間、行駛里程、馬力、軸距、廠商等息息相關(guān)。
【學位授予單位】:貴州財經(jīng)大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:F426.471
【圖文】:
大大增加了二手車市場的流動性。根據(jù)中國汽車流通協(xié)會發(fā)布的二手車數(shù)據(jù),繪制下圖 1.1 二手車交易規(guī)模及增長率。如圖 1.1 可以看出,我國二手車交易規(guī)模逐年漸增,由 2012 年的 794萬輛增至 2017 年的 1240.09 萬輛。這得益于環(huán)境保護部和商務部辦公廳聯(lián)合發(fā)布通知,明確除了國家要求的車輛被淘汰外,京津冀,長江三角洲和珠江三角洲以外的地區(qū)應遵守《關(guān)于促進二手車便利交易的若干意見》,全面取消二手車限遷政策[7]。
圖 1.2 論文框架圖1.3.2 研究方法先將清洗后的數(shù)據(jù)統(tǒng)計并進行分析,然后在此基礎上,建立統(tǒng)計模型(logist回歸模型)和分類算法模型(決策樹模型、隨機森林模型和 XGBoost 模型),根據(jù)混淆矩陣得出的分類預測準確率,對以上四個模型進行評估,選出準確率最高的模型為最優(yōu)模型,進而從此最優(yōu)模型出發(fā)得到影響二手車保值率的重要影響變量。1.3.3 創(chuàng)新之處本文借鑒了國內(nèi)外關(guān)于二手車保值率的研究,從汽車的使用狀況、基本屬性動力情況、內(nèi)外部配置、故障排除五個方面進行特征選取,將機器學習算法使用
圖 2.1 二手車原價直方圖最低的是一輛原價 2.6 萬元的眾泰江南 TT 汽車程 6.03 萬公里,國三排放標準。原價最貴的是一ranTurismo 汽車,上牌時間距今 57 個月,表顯里。汽車原價的最大值和最小值之間的差距極大,侈享受的豪車。價直方圖 2.1 可以看到,二手車原價呈現(xiàn)明顯的左右,二手車的原價均值為 18.44 萬元,中位數(shù)原價在 15 萬左右,部分豪車拉高了整體的平均水價
【學位授予單位】:貴州財經(jīng)大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:F426.471
【圖文】:
大大增加了二手車市場的流動性。根據(jù)中國汽車流通協(xié)會發(fā)布的二手車數(shù)據(jù),繪制下圖 1.1 二手車交易規(guī)模及增長率。如圖 1.1 可以看出,我國二手車交易規(guī)模逐年漸增,由 2012 年的 794萬輛增至 2017 年的 1240.09 萬輛。這得益于環(huán)境保護部和商務部辦公廳聯(lián)合發(fā)布通知,明確除了國家要求的車輛被淘汰外,京津冀,長江三角洲和珠江三角洲以外的地區(qū)應遵守《關(guān)于促進二手車便利交易的若干意見》,全面取消二手車限遷政策[7]。
圖 1.2 論文框架圖1.3.2 研究方法先將清洗后的數(shù)據(jù)統(tǒng)計并進行分析,然后在此基礎上,建立統(tǒng)計模型(logist回歸模型)和分類算法模型(決策樹模型、隨機森林模型和 XGBoost 模型),根據(jù)混淆矩陣得出的分類預測準確率,對以上四個模型進行評估,選出準確率最高的模型為最優(yōu)模型,進而從此最優(yōu)模型出發(fā)得到影響二手車保值率的重要影響變量。1.3.3 創(chuàng)新之處本文借鑒了國內(nèi)外關(guān)于二手車保值率的研究,從汽車的使用狀況、基本屬性動力情況、內(nèi)外部配置、故障排除五個方面進行特征選取,將機器學習算法使用
圖 2.1 二手車原價直方圖最低的是一輛原價 2.6 萬元的眾泰江南 TT 汽車程 6.03 萬公里,國三排放標準。原價最貴的是一ranTurismo 汽車,上牌時間距今 57 個月,表顯里。汽車原價的最大值和最小值之間的差距極大,侈享受的豪車。價直方圖 2.1 可以看到,二手車原價呈現(xiàn)明顯的左右,二手車的原價均值為 18.44 萬元,中位數(shù)原價在 15 萬左右,部分豪車拉高了整體的平均水價
【相似文獻】
相關(guān)期刊論文 前10條
1 劉文博;梁盛楠;秦喜文;董小剛;王純杰;;基于迭代隨機森林算法的糖尿病預測[J];長春工業(yè)大學學報;2019年06期
2 賈璐;李輝;陳大雷;;基于改進隨機森林的城市河流水生態(tài)健康評價研究[J];海河水利;2019年06期
3 盛曉欣;田翔華;周毅;;基于隨機森林癲癇患者腦電數(shù)據(jù)的分析研究[J];中國數(shù)字醫(yī)學;2020年01期
4 秦喜文;郭宇;董小剛;郭佳靜;袁迪;;基于局部均值分解和迭代隨機森林的腦電分類[J];吉林大學學報(信息科學版);2020年01期
5 沈智勇;蘇
本文編號:2790859
本文鏈接:http://sikaile.net/qiyeguanlilunwen/2790859.html