基于兩層特征投票法的二手車標(biāo)價(jià)研究
發(fā)布時(shí)間:2024-01-23 14:00
隨著我國(guó)經(jīng)濟(jì)的持續(xù)發(fā)展,以及“互聯(lián)網(wǎng)+”經(jīng)濟(jì)形態(tài)逐步滲入二手汽車市場(chǎng),使得消費(fèi)者在網(wǎng)絡(luò)上就可以實(shí)現(xiàn)二手車的線上交易,便捷的交易方式促使二手車市場(chǎng)得到空前的繁榮發(fā)展。大數(shù)據(jù)的應(yīng)用也使得平臺(tái)上的二手車信息復(fù)雜多樣,如何從這些良莠不齊的二手車特征中尋找出影響其標(biāo)價(jià)的重要因素,并利用它們構(gòu)建精確的預(yù)測(cè)模型顯得十分重要。傳統(tǒng)的二手車價(jià)格評(píng)估方法需要評(píng)估人對(duì)整個(gè)市場(chǎng)有長(zhǎng)期的了解和相關(guān)經(jīng)驗(yàn)的積累。近年來(lái)許多學(xué)者把機(jī)器學(xué)習(xí)中的算法應(yīng)用在二手車交易領(lǐng)域,形成了相關(guān)的價(jià)格預(yù)測(cè)模型,從數(shù)據(jù)挖掘的科學(xué)角度為買賣雙方的交易價(jià)格進(jìn)行合理預(yù)測(cè),降低了對(duì)二手車估價(jià)的專業(yè)門檻,極大地提高了二手車標(biāo)價(jià)的科學(xué)性。本文的數(shù)據(jù)來(lái)源于Python爬取汽車之家平臺(tái)上的二手車詳情資料。對(duì)數(shù)據(jù)進(jìn)行預(yù)處理后采用兩層投票法進(jìn)行特征篩選,第一層分別采用方差選擇法、相關(guān)系數(shù)法、最大信息系數(shù)法、基于1L范數(shù)的Lasso選擇法和基于樹模型的GBDT選擇法進(jìn)行特征選擇;第二層依據(jù)第一層的選擇結(jié)果再次投票,最終產(chǎn)生三個(gè)新的特征子集。另外使用主成分降維的方法作為對(duì)照,選取累計(jì)方差貢獻(xiàn)率前80%的12個(gè)主成分生成新的對(duì)照數(shù)據(jù)集。本文...
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
本文編號(hào):3882791
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
圖1-12017-2021年中國(guó)汽車轉(zhuǎn)移登記業(yè)務(wù)柱形圖(單位:萬(wàn)筆)
圖1-2技術(shù)路線圖
圖3-1投票機(jī)制流程圖
圖4-1汽車之家二手車頁(yè)面
本文編號(hào):3882791
本文鏈接:http://sikaile.net/gongshangguanlilunwen/3882791.html
最近更新
教材專著