基于機(jī)器學(xué)習(xí)模型的深圳市住房租金研究
發(fā)布時(shí)間:2023-01-12 18:03
隨著我國(guó)城鎮(zhèn)化進(jìn)程的推進(jìn),商品房?jī)r(jià)格不斷上漲,特別是“北上廣深”這些一線城市的房?jī)r(jià)更是讓人望而卻步。為了解決住房問題,租房居住成為了越來越多人的選擇。然而我國(guó)目前的住房市場(chǎng)以買賣為主,租賃市場(chǎng)還沒得到協(xié)同發(fā)展,依然存在著很多問題。其中住房租賃市場(chǎng)供求關(guān)系失衡、房東與租客信息不對(duì)稱、市場(chǎng)亂象居多等問題一直阻礙著租賃市場(chǎng)的發(fā)展。為了解決以上存在的問題,把控住房租賃市場(chǎng)的價(jià)格走向是關(guān)鍵,因而對(duì)住房租金進(jìn)行合理的定價(jià)和預(yù)測(cè)就顯得尤為重要。本文結(jié)合當(dāng)前的大數(shù)據(jù)背景,提出運(yùn)用機(jī)器學(xué)習(xí)模型來對(duì)住房租金進(jìn)行分析預(yù)測(cè),以期構(gòu)造出預(yù)測(cè)效果較好的模型來供租賃市場(chǎng)參考。本文通過網(wǎng)絡(luò)爬蟲技術(shù)從鏈家網(wǎng)上獲取了深圳市在2019年12月的真實(shí)租房數(shù)據(jù)。并對(duì)得到的原始數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗然后做可視化展示,從數(shù)據(jù)的描述性統(tǒng)計(jì)分析中直觀的獲得特征之間的關(guān)系以及影響租金的主要因素。為了更好的訓(xùn)練數(shù)據(jù),本文接著進(jìn)行數(shù)據(jù)變換,并通過特征選擇得到了用于模型訓(xùn)練的12個(gè)特征。本文建立了支持向量回歸(SVR)、隨機(jī)森林和XGBoost模型對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行預(yù)測(cè)分析。為了優(yōu)化模型,提高預(yù)測(cè)準(zhǔn)確率,本文選用網(wǎng)格搜索法分別對(duì)模型的重要參數(shù)進(jìn)行...
【文章頁(yè)數(shù)】:58 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 住房租金影響因素研究
1.2.2 住房租金預(yù)測(cè)方法研究
1.3 研究?jī)?nèi)容
1.4 文章結(jié)構(gòu)安排
第二章 相關(guān)理論基礎(chǔ)
2.1 機(jī)器學(xué)習(xí)介紹
2.2 支持向量回歸(SVR)
2.2.1 最大間隔超平面
2.2.2 線性支持向量回歸
2.2.3 非線性支持向量回歸
2.3 隨機(jī)森林
2.3.1 隨機(jī)森林儲(chǔ)備知識(shí)介紹
2.3.2 隨機(jī)森林原理介紹
2.4 XGBoost
2.5 本章小結(jié)
第三章 數(shù)據(jù)的獲取與預(yù)處理
3.1 數(shù)據(jù)的獲取
3.1.1 網(wǎng)絡(luò)爬蟲介紹
3.1.2 數(shù)據(jù)的獲取背景
3.1.3 數(shù)據(jù)爬取及指標(biāo)說明
3.2 數(shù)據(jù)的清洗
3.2.1 缺失值處理
3.2.2 異常值處理
3.2.3 重復(fù)數(shù)據(jù)處理
3.3 數(shù)據(jù)的描述性統(tǒng)計(jì)分析
3.4 數(shù)據(jù)變換
3.4.1 目標(biāo)變量的正態(tài)化
3.4.2 離散變量的編碼
3.4.3 數(shù)據(jù)的歸一化
3.5 特征選取
3.6 本章小結(jié)
第四章 深圳市住房租金預(yù)測(cè)分析
4.1 模型評(píng)價(jià)指標(biāo)
4.2 分析方法
4.2.1 支持向量回歸(SVR)
4.2.2 隨機(jī)森林
4.2.3 XGBoost
4.3 模型結(jié)果與比較
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
本文編號(hào):3730243
【文章頁(yè)數(shù)】:58 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 住房租金影響因素研究
1.2.2 住房租金預(yù)測(cè)方法研究
1.3 研究?jī)?nèi)容
1.4 文章結(jié)構(gòu)安排
第二章 相關(guān)理論基礎(chǔ)
2.1 機(jī)器學(xué)習(xí)介紹
2.2 支持向量回歸(SVR)
2.2.1 最大間隔超平面
2.2.2 線性支持向量回歸
2.2.3 非線性支持向量回歸
2.3 隨機(jī)森林
2.3.1 隨機(jī)森林儲(chǔ)備知識(shí)介紹
2.3.2 隨機(jī)森林原理介紹
2.4 XGBoost
2.5 本章小結(jié)
第三章 數(shù)據(jù)的獲取與預(yù)處理
3.1 數(shù)據(jù)的獲取
3.1.1 網(wǎng)絡(luò)爬蟲介紹
3.1.2 數(shù)據(jù)的獲取背景
3.1.3 數(shù)據(jù)爬取及指標(biāo)說明
3.2 數(shù)據(jù)的清洗
3.2.1 缺失值處理
3.2.2 異常值處理
3.2.3 重復(fù)數(shù)據(jù)處理
3.3 數(shù)據(jù)的描述性統(tǒng)計(jì)分析
3.4 數(shù)據(jù)變換
3.4.1 目標(biāo)變量的正態(tài)化
3.4.2 離散變量的編碼
3.4.3 數(shù)據(jù)的歸一化
3.5 特征選取
3.6 本章小結(jié)
第四章 深圳市住房租金預(yù)測(cè)分析
4.1 模型評(píng)價(jià)指標(biāo)
4.2 分析方法
4.2.1 支持向量回歸(SVR)
4.2.2 隨機(jī)森林
4.2.3 XGBoost
4.3 模型結(jié)果與比較
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
本文編號(hào):3730243
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3730243.html
最近更新
教材專著