基于主題模型的Airbnb短住房房源畫像分析
發(fā)布時間:2023-02-13 18:03
Airbnb作為世界范圍內(nèi)最大的C2C短住房在線預(yù)訂平臺具有海量房源和龐大的消費群體,其內(nèi)部龐大的流量也代表著極高的商業(yè)價值,成為各類閑置資源共享人員及投資商進行資源共享、創(chuàng)造收入的重要陣地,如何利用其中的房源數(shù)據(jù)對在線住宿平臺提供管理決策的依據(jù)成為企業(yè)關(guān)注的重點。本文利用Airbnb平臺上的短住房房源數(shù)據(jù)構(gòu)建房源畫像,可以對房源數(shù)據(jù)進行挖掘和分析,將房源表達成一類多維的標(biāo)簽系統(tǒng),幫助企業(yè)精準(zhǔn)定位房源特征,是改進房源產(chǎn)品和房源推薦的基礎(chǔ),對住宿預(yù)訂平臺及房源供給方都具有很高的參考意義。在這一背景下,本文研究了基于主題模型的Airbnb短住房房源畫像的構(gòu)建及分析,目的是精確描述房源特征,并將其進行類別細(xì)分及描述分析。使用的Airbnb房源數(shù)據(jù)包括房源的基礎(chǔ)屬性數(shù)據(jù)及動態(tài)的房源評論數(shù)據(jù),由于基礎(chǔ)屬性數(shù)據(jù)均為房源供給方填寫,因而數(shù)據(jù)的處理重點在于房源評論。本文的主要工作如下:(1)針對獲取到的房源評論數(shù)據(jù)進行預(yù)處理。將所有房源按照人均價位劃分為經(jīng)濟型、品質(zhì)型和高檔型,在房源評論文本的預(yù)處理過程中去除無用詞后使用了效果較好的Jieba分詞器,并進行了詞性篩選及停用詞處理。(2)使用主題模型進行...
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 引言
1.1 研究背景和意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外文獻綜述
1.2.1 共享經(jīng)濟背景下短住房企業(yè)的研究現(xiàn)狀
1.2.2 房源畫像研究現(xiàn)狀
1.2.3 主題模型研究現(xiàn)狀
1.3 研究內(nèi)容與方法
1.4 主要工作和創(chuàng)新
1.5 論文的基本結(jié)構(gòu)
第2章 相關(guān)技術(shù)介紹
2.1 房源畫像技術(shù)
2.1.1 房源畫像概述
2.1.2 房源畫像標(biāo)簽體系結(jié)構(gòu)
2.2 主題模型
2.2.1 LDA模型
2.2.2 DTM模型
2.2.3 主題模型算法的參數(shù)推斷方法
2.3 聚類算法
2.3.1 K-means聚類算法
2.3.2 Canopy聚類算法
2.4 本章小結(jié)
第3章 基于主題模型的房源畫像特征工程
3.1 房源畫像建模整體框架
3.2 數(shù)據(jù)來源與文本預(yù)處理
3.2.1 數(shù)據(jù)集介紹及劃分
3.2.2 文本預(yù)處理
3.3 基于主題模型的房源特征工程
3.3.1 基于LDA模型的房源特征提取
3.3.2 基于DTM模型的房源特征提取
3.3.3 房源評論特征的分析
3.3.4 主題模型的評價
3.4 基于DTM模型的DTM2vec融合算法
3.4.1 Word2vec
3.4.2 融合DTM模型與Word2Vec的 DTM2vec房源特征工程
3.5 本章小結(jié)
第4章 基于DTM2vec模型的房源畫像構(gòu)建與結(jié)果分析
4.1 實驗框架
4.2 實驗設(shè)計及結(jié)果分析
4.2.1 Canopy+K-means聚類
4.2.2 評價標(biāo)準(zhǔn)的選擇
4.2.3 房源聚類實驗及效果評估
4.3 短住房房源的畫像描述及建議
4.3.1 房源的畫像描述
4.3.2 房源的發(fā)展建議
4.4 本章小結(jié)
結(jié)論與展望
1、結(jié)論
2、展望
參考文獻
致謝
攻讀碩士學(xué)位期間的科研情況
本文編號:3742048
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 引言
1.1 研究背景和意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外文獻綜述
1.2.1 共享經(jīng)濟背景下短住房企業(yè)的研究現(xiàn)狀
1.2.2 房源畫像研究現(xiàn)狀
1.2.3 主題模型研究現(xiàn)狀
1.3 研究內(nèi)容與方法
1.4 主要工作和創(chuàng)新
1.5 論文的基本結(jié)構(gòu)
第2章 相關(guān)技術(shù)介紹
2.1 房源畫像技術(shù)
2.1.1 房源畫像概述
2.1.2 房源畫像標(biāo)簽體系結(jié)構(gòu)
2.2 主題模型
2.2.1 LDA模型
2.2.2 DTM模型
2.2.3 主題模型算法的參數(shù)推斷方法
2.3 聚類算法
2.3.1 K-means聚類算法
2.3.2 Canopy聚類算法
2.4 本章小結(jié)
第3章 基于主題模型的房源畫像特征工程
3.1 房源畫像建模整體框架
3.2 數(shù)據(jù)來源與文本預(yù)處理
3.2.1 數(shù)據(jù)集介紹及劃分
3.2.2 文本預(yù)處理
3.3 基于主題模型的房源特征工程
3.3.1 基于LDA模型的房源特征提取
3.3.2 基于DTM模型的房源特征提取
3.3.3 房源評論特征的分析
3.3.4 主題模型的評價
3.4 基于DTM模型的DTM2vec融合算法
3.4.1 Word2vec
3.4.2 融合DTM模型與Word2Vec的 DTM2vec房源特征工程
3.5 本章小結(jié)
第4章 基于DTM2vec模型的房源畫像構(gòu)建與結(jié)果分析
4.1 實驗框架
4.2 實驗設(shè)計及結(jié)果分析
4.2.1 Canopy+K-means聚類
4.2.2 評價標(biāo)準(zhǔn)的選擇
4.2.3 房源聚類實驗及效果評估
4.3 短住房房源的畫像描述及建議
4.3.1 房源的畫像描述
4.3.2 房源的發(fā)展建議
4.4 本章小結(jié)
結(jié)論與展望
1、結(jié)論
2、展望
參考文獻
致謝
攻讀碩士學(xué)位期間的科研情況
本文編號:3742048
本文鏈接:http://sikaile.net/guanlilunwen/jiudianguanli/3742048.html
最近更新
教材專著