基于LDA模型的湖南特色旅游線路設(shè)計(jì)
發(fā)布時(shí)間:2023-04-11 23:41
近些年來(lái),經(jīng)濟(jì)不斷發(fā)展,人民生活物質(zhì)水平不斷攀升,對(duì)于物質(zhì)水平的追求已經(jīng)逐漸淡出生活重心,精神文化逐漸走入大眾視線。旅游是精神文化享受的典型方式,在旅途中享受自由、分享歡樂(lè),已經(jīng)成為大多數(shù)人日常生活的一部分。而隨著消費(fèi)觀念的進(jìn)一步升級(jí),旅游市場(chǎng)也在悄然發(fā)生改變,個(gè)性化、品質(zhì)化成為新的競(jìng)爭(zhēng)點(diǎn),從而為旅游業(yè)所重視。湖南旅游景點(diǎn)眾多,在旅游資源方面擁有絕對(duì)的優(yōu)勢(shì),同時(shí),湖南旅游地區(qū)基礎(chǔ)設(shè)施完善、交通便利,這些都是湖南旅游業(yè)發(fā)展不可或缺的條件。然而,目前也存在著一些問(wèn)題制約著湖南省旅游業(yè)的發(fā)展,首先旅游品牌認(rèn)知度不高,沒(méi)有自己的特色;其次地區(qū)間旅游發(fā)展不均衡,以長(zhǎng)沙、張家界等城市為首的核心區(qū)域的旅游發(fā)展明顯優(yōu)于其它部分旅游邊緣城市。本文旨在合理整合湖南省旅游景點(diǎn)資源,提出以核心城市帶動(dòng)邊緣城市發(fā)展的設(shè)想。對(duì)于湖南省91個(gè)3A級(jí)以上景點(diǎn)進(jìn)行分析,通過(guò)爬蟲(chóng)獲取其百度百科詞條信息,并以此作為樣本數(shù)據(jù),以期對(duì)景點(diǎn)資源進(jìn)行分析。首先對(duì)91個(gè)文本樣本進(jìn)行文本分詞等文本預(yù)處理操作,其次基于所提取的高頻詞匯,生成詞云對(duì)湖南省景點(diǎn)整體特點(diǎn)進(jìn)行分析。結(jié)合現(xiàn)有研究分析傳統(tǒng)聚類(lèi)方法存在的缺陷,通過(guò)對(duì)現(xiàn)有研究進(jìn)行分析總...
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 文本聚類(lèi)
1.2.2 旅游線路設(shè)計(jì)
1.3 研究思路及主要研究?jī)?nèi)容
1.3.1 研究思路
1.3.2 主要研究?jī)?nèi)容
1.4 本章小結(jié)
第2章 相關(guān)理論介紹
2.1 文本聚類(lèi)相關(guān)知識(shí)介紹
2.1.1 文本預(yù)處理
2.1.2 文本表示
2.1.3 文本相似度
2.1.4 文本聚類(lèi)算法分類(lèi)
2.2 K-Means聚類(lèi)
2.3 LDA主題模型
2.4 本章小結(jié)
第3章 數(shù)據(jù)的獲取
3.1 數(shù)據(jù)來(lái)源
3.2 獲取數(shù)據(jù)
3.3 數(shù)據(jù)概覽
3.4 本章小結(jié)
第4章 數(shù)據(jù)預(yù)處理
4.1 文本分詞
4.2 提取高頻詞
4.3 文本表示
4.4 本章小結(jié)
第5章 文本聚類(lèi)
5.1 傳統(tǒng)聚類(lèi)方法的缺陷
5.2 基于LDA主題模型的K-Means聚類(lèi)
5.2.1 主題個(gè)數(shù)確定
5.2.2 LDA輸出文檔-主題模型結(jié)果
5.2.3 K-Means聚類(lèi)
5.3 基于VSM和基于LDA的比較
5.4 聚類(lèi)結(jié)果
5.4.1 聚類(lèi)類(lèi)別呈現(xiàn)
5.4.2 景點(diǎn)類(lèi)別區(qū)域分布
5.5 本章小結(jié)
第6章 特色旅游線路設(shè)計(jì)
6.1 線路一:凈化心靈游
6.2 線路二:紅色之旅
6.3 線路三:親近自然游
6.4 線路四:民俗文化游
6.5 休閑鄉(xiāng)村游
6.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
附錄A 爬蟲(chóng)代碼
附錄B 文本預(yù)處理代碼
附錄C 提取關(guān)鍵詞代碼
附錄D 文本表示代碼
附錄E K-MEANS聚類(lèi)代碼
附錄F LDA模型代碼
附錄G 聚類(lèi)結(jié)果展示代碼
致謝
本文編號(hào):3789986
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 文本聚類(lèi)
1.2.2 旅游線路設(shè)計(jì)
1.3 研究思路及主要研究?jī)?nèi)容
1.3.1 研究思路
1.3.2 主要研究?jī)?nèi)容
1.4 本章小結(jié)
第2章 相關(guān)理論介紹
2.1 文本聚類(lèi)相關(guān)知識(shí)介紹
2.1.1 文本預(yù)處理
2.1.2 文本表示
2.1.3 文本相似度
2.1.4 文本聚類(lèi)算法分類(lèi)
2.2 K-Means聚類(lèi)
2.3 LDA主題模型
2.4 本章小結(jié)
第3章 數(shù)據(jù)的獲取
3.1 數(shù)據(jù)來(lái)源
3.2 獲取數(shù)據(jù)
3.3 數(shù)據(jù)概覽
3.4 本章小結(jié)
第4章 數(shù)據(jù)預(yù)處理
4.1 文本分詞
4.2 提取高頻詞
4.3 文本表示
4.4 本章小結(jié)
第5章 文本聚類(lèi)
5.1 傳統(tǒng)聚類(lèi)方法的缺陷
5.2 基于LDA主題模型的K-Means聚類(lèi)
5.2.1 主題個(gè)數(shù)確定
5.2.2 LDA輸出文檔-主題模型結(jié)果
5.2.3 K-Means聚類(lèi)
5.3 基于VSM和基于LDA的比較
5.4 聚類(lèi)結(jié)果
5.4.1 聚類(lèi)類(lèi)別呈現(xiàn)
5.4.2 景點(diǎn)類(lèi)別區(qū)域分布
5.5 本章小結(jié)
第6章 特色旅游線路設(shè)計(jì)
6.1 線路一:凈化心靈游
6.2 線路二:紅色之旅
6.3 線路三:親近自然游
6.4 線路四:民俗文化游
6.5 休閑鄉(xiāng)村游
6.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
附錄A 爬蟲(chóng)代碼
附錄B 文本預(yù)處理代碼
附錄C 提取關(guān)鍵詞代碼
附錄D 文本表示代碼
附錄E K-MEANS聚類(lèi)代碼
附錄F LDA模型代碼
附錄G 聚類(lèi)結(jié)果展示代碼
致謝
本文編號(hào):3789986
本文鏈接:http://sikaile.net/guanlilunwen/lvyoujiudianguanlilunwen/3789986.html
最近更新
教材專(zhuān)著