天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于雙聚類方法的旅游數(shù)據(jù)挖掘與研究

發(fā)布時間:2021-04-27 15:15
  雙聚類算法(Biclustering Algorithm)于2000年被Cheng和Church提出后,在基因表達(dá)數(shù)據(jù)分析領(lǐng)域已有較為成熟的發(fā)展,但在其他領(lǐng)域的應(yīng)用仍有待發(fā)掘,尤其在旅游大數(shù)據(jù)領(lǐng)域還未有應(yīng)用。旅游大數(shù)據(jù)近年來作為熱門話題,多被用于預(yù)測出行高峰期,旅游景點接客數(shù)量等。隨著人們生活水平的提高,對旅游質(zhì)量的要求越來越高,自由行、個性化旅游成為更多人的選擇。因此對游客進(jìn)行分類,針對不同類型的游客制定個性化旅游線路及服務(wù),是非常有意義的課題。本論文將雙聚類算法應(yīng)用于旅游大數(shù)據(jù)研究,由此得到用戶聚類結(jié)果,可以發(fā)掘潛在游客,也可針對不同用戶制定個性化旅游路線,同時也能對旅游景點的熱度進(jìn)行預(yù)測。本論文采用python對旅游網(wǎng)站的用戶數(shù)據(jù)進(jìn)行采集,采集到的內(nèi)容用Excel進(jìn)行清洗,然后用ICTCLAS中文分詞系統(tǒng)進(jìn)行分詞,并用TF-IDF算法提取高頻關(guān)鍵詞,同時對這些高頻詞進(jìn)行詞頻統(tǒng)計。將出現(xiàn)頻率較高的詞作為變量,用戶作為對象,建立用戶-關(guān)鍵詞矩陣。之后,再對建立的矩陣用雙聚類算法進(jìn)行聚類。通過對不同的聚類算法進(jìn)行比較,找出了適合該高維旅游數(shù)據(jù)的算法。數(shù)據(jù)分析結(jié)果表明,雙聚類算法對挖據(jù)到... 

【文章來源】:云南大學(xué)云南省 211工程院校

【文章頁數(shù)】:54 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
abstract
第一章 緒論
    1.1 研究背景及意義
    1.2 國內(nèi)外研究現(xiàn)狀
    1.3 本文結(jié)構(gòu)及創(chuàng)新點
第二章 聚類算法及大數(shù)據(jù)挖掘技術(shù)
    2.1 聚類算法
    2.2 雙聚類算法
    2.3 關(guān)鍵詞提取
    2.4 大數(shù)據(jù)挖掘技術(shù)
第三章 數(shù)據(jù)收集與處理
    3.1 數(shù)據(jù)收集
    3.2 數(shù)據(jù)處理
    3.3 數(shù)據(jù)的矩陣表示
第四章 聚類與結(jié)果分析
    4.1 gCLUTO聚類分析
    4.2 雙聚類結(jié)果分析
        4.2.1 基于RB算法的聚類分析
        4.2.2 基于Agglomerative算法的聚類分析
        4.2.3 基于Graph算法的聚類分析
        4.2.4 基于矩陣的聚類分析
第五章 總結(jié)與展望
    5.1 總結(jié)
    5.2 展望
附錄
參考文獻(xiàn)
致謝


【參考文獻(xiàn)】:
期刊論文
[1]基于旅游者網(wǎng)絡(luò)關(guān)注度的旅游景區(qū)日游客量預(yù)測研究——以不同客戶端百度指數(shù)為例[J]. 孫燁,張宏磊,劉培學(xué),張捷.  人文地理. 2017(03)
[2]基于雙聚類的圖書協(xié)同推薦方法[J]. 陳曉.  蘭州交通大學(xué)學(xué)報. 2016(03)
[3]基于用戶興趣和興趣點流行度的個性化旅游路線推薦[J]. 吳清霞,周婭,文締堯,賀正紅.  計算機(jī)應(yīng)用. 2016(06)
[4]基于變異系數(shù)的雙聚類算法及其在電信客戶細(xì)分的應(yīng)用研究[J]. 林勤,薛云,楊柏高.  計算機(jī)應(yīng)用與軟件. 2016(02)
[5]基于ILS-CS優(yōu)化算法的個性化旅游線路研究[J]. 侯樂,楊輝華,樊永顯,李靈巧,蔣淑潔.  計算機(jī)科學(xué)與探索. 2016(01)
[6]旅游大數(shù)據(jù)的MapReduce客戶細(xì)分應(yīng)用[J]. 汪永旗,王惠嬌.  華僑大學(xué)學(xué)報(自然科學(xué)版). 2015(03)
[7]雙聚類算法在電信高價值客戶細(xì)分的應(yīng)用[J]. 林勤,薛云.  計算機(jī)應(yīng)用. 2014(06)
[8]基于特征詞袋的雙聚類算法研究[J]. 黃志艷.  計算機(jī)光盤軟件與應(yīng)用. 2014(02)
[9]中國旅游業(yè)的國際競爭力分析[J]. 魏婭楠.  經(jīng)濟(jì)研究導(dǎo)刊. 2012(31)
[10]特種旅游研究綜述[J]. 李慶雷,康濤,榮俊杰.  重慶廣播電視大學(xué)學(xué)報. 2012(01)

博士論文
[1]個性化旅游信息服務(wù)系統(tǒng)的基礎(chǔ)理論與關(guān)鍵技術(shù)研究[D]. 趙晨陽.蘭州大學(xué) 2012

碩士論文
[1]百度玩圖的用戶訪問行為分析系統(tǒng)設(shè)計[D]. 李京.東北師范大學(xué) 2014
[2]基于基因表達(dá)數(shù)據(jù)的癌癥分型方法[D]. 陳星.浙江大學(xué) 2007
[3]個性化旅游信息系統(tǒng)中用戶建模技術(shù)的研究[D]. 王娟.北京郵電大學(xué) 2007
[4]假日旅游數(shù)據(jù)挖掘和流量模型的研究[D]. 白智廣.北京工商大學(xué) 2006



本文編號:3163692

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/weiguanjingjilunwen/3163692.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f618e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com