天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 管理論文 > 旅游管理論文 >

基于網(wǎng)絡游記文本挖掘的赴三亞國內(nèi)旅游者偏好研究

發(fā)布時間:2021-01-18 17:00
  隨著我國人民經(jīng)濟水平的日益提高和旅游業(yè)的發(fā)展,游旅者的個性化需求日益凸顯,掌握旅游者的偏好規(guī)律,成為滿足游客個性化旅游需求,從而提高旅游服務水平的重要基礎(chǔ)。另一方面隨著我國互聯(lián)網(wǎng)技術(shù)的普及和電子商務的發(fā)展,越來越多的旅游者通過網(wǎng)絡選擇旅游產(chǎn)品,實現(xiàn)旅游消費,分享旅游體驗,記錄旅游經(jīng)歷。因此,網(wǎng)絡上積累了海量以自然語言文本為載體的網(wǎng)絡游記。這些游記中包含了豐富旅游者行為信息,為研究旅游者偏好提供了新的途徑。如何準確、高效地對網(wǎng)絡游記文本中蘊含的信息進行挖掘,成為實現(xiàn)基于網(wǎng)絡游記研究旅游者偏好這一新途徑的核心問題。本研究即是圍繞該問題展開,其主要研究內(nèi)容如下:(1)研究適合網(wǎng)絡游記數(shù)據(jù)的爬蟲策略及網(wǎng)絡游記數(shù)據(jù)預處理方法;(2)基于文本挖掘相關(guān)理論,構(gòu)建旅游者偏好模型;(3)根據(jù)所構(gòu)建的偏好模型,以三亞旅游者的游記數(shù)據(jù)為例進行實例研究,挖掘赴三亞國內(nèi)游客偏好,為三亞市旅游業(yè)發(fā)展提供建議。傳統(tǒng)的旅游者偏好研究主要通過問卷獲取旅游者行為數(shù)據(jù),數(shù)據(jù)獲取成本高,且數(shù)據(jù)的客觀性不強,量級有限。本文通過網(wǎng)絡上積累的海量富含旅游者行為信息的網(wǎng)絡游記數(shù)據(jù),將文本挖掘相關(guān)理論引入到旅游者偏好的研究中,為準確、... 

【文章來源】:海南大學海南省 211工程院校

【文章頁數(shù)】:74 頁

【學位級別】:碩士

【部分圖文】:

基于網(wǎng)絡游記文本挖掘的赴三亞國內(nèi)旅游者偏好研究


圖1技術(shù)路線圖??Fig.?1?The?technology?roadmap??1.5本文創(chuàng)新點??(1)結(jié)合網(wǎng)絡游記文本數(shù)據(jù)的結(jié)構(gòu),改進現(xiàn)有的數(shù)據(jù)爬蟲程序,使其更適??合爬取文本數(shù)據(jù)方面

網(wǎng)絡爬蟲,增量式,通用網(wǎng)絡,網(wǎng)頁


圖2網(wǎng)絡爬蟲基本結(jié)構(gòu)圖??Fig.2Web?crawler?basic?structure?diagram??網(wǎng)絡爬蟲可根據(jù)自身結(jié)構(gòu)及作用分為三種類型:聚焦網(wǎng)絡爬蟲和增量式網(wǎng)??絡爬蟲,通用網(wǎng)絡爬蟲。??通用網(wǎng)絡爬蟲(General?Purpose?Web?Crawler)又被稱為全網(wǎng)爬蟲(Scalable??Web?Crawler),主要應用于搜索引擎爬取整個互聯(lián)網(wǎng)的網(wǎng)頁數(shù)據(jù)。由于爬取量??巨大,通用網(wǎng)絡爬蟲需要對爬取速度和存儲空間要求很高,通常采用分布式爬??取。??聚焦網(wǎng)絡爬蟲(Focused?Web?Crawler)又被稱為主題網(wǎng)絡爬蟲(Topical??Web?Crawler)。聚焦網(wǎng)絡爬蟲是選擇性地進行網(wǎng)絡爬蟲,在實施網(wǎng)頁爬取時要??進行主題篩選,盡量保證只爬取與主題相關(guān)的網(wǎng)頁信息。和通用網(wǎng)絡爬蟲相比,??聚焦網(wǎng)絡只需爬行與主題相關(guān)的頁面,極大得降低了硬件成木和網(wǎng)絡資源,聚??焦網(wǎng)絡爬蟲爬取到的網(wǎng)頁相對較少,可以在較短時間內(nèi)對網(wǎng)頁執(zhí)行更新操作,??適合爬取與特定主題有關(guān)的網(wǎng)頁數(shù)據(jù),很好的滿足了特定人群對特定領(lǐng)域的信??息要求。??

示意圖,社區(qū)結(jié)構(gòu),示意圖,情感分析


圖3具有社區(qū)結(jié)構(gòu)的網(wǎng)絡示意圖??Fig.3Network?diagram?with?community?structure??社區(qū)發(fā)現(xiàn)作為復雜網(wǎng)絡分析中的熱點研宂問題具有非常廣泛的應用價值。??它對了解系統(tǒng)的行為和個體的屬性起著重要作用,為人們理解網(wǎng)絡拓撲和功能??結(jié)構(gòu)提供幫助,為利用和改造網(wǎng)絡提供支持。本文利用游記文本數(shù)據(jù)構(gòu)建復雜??網(wǎng)絡,通過社區(qū)發(fā)現(xiàn)技術(shù)對游記文本中的偏好信息進行挖掘。??3.?4情感分析技術(shù)??情感分析也稱意見挖掘或觀點挖掘(opinion?mining),本質(zhì)上是語義理解??的問題,主要是基于用戶評論信息來分析出用戶對某個特定事物的觀點、看法、??情感傾向以及情感色彩。目前,文本情感分析技術(shù)主要可以分為基于規(guī)則的情??感分析、基于統(tǒng)計機器學習的情感分析、基于深度學習的情感分析三大類。??基于規(guī)則的情感分析是利用對應領(lǐng)域的情感詞典中的詞語來匹配句子中的??情感詞,然后通過累加情感詞的情感強度值來確定文本的總體情感傾向。此類??方法的優(yōu)點是簡單高效,缺點是可拓展性不強,受到領(lǐng)域知識、句式搭配、語??

【參考文獻】:
期刊論文
[1]基于網(wǎng)絡游記的婺源縣鄉(xiāng)村旅游體驗研究[J]. 王蓉,黃朋濤,胡靜,李亞娟.  資源科學. 2019(02)
[2]基于網(wǎng)絡游記的廣州旅游目的地形象感知研究[J]. 瞿華,梁燕坤.  廣東社會科學. 2017(06)
[3]基于主題模型的大學學報文獻挖掘研究——以計算機科學領(lǐng)域為例[J]. 阮劍,楊海霞,黃瑱.  情報工程. 2017(04)
[4]基于微博標簽和LDA的微博主題提取算法[J]. 鄧丹君,姚莉.  計算機與數(shù)字工程. 2017(05)
[5]基于LDA主題模型的移動應用相似度構(gòu)建方法[J]. 褚征,于炯,王佳玉,王躍飛.  計算機應用. 2017(04)
[6]基于網(wǎng)絡文本的目的地旅游形象游客感知與官方傳播對比研究——以福建永定土樓為例[J]. 張文亭,駱培聰.  福建師范大學學報(自然科學版). 2017(01)
[7]旅游地感知結(jié)構(gòu)重構(gòu)——基于文本與復雜網(wǎng)絡分析的研究[J]. 鐘櫟娜.  旅游學刊. 2015(08)
[8]機器人產(chǎn)業(yè)技術(shù)機會發(fā)現(xiàn)研究——基于專利文本挖掘[J]. 龔惠群,劉瓊澤,黃超.  科技進步與對策. 2014(05)
[9]文本圖表示模型及其在文本挖掘中的應用[J]. 李綱,毛進.  情報學報. 2013 (12)
[10]基于網(wǎng)絡游記的西藏旅游目的地形象探析[J]. 楊昆,姬梅,陳婭玲.  旅游論壇. 2013(03)



本文編號:2985310

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/lvyoujiudianguanlilunwen/2985310.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2a7d2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com