面向旅游在線評論的文本挖掘方法研究
發(fā)布時間:2020-05-19 16:34
【摘要】:隨著互聯(lián)網(wǎng)的不斷發(fā)展,消費者通過網(wǎng)絡購買商品及服務的行為不斷增加,旅游已作為一種無形的以服務為性質的產(chǎn)品,逐漸被列入電子商務的范圍內(nèi),并在網(wǎng)絡產(chǎn)品消費中占有越來越重的比例。但旅游產(chǎn)品因其自身特有的無形性以及生產(chǎn)與消費的同步性,導致旅游消費者購買決策的風險性大大增加。旅游在線評論是指游客針對某一旅游景區(qū)或景點,通過專門的旅游評論網(wǎng)站、網(wǎng)絡社區(qū)或者其他渠道發(fā)表的帶有自身情感或喜好的評論性文字。旅游者了解旅游信息的渠道,除了圖片之外,最重要的是網(wǎng)上的旅游在線評論信息。因此,如何高效的對游客在線評論內(nèi)容進行分析和挖掘,識別用戶評論方面以及情感傾向,并依此改進景區(qū)自身的服務質量來吸引更多旅游者,已成為旅游景區(qū)管理者需要考慮的重要問題之一。針對上述問題,本文首先提出了一種基于詞向量的旅游在線評論的情感詞典構建方法,以攜程、去哪兒、馬蜂窩等旅游網(wǎng)站的在線評論數(shù)據(jù)為基礎,在傳統(tǒng)基于詞頻種子詞語選擇過程中加入詞向量因素,利用詞語向量之間的距離對種子詞集進行篩選,通過計算種子詞語與情感詞之間的互信息自動生成旅游在線評論情感詞典。并以山岳型景區(qū)在線評論為例驗證了該方法的可行性,構建了山岳型景區(qū)旅游在線評論情感詞典。隨后,本文提出了一種基于改進ASUM模型的旅游在線評論文本挖掘方法,指出由于用戶情感需要方面作為載體,原本ASUM模型流程上存在不足。并將原本模型中的“文檔-情感-方面-詞”四層結構改進為“文檔-方面-情感-詞”結構,通過Gibbs推理方法對改進模型進行了參數(shù)推導。論文以黃山風景區(qū)在線評論為例,利用上述文本主題挖掘模型結合山岳型景區(qū)旅游本體概念以及在線評論情感詞典對相關景區(qū)在線評論數(shù)據(jù)進行處理,得出網(wǎng)絡在線評論文本的主體和情感概率分布,并通過相關分析驗證了方法的有效性。最后,論文利用上述文本挖掘模型得出的結果,結合用戶旅游偏好矩陣,計算得出用戶旅游意向值,對用戶旅游決策過程提供了相關參考。本文提出的旅游在線評論文本挖掘方法具有一定的可行性,可以較準確的建立相關領域詞典以及分析得出旅游在線評論文本方面及偏好,對風景區(qū)服務質量改進以及輔助用戶旅游決策過程具有積極地意義。
【圖文】:
隨著互聯(lián)網(wǎng)的不斷發(fā)展以及經(jīng)濟全球化的不斷加深,大數(shù)據(jù)等相關技術的發(fā)逡逑展推動了全球電子商務的發(fā)展和壯大。二十一世紀初期,電子商務在線交易數(shù)量逡逑開始成倍增長,并一躍成為在線交易的主要構成部分。由圖1.1可以看出,近十年逡逑來我國互聯(lián)網(wǎng)得到了飛速的發(fā)展。截止2017年,我國網(wǎng)民數(shù)量己經(jīng)超過7.5億,逡逑互聯(lián)網(wǎng)普及率己經(jīng)超過50%;ヂ(lián)網(wǎng)技術的不斷發(fā)展為電子商務提供了良好的平逡逑臺和載體,傳統(tǒng)企業(yè)也開始不斷以互聯(lián)網(wǎng)為工具謀求自身發(fā)展。如何敦促傳統(tǒng)行逡逑業(yè)與互聯(lián)網(wǎng)技術相互結合、相互帶動、相互發(fā)展,真正做到“互聯(lián)網(wǎng)+”的全面普逡逑及,是當今傳統(tǒng)企業(yè)需要考慮的一個重要的問題。逡逑tiiiiiiiiN逡逑圖1.1邋2007-2017年我國網(wǎng)民數(shù)量及互聯(lián)網(wǎng)普及率逡逑Figl邋.1邋Number邋of邋Internet邋users邋and邋Internet邋penetration邋rate邋of邋China邋between邋2017邋to邋2017逡逑從企業(yè)運營過程來說,旅游的過程就是游客購買相關服務或者產(chǎn)品的一系列逡逑活動的綜合。目前,傳統(tǒng)旅游行業(yè)仍存在一定的缺陷如:消費者接受旅游信息不逡逑足,旅游企業(yè)與消費者交互不足等。這些不足一方面導致游客需要花費大量時間逡逑和精力在旅游目的地信息搜集以及評估中
件采集了相關旅游評論文本數(shù)據(jù),整合得到旅游在線評論情感分析語料庫。由于逡逑本文研宄的是網(wǎng)絡在線評論文本,,故在it論文對在線評論中包含的評分、圖片以逡逑及時間等相關信息予以舍棄。圖3.4以攜程網(wǎng)站中大別山風景區(qū)在線評論數(shù)據(jù)為例逡逑對論文數(shù)據(jù)集進行了展示。逡逑別山Tt£^琴:博S3 ̄T丁是"萬便:?至X sEfiif::〔e羧?NB芑三.+引山萬竽了巧'可逡逑三.三冿蘭寫p}大巴妄曠缸山礦了*邋?纟欯芏Hi!丈#晟劍蝌濁
本文編號:2671173
【圖文】:
隨著互聯(lián)網(wǎng)的不斷發(fā)展以及經(jīng)濟全球化的不斷加深,大數(shù)據(jù)等相關技術的發(fā)逡逑展推動了全球電子商務的發(fā)展和壯大。二十一世紀初期,電子商務在線交易數(shù)量逡逑開始成倍增長,并一躍成為在線交易的主要構成部分。由圖1.1可以看出,近十年逡逑來我國互聯(lián)網(wǎng)得到了飛速的發(fā)展。截止2017年,我國網(wǎng)民數(shù)量己經(jīng)超過7.5億,逡逑互聯(lián)網(wǎng)普及率己經(jīng)超過50%;ヂ(lián)網(wǎng)技術的不斷發(fā)展為電子商務提供了良好的平逡逑臺和載體,傳統(tǒng)企業(yè)也開始不斷以互聯(lián)網(wǎng)為工具謀求自身發(fā)展。如何敦促傳統(tǒng)行逡逑業(yè)與互聯(lián)網(wǎng)技術相互結合、相互帶動、相互發(fā)展,真正做到“互聯(lián)網(wǎng)+”的全面普逡逑及,是當今傳統(tǒng)企業(yè)需要考慮的一個重要的問題。逡逑tiiiiiiiiN逡逑圖1.1邋2007-2017年我國網(wǎng)民數(shù)量及互聯(lián)網(wǎng)普及率逡逑Figl邋.1邋Number邋of邋Internet邋users邋and邋Internet邋penetration邋rate邋of邋China邋between邋2017邋to邋2017逡逑從企業(yè)運營過程來說,旅游的過程就是游客購買相關服務或者產(chǎn)品的一系列逡逑活動的綜合。目前,傳統(tǒng)旅游行業(yè)仍存在一定的缺陷如:消費者接受旅游信息不逡逑足,旅游企業(yè)與消費者交互不足等。這些不足一方面導致游客需要花費大量時間逡逑和精力在旅游目的地信息搜集以及評估中
件采集了相關旅游評論文本數(shù)據(jù),整合得到旅游在線評論情感分析語料庫。由于逡逑本文研宄的是網(wǎng)絡在線評論文本,,故在it論文對在線評論中包含的評分、圖片以逡逑及時間等相關信息予以舍棄。圖3.4以攜程網(wǎng)站中大別山風景區(qū)在線評論數(shù)據(jù)為例逡逑對論文數(shù)據(jù)集進行了展示。逡逑別山Tt£^琴:博S3 ̄T丁是"萬便:?至X sEfiif::〔e羧?NB芑三.+引山萬竽了巧'可逡逑三.三冿蘭寫p}大巴妄曠缸山礦了*邋?纟欯芏Hi!丈#晟劍蝌濁
本文編號:2671173
本文鏈接:http://sikaile.net/guanlilunwen/lvyoujiudianguanlilunwen/2671173.html
教材專著