天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

酒店在線評論的情感傾向挖掘方法應(yīng)用研究

發(fā)布時間:2017-10-28 03:26

  本文關(guān)鍵詞:酒店在線評論的情感傾向挖掘方法應(yīng)用研究


  更多相關(guān)文章: 在線評論 情感傾向分析 機(jī)器學(xué)習(xí) 隨機(jī)森林 SVM


【摘要】:愈來愈多的在線消費用戶開始瀏覽大量的網(wǎng)絡(luò)評論來了解產(chǎn)品和服務(wù)的口碑,幫助自己做出可靠的決策。同時網(wǎng)絡(luò)客戶評論作為反饋機(jī)制也幫助了服務(wù)提供商改進(jìn)其服務(wù)從而獲得競爭力。但是,網(wǎng)絡(luò)評論數(shù)量的飛速增長,使得信息內(nèi)容越來越龐雜,造成客戶評論中有用信息難以獲取的后果,尤其使得客戶難以在短時間內(nèi)獲得對于人物、事件、產(chǎn)品的觀點和態(tài)度。因此,迫切需要一定的技術(shù)手段來使這一過程變得更為準(zhǔn)確而便捷,此時“評論挖掘”應(yīng)運而生并吸引了眾多研究者進(jìn)行學(xué)習(xí)和研究。評論挖掘主要涉及情感傾向分析、特征挖掘、主觀內(nèi)容識別等;其中情感傾向性分析目的是通過挖掘和分析文本中的立場、觀點、情緒、好惡等主觀信息,對文本中的主觀態(tài)度進(jìn)行判斷,涉及人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、自然語言處理等多個領(lǐng)域。在英文評論研究領(lǐng)域,研究者已初步取得一些成果,而針對中文網(wǎng)絡(luò)用戶評論的研究卻仍處于起步階段。隨著中國電子商務(wù)在世界領(lǐng)域內(nèi)的崛起,亟需關(guān)于中文評論中有用信息的自動提取的先進(jìn)技術(shù)。本文以中文網(wǎng)絡(luò)中對形成旅游預(yù)訂決策非常重要的酒店評論為研究對象展開探討。酒店在線評論是非常具有代表性的,與其它在線評論不同的是其更受客戶的依賴,對客戶是否進(jìn)行產(chǎn)品預(yù)訂或購買起到?jīng)Q定性作用;它是顧客對酒店服務(wù)質(zhì)量的真實感知,學(xué)術(shù)界已有利用其進(jìn)行酒店服務(wù)質(zhì)量研究的相關(guān)成果,但多采用內(nèi)容分析法,不能對評論進(jìn)行批量處理,成果應(yīng)用大受限制。 基于以上問題,本文采用機(jī)器學(xué)習(xí)的方法針對網(wǎng)絡(luò)評論文本進(jìn)行情感傾向性分析研究,旨在為中文領(lǐng)域內(nèi)的客戶和企業(yè)提供更為方便和科學(xué)的評論挖掘工具。本文采用開源爬蟲框架從攜程網(wǎng)客戶評論獲取語料并按六種不同的評價對象類別進(jìn)行分類;重點詳細(xì)介紹了語料庫的預(yù)處理,包括中文分詞和去無用詞;然后選用隨機(jī)森林降序排列特征提取方法和SVM標(biāo)準(zhǔn)分類器,結(jié)合本文提出的客戶評論情感模型在R語言環(huán)境中實現(xiàn)了多種算法分類結(jié)果的進(jìn)一步改善;實驗結(jié)果表明該計算路徑下得到的分類效果更好、準(zhǔn)確率更高,不僅克服了文本分析中高維稀疏的數(shù)據(jù)問題及訓(xùn)練集中的噪聲問題,并具有穩(wěn)定的面向海量web文本切分的實用性能,實驗結(jié)果還表明這種分類后的傾向性分析更能準(zhǔn)確和細(xì)致地反映客戶的立場和觀點,幫助管理者快速地掌握客戶對于酒店各個方面的喜愛或者厭惡程度,具有實際的意義。
【關(guān)鍵詞】:在線評論 情感傾向分析 機(jī)器學(xué)習(xí) 隨機(jī)森林 SVM
【學(xué)位授予單位】:廣東工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.1;F713.36;F719
【目錄】:
  • 摘要4-5
  • Abstract5-6
  • 目錄6-9
  • Content9-11
  • 第一章 緒論11-19
  • 1.1 研究背景及意義11-14
  • 1.1.1 研究背景11-13
  • 1.1.2 研究意義13-14
  • 1.2 研究內(nèi)容及組織結(jié)構(gòu)14-16
  • 1.2.1 研究對象及主要內(nèi)容14-16
  • 1.2.2 論文具體章節(jié)結(jié)構(gòu)16
  • 1.3 技術(shù)路線與創(chuàng)新點16-18
  • 1.3.1 技術(shù)路線16-17
  • 1.3.2 創(chuàng)新點17-18
  • 1.4 課題來源18-19
  • 第二章 隨機(jī)森林和支持向量機(jī)理論綜述19-32
  • 2.1 情感分析技術(shù)研究現(xiàn)狀19-23
  • 2.1.1 情感分析國內(nèi)外研究現(xiàn)狀19-21
  • 2.1.2 機(jī)器學(xué)習(xí)方法21-23
  • 2.2 隨機(jī)森林特征提取23-28
  • 2.2.1 RF的概念、特點及生成過程23-25
  • 2.2.2 特征提取的研究現(xiàn)狀25-26
  • 2.2.3 隨機(jī)森林用于提取特征26-28
  • 2.3 支持向量機(jī)28-31
  • 2.3.1 SVM的概念和特點28-29
  • 2.3.2 SVM的目標(biāo)和優(yōu)勢29-30
  • 2.3.3 R中的SVM標(biāo)準(zhǔn)分類30-31
  • 2.4 本章小結(jié)31-32
  • 第三章 情感心理模型與評論文本初步挖掘32-46
  • 3.1 中文文本情感模型32-36
  • 3.1.1 情感心理模型研究現(xiàn)狀32-34
  • 3.1.2 中文在線評論的情感心理模型的構(gòu)建34
  • 3.1.3 中文在線評論的情感心理模型的確立34-36
  • 3.2 評論文本初步挖掘36-45
  • 3.2.1 網(wǎng)絡(luò)爬蟲36-40
  • 3.2.2 網(wǎng)頁信息提取40-42
  • 3.2.3 中文分詞42-44
  • 3.2.4 停止詞表44-45
  • 3.3 本章小結(jié)45-46
  • 第四章 R語言環(huán)境下的情感傾向分析46-65
  • 4.1 R概述46-48
  • 4.1.1 R語言及其特點介紹46-47
  • 4.1.2 R環(huán)境下的實驗?zāi)繕?biāo)47-48
  • 4.1.3 R環(huán)境下的計算路徑48
  • 4.2 實驗部分48-64
  • 4.2.1 實驗流程及步驟49-50
  • 4.2.2 R運行環(huán)境及安裝配置50-57
  • 4.2.3 參數(shù)設(shè)置及實現(xiàn)代碼57-61
  • 4.2.4 實驗結(jié)果及分析61-64
  • 4.3 本章小結(jié)64-65
  • 結(jié)論65-66
  • 參考文獻(xiàn)66-71
  • 攻讀學(xué)位期間發(fā)表的論文71-73
  • 致謝73

【引證文獻(xiàn)】

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 童碧莎;我國旅游市場秩序的演變、評價及對策研究[D];北京交通大學(xué);2016年

,

本文編號:1106476

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/fwjj/1106476.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d341b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com