酒店在線評論的情感傾向挖掘方法應(yīng)用研究
發(fā)布時間:2017-10-28 03:26
本文關(guān)鍵詞:酒店在線評論的情感傾向挖掘方法應(yīng)用研究
更多相關(guān)文章: 在線評論 情感傾向分析 機(jī)器學(xué)習(xí) 隨機(jī)森林 SVM
【摘要】:愈來愈多的在線消費用戶開始瀏覽大量的網(wǎng)絡(luò)評論來了解產(chǎn)品和服務(wù)的口碑,幫助自己做出可靠的決策。同時網(wǎng)絡(luò)客戶評論作為反饋機(jī)制也幫助了服務(wù)提供商改進(jìn)其服務(wù)從而獲得競爭力。但是,網(wǎng)絡(luò)評論數(shù)量的飛速增長,使得信息內(nèi)容越來越龐雜,造成客戶評論中有用信息難以獲取的后果,尤其使得客戶難以在短時間內(nèi)獲得對于人物、事件、產(chǎn)品的觀點和態(tài)度。因此,迫切需要一定的技術(shù)手段來使這一過程變得更為準(zhǔn)確而便捷,此時“評論挖掘”應(yīng)運而生并吸引了眾多研究者進(jìn)行學(xué)習(xí)和研究。評論挖掘主要涉及情感傾向分析、特征挖掘、主觀內(nèi)容識別等;其中情感傾向性分析目的是通過挖掘和分析文本中的立場、觀點、情緒、好惡等主觀信息,對文本中的主觀態(tài)度進(jìn)行判斷,涉及人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、自然語言處理等多個領(lǐng)域。在英文評論研究領(lǐng)域,研究者已初步取得一些成果,而針對中文網(wǎng)絡(luò)用戶評論的研究卻仍處于起步階段。隨著中國電子商務(wù)在世界領(lǐng)域內(nèi)的崛起,亟需關(guān)于中文評論中有用信息的自動提取的先進(jìn)技術(shù)。本文以中文網(wǎng)絡(luò)中對形成旅游預(yù)訂決策非常重要的酒店評論為研究對象展開探討。酒店在線評論是非常具有代表性的,與其它在線評論不同的是其更受客戶的依賴,對客戶是否進(jìn)行產(chǎn)品預(yù)訂或購買起到?jīng)Q定性作用;它是顧客對酒店服務(wù)質(zhì)量的真實感知,學(xué)術(shù)界已有利用其進(jìn)行酒店服務(wù)質(zhì)量研究的相關(guān)成果,但多采用內(nèi)容分析法,不能對評論進(jìn)行批量處理,成果應(yīng)用大受限制。 基于以上問題,本文采用機(jī)器學(xué)習(xí)的方法針對網(wǎng)絡(luò)評論文本進(jìn)行情感傾向性分析研究,旨在為中文領(lǐng)域內(nèi)的客戶和企業(yè)提供更為方便和科學(xué)的評論挖掘工具。本文采用開源爬蟲框架從攜程網(wǎng)客戶評論獲取語料并按六種不同的評價對象類別進(jìn)行分類;重點詳細(xì)介紹了語料庫的預(yù)處理,包括中文分詞和去無用詞;然后選用隨機(jī)森林降序排列特征提取方法和SVM標(biāo)準(zhǔn)分類器,結(jié)合本文提出的客戶評論情感模型在R語言環(huán)境中實現(xiàn)了多種算法分類結(jié)果的進(jìn)一步改善;實驗結(jié)果表明該計算路徑下得到的分類效果更好、準(zhǔn)確率更高,不僅克服了文本分析中高維稀疏的數(shù)據(jù)問題及訓(xùn)練集中的噪聲問題,并具有穩(wěn)定的面向海量web文本切分的實用性能,實驗結(jié)果還表明這種分類后的傾向性分析更能準(zhǔn)確和細(xì)致地反映客戶的立場和觀點,幫助管理者快速地掌握客戶對于酒店各個方面的喜愛或者厭惡程度,具有實際的意義。
【關(guān)鍵詞】:在線評論 情感傾向分析 機(jī)器學(xué)習(xí) 隨機(jī)森林 SVM
【學(xué)位授予單位】:廣東工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.1;F713.36;F719
【目錄】:
- 摘要4-5
- Abstract5-6
- 目錄6-9
- Content9-11
- 第一章 緒論11-19
- 1.1 研究背景及意義11-14
- 1.1.1 研究背景11-13
- 1.1.2 研究意義13-14
- 1.2 研究內(nèi)容及組織結(jié)構(gòu)14-16
- 1.2.1 研究對象及主要內(nèi)容14-16
- 1.2.2 論文具體章節(jié)結(jié)構(gòu)16
- 1.3 技術(shù)路線與創(chuàng)新點16-18
- 1.3.1 技術(shù)路線16-17
- 1.3.2 創(chuàng)新點17-18
- 1.4 課題來源18-19
- 第二章 隨機(jī)森林和支持向量機(jī)理論綜述19-32
- 2.1 情感分析技術(shù)研究現(xiàn)狀19-23
- 2.1.1 情感分析國內(nèi)外研究現(xiàn)狀19-21
- 2.1.2 機(jī)器學(xué)習(xí)方法21-23
- 2.2 隨機(jī)森林特征提取23-28
- 2.2.1 RF的概念、特點及生成過程23-25
- 2.2.2 特征提取的研究現(xiàn)狀25-26
- 2.2.3 隨機(jī)森林用于提取特征26-28
- 2.3 支持向量機(jī)28-31
- 2.3.1 SVM的概念和特點28-29
- 2.3.2 SVM的目標(biāo)和優(yōu)勢29-30
- 2.3.3 R中的SVM標(biāo)準(zhǔn)分類30-31
- 2.4 本章小結(jié)31-32
- 第三章 情感心理模型與評論文本初步挖掘32-46
- 3.1 中文文本情感模型32-36
- 3.1.1 情感心理模型研究現(xiàn)狀32-34
- 3.1.2 中文在線評論的情感心理模型的構(gòu)建34
- 3.1.3 中文在線評論的情感心理模型的確立34-36
- 3.2 評論文本初步挖掘36-45
- 3.2.1 網(wǎng)絡(luò)爬蟲36-40
- 3.2.2 網(wǎng)頁信息提取40-42
- 3.2.3 中文分詞42-44
- 3.2.4 停止詞表44-45
- 3.3 本章小結(jié)45-46
- 第四章 R語言環(huán)境下的情感傾向分析46-65
- 4.1 R概述46-48
- 4.1.1 R語言及其特點介紹46-47
- 4.1.2 R環(huán)境下的實驗?zāi)繕?biāo)47-48
- 4.1.3 R環(huán)境下的計算路徑48
- 4.2 實驗部分48-64
- 4.2.1 實驗流程及步驟49-50
- 4.2.2 R運行環(huán)境及安裝配置50-57
- 4.2.3 參數(shù)設(shè)置及實現(xiàn)代碼57-61
- 4.2.4 實驗結(jié)果及分析61-64
- 4.3 本章小結(jié)64-65
- 結(jié)論65-66
- 參考文獻(xiàn)66-71
- 攻讀學(xué)位期間發(fā)表的論文71-73
- 致謝73
【引證文獻(xiàn)】
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 童碧莎;我國旅游市場秩序的演變、評價及對策研究[D];北京交通大學(xué);2016年
,本文編號:1106476
本文鏈接:http://sikaile.net/jingjilunwen/fwjj/1106476.html
最近更新
教材專著