天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 管理論文 > 酒店管理論文 >

基于方面的雙重傳播和模糊語(yǔ)言對(duì)沖酒店評(píng)論摘要研究

發(fā)布時(shí)間:2020-06-10 10:17
【摘要】:一直以來(lái),人們習(xí)慣于在對(duì)生活各方面問題做出決定之前詢問家人,朋友或?qū)<业囊庖?例如對(duì)研究的選擇、購(gòu)買的食物類型以及如何搭配著裝等。隨著互聯(lián)網(wǎng)越來(lái)越易于訪問以及社交網(wǎng)絡(luò)的穩(wěn)步增長(zhǎng),人們只需拿起電話就可以輕松獲得解決問題的答案,并且短短幾次之內(nèi),就可以得到一系列來(lái)于自世界各地的建議。人們可以找到許多擁有大量顧客評(píng)論的網(wǎng)站,在這些網(wǎng)站上用戶就自身獲得的服務(wù)或者購(gòu)買產(chǎn)品做出評(píng)價(jià),酒店領(lǐng)域也不例外。然而,這些信息擴(kuò)散性極強(qiáng)且數(shù)量巨大,從中提取有用的信息或者對(duì)其進(jìn)行快速分析存在很大的難度甚至是不可能完成的。當(dāng)前已有相關(guān)方面的研究開發(fā)出了各種技術(shù)根據(jù)極性對(duì)評(píng)論進(jìn)行分類分析,評(píng)論的極性可以分為三個(gè)方面,分別是:負(fù)面、正面以及中性。這種分類通常伴隨著文本摘要出現(xiàn),文本摘要就是將每個(gè)評(píng)論縮減為最為相關(guān)的術(shù)語(yǔ),并且依據(jù)所使用的模型,給出好的結(jié)果。文本摘要和文檔級(jí)別情感分析在許多領(lǐng)域均適用,但是對(duì)于酒店這類行業(yè),這種評(píng)論分析技術(shù)還不足以為酒店經(jīng)理提供更多關(guān)于評(píng)論的詳細(xì)信息。本文設(shè)計(jì)了一個(gè)新的系統(tǒng),該系統(tǒng)可以從每個(gè)評(píng)論中提取不同的相關(guān)特征方面,然后評(píng)估其情感。但是,由于系統(tǒng)生成的特征方面列表可能會(huì)一樣長(zhǎng),并且完全混雜在一起,所以難以瀏覽。此外,評(píng)論者使用不同表述方式來(lái)表達(dá)相同的特征方面。針對(duì)這個(gè)問題,本文所設(shè)計(jì)的系統(tǒng)提出了根據(jù)被定義的組別對(duì)各個(gè)特征方面進(jìn)行分類的解決方案,然后根據(jù)每一個(gè)組別概括其特征方面及其各自的情感。本研究設(shè)計(jì)的系統(tǒng)是一種無(wú)監(jiān)督的基于語(yǔ)料庫(kù)的方法,以酒店領(lǐng)域的雙重傳播為基礎(chǔ)同步提取意見以及產(chǎn)品特征。為了從模糊和異質(zhì)的句子中捕捉意見目標(biāo)和情感,論文利用模糊邏輯建立了一個(gè)關(guān)于在線酒店評(píng)論細(xì)粒度的基于特征方面的情感分析(ABSA)。這項(xiàng)研究將以全新的方式讓未來(lái)的客戶和酒店經(jīng)理受益。關(guān)于未來(lái)客戶,本研究旨在通過對(duì)每位用戶的評(píng)論進(jìn)行分析來(lái)突顯特定酒店的優(yōu)勢(shì)和劣勢(shì),這將有助于客戶快速掌握其正在尋找的信息。而且,可以更好地理解以前的客戶對(duì)其所提到的特征方面的看法,盡管文本的長(zhǎng)度和每家酒店的評(píng)論數(shù)量都很高。此外,處理即使是少數(shù)的復(fù)雜(經(jīng)常是相互矛盾的)評(píng)論也是一個(gè)難以理解的挑戰(zhàn)。另一方面,本文系統(tǒng)可以幫助減少客戶流失,客戶流失最初是由于客戶對(duì)酒店某些方面的不滿以及對(duì)管理人員的不了解造成的,也是由于社交媒體對(duì)酒店特定方面的不良宣傳所造成的。最終大概會(huì)有96%的不滿意客戶不會(huì)直接向公司投訴,所以酒店或服務(wù)上的問題(和排名)永遠(yuǎn)不會(huì)被管理人員注意到。事實(shí)上,不滿意的客戶可以在酒店預(yù)訂網(wǎng)站上進(jìn)行投訴,如果酒店經(jīng)理能夠發(fā)現(xiàn)其酒店的各個(gè)方面經(jīng)常在公共論壇上以消極或積極的方式被討論,就可以更好地解決這些問題并提高客戶滿意度,從而降低隱性成本,增加利潤(rùn)[1]。換句話說,研究的關(guān)鍵在于通過對(duì)每個(gè)用戶的評(píng)論進(jìn)行分析來(lái)突出特定酒店的優(yōu)勢(shì)和劣勢(shì);谔卣鞣矫娴那楦蟹治鲆恢笔且豁(xiàng)非常困難的任務(wù),其主要包含以下幾個(gè)核心子任務(wù):特征/意見提取,極性分類和總結(jié)。雖然一些研究人員已經(jīng)研究了每一個(gè)子任務(wù)的相關(guān)問題,但其算法需要額外的或外部的資源,因此仍需要被改進(jìn)。此外,許多現(xiàn)有的方法并沒有被應(yīng)用于酒店業(yè)。(1)在進(jìn)行句子分類的大量工作中,大部分研究通常將每個(gè)句子分為單個(gè)方面,而用戶則可能會(huì)談?wù)摰礁嗟姆矫。同時(shí),根據(jù)定義的一組術(shù)語(yǔ)對(duì)特征方面進(jìn)行分類需要大量時(shí)間以及用戶的補(bǔ)充工作。另外,有些用戶并沒有搜索具體的特征方面,或許查詢酒店之前的客人所談?wù)摰牟煌卣鞣矫嬉彩且粋(gè)不錯(cuò)的選擇。(2)大部分工作不涉及從目標(biāo)評(píng)論中提取隱含的特征方面。(3)很少有研究提出了對(duì)各特征方面進(jìn)行分類的系統(tǒng)。人們用不同的詞匯和表達(dá)來(lái)描述同一方面,應(yīng)該有一種機(jī)制對(duì)類似的方面進(jìn)行分類或分組。(4)監(jiān)督機(jī)器學(xué)習(xí)的大問題是它需要一組帶注釋的復(fù)審句作為訓(xùn)練樣例。(5)根據(jù)以前工作中確定的五點(diǎn),本文決定采用雙重傳播和模糊邏輯來(lái)實(shí)現(xiàn)基于特征方面的情感分析。雙重傳播方法有助于同時(shí)提取方面和意見詞。為了處理名詞短語(yǔ),動(dòng)詞意見和一些具體特征方面的提取,論文修改并添加了一些新的規(guī)則。隨著模糊語(yǔ)意修改邏輯的實(shí)施,本研究考慮使用副詞和修飾詞(反向詞)對(duì)每個(gè)特征方面進(jìn)行細(xì)粒度分類。根據(jù)特征方面類別和極性進(jìn)行特征方面概述,以便于快速訪問任一特征方面并從所有評(píng)論中獲得概述。本文建立了一個(gè)數(shù)據(jù)采集系統(tǒng),利用該系統(tǒng)不僅可以提取評(píng)論,還可以提取關(guān)于用戶(用戶名,用戶所在地)和酒店(酒店名稱,酒店星級(jí)掠奪,酒店位置(城市))的信息以及評(píng)論發(fā)布時(shí)間。本研究還在Mongo上安裝了一個(gè)數(shù)據(jù)庫(kù)系統(tǒng),可以導(dǎo)入和存儲(chǔ)具有不同數(shù)據(jù)類型的大量信息,快速地訪問以及輕松使用存儲(chǔ)的數(shù)據(jù)。作為后續(xù)工作的基礎(chǔ),本研究工作的第一部分是提取兼?zhèn)涮卣鞣矫?意見的語(yǔ)意修改(AOLH)表。這個(gè)表格由特征方面-意見組和與這個(gè)觀點(diǎn)(如果有的話)相關(guān)的不同的語(yǔ)意修改模型組成。提取階段用雙重傳播方法處理,其規(guī)則和算法已被修改為能夠提取AOLH的形式。提取AOLH之后,就進(jìn)入到意見分類階段。在這個(gè)階段,論文應(yīng)用考慮到語(yǔ)意修改的模糊函數(shù)。此函數(shù)將Senti Word Net給出的觀點(diǎn)分?jǐn)?shù)以及不同類型的語(yǔ)意修改作為參數(shù)。請(qǐng)注意,本研究中有3種類型語(yǔ)意修改,分別是:反向詞,程度增強(qiáng)詞以及程度減弱詞。根據(jù)不同語(yǔ)意修改的類型,模糊函數(shù)的功能是存在變化的,從而允許計(jì)算意見時(shí)存在偏振。在這個(gè)階段結(jié)束時(shí),本文將每個(gè)特征方面歸因于與之相關(guān)的意見的極性。系統(tǒng)的第三部分是特征方面分類。對(duì)于來(lái)自步驟2輸出的每個(gè)特征方面-極性,研究匯總給定類別。特征方面分類是通過手動(dòng)生成“特征方面——類別”語(yǔ)料庫(kù)來(lái)完成的,其實(shí)際上是一個(gè)字典,為每個(gè)類別定義一個(gè)種子列表。在將來(lái)自步驟2的列表的每個(gè)特征方面以及語(yǔ)料庫(kù)的種子向量化之后,本文計(jì)算每個(gè)特征方面與每個(gè)種子之間的相似性以確定特征方面所屬的類別。系統(tǒng)的最后一部分是特征方面匯總,該步驟顯示系統(tǒng)輸出的結(jié)果?偨Y(jié)可以更加全面的了解本文所做工作,即按照其類別收集每個(gè)特征方面,并且針對(duì)每個(gè)特征方面呈現(xiàn)列表,顯示出特征方面-極性組的出現(xiàn)頻率。本文分別使用系統(tǒng)中已實(shí)現(xiàn)的包括不同功能和篩選的場(chǎng)景來(lái)評(píng)估每個(gè)階段。在每個(gè)階段,論文都呈現(xiàn)了實(shí)驗(yàn)進(jìn)行的場(chǎng)景。在第一階段,即特征方面-意見提取中,首先測(cè)試了第二章中描述的各種功能的影響,以提高系統(tǒng)的準(zhǔn)確性。然后,第二次將本研究系統(tǒng)的提取與基于頻率的提取進(jìn)行了比較,本研究的系統(tǒng)以0.79的精度產(chǎn)生最佳輸出。第二個(gè)階段是模糊意見分類,其可以評(píng)估不同的修整功能。在定義不同的情景之后,本文分別評(píng)估每個(gè)情景的有效性,然后評(píng)估情景的組合。結(jié)果表明,情景組合比單獨(dú)采取更有效,本文選擇了呈現(xiàn)0.77準(zhǔn)確度的情景。第三步也是最后一步是特征方面分類。為了評(píng)估這種方法,本文將其與機(jī)器學(xué)習(xí)方法進(jìn)行比較,主要包括樸素貝葉斯,SGD和SVM三種方法。對(duì)比發(fā)現(xiàn),本研究的方法給出的結(jié)果最佳,其次是SVM。論文的實(shí)驗(yàn)結(jié)果可以幫助酒店管理者提高客戶滿意度,具體可以歸納為以下幾點(diǎn):(1)本文的系統(tǒng)是突出酒店客人表達(dá)意見不同特征方面的絕佳工具。在本文的數(shù)據(jù)集中,房間(31%),酒店(22%),位置(21%),員工(12.6%)和早餐(12.4%)是最受關(guān)注的五個(gè)方面。(2)從最頻繁的特征方面的極性分布結(jié)果來(lái)看,這些特征方面起到了主導(dǎo)作用!胺块g”和“地點(diǎn)”的價(jià)值最高,“房間”中不滿意用戶的比例也最高。另一方面,“地點(diǎn)”的負(fù)面意見率很低。因此可以推斷,必須付出相當(dāng)大的努力才能為用戶提供更適合其需求的房間。(3)第三點(diǎn)是非常重要的特征方面分類。酒店類別的比例最高(22.7%,其次是租金18%),服務(wù)比例為17.5%,房間為16.1%。在房間后,有12.5%的食物和飲料。最后兩個(gè)分別是房間設(shè)施,其比例為11.4%,金錢價(jià)值,其比例為1.8%。特征方面分類使我們能夠更好地評(píng)估出現(xiàn)的特征方面。沒有分類之前,“房間”出現(xiàn)的頻率最高,但是在分類之后是最常出現(xiàn)的是排在第四名的“位置”。歸功于分類,還可以發(fā)現(xiàn)屬于“房間設(shè)施”類別的方面也具有非常負(fù)面比情緒。而且,也許這個(gè)類別已經(jīng)導(dǎo)致“房間”特征方面有很高的負(fù)值。盡管分析結(jié)果很有意義,但仍存在一些不足。首先,數(shù)據(jù)集的大小并不能確保對(duì)所有酒店的特征方面進(jìn)行了分析,其他相關(guān)特征方面可能還沒有被發(fā)現(xiàn)。其次,在特征方面-意見提取系統(tǒng)中,本文只考慮了針對(duì)詞性“ADJ”(形容詞)的意見,而且也僅考慮POS標(biāo)簽是“名詞”的特征方面。這兩個(gè)考慮使本文在提取過程中遺漏了一些特征方面-意見組。并且Senti Word Net在確定某些形容詞的分?jǐn)?shù)時(shí)考慮到形容詞的上下文,給出了較低的分?jǐn)?shù),這致使本研究創(chuàng)建特定功能來(lái)調(diào)整分?jǐn)?shù)的值。為了運(yùn)用本研究并且改進(jìn)研究目標(biāo),可以考慮對(duì)主觀句子進(jìn)行類似的分析,依據(jù)獲得的結(jié)果,建立合作式酒店管理工具來(lái)幫助管理人員提高客戶滿意度?偠灾,這項(xiàng)研究已經(jīng)證明,基于特征方面的情感分析(ASBA)是一種非常有效的工具,可以用于從酒店評(píng)論中提取顧客提出的相關(guān)特征方面以及給出地對(duì)這些特征方面的感受。這個(gè)工具對(duì)于任何一個(gè)酒店經(jīng)理來(lái)說都是有價(jià)值的,不僅可以增加其營(yíng)業(yè)額,而且能夠更好地了解客戶的需求。
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:F719.2;F274

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 明拓思宇;陳鴻昶;;文本摘要研究進(jìn)展與趨勢(shì)[J];網(wǎng)絡(luò)與信息安全學(xué)報(bào);2018年06期

2 王知津;基于句子選擇的自動(dòng)文本摘要方法及其評(píng)價(jià)[J];現(xiàn)代圖書情報(bào)技術(shù);1998年01期

3 王成全;;基于專業(yè)詞典的文本摘要系統(tǒng)的探討[J];林區(qū)教學(xué);2008年02期

4 馬漢華;邵志清;過弋;;基于認(rèn)知心理學(xué)模型的自動(dòng)文本摘要生成技術(shù)[J];華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年06期

5 江開忠;李子成;顧君忠;;自動(dòng)文本摘要方法[J];計(jì)算機(jī)工程;2008年01期

6 王凱祥;;面向查詢的自動(dòng)文本摘要技術(shù)研究綜述[J];計(jì)算機(jī)科學(xué);2018年S2期

7 徐濤;;基于自動(dòng)文本摘要的中文移動(dòng)簡(jiǎn)訊系統(tǒng)[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2015年30期

8 程倩倩;田大鋼;;基于基本要素方法的中文自動(dòng)文本摘要模型[J];現(xiàn)代圖書情報(bào)技術(shù);2010年02期

9 林鴻飛,高仁t,

本文編號(hào):2706151


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/jiudianguanli/2706151.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶83265***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com