天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于字符級卷積神經(jīng)網(wǎng)絡(luò)的民宿顧客意見挖掘

發(fā)布時(shí)間:2021-04-27 10:00
  在線評論蘊(yùn)含著豐富的顧客意見信息,傳統(tǒng)意見挖掘的方式具有數(shù)據(jù)稀疏和樣本分布不均勻的問題,本文以公開在線非結(jié)構(gòu)化數(shù)據(jù)為基礎(chǔ),通過數(shù)據(jù)的結(jié)構(gòu)化抽取、無監(jiān)督聚類和深度學(xué)習(xí)分類技術(shù),以在線民宿的評論數(shù)據(jù)開展了顧客意見挖掘方面的研究,最后將多種文本分類算法進(jìn)行對比實(shí)驗(yàn),敘述了本文模型在情感分析上的優(yōu)勢,具體的研究貢獻(xiàn)體現(xiàn)在以下三個(gè)方面。第一,設(shè)計(jì)了基于Requests POST和Scrapy相結(jié)合的攜程民宿評論數(shù)據(jù)采集方法。該方式針對民宿板塊網(wǎng)頁的特殊結(jié)構(gòu),利用Requests POST解決網(wǎng)頁動(dòng)態(tài)加載的問題,結(jié)合Scrapy解決爬蟲多線程采集的問題,通過這兩種技術(shù)相結(jié)合所得到的數(shù)據(jù),可以方便的對數(shù)據(jù)進(jìn)行抽取,并將處理后的結(jié)果自動(dòng)存入數(shù)據(jù)庫。仿真實(shí)驗(yàn)表明,該方式可以增加攜程民宿板塊的數(shù)據(jù)采集效率,在采集速度和質(zhì)量上均優(yōu)于基于網(wǎng)頁加載的Selenium技術(shù)。第二,設(shè)計(jì)了基于隱含狄利克雷聚類的民宿主題屬性詞典構(gòu)造方法。首先民宿評論容易一句中出現(xiàn)多個(gè)民宿主題,以標(biāo)點(diǎn)符號為間隔能使得分散在一段評論中的不同評價(jià)主體通過標(biāo)點(diǎn)符號被分開,通過詞性標(biāo)注技術(shù)選取每段評論的名詞,然后利用多種向量化方式對評論文本進(jìn)行... 

【文章來源】:重慶師范大學(xué)重慶市

【文章頁數(shù)】:65 頁

【學(xué)位級別】:碩士

【文章目錄】:
中文摘要
英文摘要
1 緒論
    1.1 研究背景和意義
    1.2 民宿意見挖掘應(yīng)用現(xiàn)狀
    1.3 研究內(nèi)容
    1.4 本文組織結(jié)構(gòu)
2 意見挖掘相關(guān)技術(shù)及選型
    2.1 網(wǎng)絡(luò)爬蟲相關(guān)技術(shù)及選型
        2.1.1 基于Requests的爬蟲技術(shù)
        2.1.2 基于Scrapy的爬蟲技術(shù)
        2.1.3 爬蟲技術(shù)分析及選型
    2.2 主題提取相關(guān)技術(shù)及選型
        2.2.1 基于統(tǒng)計(jì)的主題提取
        2.2.2 基于概率的主題提取
        2.2.3 基于距離的主題提取
        2.2.4 主題提取技術(shù)分析及選型
    2.3 文本情感分析相關(guān)技術(shù)及選型
        2.3.1 基于規(guī)則的情感分析
        2.3.2 基于傳統(tǒng)機(jī)器學(xué)習(xí)的情感分析
        2.3.3 基于深度學(xué)習(xí)的情感分析
        2.3.4 情感分析技術(shù)分析及選型
    2.4 本章小結(jié)
3 結(jié)合Requests和 Scrapy的攜程民宿評論采集
    3.1 網(wǎng)站頁面結(jié)構(gòu)分析
        3.1.1 網(wǎng)頁結(jié)構(gòu)
        3.1.2 網(wǎng)頁解析
        3.1.3 鏈接拼接
    3.2 數(shù)據(jù)采集系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
        3.2.1 網(wǎng)絡(luò)爬蟲模塊化設(shè)計(jì)
        3.2.2 網(wǎng)絡(luò)爬蟲定制化改造
        3.2.3 數(shù)據(jù)表結(jié)構(gòu)
    3.3 采集性能測試
    3.4 本章小結(jié)
4 基于LDA的民宿主題提取
    4.1 LDA主題提取算法
    4.2 實(shí)驗(yàn)設(shè)計(jì)
        4.2.1 流程設(shè)計(jì)
        4.2.2 主題建模
        4.2.3 主題抽取
    4.3 實(shí)驗(yàn)分析
    4.4 本章小結(jié)
5 基于字符級卷積神經(jīng)網(wǎng)絡(luò)的情感強(qiáng)度識(shí)別
    5.1 基于弱監(jiān)督預(yù)訓(xùn)練構(gòu)建數(shù)據(jù)集
    5.2 卷積神經(jīng)網(wǎng)絡(luò)情感分析
        5.2.1 字符向量輸入層
        5.2.2 一維卷積層
        5.2.3 全連接層
        5.2.4 Dropout層
        5.2.5 情感極性輸出層
    5.3 民宿意見挖掘
        5.3.1 數(shù)據(jù)預(yù)處理
        5.3.2 實(shí)驗(yàn)環(huán)境
        5.3.3 流程設(shè)計(jì)
        5.3.4 模型評價(jià)
        5.3.5 系統(tǒng)實(shí)現(xiàn)
    5.4 本章小結(jié)
6 總結(jié)與展望
    6.1 總結(jié)
    6.2 展望
參考文獻(xiàn)
附錄A:作者攻讀碩士學(xué)位期間發(fā)表論文及科研情況
致謝


【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的文本表示方法[J]. 李楓林,柯佳.  情報(bào)科學(xué). 2019(01)
[2]基于主題—情感挖掘模型的微博評論情感分類研究[J]. 朱曉霞,宋嘉欣,孟建芳.  情報(bào)理論與實(shí)踐. 2019(05)
[3]基于K-means聚類的調(diào)查問卷動(dòng)態(tài)賦權(quán)統(tǒng)計(jì)方法[J]. 李曉英,周大濤.  統(tǒng)計(jì)與決策. 2018(23)
[4]融合演化特征的公共安全事件微博情感分析[J]. 曾子明,萬品玉.  情報(bào)科學(xué). 2018(12)
[5]含追加的在線評論有用性感知影響因素研究——基于眼動(dòng)實(shí)驗(yàn)[J]. 王翠翠,高慧.  現(xiàn)代情報(bào). 2018(12)
[6]一種基于共詞網(wǎng)絡(luò)的社交媒體數(shù)據(jù)主題挖掘方法[J]. 王艷東,付小康,李萌萌.  武漢大學(xué)學(xué)報(bào)(信息科學(xué)版). 2018(12)
[7]基于CSSCI的我國隱性知識(shí)研究的文獻(xiàn)計(jì)量分析[J]. 王曉紅,任曉菲.  管理學(xué)報(bào). 2018(12)
[8]基于SERVQUAL模型的旅游景區(qū)服務(wù)質(zhì)量問題研究——以鼓浪嶼為例[J]. 步會(huì)敏,魏敏,林娜.  中國農(nóng)業(yè)資源與區(qū)劃. 2018(09)
[9]基于Staay多情感等級的汽車消費(fèi)者行為偏好研究[J]. 周福禮,侯建,布朝輝,杜建輝.  工業(yè)工程與管理. 2019(01)
[10]中國共享民宿的制度規(guī)制路徑探析[J]. 姚瑤.  行政管理改革. 2018(10)

碩士論文
[1]基于游客感知的鄉(xiāng)村旅游公共衛(wèi)生服務(wù)質(zhì)量評價(jià)研究[D]. 孫凱.西北大學(xué) 2018



本文編號:3163263

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3163263.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9ba38***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com