天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于酒業(yè)大數(shù)據(jù)的輿情信息分析研究

發(fā)布時間:2021-02-07 07:35
  近年來,中國主要的白酒企業(yè)都在積極努力進(jìn)行數(shù)字化轉(zhuǎn)型升級,在這個過程中,要想深度挖掘用戶偏好和把握行業(yè)熱點就必須對網(wǎng)絡(luò)上的相關(guān)輿情信息進(jìn)行充分分析。然而網(wǎng)絡(luò)上的評論、新聞和動態(tài)都沒有明確的類別標(biāo)簽,這增加了輿情分析的難度。如何有效分析大量的網(wǎng)絡(luò)輿情文本是各個酒企都面臨的問題。傳統(tǒng)的輿情信息分析,大多是基于監(jiān)督學(xué)習(xí)的模型且各個模型之間相互獨立缺少聯(lián)系,本文針對網(wǎng)絡(luò)輿情數(shù)據(jù)樣本量大且標(biāo)注困難等問題,提出了新的解決思路。本文主要進(jìn)行了以下研究:1)本文利用基于圖卷積的半監(jiān)督文本分類模型對輿情信息進(jìn)行分類。網(wǎng)絡(luò)爬蟲采集的輿情信息雜亂無章,首先需要按照一定的標(biāo)準(zhǔn)進(jìn)行主題分類。由于網(wǎng)絡(luò)輿情數(shù)據(jù)量較大且標(biāo)注數(shù)據(jù)成本過高,有標(biāo)注數(shù)據(jù)占比較少,所以傳統(tǒng)的有監(jiān)督文本分類算法在這種場景下效果不理想。本文為了解決這個問題,提出了一種基于圖卷積網(wǎng)絡(luò)的半監(jiān)督文本分類算法SS-GCN,將文本分類任務(wù)轉(zhuǎn)化為圖分類任務(wù),實現(xiàn)了半監(jiān)督學(xué)習(xí),分類準(zhǔn)確率為0.896。通過與經(jīng)典的文本分類算法進(jìn)行對比實驗證實了基于圖卷積的半監(jiān)督學(xué)習(xí)的可行性和高效性。2)本文通過增加初始化聚類和倒排索引的方式對Single-Pass算法進(jìn)行了改... 

【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:84 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
abstract
第一章 緒論
    1.1 研究背景及意義
    1.2 國內(nèi)外相關(guān)研究現(xiàn)狀
        1.2.1 文本分類研究現(xiàn)狀
        1.2.2 話題檢測研究現(xiàn)狀
        1.2.3 情感分類研究現(xiàn)狀
    1.3 本文的主要工作和創(chuàng)新點
    1.4 本文結(jié)構(gòu)安排
第二章 輿情分析相關(guān)理論基礎(chǔ)
    2.1 酒業(yè)輿情信息數(shù)據(jù)預(yù)處理
        2.1.1 數(shù)據(jù)清洗
        2.1.2 中文分詞
        2.1.3 去停用詞
        2.1.4 詞向量技術(shù)
    2.2 經(jīng)典文本分類算法
        2.2.1 樸素貝葉斯
        2.2.2 Hierarchical Attention Network
    2.3 經(jīng)典話題檢測算法
        2.3.1 基于密度的聚類算法
        2.3.2 Single-Pass算法
    2.4 經(jīng)典情感分類算法
        2.4.1 情感詞典
    2.5 半監(jiān)督學(xué)習(xí)
    2.6 圖卷積網(wǎng)絡(luò)
    2.7 GRU
    2.8 本章小結(jié)
第三章 基于SS-GCN的酒業(yè)輿情分類算法
    3.1 數(shù)據(jù)采集與預(yù)處理
        3.1.1 數(shù)據(jù)采集
        3.1.2 數(shù)據(jù)清洗和標(biāo)注
        3.1.3 文本分詞和去停用詞
    3.2 SS-GCN半監(jiān)督文本分類模型
        3.2.1 文本圖表示
        3.2.2 兩層圖卷積網(wǎng)絡(luò)
        3.2.3 softmax層
    3.3 實驗與結(jié)果分析
        3.3.1 實驗環(huán)境
        3.3.2 分類模型評價指標(biāo)
        3.3.3 實驗設(shè)計
        3.3.4 滑動窗口的影響
        3.3.5 隱藏層維度的影響
        3.3.6 標(biāo)注數(shù)據(jù)的占比的影響
        3.3.7 單詞-文檔嵌入可視化
        3.3.8 不同模型對比實驗
    3.4 本章小結(jié)
第四章 基于改進(jìn)Single-Pass的酒業(yè)輿情話題檢測算法
    4.1 話題檢測數(shù)據(jù)集
    4.2 一種改進(jìn)的Single-Pass算法
    4.3 聲量計算
    4.4 實驗與結(jié)果分析
        4.4.1 實驗環(huán)境
        4.4.2 聚類模型評價指標(biāo)
        4.4.3 實驗設(shè)計
        4.4.4 模型聚類效果對比
        4.4.5 模型執(zhí)行時間對比
        4.4.6 事件聲量趨勢
    4.5 本章小結(jié)
第五章 基于Attention-BiGRU-CNN的酒業(yè)輿情情感分類算法
    5.1 情感分類數(shù)據(jù)集
    5.2 Attention-BiGRU-CNN情感分類模型
        5.2.1 文檔表示模塊
        5.2.2 卷積神經(jīng)網(wǎng)絡(luò)模塊
        5.2.3 輸出層
    5.3 實驗與結(jié)果分析
        5.3.1 實驗環(huán)境
        5.3.2 實驗設(shè)計
        5.3.3 模型分類效果對比
        5.3.4 卷積核大小的影響
        5.3.5 特征圖數(shù)量的影響
    5.4 本章小結(jié)
第六章 全文總結(jié)與展望
    6.1 全文總結(jié)
    6.2 后續(xù)工作展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的成果



本文編號:3021910

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3021910.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶29061***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com