天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

面向短文本的情感分類算法研究

發(fā)布時(shí)間:2021-08-20 15:37
  伴隨著信息技術(shù)的突飛猛進(jìn)以及移動(dòng)互聯(lián)網(wǎng)的快速普及,廣大群眾更樂于在互聯(lián)網(wǎng)上發(fā)表自己的評(píng)論、分享自己的生活,這創(chuàng)造了互聯(lián)網(wǎng)上海量、包含豐富情感信息的短文本語料庫。對(duì)短文本進(jìn)行情感分類早已經(jīng)不僅是學(xué)術(shù)范圍內(nèi)的任務(wù),生活中購物網(wǎng)站通過對(duì)消費(fèi)評(píng)價(jià)信息進(jìn)行分析,幫助消費(fèi)者消除消費(fèi)者和商家之間的信息不對(duì)稱,使得消費(fèi)者購買到滿意的商品和享受到優(yōu)質(zhì)的服務(wù)。政府通過輿情分析系統(tǒng),利用短文本分析技術(shù)引導(dǎo)輿論走向,保護(hù)民眾利益、維持國家安全與穩(wěn)定,成為新時(shí)代為人民服務(wù)的重要手段和途徑。因此,面向短文本的情感分類研究有著重要的理論價(jià)值和現(xiàn)實(shí)意義。本文以“面向短文本的情感分類算法研究”為題展開研究,對(duì)當(dāng)前國內(nèi)外研究現(xiàn)狀和主流算法進(jìn)行了深入的介紹和分析。針對(duì)短文本缺乏豐富的上下文語義信息這一研究難點(diǎn),從文本表示和分類模型兩個(gè)方面,進(jìn)行了以下研究:(1)分布式向量化模型Paragraph Vector是一種隱性語義模型,該模型訓(xùn)練出的向量的每一個(gè)維度的含義人們無法解釋,且該模型的訓(xùn)練只運(yùn)用了局部窗口的信息,無法對(duì)窗口之外甚至整個(gè)語料庫的信息加以利用。針對(duì)以上問題,本文提出了一種面向短文本的詞對(duì)主題句向量模型BTPV... 

【文章來源】:山西大學(xué)山西省

【文章頁數(shù)】:67 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

面向短文本的情感分類算法研究


BTM概率圖模型

模型圖,概率圖,模型,主題


的主題分布可按公式(2.6)求得:,()()()()()()()()(|)(|) bddbzijijbnbnbPzPwzPwzPzPwzPwzP( z|d)PzbPbd表示詞對(duì)被分配到主題z 的次數(shù),wzn|表示詞w被分配主題z 的次本集中的不同單詞的單詞數(shù), n (b)d是文檔 d 中詞對(duì) b 出現(xiàn)的次程可以在文獻(xiàn)[30]中找到。 BTM 的啟發(fā)下,有關(guān)學(xué)者又提出了專門針對(duì)短文本情感的弱監(jiān)督 SSTM,該模型本質(zhì)上是概率混合模型,該模型模擬整個(gè)詞對(duì)生習(xí)出文本中有關(guān)情感和主題的信息[34]。較之于 BTM,該模型的優(yōu)測(cè)情感于主題,改進(jìn)了 BTM 只考慮主題信息的缺陷。圖 2.2 為 S型。

模型圖,模型,矩陣,中心詞


第二章 短文本情感分類算法綜述機(jī)初始化的矩陣 D 相乘,隨之被映射為固定維度向量,即矩陣 D 中的列向量個(gè)上下文詞也采用同樣的隨機(jī)初始化相乘的辦法被表示為矩陣 W 中的一個(gè)量,然后可將得出的 paragraph vector 和 word vector 進(jìn)行直接相加操作尾拼接操作,來預(yù)測(cè)上下文的中心詞。

【參考文獻(xiàn)】:
期刊論文
[1]網(wǎng)絡(luò)評(píng)論方面級(jí)觀點(diǎn)挖掘方法研究綜述[J]. 韓忠明,李夢(mèng)琪,劉雯,張夢(mèng)玫,段大高,于重重.  軟件學(xué)報(bào). 2018(02)
[2]基于半監(jiān)督CRF的跨領(lǐng)域中文分詞[J]. 鄧麗萍,羅智勇.  中文信息學(xué)報(bào). 2017(04)
[3]基于情感詞向量的微博情感分類[J]. 杜慧,徐學(xué)可,伍大勇,劉悅,余智華,程學(xué)旗.  中文信息學(xué)報(bào). 2017(03)
[4]大規(guī)模情感詞典的構(gòu)建及其在情感分類中的應(yīng)用[J]. 趙妍妍,秦兵,石秋慧,劉挺.  中文信息學(xué)報(bào). 2017(02)
[5]用于微博情感分析的一種情感語義增強(qiáng)的深度學(xué)習(xí)模型[J]. 何炎祥,孫松濤,牛菲菲,李飛.  計(jì)算機(jī)學(xué)報(bào). 2017(04)
[6]面向短文本情感分類的特征拓?fù)渚酆夏P蚚J]. 胡楊,馮旭鵬,黃青松,付曉東,劉驪,劉利軍.  中文信息學(xué)報(bào). 2016(05)
[7]面向產(chǎn)品評(píng)論分析的短文本情感主題模型[J]. 熊蜀峰,姬東鴻.  自動(dòng)化學(xué)報(bào). 2016(08)
[8]情感詞典自動(dòng)構(gòu)建方法綜述[J]. 王科,夏睿.  自動(dòng)化學(xué)報(bào). 2016(04)
[9]短文本理解研究[J]. 王仲遠(yuǎn),程健鵬,王海勛,文繼榮.  計(jì)算機(jī)研究與發(fā)展. 2016(02)
[10]結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和詞語情感序列特征的中文情感分析[J]. 陳釗,徐睿峰,桂林,陸勤.  中文信息學(xué)報(bào). 2015(06)



本文編號(hào):3353763

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3353763.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4cad2***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com