基于強(qiáng)化學(xué)習(xí)的個性化不良評論過濾算法研究
發(fā)布時間:2021-10-01 02:56
不良評論正在影響著數(shù)以億計的互聯(lián)網(wǎng)用戶,部分用戶因不良評論而抑郁甚至自殺。傳統(tǒng)的過濾不良評論的算法有兩種。一是通過簡單的關(guān)鍵詞過濾技術(shù)進(jìn)行評論過濾。二是在不良評論數(shù)據(jù)集上訓(xùn)練一個通用機(jī)器學(xué)習(xí)模型,然后使用此模型對評論進(jìn)行判別。以上兩種算法都沒有考慮到用戶個性化問題。由于不同用戶具有不同的背景、擁有不同的性格,所以他們對不良評論的判別標(biāo)準(zhǔn)也是不同。無論是關(guān)鍵字過濾還是訓(xùn)練出來的通用模型都遠(yuǎn)無法滿足用戶個性化需求。本文的主要工作是在不良評論過濾算法中引入用戶個性化配置文件,并且使用強(qiáng)化學(xué)習(xí)算法構(gòu)建可學(xué)習(xí)的用戶配置文件。本文將不良評論過濾算法分成兩個網(wǎng)絡(luò),一部分是特征提取網(wǎng)絡(luò),一部分是用戶配置文件。在特征提取網(wǎng)絡(luò)部分,本文實(shí)驗(yàn)了多種選擇,包括基于CNN、RNN和自注意力機(jī)制的模型。在用戶配置文件部分,由于本文不僅考慮到不同用戶之間的差異,而且還考慮到相同的用戶在不同的心情狀態(tài)下對于不良評論評判標(biāo)準(zhǔn)的差異,所以本文提出了三種基于強(qiáng)化學(xué)習(xí)的方法來構(gòu)建可學(xué)習(xí)的用戶配置文件。一是通過DQN算法或者PG算法使用用戶相關(guān)數(shù)據(jù)直接微調(diào)特征提取網(wǎng)絡(luò)使得網(wǎng)絡(luò)參數(shù)包含個性化信息。二是引入用戶特征向量,同樣也是使...
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:77 頁
【學(xué)位級別】:碩士
【部分圖文】:
文本分類流程圖
樸素貝葉斯分類器流程圖
RNN最后一個隱狀態(tài)作為句子特征用于分類
本文編號:3417118
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:77 頁
【學(xué)位級別】:碩士
【部分圖文】:
文本分類流程圖
樸素貝葉斯分類器流程圖
RNN最后一個隱狀態(tài)作為句子特征用于分類
本文編號:3417118
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3417118.html
最近更新
教材專著