天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于多粒度序列注意力機(jī)制的短文本分析

發(fā)布時(shí)間:2021-07-12 12:33
  隨著互聯(lián)網(wǎng)的飛速發(fā)展,海量數(shù)據(jù)不斷更新,數(shù)據(jù)的類型多種多樣,其中文本是最直接和最常見(jiàn)的組織形式之一。挖掘文本的有效信息可更快速、準(zhǔn)確地了解人們的觀點(diǎn)和情感傾向等內(nèi)容,有利于人們掌握市場(chǎng)動(dòng)態(tài)、社會(huì)輿情、網(wǎng)絡(luò)安全態(tài)勢(shì)等。技術(shù)日趨成熟,人們期望能夠讓機(jī)器像人類一樣思考,讓它可以在諸多文本中過(guò)濾掉冗余信息,將核心內(nèi)容合理地組織、呈現(xiàn)出來(lái)。隨著生活節(jié)奏的逐步加快,越來(lái)越多像簡(jiǎn)訊、評(píng)論等字符數(shù)量較少的“快餐式”信息涌入生活中,如何快速準(zhǔn)確地從大量短文本信息中獲取有價(jià)值的信息是值得人們深思。因此,本文嘗試模擬人類的認(rèn)知過(guò)程并結(jié)合多粒度的思想,提出了一種基于多粒度序列注意力機(jī)制的短文本分析方法,主要研究如下:1.提出一種基于序列注意力機(jī)制的卷積神經(jīng)網(wǎng)絡(luò)對(duì)URL進(jìn)行異常檢測(cè)。該模型用于檢測(cè)網(wǎng)絡(luò)中的異常流量。URL全稱統(tǒng)一資源定位符,是由一些列字符組成的用于向服務(wù)器請(qǐng)求資源的標(biāo)識(shí)符,其具有一定的語(yǔ)義信息并且組成它的字符數(shù)量相對(duì)較少,它是屬于短文本的一種。針對(duì)該問(wèn)題提出了由五層網(wǎng)絡(luò)組成的檢測(cè)模型,首先,使用word2vec對(duì)URL進(jìn)行編碼,然后使用卷積進(jìn)行特征自學(xué)習(xí),與此同時(shí)添加了一個(gè)外部語(yǔ)言模型來(lái)幫助模型... 

【文章來(lái)源】:重慶郵電大學(xué)重慶市

【文章頁(yè)數(shù)】:60 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于多粒度序列注意力機(jī)制的短文本分析


文本分類的框架

模型圖,模型,句子,注意力機(jī)制


圖 2.1 基于注意力機(jī)制的機(jī)器翻譯詞匯對(duì)照結(jié)果給定的目標(biāo)語(yǔ)句為 X ,期望通過(guò)Encoder-Decoder框架得到的輸中句子 X 和Y 的語(yǔ)種并無(wú)限制,可以是同語(yǔ)種或跨語(yǔ)言的,輸示為 ( ,)mX =x x x1 2;輸出的句子為 ( ,)nY =y y y1 2。傳統(tǒng)的編圖 2.2 所示,Encoder過(guò)程是對(duì)輸入語(yǔ)句進(jìn)行編碼,得到中間過(guò)( , ) ( ,)m n= F x x x =c c c1 2 1 2;而 Decoder 則根據(jù)語(yǔ)義結(jié)果轉(zhuǎn)化得到就是要輸出的句子 ( ,)nY =y y y1 2。

框架圖,框架,基本模型,易于理解


圖 2.3 引入Attention 模型的Encoder-Decoder 框架制在很多的具體模型中均有應(yīng)用,如下圖 2.4 所示ent Neural Network RNN)結(jié)合 機(jī)制使用Enseq2seq 基本模型,在編碼和解碼的兩部分分別采用了圖 2.4 RNN的seq2seq基本模型框架不同應(yīng)用中設(shè)計(jì)是不同的,學(xué)者根據(jù)研究目標(biāo)利用新分配。嘗試將 抽象為一個(gè)易于理解的大

【參考文獻(xiàn)】:
期刊論文
[1]粒計(jì)算研究綜述[J]. 王國(guó)胤,張清華,胡軍.  智能系統(tǒng)學(xué)報(bào). 2007(06)
[2]使用最大熵模型進(jìn)行中文文本分類[J]. 李榮陸,王建會(huì),陳曉云,陶曉鵬,胡運(yùn)發(fā).  計(jì)算機(jī)研究與發(fā)展. 2005(01)



本文編號(hào):3279922

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3279922.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0e6f9***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com