天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于Attention機(jī)制與詞義消歧的文本處理方法及應(yīng)用研究

發(fā)布時(shí)間:2021-08-03 21:12
  網(wǎng)絡(luò)信息爆炸式的增長(zhǎng)方式促使了計(jì)算機(jī)文本自動(dòng)處理技術(shù)的發(fā)展,如何高效、準(zhǔn)確地獲取文本語(yǔ)義信息是目前迫切需要解決的問(wèn)題?紤]到人類理解句子的過(guò)程可以描述為對(duì)先驗(yàn)信息的檢索及語(yǔ)義概念的整合,因此本文主要通過(guò)研究相關(guān)計(jì)算模型,獲取更多的先驗(yàn)知識(shí)以及較為關(guān)鍵的信息,從而更加準(zhǔn)確地消除詞語(yǔ)的歧義并且提取更為豐富的語(yǔ)義信息,主要工作及研究?jī)?nèi)容如下:(1)研究融合統(tǒng)計(jì)特征與事件Attention機(jī)制的特征提取方法。針對(duì)現(xiàn)有基于Attention機(jī)制的雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)在解決文本分類相關(guān)問(wèn)題時(shí)存在增大模型計(jì)算量以及損失部分文本語(yǔ)義信息的問(wèn)題,提出在結(jié)構(gòu)化的事件級(jí)別上計(jì)算Attention權(quán)值的方法。同時(shí),考慮到深度學(xué)習(xí)模型無(wú)法學(xué)習(xí)文本統(tǒng)計(jì)特征的問(wèn)題,本文在事件Attention權(quán)值計(jì)算的基礎(chǔ)上融入統(tǒng)計(jì)特征。實(shí)驗(yàn)表明,與現(xiàn)有的模型相比,文本統(tǒng)計(jì)特征以及事件結(jié)構(gòu)固有的語(yǔ)義信息提高了文本表示的質(zhì)量,降低了模型計(jì)算復(fù)雜度,提升了文本分類的準(zhǔn)確率。(2)研究基于雙通道LDA主題模型的詞義消歧方法,F(xiàn)有的基于LDA主題模型的詞義消歧方法多將訓(xùn)練獲取的文檔主題作為消歧的主要依據(jù),雖然利用了整個(gè)文檔作為訓(xùn)練語(yǔ)料,但弱... 

【文章來(lái)源】:武漢理工大學(xué)湖北省 211工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:76 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于Attention機(jī)制與詞義消歧的文本處理方法及應(yīng)用研究


章節(jié)

示意圖,向量,損失函數(shù)


13的索引,ju為輸出矩陣U中第j行。|V||V|11exp()exp()(|())exp()exp()ttTiittTjjjjzuvPwcontextwzuv====(2-3)隨后利用最大化條件概率的對(duì)數(shù)似然函數(shù)構(gòu)建模型損失函數(shù)J,通過(guò)隨機(jī)梯度下降法使損失函數(shù)最小化,之后迭代優(yōu)化參數(shù)矩陣W和U。(2)Skip-gram模型對(duì)于Skip-gram模型,已知當(dāng)前輸入詞tw,需要預(yù)測(cè)其上下文()tcontextw,與CBOW網(wǎng)絡(luò)結(jié)構(gòu)類似,其模型結(jié)構(gòu)如圖2-2所示,通過(guò)輸入詞tw的one-hot編碼向量tx來(lái)計(jì)算(()|)ttPcontextww。W(t-2)W(t-1)W(t+1)W(t+2)OutputW(t-2)W(t-2)ProjectionInput圖2-2Skip-gram模型結(jié)構(gòu)示意圖本章實(shí)驗(yàn)使用CBOW模型訓(xùn)練詞向量,設(shè)置的詞向量維度為100,使用Word2vec訓(xùn)練得到的部分詞向量如圖2-3所示。圖2-3使用Word2vec訓(xùn)練生成的部分詞向量

基于Attention機(jī)制與詞義消歧的文本處理方法及應(yīng)用研究


展開(kāi)的

【參考文獻(xiàn)】:
期刊論文
[1]神經(jīng)機(jī)器翻譯綜述[J]. 李亞超,熊德意,張民.  計(jì)算機(jī)學(xué)報(bào). 2018(12)
[2]引入詞性標(biāo)記的基于語(yǔ)境相似度的詞義消歧[J]. 孟禹光,周俏麗,張桂平,蔡?hào)|風(fēng).  中文信息學(xué)報(bào). 2018(08)
[3]基于短語(yǔ)注意機(jī)制的文本分類[J]. 江偉,金忠.  中文信息學(xué)報(bào). 2018(02)
[4]特征驅(qū)動(dòng)的關(guān)鍵詞提取算法綜述[J]. 常耀成,張宇翔,王紅,萬(wàn)懷宇,肖春景.  軟件學(xué)報(bào). 2018(07)
[5]漢語(yǔ)復(fù)句中基于依存關(guān)系與最大熵模型的詞義消歧方法研究[J]. 李源,翟宏森,劉鳳嬌,黃文燦,楊夢(mèng)川.  計(jì)算機(jī)與數(shù)字工程. 2018(01)
[6]融合詞向量和主題模型的領(lǐng)域?qū)嶓w消歧[J]. 馬曉軍,郭劍毅,王紅斌,張志坤,線巖團(tuán),余正濤.  模式識(shí)別與人工智能. 2017(12)
[7]用于文本分類的局部化雙向長(zhǎng)短時(shí)記憶[J]. 萬(wàn)圣賢,蘭艷艷,郭嘉豐,徐君,龐亮,程學(xué)旗.  中文信息學(xué)報(bào). 2017(03)
[8]基于上下文翻譯的有監(jiān)督詞義消歧研究[J]. 楊陟卓.  計(jì)算機(jī)科學(xué). 2017(04)
[9]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍.  計(jì)算機(jī)學(xué)報(bào). 2017(06)
[10]統(tǒng)計(jì)機(jī)器翻譯中大規(guī)模特征的深度融合[J]. 劉宇鵬,喬秀明,趙石磊,馬春光.  浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2017(01)

碩士論文
[1]基于深度學(xué)習(xí)的知乎標(biāo)題的多標(biāo)簽文本分類[D]. 張闖.北京交通大學(xué) 2018
[2]基于LSTM的語(yǔ)義關(guān)系分類研究[D]. 胡新辰.哈爾濱工業(yè)大學(xué) 2015
[3]基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯解碼優(yōu)化技術(shù)研究[D]. 曲宇濤.東北大學(xué) 2015



本文編號(hào):3320345

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3320345.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cbac7***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
伊人久久青草地综合婷婷| 午夜福利激情性生活免费视频| 99一级特黄色性生活片| 欧美成人免费一级特黄| 日韩亚洲精品国产第二页| 在线中文字幕亚洲欧美一区| 欧美日韩国产午夜福利| 国产免费观看一区二区| 亚洲熟妇熟女久久精品 | 久久热在线免费视频精品| 欧美二区视频在线观看| 国产成人精品国内自产拍| 国产精品日韩欧美第一页| 日韩熟妇人妻一区二区三区| 日韩一级毛一欧美一级乱| 国产又粗又猛又长又大| 不卡一区二区在线视频| 日韩成人中文字幕在线一区| 果冻传媒精选麻豆白晶晶| 日本中文在线不卡视频| 国产精品内射视频免费| 丰满人妻一二三区av| 色婷婷亚洲精品综合网| 国产乱淫av一区二区三区| 国产成人精品久久二区二区| 精品人妻精品一区二区三区| 亚洲最新中文字幕一区| 欧美综合色婷婷欧美激情| 国产日产欧美精品视频| 国产精品九九九一区二区| 亚洲精品偷拍视频免费观看| 国产高清一区二区白浆| 人妻中文一区二区三区| 欧美精品久久99九九| 超碰在线播放国产精品| 午夜精品麻豆视频91| 国产高清一区二区不卡| 麻豆印象传媒在线观看| 又大又长又粗又猛国产精品| 青青操精品视频在线观看| 久久永久免费一区二区|