基于Attention機(jī)制與詞義消歧的文本處理方法及應(yīng)用研究
發(fā)布時(shí)間:2021-08-03 21:12
網(wǎng)絡(luò)信息爆炸式的增長(zhǎng)方式促使了計(jì)算機(jī)文本自動(dòng)處理技術(shù)的發(fā)展,如何高效、準(zhǔn)確地獲取文本語(yǔ)義信息是目前迫切需要解決的問(wèn)題?紤]到人類理解句子的過(guò)程可以描述為對(duì)先驗(yàn)信息的檢索及語(yǔ)義概念的整合,因此本文主要通過(guò)研究相關(guān)計(jì)算模型,獲取更多的先驗(yàn)知識(shí)以及較為關(guān)鍵的信息,從而更加準(zhǔn)確地消除詞語(yǔ)的歧義并且提取更為豐富的語(yǔ)義信息,主要工作及研究?jī)?nèi)容如下:(1)研究融合統(tǒng)計(jì)特征與事件Attention機(jī)制的特征提取方法。針對(duì)現(xiàn)有基于Attention機(jī)制的雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)在解決文本分類相關(guān)問(wèn)題時(shí)存在增大模型計(jì)算量以及損失部分文本語(yǔ)義信息的問(wèn)題,提出在結(jié)構(gòu)化的事件級(jí)別上計(jì)算Attention權(quán)值的方法。同時(shí),考慮到深度學(xué)習(xí)模型無(wú)法學(xué)習(xí)文本統(tǒng)計(jì)特征的問(wèn)題,本文在事件Attention權(quán)值計(jì)算的基礎(chǔ)上融入統(tǒng)計(jì)特征。實(shí)驗(yàn)表明,與現(xiàn)有的模型相比,文本統(tǒng)計(jì)特征以及事件結(jié)構(gòu)固有的語(yǔ)義信息提高了文本表示的質(zhì)量,降低了模型計(jì)算復(fù)雜度,提升了文本分類的準(zhǔn)確率。(2)研究基于雙通道LDA主題模型的詞義消歧方法,F(xiàn)有的基于LDA主題模型的詞義消歧方法多將訓(xùn)練獲取的文檔主題作為消歧的主要依據(jù),雖然利用了整個(gè)文檔作為訓(xùn)練語(yǔ)料,但弱...
【文章來(lái)源】:武漢理工大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:76 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
章節(jié)
13的索引,ju為輸出矩陣U中第j行。|V||V|11exp()exp()(|())exp()exp()ttTiittTjjjjzuvPwcontextwzuv====(2-3)隨后利用最大化條件概率的對(duì)數(shù)似然函數(shù)構(gòu)建模型損失函數(shù)J,通過(guò)隨機(jī)梯度下降法使損失函數(shù)最小化,之后迭代優(yōu)化參數(shù)矩陣W和U。(2)Skip-gram模型對(duì)于Skip-gram模型,已知當(dāng)前輸入詞tw,需要預(yù)測(cè)其上下文()tcontextw,與CBOW網(wǎng)絡(luò)結(jié)構(gòu)類似,其模型結(jié)構(gòu)如圖2-2所示,通過(guò)輸入詞tw的one-hot編碼向量tx來(lái)計(jì)算(()|)ttPcontextww。W(t-2)W(t-1)W(t+1)W(t+2)OutputW(t-2)W(t-2)ProjectionInput圖2-2Skip-gram模型結(jié)構(gòu)示意圖本章實(shí)驗(yàn)使用CBOW模型訓(xùn)練詞向量,設(shè)置的詞向量維度為100,使用Word2vec訓(xùn)練得到的部分詞向量如圖2-3所示。圖2-3使用Word2vec訓(xùn)練生成的部分詞向量
展開(kāi)的
【參考文獻(xiàn)】:
期刊論文
[1]神經(jīng)機(jī)器翻譯綜述[J]. 李亞超,熊德意,張民. 計(jì)算機(jī)學(xué)報(bào). 2018(12)
[2]引入詞性標(biāo)記的基于語(yǔ)境相似度的詞義消歧[J]. 孟禹光,周俏麗,張桂平,蔡?hào)|風(fēng). 中文信息學(xué)報(bào). 2018(08)
[3]基于短語(yǔ)注意機(jī)制的文本分類[J]. 江偉,金忠. 中文信息學(xué)報(bào). 2018(02)
[4]特征驅(qū)動(dòng)的關(guān)鍵詞提取算法綜述[J]. 常耀成,張宇翔,王紅,萬(wàn)懷宇,肖春景. 軟件學(xué)報(bào). 2018(07)
[5]漢語(yǔ)復(fù)句中基于依存關(guān)系與最大熵模型的詞義消歧方法研究[J]. 李源,翟宏森,劉鳳嬌,黃文燦,楊夢(mèng)川. 計(jì)算機(jī)與數(shù)字工程. 2018(01)
[6]融合詞向量和主題模型的領(lǐng)域?qū)嶓w消歧[J]. 馬曉軍,郭劍毅,王紅斌,張志坤,線巖團(tuán),余正濤. 模式識(shí)別與人工智能. 2017(12)
[7]用于文本分類的局部化雙向長(zhǎng)短時(shí)記憶[J]. 萬(wàn)圣賢,蘭艷艷,郭嘉豐,徐君,龐亮,程學(xué)旗. 中文信息學(xué)報(bào). 2017(03)
[8]基于上下文翻譯的有監(jiān)督詞義消歧研究[J]. 楊陟卓. 計(jì)算機(jī)科學(xué). 2017(04)
[9]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
[10]統(tǒng)計(jì)機(jī)器翻譯中大規(guī)模特征的深度融合[J]. 劉宇鵬,喬秀明,趙石磊,馬春光. 浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2017(01)
碩士論文
[1]基于深度學(xué)習(xí)的知乎標(biāo)題的多標(biāo)簽文本分類[D]. 張闖.北京交通大學(xué) 2018
[2]基于LSTM的語(yǔ)義關(guān)系分類研究[D]. 胡新辰.哈爾濱工業(yè)大學(xué) 2015
[3]基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯解碼優(yōu)化技術(shù)研究[D]. 曲宇濤.東北大學(xué) 2015
本文編號(hào):3320345
【文章來(lái)源】:武漢理工大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:76 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
章節(jié)
13的索引,ju為輸出矩陣U中第j行。|V||V|11exp()exp()(|())exp()exp()ttTiittTjjjjzuvPwcontextwzuv====(2-3)隨后利用最大化條件概率的對(duì)數(shù)似然函數(shù)構(gòu)建模型損失函數(shù)J,通過(guò)隨機(jī)梯度下降法使損失函數(shù)最小化,之后迭代優(yōu)化參數(shù)矩陣W和U。(2)Skip-gram模型對(duì)于Skip-gram模型,已知當(dāng)前輸入詞tw,需要預(yù)測(cè)其上下文()tcontextw,與CBOW網(wǎng)絡(luò)結(jié)構(gòu)類似,其模型結(jié)構(gòu)如圖2-2所示,通過(guò)輸入詞tw的one-hot編碼向量tx來(lái)計(jì)算(()|)ttPcontextww。W(t-2)W(t-1)W(t+1)W(t+2)OutputW(t-2)W(t-2)ProjectionInput圖2-2Skip-gram模型結(jié)構(gòu)示意圖本章實(shí)驗(yàn)使用CBOW模型訓(xùn)練詞向量,設(shè)置的詞向量維度為100,使用Word2vec訓(xùn)練得到的部分詞向量如圖2-3所示。圖2-3使用Word2vec訓(xùn)練生成的部分詞向量
展開(kāi)的
【參考文獻(xiàn)】:
期刊論文
[1]神經(jīng)機(jī)器翻譯綜述[J]. 李亞超,熊德意,張民. 計(jì)算機(jī)學(xué)報(bào). 2018(12)
[2]引入詞性標(biāo)記的基于語(yǔ)境相似度的詞義消歧[J]. 孟禹光,周俏麗,張桂平,蔡?hào)|風(fēng). 中文信息學(xué)報(bào). 2018(08)
[3]基于短語(yǔ)注意機(jī)制的文本分類[J]. 江偉,金忠. 中文信息學(xué)報(bào). 2018(02)
[4]特征驅(qū)動(dòng)的關(guān)鍵詞提取算法綜述[J]. 常耀成,張宇翔,王紅,萬(wàn)懷宇,肖春景. 軟件學(xué)報(bào). 2018(07)
[5]漢語(yǔ)復(fù)句中基于依存關(guān)系與最大熵模型的詞義消歧方法研究[J]. 李源,翟宏森,劉鳳嬌,黃文燦,楊夢(mèng)川. 計(jì)算機(jī)與數(shù)字工程. 2018(01)
[6]融合詞向量和主題模型的領(lǐng)域?qū)嶓w消歧[J]. 馬曉軍,郭劍毅,王紅斌,張志坤,線巖團(tuán),余正濤. 模式識(shí)別與人工智能. 2017(12)
[7]用于文本分類的局部化雙向長(zhǎng)短時(shí)記憶[J]. 萬(wàn)圣賢,蘭艷艷,郭嘉豐,徐君,龐亮,程學(xué)旗. 中文信息學(xué)報(bào). 2017(03)
[8]基于上下文翻譯的有監(jiān)督詞義消歧研究[J]. 楊陟卓. 計(jì)算機(jī)科學(xué). 2017(04)
[9]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
[10]統(tǒng)計(jì)機(jī)器翻譯中大規(guī)模特征的深度融合[J]. 劉宇鵬,喬秀明,趙石磊,馬春光. 浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2017(01)
碩士論文
[1]基于深度學(xué)習(xí)的知乎標(biāo)題的多標(biāo)簽文本分類[D]. 張闖.北京交通大學(xué) 2018
[2]基于LSTM的語(yǔ)義關(guān)系分類研究[D]. 胡新辰.哈爾濱工業(yè)大學(xué) 2015
[3]基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯解碼優(yōu)化技術(shù)研究[D]. 曲宇濤.東北大學(xué) 2015
本文編號(hào):3320345
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3320345.html
最近更新
教材專著