結(jié)合遷移學(xué)習(xí)的文本自動(dòng)摘要技術(shù)研究
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1.1論文主要內(nèi)容框架
國防科技大學(xué)研究生院碩士學(xué)位論文第9頁(1)為加快模型收斂速度,考慮將神經(jīng)網(wǎng)絡(luò)文本自動(dòng)摘要模型常用的長短時(shí)記憶網(wǎng)絡(luò)(LSTM)單元替換為待訓(xùn)練參數(shù)更少的門控循環(huán)單元(GRU)。(2)針對超出詞表問題,由于摘要模型無法從詞表中直接生成需要的低頻詞,考慮從原始文本中將所需生成的詞直接....
圖2.1基本的seq2seq編碼器-解碼器框架
玫奶岢。以?鞣?氳撓τ夢侍馕???纈⒎ǚ?耄?創(chuàng)佑⒂锏椒?語文本轉(zhuǎn)換,從序列到序列問題的角度看就是將輸入的英文序列轉(zhuǎn)換為法文序列輸出。編碼器-解碼器框架中編碼器的作用,就是把輸入的序列轉(zhuǎn)換成固定長度的文本向量表示,相應(yīng)地解碼器的作用就是將編碼器轉(zhuǎn)換出的固定文本向量表示再次轉(zhuǎn)化成....
圖2.2RNN的網(wǎng)絡(luò)結(jié)構(gòu)圖
國防科技大學(xué)研究生院碩士學(xué)位論文第14頁單詞,由于自然語言中每個(gè)字詞都與句子中其他字詞相關(guān)才能產(chǎn)生意義,人類處理的方法是根據(jù)前文信息推斷后文,而FNN的每一個(gè)同層隱藏狀態(tài)間相互獨(dú)立,完全無法考慮前后文的關(guān)聯(lián)。為此提出了RNN以解決類似具有序列關(guān)聯(lián)性的機(jī)器學(xué)習(xí)問題,其思想即在于體現(xiàn)....
圖2.3不含注意力機(jī)制的RNN編碼器-解碼器框架
??餼偷賈掠鏌逑蛄勘硎綾包含語義信息特征的能力受到限制;其次,由于編碼階段是按照時(shí)序?qū)⑽谋拘蛄袛?shù)據(jù)逐個(gè)輸入編碼端,在靠后序列輸入的內(nèi)容會(huì)稀釋淡化之前時(shí)間步輸入的內(nèi)容信息特征。在長句子長文本輸入序列中,這個(gè)特征丟失的現(xiàn)象就會(huì)更嚴(yán)重。那么解碼端所依賴的初始輸入也就是語義向量表示c沒有....
本文編號:3975687
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3975687.html