基于自適應學習和多尺度前向注意力的語音識別研究
【文章頁數(shù)】:69 頁
【學位級別】:碩士
【部分圖文】:
圖1-1端到端的語音識別系統(tǒng)
哈爾濱工業(yè)大學工學碩士學位論文-5-圖1-1端到端的語音識別系統(tǒng)圖1-2序列到序列模型圖1-2的子圖(a)為CTC模型。在無先驗性對齊情況下,該模型能夠度量輸入和輸出序列的相似度,并且能刻畫語音特征和音素序列的相關性。基于CTC的語音識別系統(tǒng)由RNN編碼模塊和CTC損失函數(shù)模塊組....
圖1-3本文統(tǒng)識別
哈爾濱工業(yè)大學工學碩士學位論文-10-外研究現(xiàn)狀,還詳細描述如何搭建基于注意力機制的語音識別系統(tǒng)基線,分別在第1章、第2章介紹;第二部分是從編碼器的角度利用CTC損失進行改進,并提出自適應多任務學習,這將在第3章介紹;第三部分,從注意力機制的角度提出前向注意力模型和多尺度模型,并....
圖1-3本文的組織結構
哈爾濱工業(yè)大學工學碩士學位論文-10-外研究現(xiàn)狀,還詳細描述如何搭建基于注意力機制的語音識別系統(tǒng)基線,分別在第1章、第2章介紹;第二部分是從編碼器的角度利用CTC損失進行改進,并提出自適應多任務學習,這將在第3章介紹;第三部分,從注意力機制的角度提出前向注意力模型和多尺度模型,并....
圖2-2二維輸入的有效卷積過程
哈爾濱工業(yè)大學工學碩士學位論文-16-假設輸入的信號x是一維序列,即xnPù±,n是信號采樣數(shù);卷積濾波器mw,m是濾波器大小;y是卷積操作后的結果,則:(1)有效卷積11(,,"")((1),...,(),...,(1))()(1)()nmmiconvvalidtnmttii+....
本文編號:3930303
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3930303.html