基于深度學(xué)習(xí)的客家方言語音識別
發(fā)布時間:2021-12-02 01:11
近年來,由于大數(shù)據(jù)和云計算的高速發(fā)展,在人工智能浪潮的推動下,使用自然語言進行人機交互,這類自動語音識別一直是研究的熱點。同時語音識別也是智能家居和智慧電商等市場的首要研究重點。雖然市場上的語音識別系統(tǒng)眾多,但針對方言的語音識別及研究寥寥無幾。在此背景之下,本文以客家方言語料庫為語料,以神經(jīng)網(wǎng)絡(luò)作為模型結(jié)構(gòu),搭建一個基于深度神經(jīng)網(wǎng)絡(luò)的客家方言語音識別系統(tǒng),對客家方言的語音識別研究具有實用價值。首先,本文介紹了深度學(xué)習(xí)相關(guān)的關(guān)鍵技術(shù),包括神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)、長短時記憶網(wǎng)絡(luò)(Long Short Term Memory Network,LSTM)以及結(jié)構(gòu)更為簡單的門控循環(huán)單元網(wǎng)絡(luò)(Gated Recurrent Unit,GRU)。然后,對語音識別系統(tǒng)的結(jié)構(gòu)與技術(shù)進行分析,并著重介紹了語音信號的處理技術(shù)。其次,通過建設(shè)客家方言語料庫,詳細(xì)地介紹了語料庫的建設(shè)過程,包括語料的選取、錄制、整理與核音、語音標(biāo)注;最后,基于TensorFlow的深度學(xué)習(xí)框架,選擇了一款開源的語音識別工具,通過對客家方言的語音采集作為語料,結(jié)合當(dāng)前先...
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:77 頁
【學(xué)位級別】:碩士
【部分圖文】:
深度學(xué)習(xí)人臉識別過程示意圖
華南理工大學(xué)碩士學(xué)位論文經(jīng)元模型,基于生物神經(jīng)網(wǎng)絡(luò)的神經(jīng)元模型誕生[30]。它由心理學(xué)家 Warralter Pitts 提出。神經(jīng)元是模仿生物的神經(jīng)元設(shè)計的,樹突、軸突體的輸入、輸出和接口,神經(jīng)細(xì)胞的工作方式是興奮與抑制,并硬權(quán)限函數(shù))來模擬各種機制。單個神經(jīng)元模型結(jié)構(gòu)如圖 2-2 所
(a) sigmod 函數(shù) (b) ReLU 函數(shù)圖 2-3 兩種激活函數(shù)ltilayer Perceptron)是一種單向多層的前饋神經(jīng)網(wǎng)其結(jié)構(gòu)如圖 2-4 所示,包括一個輸入層、一個步驟也就是前向傳播(Forward Pass)過程。前然后經(jīng)過激活函數(shù)處理。經(jīng)過激活函數(shù)后的輸定一個損失函數(shù)對差距大小計算誤差,并根據(jù)傳播和目標(biāo)輸出相對接近,這種參數(shù)修正的過
【參考文獻】:
期刊論文
[1]語音識別大揭秘:計算機如何處理聲音?[J]. 周弘燁. 中國新通信. 2019(04)
[2]基于深度學(xué)習(xí)和MFCC特征的腦卒中預(yù)測方法[J]. 陳鷗宇,劉怡俊,葉武劍,牟志偉,李琪. 信息與電腦(理論版). 2019(03)
[3]深度學(xué)習(xí)技術(shù)概述[J]. 張睿哲. 中國新通信. 2018(21)
[4]卷積神經(jīng)網(wǎng)絡(luò)算法在語音識別中的應(yīng)用[J]. 張文宇,劉暢. 信息技術(shù). 2018(10)
[5]語音識別技術(shù)概述[J]. 李志遠(yuǎn). 中國新通信. 2018(17)
[6]基于動態(tài)BLSTM和CTC的瀕危語言語音識別研究[J]. 于重重,陳運兵,孫沁瑤,劉暢,徐世璇,尹蔚彬. 計算機應(yīng)用研究. 2019(11)
[7]深度學(xué)習(xí)研究綜述[J]. 張榮,李偉平,莫同. 信息與控制. 2018(04)
[8]語音識別技術(shù)的研究進展與展望[J]. 王海坤,潘嘉,劉聰. 電信科學(xué). 2018(02)
[9]ReLU激活函數(shù)優(yōu)化研究[J]. 蔣昂波,王維維. 傳感器與微系統(tǒng). 2018(02)
[10]重慶方言語音識別系統(tǒng)的設(shè)計與實現(xiàn)[J]. 張策,韋鵬程,陸曉燕,石熙. 計算機測量與控制. 2018(01)
博士論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的語音識別模型研究[D]. 張仕良.中國科學(xué)技術(shù)大學(xué) 2017
碩士論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的蒙古語語音識別系統(tǒng)聲學(xué)模型的研究[D]. 張紅偉.內(nèi)蒙古大學(xué) 2017
[2]基于深度關(guān)注神經(jīng)網(wǎng)絡(luò)的漢語方言辨識[D]. 邱遠(yuǎn)航.江蘇師范大學(xué) 2017
[3]基于深度學(xué)習(xí)的藏語拉薩方言語音識別的研究[D]. 張宇聰.西北師范大學(xué) 2016
本文編號:3527422
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:77 頁
【學(xué)位級別】:碩士
【部分圖文】:
深度學(xué)習(xí)人臉識別過程示意圖
華南理工大學(xué)碩士學(xué)位論文經(jīng)元模型,基于生物神經(jīng)網(wǎng)絡(luò)的神經(jīng)元模型誕生[30]。它由心理學(xué)家 Warralter Pitts 提出。神經(jīng)元是模仿生物的神經(jīng)元設(shè)計的,樹突、軸突體的輸入、輸出和接口,神經(jīng)細(xì)胞的工作方式是興奮與抑制,并硬權(quán)限函數(shù))來模擬各種機制。單個神經(jīng)元模型結(jié)構(gòu)如圖 2-2 所
(a) sigmod 函數(shù) (b) ReLU 函數(shù)圖 2-3 兩種激活函數(shù)ltilayer Perceptron)是一種單向多層的前饋神經(jīng)網(wǎng)其結(jié)構(gòu)如圖 2-4 所示,包括一個輸入層、一個步驟也就是前向傳播(Forward Pass)過程。前然后經(jīng)過激活函數(shù)處理。經(jīng)過激活函數(shù)后的輸定一個損失函數(shù)對差距大小計算誤差,并根據(jù)傳播和目標(biāo)輸出相對接近,這種參數(shù)修正的過
【參考文獻】:
期刊論文
[1]語音識別大揭秘:計算機如何處理聲音?[J]. 周弘燁. 中國新通信. 2019(04)
[2]基于深度學(xué)習(xí)和MFCC特征的腦卒中預(yù)測方法[J]. 陳鷗宇,劉怡俊,葉武劍,牟志偉,李琪. 信息與電腦(理論版). 2019(03)
[3]深度學(xué)習(xí)技術(shù)概述[J]. 張睿哲. 中國新通信. 2018(21)
[4]卷積神經(jīng)網(wǎng)絡(luò)算法在語音識別中的應(yīng)用[J]. 張文宇,劉暢. 信息技術(shù). 2018(10)
[5]語音識別技術(shù)概述[J]. 李志遠(yuǎn). 中國新通信. 2018(17)
[6]基于動態(tài)BLSTM和CTC的瀕危語言語音識別研究[J]. 于重重,陳運兵,孫沁瑤,劉暢,徐世璇,尹蔚彬. 計算機應(yīng)用研究. 2019(11)
[7]深度學(xué)習(xí)研究綜述[J]. 張榮,李偉平,莫同. 信息與控制. 2018(04)
[8]語音識別技術(shù)的研究進展與展望[J]. 王海坤,潘嘉,劉聰. 電信科學(xué). 2018(02)
[9]ReLU激活函數(shù)優(yōu)化研究[J]. 蔣昂波,王維維. 傳感器與微系統(tǒng). 2018(02)
[10]重慶方言語音識別系統(tǒng)的設(shè)計與實現(xiàn)[J]. 張策,韋鵬程,陸曉燕,石熙. 計算機測量與控制. 2018(01)
博士論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的語音識別模型研究[D]. 張仕良.中國科學(xué)技術(shù)大學(xué) 2017
碩士論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的蒙古語語音識別系統(tǒng)聲學(xué)模型的研究[D]. 張紅偉.內(nèi)蒙古大學(xué) 2017
[2]基于深度關(guān)注神經(jīng)網(wǎng)絡(luò)的漢語方言辨識[D]. 邱遠(yuǎn)航.江蘇師范大學(xué) 2017
[3]基于深度學(xué)習(xí)的藏語拉薩方言語音識別的研究[D]. 張宇聰.西北師范大學(xué) 2016
本文編號:3527422
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3527422.html
最近更新
教材專著