基于深度學(xué)習(xí)的客家方言語(yǔ)音識(shí)別
發(fā)布時(shí)間:2021-12-02 01:11
近年來(lái),由于大數(shù)據(jù)和云計(jì)算的高速發(fā)展,在人工智能浪潮的推動(dòng)下,使用自然語(yǔ)言進(jìn)行人機(jī)交互,這類自動(dòng)語(yǔ)音識(shí)別一直是研究的熱點(diǎn)。同時(shí)語(yǔ)音識(shí)別也是智能家居和智慧電商等市場(chǎng)的首要研究重點(diǎn)。雖然市場(chǎng)上的語(yǔ)音識(shí)別系統(tǒng)眾多,但針對(duì)方言的語(yǔ)音識(shí)別及研究寥寥無(wú)幾。在此背景之下,本文以客家方言語(yǔ)料庫(kù)為語(yǔ)料,以神經(jīng)網(wǎng)絡(luò)作為模型結(jié)構(gòu),搭建一個(gè)基于深度神經(jīng)網(wǎng)絡(luò)的客家方言語(yǔ)音識(shí)別系統(tǒng),對(duì)客家方言的語(yǔ)音識(shí)別研究具有實(shí)用價(jià)值。首先,本文介紹了深度學(xué)習(xí)相關(guān)的關(guān)鍵技術(shù),包括神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)、長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Long Short Term Memory Network,LSTM)以及結(jié)構(gòu)更為簡(jiǎn)單的門控循環(huán)單元網(wǎng)絡(luò)(Gated Recurrent Unit,GRU)。然后,對(duì)語(yǔ)音識(shí)別系統(tǒng)的結(jié)構(gòu)與技術(shù)進(jìn)行分析,并著重介紹了語(yǔ)音信號(hào)的處理技術(shù)。其次,通過(guò)建設(shè)客家方言語(yǔ)料庫(kù),詳細(xì)地介紹了語(yǔ)料庫(kù)的建設(shè)過(guò)程,包括語(yǔ)料的選取、錄制、整理與核音、語(yǔ)音標(biāo)注;最后,基于TensorFlow的深度學(xué)習(xí)框架,選擇了一款開(kāi)源的語(yǔ)音識(shí)別工具,通過(guò)對(duì)客家方言的語(yǔ)音采集作為語(yǔ)料,結(jié)合當(dāng)前先...
【文章來(lái)源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:77 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
深度學(xué)習(xí)人臉識(shí)別過(guò)程示意圖
華南理工大學(xué)碩士學(xué)位論文經(jīng)元模型,基于生物神經(jīng)網(wǎng)絡(luò)的神經(jīng)元模型誕生[30]。它由心理學(xué)家 Warralter Pitts 提出。神經(jīng)元是模仿生物的神經(jīng)元設(shè)計(jì)的,樹(shù)突、軸突體的輸入、輸出和接口,神經(jīng)細(xì)胞的工作方式是興奮與抑制,并硬權(quán)限函數(shù))來(lái)模擬各種機(jī)制。單個(gè)神經(jīng)元模型結(jié)構(gòu)如圖 2-2 所
(a) sigmod 函數(shù) (b) ReLU 函數(shù)圖 2-3 兩種激活函數(shù)ltilayer Perceptron)是一種單向多層的前饋神經(jīng)網(wǎng)其結(jié)構(gòu)如圖 2-4 所示,包括一個(gè)輸入層、一個(gè)步驟也就是前向傳播(Forward Pass)過(guò)程。前然后經(jīng)過(guò)激活函數(shù)處理。經(jīng)過(guò)激活函數(shù)后的輸定一個(gè)損失函數(shù)對(duì)差距大小計(jì)算誤差,并根據(jù)傳播和目標(biāo)輸出相對(duì)接近,這種參數(shù)修正的過(guò)
【參考文獻(xiàn)】:
期刊論文
[1]語(yǔ)音識(shí)別大揭秘:計(jì)算機(jī)如何處理聲音?[J]. 周弘燁. 中國(guó)新通信. 2019(04)
[2]基于深度學(xué)習(xí)和MFCC特征的腦卒中預(yù)測(cè)方法[J]. 陳鷗宇,劉怡俊,葉武劍,牟志偉,李琪. 信息與電腦(理論版). 2019(03)
[3]深度學(xué)習(xí)技術(shù)概述[J]. 張睿哲. 中國(guó)新通信. 2018(21)
[4]卷積神經(jīng)網(wǎng)絡(luò)算法在語(yǔ)音識(shí)別中的應(yīng)用[J]. 張文宇,劉暢. 信息技術(shù). 2018(10)
[5]語(yǔ)音識(shí)別技術(shù)概述[J]. 李志遠(yuǎn). 中國(guó)新通信. 2018(17)
[6]基于動(dòng)態(tài)BLSTM和CTC的瀕危語(yǔ)言語(yǔ)音識(shí)別研究[J]. 于重重,陳運(yùn)兵,孫沁瑤,劉暢,徐世璇,尹蔚彬. 計(jì)算機(jī)應(yīng)用研究. 2019(11)
[7]深度學(xué)習(xí)研究綜述[J]. 張榮,李偉平,莫同. 信息與控制. 2018(04)
[8]語(yǔ)音識(shí)別技術(shù)的研究進(jìn)展與展望[J]. 王海坤,潘嘉,劉聰. 電信科學(xué). 2018(02)
[9]ReLU激活函數(shù)優(yōu)化研究[J]. 蔣昂波,王維維. 傳感器與微系統(tǒng). 2018(02)
[10]重慶方言語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 張策,韋鵬程,陸曉燕,石熙. 計(jì)算機(jī)測(cè)量與控制. 2018(01)
博士論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別模型研究[D]. 張仕良.中國(guó)科學(xué)技術(shù)大學(xué) 2017
碩士論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的蒙古語(yǔ)語(yǔ)音識(shí)別系統(tǒng)聲學(xué)模型的研究[D]. 張紅偉.內(nèi)蒙古大學(xué) 2017
[2]基于深度關(guān)注神經(jīng)網(wǎng)絡(luò)的漢語(yǔ)方言辨識(shí)[D]. 邱遠(yuǎn)航.江蘇師范大學(xué) 2017
[3]基于深度學(xué)習(xí)的藏語(yǔ)拉薩方言語(yǔ)音識(shí)別的研究[D]. 張宇聰.西北師范大學(xué) 2016
本文編號(hào):3527422
【文章來(lái)源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:77 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
深度學(xué)習(xí)人臉識(shí)別過(guò)程示意圖
華南理工大學(xué)碩士學(xué)位論文經(jīng)元模型,基于生物神經(jīng)網(wǎng)絡(luò)的神經(jīng)元模型誕生[30]。它由心理學(xué)家 Warralter Pitts 提出。神經(jīng)元是模仿生物的神經(jīng)元設(shè)計(jì)的,樹(shù)突、軸突體的輸入、輸出和接口,神經(jīng)細(xì)胞的工作方式是興奮與抑制,并硬權(quán)限函數(shù))來(lái)模擬各種機(jī)制。單個(gè)神經(jīng)元模型結(jié)構(gòu)如圖 2-2 所
(a) sigmod 函數(shù) (b) ReLU 函數(shù)圖 2-3 兩種激活函數(shù)ltilayer Perceptron)是一種單向多層的前饋神經(jīng)網(wǎng)其結(jié)構(gòu)如圖 2-4 所示,包括一個(gè)輸入層、一個(gè)步驟也就是前向傳播(Forward Pass)過(guò)程。前然后經(jīng)過(guò)激活函數(shù)處理。經(jīng)過(guò)激活函數(shù)后的輸定一個(gè)損失函數(shù)對(duì)差距大小計(jì)算誤差,并根據(jù)傳播和目標(biāo)輸出相對(duì)接近,這種參數(shù)修正的過(guò)
【參考文獻(xiàn)】:
期刊論文
[1]語(yǔ)音識(shí)別大揭秘:計(jì)算機(jī)如何處理聲音?[J]. 周弘燁. 中國(guó)新通信. 2019(04)
[2]基于深度學(xué)習(xí)和MFCC特征的腦卒中預(yù)測(cè)方法[J]. 陳鷗宇,劉怡俊,葉武劍,牟志偉,李琪. 信息與電腦(理論版). 2019(03)
[3]深度學(xué)習(xí)技術(shù)概述[J]. 張睿哲. 中國(guó)新通信. 2018(21)
[4]卷積神經(jīng)網(wǎng)絡(luò)算法在語(yǔ)音識(shí)別中的應(yīng)用[J]. 張文宇,劉暢. 信息技術(shù). 2018(10)
[5]語(yǔ)音識(shí)別技術(shù)概述[J]. 李志遠(yuǎn). 中國(guó)新通信. 2018(17)
[6]基于動(dòng)態(tài)BLSTM和CTC的瀕危語(yǔ)言語(yǔ)音識(shí)別研究[J]. 于重重,陳運(yùn)兵,孫沁瑤,劉暢,徐世璇,尹蔚彬. 計(jì)算機(jī)應(yīng)用研究. 2019(11)
[7]深度學(xué)習(xí)研究綜述[J]. 張榮,李偉平,莫同. 信息與控制. 2018(04)
[8]語(yǔ)音識(shí)別技術(shù)的研究進(jìn)展與展望[J]. 王海坤,潘嘉,劉聰. 電信科學(xué). 2018(02)
[9]ReLU激活函數(shù)優(yōu)化研究[J]. 蔣昂波,王維維. 傳感器與微系統(tǒng). 2018(02)
[10]重慶方言語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 張策,韋鵬程,陸曉燕,石熙. 計(jì)算機(jī)測(cè)量與控制. 2018(01)
博士論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別模型研究[D]. 張仕良.中國(guó)科學(xué)技術(shù)大學(xué) 2017
碩士論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的蒙古語(yǔ)語(yǔ)音識(shí)別系統(tǒng)聲學(xué)模型的研究[D]. 張紅偉.內(nèi)蒙古大學(xué) 2017
[2]基于深度關(guān)注神經(jīng)網(wǎng)絡(luò)的漢語(yǔ)方言辨識(shí)[D]. 邱遠(yuǎn)航.江蘇師范大學(xué) 2017
[3]基于深度學(xué)習(xí)的藏語(yǔ)拉薩方言語(yǔ)音識(shí)別的研究[D]. 張宇聰.西北師范大學(xué) 2016
本文編號(hào):3527422
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3527422.html
最近更新
教材專著