天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

基于深度學(xué)習(xí)的客家方言語(yǔ)音識(shí)別

發(fā)布時(shí)間:2021-12-02 01:11
  近年來(lái),由于大數(shù)據(jù)和云計(jì)算的高速發(fā)展,在人工智能浪潮的推動(dòng)下,使用自然語(yǔ)言進(jìn)行人機(jī)交互,這類自動(dòng)語(yǔ)音識(shí)別一直是研究的熱點(diǎn)。同時(shí)語(yǔ)音識(shí)別也是智能家居和智慧電商等市場(chǎng)的首要研究重點(diǎn)。雖然市場(chǎng)上的語(yǔ)音識(shí)別系統(tǒng)眾多,但針對(duì)方言的語(yǔ)音識(shí)別及研究寥寥無(wú)幾。在此背景之下,本文以客家方言語(yǔ)料庫(kù)為語(yǔ)料,以神經(jīng)網(wǎng)絡(luò)作為模型結(jié)構(gòu),搭建一個(gè)基于深度神經(jīng)網(wǎng)絡(luò)的客家方言語(yǔ)音識(shí)別系統(tǒng),對(duì)客家方言的語(yǔ)音識(shí)別研究具有實(shí)用價(jià)值。首先,本文介紹了深度學(xué)習(xí)相關(guān)的關(guān)鍵技術(shù),包括神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)、長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Long Short Term Memory Network,LSTM)以及結(jié)構(gòu)更為簡(jiǎn)單的門控循環(huán)單元網(wǎng)絡(luò)(Gated Recurrent Unit,GRU)。然后,對(duì)語(yǔ)音識(shí)別系統(tǒng)的結(jié)構(gòu)與技術(shù)進(jìn)行分析,并著重介紹了語(yǔ)音信號(hào)的處理技術(shù)。其次,通過(guò)建設(shè)客家方言語(yǔ)料庫(kù),詳細(xì)地介紹了語(yǔ)料庫(kù)的建設(shè)過(guò)程,包括語(yǔ)料的選取、錄制、整理與核音、語(yǔ)音標(biāo)注;最后,基于TensorFlow的深度學(xué)習(xí)框架,選擇了一款開(kāi)源的語(yǔ)音識(shí)別工具,通過(guò)對(duì)客家方言的語(yǔ)音采集作為語(yǔ)料,結(jié)合當(dāng)前先... 

【文章來(lái)源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:77 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于深度學(xué)習(xí)的客家方言語(yǔ)音識(shí)別


深度學(xué)習(xí)人臉識(shí)別過(guò)程示意圖

結(jié)構(gòu)圖,神經(jīng)元模型,結(jié)構(gòu)圖


華南理工大學(xué)碩士學(xué)位論文經(jīng)元模型,基于生物神經(jīng)網(wǎng)絡(luò)的神經(jīng)元模型誕生[30]。它由心理學(xué)家 Warralter Pitts 提出。神經(jīng)元是模仿生物的神經(jīng)元設(shè)計(jì)的,樹(shù)突、軸突體的輸入、輸出和接口,神經(jīng)細(xì)胞的工作方式是興奮與抑制,并硬權(quán)限函數(shù))來(lái)模擬各種機(jī)制。單個(gè)神經(jīng)元模型結(jié)構(gòu)如圖 2-2 所

激活函數(shù),參數(shù)修正,損失函數(shù)


(a) sigmod 函數(shù) (b) ReLU 函數(shù)圖 2-3 兩種激活函數(shù)ltilayer Perceptron)是一種單向多層的前饋神經(jīng)網(wǎng)其結(jié)構(gòu)如圖 2-4 所示,包括一個(gè)輸入層、一個(gè)步驟也就是前向傳播(Forward Pass)過(guò)程。前然后經(jīng)過(guò)激活函數(shù)處理。經(jīng)過(guò)激活函數(shù)后的輸定一個(gè)損失函數(shù)對(duì)差距大小計(jì)算誤差,并根據(jù)傳播和目標(biāo)輸出相對(duì)接近,這種參數(shù)修正的過(guò)

【參考文獻(xiàn)】:
期刊論文
[1]語(yǔ)音識(shí)別大揭秘:計(jì)算機(jī)如何處理聲音?[J]. 周弘燁.  中國(guó)新通信. 2019(04)
[2]基于深度學(xué)習(xí)和MFCC特征的腦卒中預(yù)測(cè)方法[J]. 陳鷗宇,劉怡俊,葉武劍,牟志偉,李琪.  信息與電腦(理論版). 2019(03)
[3]深度學(xué)習(xí)技術(shù)概述[J]. 張睿哲.  中國(guó)新通信. 2018(21)
[4]卷積神經(jīng)網(wǎng)絡(luò)算法在語(yǔ)音識(shí)別中的應(yīng)用[J]. 張文宇,劉暢.  信息技術(shù). 2018(10)
[5]語(yǔ)音識(shí)別技術(shù)概述[J]. 李志遠(yuǎn).  中國(guó)新通信. 2018(17)
[6]基于動(dòng)態(tài)BLSTM和CTC的瀕危語(yǔ)言語(yǔ)音識(shí)別研究[J]. 于重重,陳運(yùn)兵,孫沁瑤,劉暢,徐世璇,尹蔚彬.  計(jì)算機(jī)應(yīng)用研究. 2019(11)
[7]深度學(xué)習(xí)研究綜述[J]. 張榮,李偉平,莫同.  信息與控制. 2018(04)
[8]語(yǔ)音識(shí)別技術(shù)的研究進(jìn)展與展望[J]. 王海坤,潘嘉,劉聰.  電信科學(xué). 2018(02)
[9]ReLU激活函數(shù)優(yōu)化研究[J]. 蔣昂波,王維維.  傳感器與微系統(tǒng). 2018(02)
[10]重慶方言語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 張策,韋鵬程,陸曉燕,石熙.  計(jì)算機(jī)測(cè)量與控制. 2018(01)

博士論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別模型研究[D]. 張仕良.中國(guó)科學(xué)技術(shù)大學(xué) 2017

碩士論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的蒙古語(yǔ)語(yǔ)音識(shí)別系統(tǒng)聲學(xué)模型的研究[D]. 張紅偉.內(nèi)蒙古大學(xué) 2017
[2]基于深度關(guān)注神經(jīng)網(wǎng)絡(luò)的漢語(yǔ)方言辨識(shí)[D]. 邱遠(yuǎn)航.江蘇師范大學(xué) 2017
[3]基于深度學(xué)習(xí)的藏語(yǔ)拉薩方言語(yǔ)音識(shí)別的研究[D]. 張宇聰.西北師范大學(xué) 2016



本文編號(hào):3527422

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3527422.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e6439***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com