天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于深度學(xué)習(xí)的調(diào)頻廣播語(yǔ)種識(shí)別模型及應(yīng)用

發(fā)布時(shí)間:2021-11-20 04:16
  隨著社會(huì)經(jīng)濟(jì)的高速發(fā)展以及全球化進(jìn)程的加快,全球范圍內(nèi)的人員流動(dòng)增加了擁有不同語(yǔ)言背景的人相互交流的機(jī)會(huì),自動(dòng)語(yǔ)種識(shí)別作為語(yǔ)音識(shí)別的第一步顯得十分重要。全球人工智能的快速發(fā)展也促進(jìn)了各項(xiàng)技術(shù)的升級(jí),語(yǔ)音技術(shù)作為人類信息交流的橋梁技術(shù),引得越來(lái)越多的科研工作者投入到實(shí)現(xiàn)良好語(yǔ)音交互的行列中。包括邊境地區(qū)的無(wú)線電通信安全問(wèn)題,也可采用語(yǔ)音識(shí)別的方法進(jìn)行監(jiān)測(cè),實(shí)現(xiàn)快速精準(zhǔn)的語(yǔ)種識(shí)別對(duì)后續(xù)所有與語(yǔ)音識(shí)別相關(guān)的工作顯得極為重要。本文圍繞廣播的語(yǔ)音語(yǔ)種識(shí)別,對(duì)語(yǔ)種識(shí)別方法進(jìn)行了詳細(xì)的討論與研究,主要工作如下:1)根據(jù)語(yǔ)種識(shí)別領(lǐng)域的對(duì)數(shù)據(jù)集的要求,采集了老撾語(yǔ)、普通話、緬甸語(yǔ)、泰國(guó)語(yǔ)和越南語(yǔ)共5種語(yǔ)言約25小時(shí)的數(shù)據(jù)集,并通過(guò)與其他數(shù)據(jù)集對(duì)比研究,確認(rèn)數(shù)據(jù)的可靠性。2)結(jié)合語(yǔ)音處理的方法,建立廣播信號(hào)識(shí)別數(shù)據(jù)集,利用深度學(xué)習(xí)對(duì)調(diào)頻廣播信號(hào)掃頻錄音保存后音頻文件進(jìn)行識(shí)別,以此來(lái)識(shí)別信號(hào)與非信號(hào)。3)采用I-Vector的方法建立可靠語(yǔ)種識(shí)別的基線系統(tǒng),為后續(xù)試驗(yàn)的改進(jìn)提供可靠的理論依據(jù)。4)以深層神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),針對(duì)短時(shí)變長(zhǎng)的語(yǔ)音信號(hào),設(shè)計(jì)了兩種采用底層聲學(xué)特征作為輸入的深度學(xué)習(xí)的語(yǔ)種識(shí)別方法。一種是... 

【文章來(lái)源】:云南大學(xué)云南省 211工程院校

【文章頁(yè)數(shù)】:75 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于深度學(xué)習(xí)的調(diào)頻廣播語(yǔ)種識(shí)別模型及應(yīng)用


圖1-1所示的一種語(yǔ)吉的語(yǔ)音到另一種語(yǔ)言的語(yǔ)音的轉(zhuǎn)換,是在確記了待??1??

結(jié)構(gòu)圖,語(yǔ)種,特征層,結(jié)構(gòu)圖


中模型訓(xùn)練和模型測(cè)試,又可以分為模型的構(gòu)建、訓(xùn)練和測(cè)試,關(guān)容將會(huì)在下面章節(jié)做詳細(xì)介紹。在這里主要介紹特征提取,特征提理階段,提取出的特征在語(yǔ)種識(shí)別中用于區(qū)分不同語(yǔ)種。由于該類言類別區(qū)分性,特征提取階段要減弱或者消除語(yǔ)音信號(hào)中所攜帶的類無(wú)關(guān)的信息。語(yǔ)種識(shí)別系統(tǒng)用于分類的特征從底層特征到高層特征征(Acoustic)、音位序列特征(Phonotactics)、韻律特征(Prosodic)、cal)和語(yǔ)法(Syntactic),如圖?1-3?所不[21。??聲學(xué)特征。語(yǔ)音作為語(yǔ)言系統(tǒng)中的實(shí)體是音素[3),??種語(yǔ)言中使用的數(shù)量在15到50個(gè)不等,其中大多數(shù)語(yǔ)言使用的音素大約有30個(gè)[4]。普通話有21個(gè)輔音10個(gè)元音,英語(yǔ)有24個(gè)輔荇和14個(gè)元音W。言可能會(huì)擁有共同的因素,但不同語(yǔ)言其語(yǔ)音由不同的聲學(xué)單元構(gòu)于這一點(diǎn),可以通過(guò)對(duì)語(yǔ)音信號(hào)分幀和加窗提取聲學(xué)特征用于語(yǔ)種識(shí)

客家話,閩南話,上海話,智能手機(jī)


?云南大學(xué)碩士學(xué)位論文???(changsha)、河北話(hebei)、南昌話(nanchang)、上海話(shanghai)、客家話??(kejia)和閩南話(minnan)。音頻數(shù)據(jù)由各個(gè)型號(hào)的智能手機(jī)采集,錄制環(huán)境包??含安靜環(huán)境和噪聲環(huán)境,采樣率為16kHz,以16bits量化的PCM格式存儲(chǔ)。訓(xùn)練??數(shù)據(jù)每種語(yǔ)言包含30人,男女各15人,每人200句。測(cè)試數(shù)據(jù)包含5人,2名女??性3名男性,每人100句。數(shù)據(jù)具體描述見表1-1。??


本文編號(hào):3506546

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3506546.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4f301***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com