天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學(xué)習(xí)的語(yǔ)音喚醒研究及其應(yīng)用

發(fā)布時(shí)間:2020-11-21 11:36
   語(yǔ)音喚醒技術(shù)是一種特別的語(yǔ)音識(shí)別技術(shù),隨著移動(dòng)互聯(lián)網(wǎng)和人工智能時(shí)代的來(lái)臨被應(yīng)用在各種智能化設(shè)備上。語(yǔ)音喚醒經(jīng)常扮演一個(gè)開(kāi)啟系統(tǒng)的入口角色,在手機(jī)助手、車(chē)載環(huán)境和智能家居環(huán)境運(yùn)用得尤其多。語(yǔ)音喚醒技術(shù)一直在發(fā)展前行,但是在實(shí)際應(yīng)用場(chǎng)景中還面臨著噪聲、遠(yuǎn)場(chǎng)等環(huán)境下識(shí)別效果差,在一些計(jì)算性能低的平臺(tái)還面臨著相對(duì)計(jì)算復(fù)雜度高、資源占用大的問(wèn)題。本文主要針對(duì)以上問(wèn)題,對(duì)聲學(xué)模型進(jìn)行優(yōu)化,應(yīng)用相對(duì)計(jì)算復(fù)雜度較低的解碼算法,致力于提升語(yǔ)音喚醒系統(tǒng)的性能,同時(shí)還將語(yǔ)音喚醒系統(tǒng)應(yīng)用在實(shí)際工程中,實(shí)現(xiàn)算法的移植。本文的主要工作包括:1、為提升噪聲和遠(yuǎn)場(chǎng)環(huán)境下語(yǔ)音喚醒系統(tǒng)的準(zhǔn)確性,將數(shù)據(jù)集進(jìn)行加噪和模擬遠(yuǎn)場(chǎng)處理,訓(xùn)練多結(jié)構(gòu)、精簡(jiǎn)的語(yǔ)音喚醒專用聲學(xué)模型,并使用Viterbi算法進(jìn)行路徑搜索,實(shí)現(xiàn)基于HMM/Filler的語(yǔ)音喚醒系統(tǒng)。2、實(shí)現(xiàn)基于置信度解碼計(jì)算的專用喚醒詞與可定制喚醒詞的語(yǔ)音喚醒系統(tǒng)。經(jīng)過(guò)實(shí)驗(yàn)論證,使用基于置信度計(jì)算的語(yǔ)音喚醒系統(tǒng)相比于基于HMM/Filler的語(yǔ)音喚醒系統(tǒng),能夠獲得更好的識(shí)別性能。3、語(yǔ)音喚醒系統(tǒng)的工程應(yīng)用。將語(yǔ)音喚醒系統(tǒng)的后臺(tái)算法移植到Android平臺(tái),并編寫(xiě)可擴(kuò)展調(diào)用的SDK,在移動(dòng)端驗(yàn)證語(yǔ)音喚醒系統(tǒng)的可行性。
【學(xué)位單位】:廈門(mén)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TN912.34;TP181
【部分圖文】:

架構(gòu)圖,語(yǔ)音識(shí)別系統(tǒng),架構(gòu),聲學(xué)模型


2.1引言??語(yǔ)音識(shí)別系統(tǒng)的實(shí)現(xiàn)分為四個(gè)部分:語(yǔ)音信號(hào)處理和特征提取、聲學(xué)模型、??語(yǔ)言模型、解碼搜索。其系統(tǒng)框架圖如圖2.1所示。??語(yǔ)音信號(hào)?識(shí)別1結(jié)果??^^,?'1:?,?1?????(聲學(xué)語(yǔ)抖(j?丨|解碼搜_?1??聲學(xué)模型??訓(xùn)練解碼%??.1/,?L?\??/i\?/?A?/^?八?模廠——‘一7??丨聲學(xué)模型i丨?發(fā)音字典::語(yǔ)言模型丨耍思一"丨文本語(yǔ)料:??I?\]?\?y?\?y?型訓(xùn)紅?\?\??圖2.1語(yǔ)音識(shí)別系統(tǒng)架構(gòu)圖??從圖中可以看出,這四個(gè)部分貫穿了整個(gè)語(yǔ)音識(shí)別系統(tǒng),而從中又可以引出??幾個(gè)更具體的問(wèn)題:??*語(yǔ)音的存儲(chǔ)及數(shù)字化表示??*輸入語(yǔ)音流的有效起點(diǎn)和終點(diǎn)檢測(cè)??*語(yǔ)音的特征提取過(guò)程??*聲學(xué)模型的選取及其訓(xùn)練方法??*語(yǔ)言模型的分類及選用??*解碼方法及其搜索過(guò)程??本章將針對(duì)這些問(wèn)題,從各個(gè)方面對(duì)語(yǔ)音識(shí)別系統(tǒng)進(jìn)行一個(gè)全面的介紹。首??先是對(duì)語(yǔ)音如何存儲(chǔ)表示做一個(gè)說(shuō)明,再者是對(duì)語(yǔ)音的端點(diǎn)檢測(cè)及特征提取問(wèn)題??做一個(gè)介紹。然后是對(duì)傳統(tǒng)的聲學(xué)模型的理論基礎(chǔ)進(jìn)行更加詳細(xì)的介紹。聲學(xué)模??型的選取是語(yǔ)音識(shí)別的重點(diǎn)內(nèi)容,在傳統(tǒng)GMM-HMM模型應(yīng)用的基礎(chǔ)上,隨著??11??

時(shí)域波形圖,語(yǔ)音信號(hào),單聲道,語(yǔ)音


16KHz*16Bits?=?256Kbps?〇??語(yǔ)音通道數(shù)就是一段語(yǔ)音生成波形的數(shù)量,通常來(lái)說(shuō)分成單聲道以及立體聲??道。單聲道生成一個(gè)波形,立體聲道則生成兩個(gè)波形。如圖2.2是一段16KHz,??16bits的單聲道語(yǔ)音時(shí)域波形圖。??一般來(lái)說(shuō),語(yǔ)音文件常見(jiàn)的格式有Wav、A-law、mp3等,其中Wav是原生??音頻PCM加上頭部信息得到的,A-law?—般是8k?8bit的語(yǔ)音,mp3是經(jīng)過(guò)壓縮??得到的音頻格式。如果想查看音頻的具體信息,可以借助Cool?EditPro這一專??業(yè)的軟件進(jìn)行波形圖、頻譜圖等的查看。圖2.2就是通過(guò)CoolEditPro得到的語(yǔ)??音波形圖,其內(nèi)容為“你好小一”。??HHHH??圖2.2語(yǔ)音信號(hào)時(shí)域波形圖??2.2.2端點(diǎn)檢測(cè)??在對(duì)一段長(zhǎng)語(yǔ)音或者對(duì)語(yǔ)音流進(jìn)行運(yùn)算之前,需要過(guò)濾掉一些無(wú)效的語(yǔ)音段,??13??

雙門(mén)限


??語(yǔ)音為清音,如圖2.3所示。??M?A??M?j一,\???7i?\??Ml??..…j.?j\??一?^?j?!?;?:?^??Cl?j?Bi?:?All?Ai\?Bl\?p2?1??Z?‘?j?j?I?|?|?j?? ̄^—HJ??Zs.....?|f?|?r%.?^??Cl?Bi?Ai?A2?Bi?C2?j??圖2.3雙門(mén)限法不意圖??但是在實(shí)際應(yīng)用中,過(guò)零率作為一個(gè)特征在尋找結(jié)束幀時(shí)并不穩(wěn)定。??另外一種方法是基于窗能量的實(shí)時(shí)檢測(cè)算法。該算法是以一定時(shí)長(zhǎng)的語(yǔ)音段??的窗能量作為判定的一個(gè)標(biāo)準(zhǔn)設(shè)定緩沖區(qū)的最小窗能量閾值,計(jì)算公式為:??窗能量閾值=最小幅度絕對(duì)值x窗長(zhǎng)x采樣率?(2-3)??當(dāng)連續(xù)5次窗能量小于閾值時(shí),則停止錄音,找到語(yǔ)音的結(jié)束端點(diǎn);否則,??將有效的窗語(yǔ)音信號(hào)進(jìn)行拼接,送入到特征提取模塊進(jìn)行進(jìn)一步處理。??另外還可通過(guò)語(yǔ)音特征來(lái)檢測(cè)靜音與否,內(nèi)容將在后文進(jìn)行詳細(xì)介紹。??2.2.3特征提取??目前語(yǔ)音識(shí)別的過(guò)程都是建立在對(duì)語(yǔ)音的特征分析的基礎(chǔ)上,并不是直接對(duì)??音頻本身進(jìn)行處理。語(yǔ)音的特征包含了語(yǔ)音的很多特性
【參考文獻(xiàn)】

相關(guān)期刊論文 前2條

1 路青起;白燕燕;;基于雙門(mén)限兩級(jí)判決的語(yǔ)音端點(diǎn)檢測(cè)方法[J];電子科技;2012年01期

2 李虎生,劉加,劉潤(rùn)生;語(yǔ)音識(shí)別說(shuō)話人自適應(yīng)研究現(xiàn)狀及發(fā)展趨勢(shì)[J];電子學(xué)報(bào);2003年01期


相關(guān)碩士學(xué)位論文 前1條

1 李敏;基于語(yǔ)音關(guān)鍵詞檢測(cè)的人機(jī)交互研究[D];北京交通大學(xué);2016年



本文編號(hào):2892939

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2892939.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶bd53e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com