天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

對感冒語音魯棒的語音指令識別及嵌入式實現(xiàn)

發(fā)布時間:2020-07-24 04:59
【摘要】:近幾年來,語音識別技術(shù)逐漸進入人們的日常生活,而加入了語音識別技術(shù)的智能家居系統(tǒng)使得人們的生活更加舒適、便利。但是在實際應(yīng)用場景中,語音識別準確性受許多因素的影響,例如環(huán)境噪聲或者說話人本身變音(如感冒、聲帶發(fā)炎、咽喉炎等),從而導致語音識別系統(tǒng)魯棒性不強。環(huán)境噪聲的因素目前已得到研究人員廣泛關(guān)注并采取各種措施來降低噪聲的影響,但是對說話人本身變音的研究還十分缺乏。因此本文對說話人感冒狀態(tài)下的語音識別進行了研究,其中重點研究了語音識別系統(tǒng)在保證正常語音識別率的同時使得感冒語音識別率盡量接近正常語音識別率,從而改善語音識別系統(tǒng)性能。本論文的主要研究工作和創(chuàng)新如下:(1)建立了感冒語音數(shù)據(jù)庫。根據(jù)智能家居控制語音指令,建立了“感冒非常態(tài)及常態(tài)語音數(shù)據(jù)庫”,該數(shù)據(jù)庫已被中文語言資源聯(lián)盟收錄(No:CLDC-2018-001)。(2)對感冒語音與正常語音的特征進行差異分析和特征參數(shù)處理。采用研究對象感冒前、后的語音,對所提取的特征參數(shù)做統(tǒng)計分析。分析表明研究對象感冒前、后的基音頻率、共振峰、Mel倒譜系數(shù)具有明顯的區(qū)別。根據(jù)特征參數(shù)的差異,本文提出一種基于特征空間軌跡的時間規(guī)正方法,該方法采用段內(nèi)語音信號的均值代表語音特征。實驗結(jié)果表明相比Mel倒譜系數(shù)特征,經(jīng)過該方法處理的特征能有效降低正常語音與感冒語音之間的特征差異。(3)考慮到感冒語音與正常語音模板的失配問題,提出了兩種對感冒語音魯棒的語音識別方案。第一種是基于決策融合的語音識別方案,該方案通過SVM分類器對輸入語音進行正常語音和感冒語音的分類判別。當感冒語音與正常語音區(qū)分度較小時,經(jīng)過決策融合方法得出識別結(jié)果;而區(qū)分度較大時,根據(jù)分類結(jié)果采用對應(yīng)的語音模板得出識別結(jié)果。該方案彌補了語音判別過程帶來的誤差,提升了感冒語音在語音識別系統(tǒng)中的識別率。第二種是基于特征空間軌跡的時間規(guī)正的語音識別方案,該方案對感冒語音特征參數(shù)進行時間規(guī)正處理。該方案能有效提高了感冒語音的識別率和實時性。(4)實現(xiàn)了嵌入式語音識別系統(tǒng),其中包括語音識別算法模塊、人機交互界面模塊及在線學習模塊。最后在真實場景下對系統(tǒng)進行測試,系統(tǒng)識別率在77.52%左右。
【學位授予單位】:華南理工大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TN912.34
【圖文】:

結(jié)構(gòu)圖,發(fā)聲器官,人體,結(jié)構(gòu)圖


語 1272 個、控制指令 1032 個(8 人),此數(shù)據(jù)集二中感冒語音與正常語音實驗平臺 MATLAB2014a 利用 Voicebox、Pmtk3-master、Lib-SVM 等工具箱搭建一實驗使用的計算機為 DELL,該計算機內(nèi)核為 Intel(R) Core(TM) i7,安裝indows 操作系統(tǒng)。音信號的產(chǎn)生過程類產(chǎn)生語音過程分為生理階段和物理階段。在生理階段,大腦將要表達的的形式,向發(fā)音器官發(fā)送一系列的神經(jīng)指令,在物理階段,聲音經(jīng)過呼官和共鳴器官的共同作用以聲波的形式發(fā)出與傳遞[32]。

短時自相關(guān)函數(shù),基音提取,基音頻率


圖 2-3 基于短時自相關(guān)函數(shù)的基音提取.2 感冒前、后基音周期對比采用短時自相關(guān)函數(shù)法提取基音,在語音信號有說話聲部分提取的基音頻率或平穩(wěn);糁芷趯Ρ葘嶒,提取 6 名感冒患者感冒前、后語音,語音來自 PA庫數(shù)據(jù),男生 4 名,女生 2 名。統(tǒng)計 6 位錄音者感冒前、后的基音頻率,分析

語音信號,共振峰


X k 的包絡(luò)線,在語音信號的 包絡(luò)線上尋找出幅值的極大值,通過多個極大值求得共振峰。圖 2-4 是一幀語音信號的頻譜,頻譜曲線用黑實線表示,頻譜包絡(luò)線用黑粗線表示,共振峰峰值位置用黑色小圓圈表示。圖中有四個黑色小圓圈,表示該段語音信號的 4 個共振峰 F1、F2、F3、F4 的位置。圖 2-4 語音信號的共振峰提取圖 2-5 為原始語音信號的時域波形圖,圖 2-6 為語音信號的二維語譜圖,用顏色表示能量值,語譜圖中顏色的深淺表示語音能量的大小,顏色越深,則表示能量越大。語

【參考文獻】

相關(guān)期刊論文 前10條

1 劉佩軍;;關(guān)于普通感冒發(fā)病機制的新思考[J];醫(yī)學爭鳴;2015年03期

2 楊瀟亮;;基于安卓操作系統(tǒng)的應(yīng)用軟件開發(fā)[J];電子制作;2014年19期

3 吳勇毅;;智能家居產(chǎn)業(yè)的機遇與挑戰(zhàn)[J];上海信息化;2014年05期

4 酆勇;李宓;李子明;;文本無關(guān)的說話人識別研究[J];數(shù)字通信;2013年04期

5 王文娟;楊震;;基于語音壓縮感知觀測序列非重構(gòu)的清濁音判別法[J];數(shù)據(jù)采集與處理;2013年03期

6 張永剛;;我國智能家居現(xiàn)狀與問題[J];智能建筑與城市信息;2012年12期

7 周英;;關(guān)于語音識別技術(shù)發(fā)展趨勢的分析[J];計算機光盤軟件與應(yīng)用;2012年19期

8 朱立;;一種基于Android系統(tǒng)的嵌入式數(shù)據(jù)庫同步方案[J];價值工程;2011年16期

9 丁世飛;齊丙娟;譚紅艷;;支持向量機理論與算法研究綜述[J];電子科技大學學報;2011年01期

10 嚴樂貧;奉小慧;;雙模態(tài)車載語音控制仿真系統(tǒng)的設(shè)計與實現(xiàn)[J];計算機與現(xiàn)代化;2010年08期

相關(guān)博士學位論文 前1條

1 何俊;聲紋身份識別中非常態(tài)語音應(yīng)對方法研究[D];華南理工大學;2012年

相關(guān)碩士學位論文 前2條

1 金海;基于深度神經(jīng)網(wǎng)絡(luò)的音頻事件檢測[D];華南理工大學;2016年

2 杜朦旭;感冒病人嗓音的特征提取與識別研究[D];浙江大學;2016年



本文編號:2768353

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2768353.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c24a8***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com