天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于卷積神經(jīng)網(wǎng)絡(luò)的歌唱語音識別

發(fā)布時間:2020-08-08 03:45
【摘要】:采用信號分析手段對歌唱藝術(shù)嗓音的質(zhì)量和狀態(tài)進行科學(xué)客觀評價,這樣對歌唱表演人才的科學(xué)選拔、教學(xué)、培訓(xùn)以及嗓音疾病診斷等方面有著重要的意義。然而,目前相關(guān)方法還存在著較多問題亟待解決,如聲學(xué)參數(shù)研究單一、信息融合效率低、算法魯棒性不好、低信噪比情況下識別準(zhǔn)確率低、評價階段信息利用不充分等。針對以上問題,本文采用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)作為基礎(chǔ)網(wǎng)絡(luò),通過相關(guān)預(yù)處理以及對CNN網(wǎng)絡(luò)的參數(shù)優(yōu)化和結(jié)構(gòu)調(diào)整,將傳統(tǒng)二維CNN(2DCNN)網(wǎng)絡(luò)改進為更適用于一維聲音信號的一維CNN(1DCNN)網(wǎng)絡(luò),提出了基于1DCNN網(wǎng)絡(luò)的歌唱藝術(shù)嗓音質(zhì)量評價方法。首先,對嗓音信號進行預(yù)處理。利用語音分析技術(shù)提取歌聲聲學(xué)參數(shù)第一共振峰、第三共振峰、基頻、音域、基頻微擾、第一共振峰微擾、第三共振峰微擾、平均能量等,將這些基礎(chǔ)特征進行融合重組構(gòu)成輸入信號。本文采用小波分解重構(gòu)低頻系數(shù)信號,結(jié)合高階累積量思想對重構(gòu)的帶噪嗓音信號進行檢測分析,提出了一種基于改進小波變換的基音周期檢測方法。實驗證明,本文所提方法可以提高低信噪比下基音周期檢測的準(zhǔn)確性,且計算量較小,聲音信號的頻譜結(jié)構(gòu)和信息保留完整。然后,提出了改進的適用于一維聲音信號的1DCNN模型。通過改進和調(diào)整傳統(tǒng)2DCNN的結(jié)構(gòu),提出了一種能更好地描述一維嗓音信號的時變特性的1DCNN模型。針對CNN訓(xùn)練過程中耗時較長的問題,本文通過融合分?jǐn)?shù)階神經(jīng)網(wǎng)絡(luò)思想,提出了利用Sigmoid函數(shù)分?jǐn)?shù)階處理節(jié)點的方法,同時提出了改進的0.5分?jǐn)?shù)階1DCNN模型。實驗證明,本文所提模型收斂速度更快,縮短了CNN訓(xùn)練耗時,且嗓音質(zhì)量評價系統(tǒng)精度為85.7%,相較于傳統(tǒng)2DCNN網(wǎng)絡(luò)提升了5.4%。最后,提出了一種基于1DCNN模型的歌唱藝術(shù)嗓音質(zhì)量評價方法。在Matlab R2016a平臺完成仿真實驗,將預(yù)測評價結(jié)果與專業(yè)人士的主觀評價結(jié)果進行比較,得出誤差統(tǒng)計結(jié)果;并與BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)、小波神經(jīng)網(wǎng)絡(luò)以及傳統(tǒng)2DCNN網(wǎng)絡(luò)進行對比分析。實驗結(jié)果表明,本文所提方法平均誤差為0.23,比BP神經(jīng)網(wǎng)絡(luò)低0.50,比小波神經(jīng)網(wǎng)絡(luò)低0.33。本文所提基于1DCNN的歌唱藝術(shù)嗓音質(zhì)量評價方法較好地解決了特征信息融合以及利用率、低信噪比下基音周期檢測、一維卷積神經(jīng)網(wǎng)絡(luò)的構(gòu)造以及訓(xùn)練效率等問題,能夠客觀有效地評估歌唱藝術(shù)嗓音質(zhì)量等級,對比誤差小,魯棒性較好且可移植性強。本文方法不僅可用于歌唱嗓音評估,還可用于嗓音疾病診斷等方面,具有較大的應(yīng)用價值。
【學(xué)位授予單位】:西南科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TN912.34;TP183
【圖文】:

統(tǒng)計模型,量化過程


量化過程統(tǒng)計模型

波形,分布密度,取樣定理,量化過程


散變換[35]。根據(jù)取樣定理,當(dāng)取樣丟失信息,通過取樣信號可以準(zhǔn)確地號進行量化,連續(xù)波形的波形離散成若干個,并且在同一個幅值范圍電平的選擇依賴于數(shù)字表示的應(yīng)模型來表示,即量化后的信號 (~x n和,即 ()~x n= x (n)+ e (n)。圖 2-1 量化過程統(tǒng)計模型 statistical model of quantizing proc

譜線,預(yù)加重,基音,譜線


)量化誤差在所劃分的間隔內(nèi)均勻分布,且具有度函數(shù)如圖 2-2 所示。音的預(yù)加重弱的原因很多,但在口腔唇中對高頻的影響遠遠析最原始信號,所以要對藝術(shù)嗓音進行預(yù)加重技使得信號更加接近原始信號。在實驗中,通常是重,一般選取 FIR 數(shù)字濾波器[42],其傳遞函數(shù)()11 H z z個作用:(1)增添一個零點抵消減少的高頻成其頻譜;在藝術(shù)嗓音中剩下聲道的影響,提取的致[43];(2)FIR 數(shù)字濾波器是一個高通濾波器)它還便于共振峰的檢測,減少頻譜的動蕩,提

【相似文獻】

相關(guān)期刊論文 前10條

1 曾維亮;林志賢;陳永灑;;基于卷積神經(jīng)網(wǎng)絡(luò)的智能冰箱果蔬圖像識別的研究[J];微型機與應(yīng)用;2017年08期

2 王媛媛;周濤;吳翠穎;;基于卷積神經(jīng)網(wǎng)絡(luò)的PET/CT多模態(tài)圖像識別研究[J];電視技術(shù);2017年03期

3 尹勰;閆磊;;基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像目標(biāo)檢測[J];工業(yè)控制計算機;2017年04期

4 張慶輝;萬晨霞;;卷積神經(jīng)網(wǎng)絡(luò)綜述[J];中原工學(xué)院學(xué)報;2017年03期

5 俞汝R

本文編號:2784997


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2784997.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶36b37***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com