天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

基于卷積神經(jīng)網(wǎng)絡(luò)的魯棒性基音檢測方法研究

發(fā)布時間:2018-10-26 14:31
【摘要】:語音是語言符號系統(tǒng)中信息的載體,是日常生活中應(yīng)用最普遍的交流媒介。在語音信號中,基音是一個關(guān)鍵的特征,且發(fā)揮不可替代的作用,已廣泛應(yīng)用于語音合成、語音識別等領(lǐng)域。精確而高效地提取語音基音直接影響著語音識別的準(zhǔn)確率、語音合成的自然度以及語音分離的清晰度等。目前,在純凈語音環(huán)境中提取語音基音已經(jīng)取得了不錯的效果,然而,在噪聲環(huán)境下,由于諧波結(jié)構(gòu)被嚴(yán)重破壞,檢測噪聲環(huán)境中語音的基音仍然是一項(xiàng)難度較大的工作。本文提出使用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)來完成這項(xiàng)工作。CNN具有位移不變性,通過卷積核的移動,能夠更好地刻畫語譜中的諧波結(jié)構(gòu)。在具體的實(shí)現(xiàn)中,本文使用CNN來選取候選基音,然后考慮到語音信號的連續(xù)性,再用動態(tài)規(guī)劃(Dynamic Programing, DP)方法進(jìn)行基音追蹤,生成連續(xù)的基音輪廓。在相同的數(shù)據(jù)集上用不同的方法進(jìn)行對比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,與其它方法相比,本文的方法具有明顯的性能優(yōu)勢,能夠得到較高的基音檢測率(Detection Rate, DR)和較低的錯誤決策率(Voice Decision Error, VDE):與深度神經(jīng)網(wǎng)絡(luò)(Deep Neutral Network, DNN)、非線性幅度壓縮法(以下簡稱'PEFAC')和Jin and Wang(以下簡稱‘Jin’)相比,本文提出的方法,DR平均分別提升了5.58%、5.75%和16.41%;VDE則分別下降了1.91%、4.25%和10.04%,該方法對新的說話人和噪聲有很好的泛化性能,具有更好的魯棒性。并且隨著測試集與訓(xùn)練集的相似性逐漸變小,我們所提出方法的優(yōu)勢也越來越明顯。
[Abstract]:Speech is the carrier of information in language symbol system and the most common communication medium in daily life. Pitch is a key feature in speech signal and plays an irreplaceable role. It has been widely used in speech synthesis, speech recognition and other fields. Accurate and efficient speech pitch extraction directly affects the accuracy of speech recognition, the naturalness of speech synthesis and the clarity of speech separation. At present, the extraction of speech pitch in pure speech environment has achieved good results. However, in the noise environment, because the harmonic structure is seriously damaged, it is still a difficult task to detect the pitch in the noise environment. In this paper, a convolutional neural network (Convolutional Neural Network, CNN) is proposed to accomplish this work. CNN is displacement-invariant. By moving the convolution kernel, it can better describe the harmonic structure in the linguistic spectrum. In the implementation, we use CNN to select candidate pitch, then consider the continuity of speech signal, and then use dynamic programming (Dynamic Programing, DP) method to track pitch to generate continuous pitch contour. In the same data set, different methods are used to carry out the contrast experiment. The experimental results show that compared with other methods, the proposed method has obvious performance advantages and can obtain higher pitch detection rate (Detection Rate, DR), lower error decision rate (Voice Decision Error, VDE):) and depth neural network (Deep Neutral Network,). Compared with the DNN), nonlinear amplitude compression method ('PEFAC') and Jin and Wang (' Jin', the average DR increases by 5.58% and 16.41%, respectively. VDE decreased by 1.91% and 10.04% respectively. This method has better generalization performance and better robustness to the new speaker and noise. As the similarity between the test set and the training set becomes smaller, the advantages of the proposed method become more and more obvious.
【學(xué)位授予單位】:內(nèi)蒙古大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TN912.3;TP183

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王都生,鐵滿霞,樊昌信;一種實(shí)時基音檢測算法[J];電子學(xué)報;2000年10期

2 胡劍凌,徐盛,陳健;一種改進(jìn)的基音檢測算法[J];上海交通大學(xué)學(xué)報;2000年06期

3 由紅,陳健;改進(jìn)的頻域基音檢測算法[J];上海交通大學(xué)學(xué)報;2001年06期

4 趙建偉,樓紅偉,徐大為,劉重慶;噪聲環(huán)境下的基音檢測方法[J];紅外與激光工程;2002年01期

5 李香春,杜利民;一種基于多尺度邊緣特征提取的基音檢測算法[J];電子學(xué)報;2003年10期

6 彭輝,寧飛,孔宇;小波的提升方法在基音提取中的應(yīng)用[J];山東大學(xué)學(xué)報(理學(xué)版);2003年01期

7 樓紅偉,趙建偉,胡光銳;一種小波加權(quán)的基音檢測方法[J];上海交通大學(xué)學(xué)報;2003年03期

8 朱君波,高瑞華,王守覺;一種基于能量對稱度參數(shù)的實(shí)時基音檢測方法[J];聲學(xué)與電子工程;2003年04期

9 趙曉群,劉穎娜,武睿;基于形態(tài)濾波的基音檢測新方法[J];通信學(xué)報;2004年05期

10 張?zhí)祢U,張戰(zhàn),權(quán)進(jìn)國,林孝康;語音信號基音檢測的二次譜方法[J];計(jì)算機(jī)應(yīng)用;2005年04期

相關(guān)會議論文 前8條

1 黃鶴;鮑長春;;一種低延時堅(jiān)韌的基音檢測算法[A];第九屆全國信號處理學(xué)術(shù)年會(CCSP-99)論文集[C];1999年

2 林志鋼;王長富;戴蓓倩;;基音檢測的新方法[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1992年

3 尹建琪;張涌;;無限精度語聲基音提取[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1992年

4 李寶利;景新幸;;小波分析在語音基音檢測中的應(yīng)用[A];中國聲學(xué)學(xué)會2007年青年學(xué)術(shù)會議論文集(下)[C];2007年

5 關(guān)存太;陳永彬;;用編碼器實(shí)現(xiàn)清濁判別和基音檢測[A];第一屆全國語言識別學(xué)術(shù)報告與展示會論文集[C];1990年

6 謝曉樺;謝凌云;;基于曲線擬合系數(shù)的漢語聲調(diào)判別方法[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年

7 胡波;肖熙;;一種新的檢測語音端點(diǎn)及基音的概率模型及方法[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年

8 劉洪濤;張保軒;;在PC機(jī)上實(shí)現(xiàn)的漢語話者確認(rèn)系統(tǒng)[A];第四屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1996年

相關(guān)博士學(xué)位論文 前1條

1 胡琦;基于計(jì)算聽覺場景分析的單信道語言分離[D];北京交通大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 黃志強(qiáng);卷積神經(jīng)網(wǎng)絡(luò)研究及其在基音檢測中的應(yīng)用[D];內(nèi)蒙古大學(xué);2015年

2 王春娟;基于多窗譜和均值移動算法的基音檢測研究[D];蘇州大學(xué);2015年

3 蘇紅;基于卷積神經(jīng)網(wǎng)絡(luò)的魯棒性基音檢測方法研究[D];內(nèi)蒙古大學(xué);2016年

4 胡瑛;低信噪比下基音檢測算法研究[D];中南大學(xué);2007年

5 徐國鈺;基于多小波的基音檢測法及歌聲的客觀評價研究[D];廣西師范大學(xué);2006年

6 李仕濤;多基音檢測算法研究[D];西安電子科技大學(xué);2014年

7 焦蓓;語音信號的基音檢測法研究[D];湘潭大學(xué);2013年

8 鄭瑞;基音檢測算法研究及其在語音合成中的應(yīng)用[D];南京師范大學(xué);2014年

9 肖春梅;基于基音同步疊加方法的漢語語音合成處理研究[D];昆明理工大學(xué);2014年

10 張營;基音特征提取算法的研究及其在語音門鎖中的應(yīng)用[D];吉林大學(xué);2007年

,

本文編號:2296036

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2296036.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶25903***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com