基于卷積神經(jīng)網(wǎng)絡(luò)的魯棒性基音檢測方法研究
[Abstract]:Speech is the carrier of information in language symbol system and the most common communication medium in daily life. Pitch is a key feature in speech signal and plays an irreplaceable role. It has been widely used in speech synthesis, speech recognition and other fields. Accurate and efficient speech pitch extraction directly affects the accuracy of speech recognition, the naturalness of speech synthesis and the clarity of speech separation. At present, the extraction of speech pitch in pure speech environment has achieved good results. However, in the noise environment, because the harmonic structure is seriously damaged, it is still a difficult task to detect the pitch in the noise environment. In this paper, a convolutional neural network (Convolutional Neural Network, CNN) is proposed to accomplish this work. CNN is displacement-invariant. By moving the convolution kernel, it can better describe the harmonic structure in the linguistic spectrum. In the implementation, we use CNN to select candidate pitch, then consider the continuity of speech signal, and then use dynamic programming (Dynamic Programing, DP) method to track pitch to generate continuous pitch contour. In the same data set, different methods are used to carry out the contrast experiment. The experimental results show that compared with other methods, the proposed method has obvious performance advantages and can obtain higher pitch detection rate (Detection Rate, DR), lower error decision rate (Voice Decision Error, VDE):) and depth neural network (Deep Neutral Network,). Compared with the DNN), nonlinear amplitude compression method ('PEFAC') and Jin and Wang (' Jin', the average DR increases by 5.58% and 16.41%, respectively. VDE decreased by 1.91% and 10.04% respectively. This method has better generalization performance and better robustness to the new speaker and noise. As the similarity between the test set and the training set becomes smaller, the advantages of the proposed method become more and more obvious.
【學(xué)位授予單位】:內(nèi)蒙古大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TN912.3;TP183
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王都生,鐵滿霞,樊昌信;一種實(shí)時基音檢測算法[J];電子學(xué)報;2000年10期
2 胡劍凌,徐盛,陳健;一種改進(jìn)的基音檢測算法[J];上海交通大學(xué)學(xué)報;2000年06期
3 由紅,陳健;改進(jìn)的頻域基音檢測算法[J];上海交通大學(xué)學(xué)報;2001年06期
4 趙建偉,樓紅偉,徐大為,劉重慶;噪聲環(huán)境下的基音檢測方法[J];紅外與激光工程;2002年01期
5 李香春,杜利民;一種基于多尺度邊緣特征提取的基音檢測算法[J];電子學(xué)報;2003年10期
6 彭輝,寧飛,孔宇;小波的提升方法在基音提取中的應(yīng)用[J];山東大學(xué)學(xué)報(理學(xué)版);2003年01期
7 樓紅偉,趙建偉,胡光銳;一種小波加權(quán)的基音檢測方法[J];上海交通大學(xué)學(xué)報;2003年03期
8 朱君波,高瑞華,王守覺;一種基于能量對稱度參數(shù)的實(shí)時基音檢測方法[J];聲學(xué)與電子工程;2003年04期
9 趙曉群,劉穎娜,武睿;基于形態(tài)濾波的基音檢測新方法[J];通信學(xué)報;2004年05期
10 張?zhí)祢U,張戰(zhàn),權(quán)進(jìn)國,林孝康;語音信號基音檢測的二次譜方法[J];計(jì)算機(jī)應(yīng)用;2005年04期
相關(guān)會議論文 前8條
1 黃鶴;鮑長春;;一種低延時堅(jiān)韌的基音檢測算法[A];第九屆全國信號處理學(xué)術(shù)年會(CCSP-99)論文集[C];1999年
2 林志鋼;王長富;戴蓓倩;;基音檢測的新方法[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1992年
3 尹建琪;張涌;;無限精度語聲基音提取[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1992年
4 李寶利;景新幸;;小波分析在語音基音檢測中的應(yīng)用[A];中國聲學(xué)學(xué)會2007年青年學(xué)術(shù)會議論文集(下)[C];2007年
5 關(guān)存太;陳永彬;;用編碼器實(shí)現(xiàn)清濁判別和基音檢測[A];第一屆全國語言識別學(xué)術(shù)報告與展示會論文集[C];1990年
6 謝曉樺;謝凌云;;基于曲線擬合系數(shù)的漢語聲調(diào)判別方法[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
7 胡波;肖熙;;一種新的檢測語音端點(diǎn)及基音的概率模型及方法[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年
8 劉洪濤;張保軒;;在PC機(jī)上實(shí)現(xiàn)的漢語話者確認(rèn)系統(tǒng)[A];第四屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1996年
相關(guān)博士學(xué)位論文 前1條
1 胡琦;基于計(jì)算聽覺場景分析的單信道語言分離[D];北京交通大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 黃志強(qiáng);卷積神經(jīng)網(wǎng)絡(luò)研究及其在基音檢測中的應(yīng)用[D];內(nèi)蒙古大學(xué);2015年
2 王春娟;基于多窗譜和均值移動算法的基音檢測研究[D];蘇州大學(xué);2015年
3 蘇紅;基于卷積神經(jīng)網(wǎng)絡(luò)的魯棒性基音檢測方法研究[D];內(nèi)蒙古大學(xué);2016年
4 胡瑛;低信噪比下基音檢測算法研究[D];中南大學(xué);2007年
5 徐國鈺;基于多小波的基音檢測法及歌聲的客觀評價研究[D];廣西師范大學(xué);2006年
6 李仕濤;多基音檢測算法研究[D];西安電子科技大學(xué);2014年
7 焦蓓;語音信號的基音檢測法研究[D];湘潭大學(xué);2013年
8 鄭瑞;基音檢測算法研究及其在語音合成中的應(yīng)用[D];南京師范大學(xué);2014年
9 肖春梅;基于基音同步疊加方法的漢語語音合成處理研究[D];昆明理工大學(xué);2014年
10 張營;基音特征提取算法的研究及其在語音門鎖中的應(yīng)用[D];吉林大學(xué);2007年
,本文編號:2296036
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2296036.html