全局譜參數(shù)下的耳語說話人狀態(tài)因子分析
發(fā)布時間:2018-05-17 02:16
本文選題:耳語音 + 說話人識別; 參考:《聲學(xué)學(xué)報》2014年02期
【摘要】:提出了全局譜參數(shù)下的耳語說話人狀態(tài)因子分析方法。首先,根據(jù)耳語聽辨實驗結(jié)果,提出導(dǎo)入喚醒度-愉悅度因子對說話人狀態(tài)進(jìn)行三級度量;其次,提取耳語音正弦模型、人耳聽覺模型下的譜參數(shù),結(jié)合其他短時頻譜參量,進(jìn)行軌跡跟蹤并計算各參數(shù)的全局統(tǒng)計變量,作為特征參數(shù)來實現(xiàn)耳語說話人狀態(tài)的分類。實驗結(jié)果顯示,正弦模型及人耳聽覺模型的全局譜參數(shù)可將耳語說話人狀態(tài)因子分類系統(tǒng)的準(zhǔn)確率提高至90%。該分類方法及狀態(tài)因子描述方案提供了耳語音說話人狀態(tài)分析的有效途徑。
[Abstract]:In this paper, a method of whispering speaker state factor analysis based on global spectral parameters is proposed. First of all, according to the experimental results of hearing in whispers, we propose a three-level measurement of the speaker's state by introducing the arousal and pleasure factors. Secondly, we extract the spectral parameters of the sinusoidal model and the auditory model, and combine with other short-term spectral parameters. Track and calculate the global statistical variables of each parameter, as characteristic parameters to achieve the classification of whispers' states. The experimental results show that the global spectral parameters of sinusoidal model and auditory model can improve the accuracy of the classification system of whispering speaker state factors to 90. The classification method and the description scheme of the state factor provide an effective way to analyze the state of the speaker.
【作者單位】: 蘇州大學(xué)電子信息學(xué)院;蘇州大學(xué)物理科學(xué)與技術(shù)學(xué)院;
【基金】:國家自然科學(xué)基金(61071215,61271359,61372146) 江蘇省普通高校研究生科研創(chuàng)新計劃項目(05KJB510113)資助
【分類號】:TN912.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前7條
1 陳雪勤;趙鶴鳴;;基于聽覺模型的漢語耳語音聲調(diào)檢測[J];電子學(xué)報;2009年04期
2 趙迎春;張勁松;韓晶晶;任芳;蔡汝剛;;中國兒童情感評價圖片庫(7~14歲,上海版)的建立[J];中國兒童保健雜志;2009年03期
3 趙鶴鳴,朱祺,陳雪勤,俞一彪;臨界頻帶子波變換用于混疊語音分離的研究[J];聲學(xué)學(xué)報;2004年02期
4 陶智;趙鶴鳴;吳迪;陳大慶;張曉俊;;基于修正Mel域掩蔽模型和無語音概率的耳語音增強[J];聲學(xué)學(xué)報(中文版);2009年04期
5 王敏;趙鶴鳴;;基于多帶解調(diào)分析和瞬時頻率估計的耳語音話者識別[J];聲學(xué)學(xué)報;2010年04期
6 張翠玲;譚鐵軍;劉f;;偽裝語音的自動話者識別研究[J];刑事技術(shù);2007年02期
7 潘欣裕;趙鶴鳴;;中文耳語元音的聲調(diào)特征研究[J];信號處理;2011年10期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王忠文;謝莉萍;梁杰豪;;基于計算聽覺場景分析的混疊語音分離算法[J];電聲技術(shù);2008年10期
2 王s,
本文編號:1899453
本文鏈接:http://sikaile.net/kejilunwen/wltx/1899453.html
最近更新
教材專著