韻律特征在概率線性判別分析說話人確認中的應用
本文關鍵詞:韻律特征在概率線性判別分析說話人確認中的應用
更多相關文章: 韻律特征 說話人確認 線性判別分析 倒譜系數(shù) 說話人識別 特征融合 多項式擬合 單系統(tǒng) 特征參數(shù) 子空間
【摘要】:研究韻律特征在說話人確認中的應用。將整個韻律軌跡以固定段長和段移進行片段劃分,并對其進行勒讓德多項式擬合從而獲取連續(xù)性的韻律特征,將特征映射到總變化因子空間,并用概率線性判別分析來補償說話人和場景的差異。在美國國家標準技術研究院2010年說話人識別評測擴展核心測試集5的基礎上加入噪聲構造測試集,并分別對韻律特征和傳統(tǒng)Mel頻率倒譜系數(shù)進行測試。結果顯示,隨著信噪比的逐漸減小,Mel頻率倒譜系數(shù)性能出現(xiàn)大幅度下降,而韻律特征性能相對比較穩(wěn)定,兩種特征融合后能使系統(tǒng)性能得到進一步提升,等錯率和最小檢測錯誤代價相對于Mel頻率倒譜系數(shù)單系統(tǒng)最多能分別下降9%和11%。實驗表明,韻律特征應用于說話人識別中具有較強的噪聲魯棒性,且與傳統(tǒng)的Mel頻率倒譜系數(shù)存在較強的互補性。
【作者單位】: 山東理工大學計算機科學與技術學院;中國科學院聲學研究所中國科學院語言聲學與內(nèi)容理解重點實驗室;
【基金】:國家自然科學基金(10925419,90920302,61072124,11074275,11161140319,91120001,61271426) 中國科學院戰(zhàn)略性先導科技專項(XDA06030100,XDA06030500) 國家863計劃(2012AA012503) 中國科學院重點部署項目(KGZD-EW-103-2)資助
【分類號】:TN912.3
【正文快照】: 判決的技術p-a。說話人確認的語音參數(shù)按照層次31^- 從低到高可分為:聲學層短時特征、韻律層特征、音素層特征和語法特征等。其中聲學層短時特征具有說話人確認技術是利用語音信號中所包含的說很高的識別性能,是說話人確認中最常用的特征參話人特征信息,對其所聲明的身份做出
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前7條
1 何亮;史永哲;劉加;;聯(lián)合因子分析中的本征信道空間拼接方法[J];自動化學報;2011年07期
2 WANG Maolin;LI Jinsui;LIN Maocan;XIONG Ziyu;;A comparison on the pitch of statement of dialogue and read speech in Chinese Putonghua[J];Chinese Journal of Acoustics;2013年01期
3 FENG Yongqiang;YAN Qian;GAO Xinglong;PAN Fuping;XING Lili;LIN Chunlan;PAN Jielin;;Acoustic characteristics of stop consonants in fluent reading Chinese Putonghua speech of adult stutterers[J];Chinese Journal of Acoustics;2013年03期
4 ZHOU Jian;ZHENG Wenming;WANG Qingyun;ZHAO Li;;Intelligibility enhancement for noisy whispered speech using asymmetric cost function[J];Chinese Journal of Acoustics;2014年03期
5 WU Di;ZHAO Heming;HUANG Chengwei;XIAO Zhongzhe;ZHANG Xiaojun;XU Yishen;TAO Zhi;;Speech endpoint detection in low-SNRs environment based on perception spectrogram structure boundary parameter[J];Chinese Journal of Acoustics;2014年04期
6 張建平;李明;索宏彬;楊琳;付強;顏永紅;;長時語音特征在說話人識別技術上的應用[J];聲學學報;2010年02期
7 楊海;張翔;梁春燕;索宏彬;顏永紅;;聯(lián)合因子分析和稀疏表示在穩(wěn)健性說話人確認中的應用[J];聲學學報;2012年05期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 賀前華;王志鋒;Alexander I Rudnicky;朱錚宇;李新超;;基于改進PNCC特征和兩步區(qū)分性訓練的錄音設備識別方法[J];電子學報;2014年01期
2 黃奮;馬皓;鄧菁;;說話人識別技術在社保系統(tǒng)中的遠程身份認證應用研究[J];電子技術與軟件工程;2014年02期
3 李晉;郭武;戴禮榮;;聯(lián)合因子分析算法中基于信號子空間的空間變換方法[J];模式識別與人工智能;2013年08期
4 楊棟;周秀玲;郭平;;基于貝葉斯通用背景模型的圖像標注[J];自動化學報;2013年10期
5 祝太鋒;;基于動態(tài)反饋負載均衡算法的改進[J];湖南農(nóng)機;2013年11期
6 駱啟帆;章堅武;吳震東;;一種基于MFCC與韻律特征的說話人確認方法[J];杭州電子科技大學學報;2013年05期
7 陳麗萍;王爾玉;戴禮榮;宋彥;;基于深層置信網(wǎng)絡的說話人信息提取方法[J];模式識別與人工智能;2013年12期
8 廖曉鋒;范修斌;姜青山;;基于協(xié)方差的高斯混合模型參數(shù)學習算法[J];計算機科學;2013年S2期
9 郭心語;何曉豐;宮學慶;張蓉;周傲英;;一種基于曝光量和點擊率的用戶組優(yōu)化策略[J];計算機研究與發(fā)展;2013年S1期
10 李晉徽;楊俊安;王一;;一種新的基于瓶頸深度信念網(wǎng)絡的特征提取方法及其在語種識別中的應用[J];計算機科學;2014年03期
中國重要會議論文全文數(shù)據(jù)庫 前6條
1 駱啟帆;章堅武;吳震東;;一種基于MFCC與韻律特征的說話人確認方法[A];浙江省電子學會2013學術年會論文集[C];2013年
2 尹聰;白靜;龔[,
本文編號:1246360
本文鏈接:http://sikaile.net/kejilunwen/wltx/1246360.html