基于深度神經(jīng)網(wǎng)絡和Bottleneck特征的說話人識別系統(tǒng)
本文關(guān)鍵詞:基于深度神經(jīng)網(wǎng)絡和Bottleneck特征的說話人識別系統(tǒng)
更多相關(guān)文章: 說話人識別 深度神經(jīng)網(wǎng)絡 Bottleneck特征
【摘要】:近來,一種結(jié)合語音識別中深度神經(jīng)網(wǎng)絡(deep neural network,DNN)模型和說話人識別中身份認證矢量(identity vector,i-vector)模型的方法被證明對說話人識別十分有效。為了進一步提升系統(tǒng)性能,該文提出使用基于說話人標簽的DNN模型提取Bottleneck特征代替該模型中的短時頻譜特征來計算充分統(tǒng)計量,從而使統(tǒng)計量中包含更多有利于說話人識別的信息。在美國國家標準與技術(shù)研究院說話人識別庫2008年度女性電話對電話英語測試任務上進行的實驗證明了該方法的有效性。相比原來的短時頻譜特征,基于Bottleneck特征的說話人識別系統(tǒng)在等錯誤率和最小檢測代價上相對減小了7.65%和5.71%。
【作者單位】: 清華大學電子工程系清華信息科學與技術(shù)國家實驗室(籌);
【關(guān)鍵詞】: 說話人識別 深度神經(jīng)網(wǎng)絡 Bottleneck特征
【基金】:國家自然科學基金資助項目(61273268,61370034,61403224)
【分類號】:TN912.34;TP183
【正文快照】: 說話人識別又稱聲紋識別,是利用語音信號中含有的特定說話人信息來自動識別說話者身份的一種生物認證技術(shù)[1]。近年來,基于i-vector建模方法的引入使得說話人識別系統(tǒng)的性能有了顯著的提升[2]。i-vector模型認為語音中的說話人和信道信息均包含于一個低維的線性子空間之中,每
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 石艷;王曉曄;;新穎檢測法在說話人識別技術(shù)中的應用[J];現(xiàn)代計算機(專業(yè)版);2008年07期
2 劉雪燕;張娜;袁寶玲;;說話人識別綜述[J];電腦知識與技術(shù);2009年01期
3 邱政權(quán);范小春;王俊年;;基于動態(tài)環(huán)境下的說話人識別[J];科學技術(shù)與工程;2010年02期
4 單進;;說話人識別技術(shù)研究[J];科技資訊;2010年21期
5 申志生;于明;;說話人識別算法的定點DSP實現(xiàn)[J];單片機與嵌入式系統(tǒng)應用;2011年03期
6 謝建勛;;淺談說話人識別技術(shù)[J];電腦知識與技術(shù);2011年11期
7 安茂波;劉建;;一個快速說話人識別系統(tǒng)的設計和實現(xiàn)[J];網(wǎng)絡新媒體技術(shù);2012年03期
8 楊迪;戚銀城;劉明軍;張華芳子;武軍娜;;說話人識別綜述[J];電子科技;2012年06期
9 武光利;;說話人識別方法概述[J];硅谷;2012年19期
10 曹業(yè)敏,侯風雷,王炳錫;說話人識別技術(shù)現(xiàn)狀與進展[J];河南科技;1998年09期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 鮑福良;方志剛;徐潔;;說話人識別綜述[A];第六屆全國信息獲取與處理學術(shù)會議論文集(2)[C];2008年
2 孫帆;遲惠生;;循環(huán)網(wǎng)絡說話人識別[A];第二屆全國人機語音通訊學術(shù)會議論文集[C];1992年
3 肖劍;歐貴文;;多層前饋神經(jīng)網(wǎng)絡組的文本無關(guān)說話人識別[A];第七屆全國人機語音通訊學術(shù)會議(NCMMSC7)論文集[C];2003年
4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類算法及其在說話人識別中的應用研究[A];第八屆全國人機語音通訊學術(shù)會議論文集[C];2005年
5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關(guān)說話人識別[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學術(shù)會議論文集(上冊)[C];2007年
6 戴紅霞;趙力;;文本無關(guān)說話人識別系統(tǒng)的研究[A];2007’促進西部發(fā)展聲學學術(shù)交流會論文集[C];2007年
7 陳聯(lián)武;郭武;戴禮榮;;說話人識別系統(tǒng)中多樣訓練的應用[A];第十一屆全國人機語音通訊學術(shù)會議論文集(一)[C];2011年
8 崔玉紅;胡光銳;;基于神經(jīng)網(wǎng)絡特征維數(shù)壓縮方法及其在說話人識別中的應用[A];第十屆全國信號處理學術(shù)年會(CCSP-2001)論文集[C];2001年
9 吳麗麗;;基于仿生模式識別的說話人識別學習模型研究[A];第二屆中國科學院博士后學術(shù)年會暨高新技術(shù)前沿與發(fā)展學術(shù)會議程序冊[C];2010年
10 張晶;董金明;馮文全;;說話人識別系統(tǒng)研究與實現(xiàn)[A];全國第二屆信號處理與應用學術(shù)會議?痆C];2008年
中國重要報紙全文數(shù)據(jù)庫 前2條
1 汪永安;科大訊飛說話人識別技術(shù)世界領(lǐng)先[N];安徽日報;2008年
2 吳長鋒;科大訊飛勇奪說話人識別國際大賽第一[N];科技日報;2008年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 單振宇;情感說話人識別及其解決方法的研究[D];浙江大學;2010年
2 別凡虎;說話人識別中區(qū)分性問題的研究[D];清華大學;2015年
3 陸偉;基于缺失特征的文本無關(guān)說話人識別魯棒性研究[D];中國科學技術(shù)大學;2008年
4 劉鏑;說話人識別中信息融合算法的研究[D];北京交通大學;2011年
5 付中華;說話人識別系統(tǒng)魯棒性研究[D];西北工業(yè)大學;2004年
6 林琳;基于模糊聚類與遺傳算法的說話人識別理論研究及應用[D];吉林大學;2007年
7 邱政權(quán);在噪聲環(huán)境下的說話人識別[D];華南理工大學;2007年
8 郭武;復雜信道下的說話人識別[D];中國科學技術(shù)大學;2007年
9 錢博;基于漢語元音映射的說話人識別技術(shù)研究[D];南京理工大學;2007年
10 姜濤;網(wǎng)絡環(huán)境下說話人識別關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學;2011年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 叢菡菡;基于支持相量機的穩(wěn)鍵說話人識別[D];電子科技大學;2008年
2 任舒彬;面向手持應用的說話人識別算法研究[D];浙江大學;2006年
3 申志生;文本相關(guān)說話人識別嵌入式系統(tǒng)及其關(guān)鍵技術(shù)研究[D];河北工業(yè)大學;2011年
4 汪q,
本文編號:844476
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/844476.html