一種基于受限玻爾茲曼機(jī)的說話人特征提取算法
本文關(guān)鍵詞:一種基于受限玻爾茲曼機(jī)的說話人特征提取算法 出處:《儀器儀表學(xué)報(bào)》2016年02期 論文類型:期刊論文
更多相關(guān)文章: 說話人確認(rèn) 身份認(rèn)證矢量 深度學(xué)習(xí) 受限玻爾茲曼機(jī) 線性判別分析
【摘要】:基于總體空間差異模型的身份認(rèn)證矢量(即i-vector)已經(jīng)在說話人識(shí)別任務(wù)中得到了廣泛應(yīng)用。本文提出了一種基于受限玻爾茲曼機(jī)(RBM)的說話人特征向量提取方法來替代總體差異建模的特征提取方法。該方法通過訓(xùn)練得到RBM的模型參數(shù),之后利用隱層輸出來表征輸入語音超向量的說話人信息。文中比較了不同結(jié)構(gòu)和模塊(包括構(gòu)建RBM的2種單元分布、線性判別分析等)對(duì)說話人確認(rèn)性能的影響。所提方法作為一種新的i-vector特征表示方法,在NIST SRE 2008上取得了和ivector說話人基線系統(tǒng)相當(dāng)?shù)男阅堋Mㄟ^與i-vector基線系統(tǒng)進(jìn)行融合,系統(tǒng)性能進(jìn)一步提升。在NIST SRE 2008女性電話語音測試集和男性電話語音測試集上的等錯(cuò)誤率分別降至6.83%和4.73%。
【作者單位】: 重慶大學(xué)自動(dòng)化學(xué)院;重慶市公安局;
【基金】:重慶市自然科學(xué)基金計(jì)劃(cstc2012jj A40046)項(xiàng)目資助
【分類號(hào)】:TP391.41
【正文快照】: 1引言隨著模式識(shí)別和機(jī)器學(xué)習(xí)技術(shù)的不斷發(fā)展,越來越多的說話人建模技術(shù)被應(yīng)用到說話人識(shí)別任務(wù)中。尤其是在文本無關(guān)的說話人識(shí)別研究方面,隨著相關(guān)研究的不斷深入,涌現(xiàn)了一批優(yōu)秀的建模算法[1-4],在解決復(fù)雜環(huán)境下的會(huì)話差異方面取得了巨大成功。當(dāng)前,大多數(shù)說話人確認(rèn)系統(tǒng)
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 呂聲,尹俊勛;同語種說話人轉(zhuǎn)換的實(shí)現(xiàn)[J];移動(dòng)通信;2004年S3期
2 董明,劉加,劉潤生;快速口音自適應(yīng)的動(dòng)態(tài)說話人選擇性訓(xùn)練[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年07期
3 王堅(jiān);;基于說話人聚類的說話人自適應(yīng)[J];計(jì)算機(jī)與信息技術(shù);2007年07期
4 王煒;呂萍;顏永紅;;一種改進(jìn)的基于層次聚類的說話人自動(dòng)聚類算法[J];聲學(xué)學(xué)報(bào)(中文版);2008年01期
5 蔣曄;唐振民;;短語音說話人辨認(rèn)的研究[J];電子學(xué)報(bào);2011年04期
6 楊繼臣;姚學(xué)科;符志強(qiáng);;使用懲罰距離進(jìn)行說話人改變檢測(英文)[J];仲愷農(nóng)業(yè)工程學(xué)院學(xué)報(bào);2011年03期
7 陳雪芳;楊繼臣;;基于遠(yuǎn)近距離的說話人聚類算法[J];科學(xué)技術(shù)與工程;2013年12期
8 馬勇;鮑長春;;說話人分割聚類研究進(jìn)展[J];信號(hào)處理;2013年09期
9 陳麗萍;王爾玉;戴禮榮;宋彥;;基于深層置信網(wǎng)絡(luò)的說話人信息提取方法[J];模式識(shí)別與人工智能;2013年12期
10 張怡穎,朱小燕,張鈸;與文本無關(guān)的說話人自適應(yīng)確認(rèn)方法[J];軟件學(xué)報(bào);2000年06期
相關(guān)會(huì)議論文 前10條
1 司羅;胡起秀;金琴;;完全無監(jiān)督的雙人對(duì)話中的說話人分隔[A];第九屆全國信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-99)論文集[C];1999年
2 金乃高;侯剛;王學(xué)輝;李非墨;;基于主動(dòng)感知的音視頻聯(lián)合說話人跟蹤方法[A];2010年通信理論與信號(hào)處理學(xué)術(shù)年會(huì)論文集[C];2010年
3 白俊梅;張樹武;徐波;;廣播電視中的目標(biāo)說話人跟蹤技術(shù)[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
4 索宏彬;劉曉星;;基于高斯混合模型的說話人跟蹤系統(tǒng)[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
5 馬勇;鮑長春;夏丙寅;;基于辨別性深度信念網(wǎng)絡(luò)的說話人分割[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
6 羅海風(fēng);龍長才;;多話者環(huán)境下說話人辨識(shí)聽覺線索研究[A];中國聲學(xué)學(xué)會(huì)2009年青年學(xué)術(shù)會(huì)議[CYCA’09]論文集[C];2009年
7 王剛;鄔曉鈞;鄭方;王琳琳;張陳昊;;基于參考說話人模型和雙層結(jié)構(gòu)的說話人辨認(rèn)快速算法[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年
8 李經(jīng)偉;;語體轉(zhuǎn)換與角色定位[A];全國語言與符號(hào)學(xué)研究會(huì)第五屆研討會(huì)論文摘要集[C];2002年
9 王剛;鄔曉鈞;鄭方;王琳琳;張陳昊;;基于參考說話人模型和雙層結(jié)構(gòu)的說話人辨認(rèn)[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集(二)[C];2011年
10 何磊;方棣棠;吳文虎;;說話人聚類與模型自適應(yīng)結(jié)合的說話人自適應(yīng)方法[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
相關(guān)重要報(bào)紙文章 前4條
1 ;做一名積極的傾聽者[N];中國紡織報(bào);2003年
2 唐志強(qiáng);不聽別人說話,也能模仿其口音[N];新華每日電訊;2010年
3 黃惠慧(南京師范大學(xué)附屬揚(yáng)子中學(xué));高考聽力要求及對(duì)策[N];中國教育資訊報(bào);2002年
4 本報(bào)記者 賈婧;口語翻譯:突破語言通訊障礙的“法寶”[N];科技日?qǐng)?bào);2007年
,本文編號(hào):1337476
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1337476.html