基于改進(jìn)MFD的I-Vector說話人識(shí)別
本文關(guān)鍵詞:基于改進(jìn)MFD的I-Vector說話人識(shí)別 出處:《電聲技術(shù)》2016年12期 論文類型:期刊論文
更多相關(guān)文章: 說話人識(shí)別 i向量 PLDA模型 線性區(qū)分性分析 改進(jìn)中值分類器 信道補(bǔ)償
【摘要】:基于I-Vector的說話人識(shí)別系統(tǒng)通常采用LDA進(jìn)行信道補(bǔ)償和特征降維,在開發(fā)集樣本有限的情況下,LDA的區(qū)分性不強(qiáng);诖,提出一種改進(jìn)I-Vector說話人確認(rèn)算法。在話者樣本數(shù)較少的情況下,以中值i向量代替均值i向量作為集中統(tǒng)計(jì)量可以減少區(qū)分信息的丟失。隨著樣本數(shù)量增加,改進(jìn)中值分類器,采用去最大最小值后求均值的方法作為i向量的集中趨勢(shì)。用此方法計(jì)算類間與類內(nèi)離散度矩陣后,對(duì)i向量進(jìn)行信道補(bǔ)償和降維。結(jié)合高斯PLDA模型,以LDA和WCCN為基線系統(tǒng)進(jìn)行仿真對(duì)比。實(shí)驗(yàn)結(jié)果表明,提出的算法具有良好的區(qū)分性能,在有限的話者語音樣本數(shù)量范圍內(nèi),與基線相比能提升總和約3%的性能。
[Abstract]:The speaker recognition system based on I-Vector usually uses LDA for channel compensation and feature reduction. In the case of limited sample development set, the LDA is not strong. Based on this, an improved I-Vector speaker recognition algorithm is proposed. When the number of speakers is less, the median I vector instead of the mean I vector can reduce the loss of the discriminative information. As the number of samples increases, the median classifier is improved, and the method of seeking the mean after the maximum minimum value is used as the centralization trend of the I vector. After calculating the inter class and intra class dispersion matrix by this method, the channel compensation and dimensionality reduction for the I vector are carried out. Combined with the Gauss PLDA model, LDA and WCCN are used as the baseline system for simulation and comparison. The experimental results show that the proposed algorithm has good discriminative performance, and the performance of the proposed algorithm can be increased by about 3% compared with baseline in the limited number of speakers.
【作者單位】: 浙江大學(xué)電氣工程學(xué)院;
【分類號(hào)】:TN912.34
【正文快照】: 與二次驗(yàn)證碼校驗(yàn)比較,生物特征驗(yàn)證更加安全。相對(duì)指紋認(rèn)證、面部輪廓(人臉)認(rèn)證、虹膜認(rèn)證以及DNA認(rèn)證等技術(shù),語音信號(hào)獲取容易,采集設(shè)備成本較低,說話人識(shí)別技術(shù)更加容易普及。說話人確認(rèn)是說話人識(shí)別研究的一個(gè)重要分支,在語音門禁、電話銀行、數(shù)據(jù)庫訪問等系統(tǒng)中具有廣泛
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 石艷;王曉曄;;新穎檢測(cè)法在說話人識(shí)別技術(shù)中的應(yīng)用[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2008年07期
2 劉雪燕;張娜;袁寶玲;;說話人識(shí)別綜述[J];電腦知識(shí)與技術(shù);2009年01期
3 邱政權(quán);范小春;王俊年;;基于動(dòng)態(tài)環(huán)境下的說話人識(shí)別[J];科學(xué)技術(shù)與工程;2010年02期
4 單進(jìn);;說話人識(shí)別技術(shù)研究[J];科技資訊;2010年21期
5 申志生;于明;;說話人識(shí)別算法的定點(diǎn)DSP實(shí)現(xiàn)[J];單片機(jī)與嵌入式系統(tǒng)應(yīng)用;2011年03期
6 謝建勛;;淺談?wù)f話人識(shí)別技術(shù)[J];電腦知識(shí)與技術(shù);2011年11期
7 安茂波;劉建;;一個(gè)快速說話人識(shí)別系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[J];網(wǎng)絡(luò)新媒體技術(shù);2012年03期
8 楊迪;戚銀城;劉明軍;張華芳子;武軍娜;;說話人識(shí)別綜述[J];電子科技;2012年06期
9 武光利;;說話人識(shí)別方法概述[J];硅谷;2012年19期
10 曹業(yè)敏,侯風(fēng)雷,王炳錫;說話人識(shí)別技術(shù)現(xiàn)狀與進(jìn)展[J];河南科技;1998年09期
相關(guān)會(huì)議論文 前10條
1 鮑福良;方志剛;徐潔;;說話人識(shí)別綜述[A];第六屆全國信息獲取與處理學(xué)術(shù)會(huì)議論文集(2)[C];2008年
2 孫帆;遲惠生;;循環(huán)網(wǎng)絡(luò)說話人識(shí)別[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1992年
3 肖劍;歐貴文;;多層前饋神經(jīng)網(wǎng)絡(luò)組的文本無關(guān)說話人識(shí)別[A];第七屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議(NCMMSC7)論文集[C];2003年
4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類算法及其在說話人識(shí)別中的應(yīng)用研究[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關(guān)說話人識(shí)別[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年
6 戴紅霞;趙力;;文本無關(guān)說話人識(shí)別系統(tǒng)的研究[A];2007’促進(jìn)西部發(fā)展聲學(xué)學(xué)術(shù)交流會(huì)論文集[C];2007年
7 陳聯(lián)武;郭武;戴禮榮;;說話人識(shí)別系統(tǒng)中多樣訓(xùn)練的應(yīng)用[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年
8 崔玉紅;胡光銳;;基于神經(jīng)網(wǎng)絡(luò)特征維數(shù)壓縮方法及其在說話人識(shí)別中的應(yīng)用[A];第十屆全國信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年
9 吳麗麗;;基于仿生模式識(shí)別的說話人識(shí)別學(xué)習(xí)模型研究[A];第二屆中國科學(xué)院博士后學(xué)術(shù)年會(huì)暨高新技術(shù)前沿與發(fā)展學(xué)術(shù)會(huì)議程序冊(cè)[C];2010年
10 張晶;董金明;馮文全;;說話人識(shí)別系統(tǒng)研究與實(shí)現(xiàn)[A];全國第二屆信號(hào)處理與應(yīng)用學(xué)術(shù)會(huì)議?痆C];2008年
相關(guān)重要報(bào)紙文章 前2條
1 汪永安;科大訊飛說話人識(shí)別技術(shù)世界領(lǐng)先[N];安徽日?qǐng)?bào);2008年
2 吳長鋒;科大訊飛勇奪說話人識(shí)別國際大賽第一[N];科技日?qǐng)?bào);2008年
相關(guān)博士學(xué)位論文 前10條
1 單振宇;情感說話人識(shí)別及其解決方法的研究[D];浙江大學(xué);2010年
2 別凡虎;說話人識(shí)別中區(qū)分性問題的研究[D];清華大學(xué);2015年
3 謝怡寧;基于稀疏編碼的魯棒說話人識(shí)別方法研究[D];哈爾濱理工大學(xué);2016年
4 安冬;噪聲背景下說話人識(shí)別的若干關(guān)鍵問題研究[D];東北大學(xué);2013年
5 吳迪;低信噪比環(huán)境下說話人識(shí)別研究[D];蘇州大學(xué);2016年
6 酆勇;基于深度學(xué)習(xí)的說話人識(shí)別建模研究[D];重慶大學(xué);2016年
7 陸偉;基于缺失特征的文本無關(guān)說話人識(shí)別魯棒性研究[D];中國科學(xué)技術(shù)大學(xué);2008年
8 劉鏑;說話人識(shí)別中信息融合算法的研究[D];北京交通大學(xué);2011年
9 付中華;說話人識(shí)別系統(tǒng)魯棒性研究[D];西北工業(yè)大學(xué);2004年
10 林琳;基于模糊聚類與遺傳算法的說話人識(shí)別理論研究及應(yīng)用[D];吉林大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 叢菡菡;基于支持相量機(jī)的穩(wěn)鍵說話人識(shí)別[D];電子科技大學(xué);2008年
2 任舒彬;面向手持應(yīng)用的說話人識(shí)別算法研究[D];浙江大學(xué);2006年
3 申志生;文本相關(guān)說話人識(shí)別嵌入式系統(tǒng)及其關(guān)鍵技術(shù)研究[D];河北工業(yè)大學(xué);2011年
4 汪q,
本文編號(hào):1347371
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1347371.html