匹配追蹤說話人自適應(yīng)方法
本文選題:說話人 + 自適應(yīng)方法; 參考:《聲學(xué)學(xué)報》2014年04期
【摘要】:針對現(xiàn)有子空間自適應(yīng)方法無法確定最佳說話人子空間的問題,提出一種基于匹配追蹤的說話人自適應(yīng)方法。將說話人自適應(yīng)視為一種高維信號的稀疏分解問題,利用本征音和參考說話人超矢量的各自優(yōu)勢聯(lián)合構(gòu)造說話人字典;依據(jù)匹配追蹤原理,通過迭代優(yōu)化,以后驗方式確定最佳說話人子空間維數(shù)及其基矢量。引入冗余基矢量檢測與去除機制以保證算法的穩(wěn)定性,并通過快速遞推算法得到新說話人坐標(biāo);跐h語連續(xù)語音識別的有監(jiān)督說話人自適應(yīng)實驗結(jié)果表明,與本征音及參考說話人加權(quán)方法相比,平均有調(diào)音節(jié)正識率相對提高了1.9%。
[Abstract]:In order to solve the problem that the existing subspace adaptive methods can not determine the optimal subspace of the speaker, a speaker adaptive method based on matching tracking is proposed. The speaker adaptation is regarded as a sparse decomposition problem of high-dimensional signal. The speaker dictionary is constructed by using the respective advantages of intrinsic sound and reference speaker supervector, and is optimized by iteration according to the matching tracing principle. A posteriori method is used to determine the dimension of the optimal speaker subspace and its basis vector. The redundant basis vector detection and removal mechanism is introduced to ensure the stability of the algorithm, and the new speaker coordinates are obtained by a fast recursive algorithm. The experimental results of supervised speaker adaptation based on Chinese continuous speech recognition show that compared with the intrinsic tone and reference speaker weighting method, the average correct recognition rate of tonal syllable is improved by 1.9%.
【作者單位】: 解放軍信息工程大學(xué)信息系統(tǒng)工程學(xué)院;
【基金】:國家自然科學(xué)基金(61175017) 國家高技術(shù)研究發(fā)展計劃(863)(2012AA011603)資助
【分類號】:TN912.3
【參考文獻】
相關(guān)期刊論文 前1條
1 李虎生,劉加,劉潤生;語音識別說話人自適應(yīng)研究現(xiàn)狀及發(fā)展趨勢[J];電子學(xué)報;2003年01期
【共引文獻】
相關(guān)期刊論文 前10條
1 朱浩冰;郭東輝;;聲紋識別系統(tǒng)原理及其關(guān)鍵技術(shù)[J];計算機安全;2007年09期
2 張文林;牛銅;張連海;李弼程;;基于最大似然可變子空間的快速說話人自適應(yīng)方法[J];電子與信息學(xué)報;2012年03期
3 余姍姍;張亞瓊;;語音識別的自適應(yīng)研究[J];福建電腦;2011年06期
4 倪建克;曾虹;張翔;;基于最大均值似然判決規(guī)則的說話人辨認(rèn)研究[J];杭州電子科技大學(xué)學(xué)報;2006年05期
5 王堅;;基于說話人聚類的說話人自適應(yīng)[J];計算機與信息技術(shù);2007年07期
6 黃盈椿;王歡良;馮濤;;應(yīng)用MAP方差估計的話者自適應(yīng)訓(xùn)練方法[J];計算機工程;2006年20期
7 李財蓮;趙小陽;王麗娟;岳振軍;;說話人識別中關(guān)鍵技術(shù)的現(xiàn)狀與發(fā)展[J];軍事通信技術(shù);2005年02期
8 雷建軍;楊震;劉剛;郭軍;;噪聲魯棒語音識別研究綜述[J];計算機應(yīng)用研究;2009年04期
9 魏星;周萍;;語音識別系統(tǒng)及其特征參數(shù)的提取研究[J];計算機與現(xiàn)代化;2009年09期
10 張文林;張衛(wèi)強;劉加;李弼程;屈丹;;一種新的基于子空間的說話人自適應(yīng)方法[J];自動化學(xué)報;2011年12期
相關(guān)會議論文 前2條
1 陳江;楊鑒;徐永華;;基于發(fā)音詞典自適應(yīng)的納西語口音漢語普通話語音識別[A];第二十九屆中國控制會議論文集[C];2010年
2 熊軍軍;馬瑞堂;李成榮;;兒童語音識別的研究現(xiàn)狀[A];第九屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2007年
相關(guān)博士學(xué)位論文 前6條
1 黃麗霞;非特定人魯棒性語音識別中前端濾波器的研究[D];太原理工大學(xué);2011年
2 沈海峰;語音識別中的環(huán)境補償研究[D];北京郵電大學(xué);2006年
3 徐望;連續(xù)語音識別的穩(wěn)健性技術(shù)研究[D];解放軍信息工程大學(xué);2006年
4 雷建軍;噪聲魯棒語音識別中若干問題的研究[D];北京郵電大學(xué);2007年
5 王堅;語音識別中的說話人自適應(yīng)研究[D];北京郵電大學(xué);2007年
6 王琳琳;說話人識別中的時變魯棒性問題研究[D];清華大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 吳榮娣;基于特征分類直方圖均衡的魯棒性語音識別研究[D];蘇州大學(xué);2010年
2 韋麗興;采用脈沖耦合神經(jīng)網(wǎng)絡(luò)的有噪特定人語音識別系統(tǒng)研究[D];廣東工業(yè)大學(xué);2011年
3 張俊如;雙模態(tài)車載語音指令識別系統(tǒng)在線學(xué)習(xí)方法[D];華南理工大學(xué);2011年
4 楊丹;基于DSP的助殘智能語音識別及控制系統(tǒng)[D];長春理工大學(xué);2011年
5 徐煉東;語音識別在訪問控制的應(yīng)用[D];電子科技大學(xué);2011年
6 吳艷艷;孤立詞語音識別的關(guān)鍵技術(shù)研究[D];青島大學(xué);2012年
7 余浩;說話人識別的自適應(yīng)算法研究[D];武漢理工大學(xué);2005年
8 周祖洋;基于VxWorks平臺的人聲識別技術(shù)的研究[D];哈爾濱工程大學(xué);2005年
9 方鶴鶴;基于人耳聽覺特性的語音特征提取研究[D];西北大學(xué);2006年
10 曾海濤;說話人識別的研究與DSP實現(xiàn)[D];西南交通大學(xué);2006年
【二級參考文獻】
相關(guān)期刊論文 前1條
1 李虎生,楊明杰,劉潤生;漢語數(shù)碼語音識別自適應(yīng)算法[J];電路與系統(tǒng)學(xué)報;1999年02期
【相似文獻】
相關(guān)期刊論文 前10條
1 呂聲,尹俊勛;同語種說話人轉(zhuǎn)換的實現(xiàn)[J];移動通信;2004年S3期
2 夏菁,尹俊勛,黃建成,黃鋒;基于正弦加噪聲模型的說話人轉(zhuǎn)換方法[J];電聲技術(shù);2005年02期
3 岳喜才,伍曉宇,鄭崇勛;用神經(jīng)陣列網(wǎng)絡(luò)進行文本無關(guān)的說話人識別[J];聲學(xué)學(xué)報(中文版);2000年03期
4 彭煊,王炳錫;基于高斯混合模型差別度量的說話人聚類[J];計算機工程與應(yīng)用;2005年05期
5 杜江,朱柯;智能麥克風(fēng)陣列語音分離和說話人跟蹤技術(shù)研究[J];電子學(xué)報;2005年02期
6 寧飛,陳頻;說話人識別的幾種方法[J];電聲技術(shù);2001年12期
7 楊毅明;陳東華;;一種實時說話人身份識別系統(tǒng)的設(shè)計[J];華僑大學(xué)學(xué)報(自然科學(xué)版);2009年05期
8 趙力,鄒采榮,吳鎮(zhèn)揚;HMM在說話人識別中的應(yīng)用[J];電路與系統(tǒng)學(xué)報;2001年03期
9 羅駿,歐智堅,王作英;說話人自適應(yīng)訓(xùn)練方法在連續(xù)語音識別中的應(yīng)用[J];中文信息學(xué)報;2004年03期
10 陳景東,姚磊,黃泰翼;幾種高魯棒性通道及說話人自適應(yīng)語音識別算法研究[J];聲學(xué)學(xué)報(中文版);1998年06期
相關(guān)會議論文 前10條
1 林會杰;賈珈;王曉慧;蔡蓮紅;;基于B/S模式的3D雙語虛擬說話人的研究與實現(xiàn)[A];第七屆和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2011)論文集【oral】[C];2011年
2 劉大力;趙力;;與文本無關(guān)說話人識別系統(tǒng)的性能比較[A];2004年全國物理聲學(xué)會議論文集[C];2004年
3 尹巧萍;趙力;;利用語音基音統(tǒng)計特征的說話人性別判識的研究[A];2007’促進西部發(fā)展聲學(xué)學(xué)術(shù)交流會論文集[C];2007年
4 蔣冬梅;趙榮椿;;基于尺度描述的說話人歸一化語音特征[A];信號與信息處理技術(shù)第三屆信號與信息處理全國聯(lián)合學(xué)術(shù)會議論文集[C];2004年
5 歐貴文;鄧英;;基于說話人的對話語音分割[A];第七屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年
6 王洪海;劉剛;郭軍;;基于二次彎折函數(shù)的頻率彎折方法[A];第二十六屆中國控制會議論文集[C];2007年
7 屈丹;魏鑫;王炳錫;;說話人歸一化技術(shù)用于語言辨識系統(tǒng)[A];中國聲學(xué)學(xué)會2002年全國聲學(xué)學(xué)術(shù)會議論文集[C];2002年
8 李稀敏;洪青陽;黃曉丹;;基于分層結(jié)構(gòu)的文本相關(guān)說話人識別算法[A];第十一屆全國人機語音通訊學(xué)術(shù)會議論文集(一)[C];2011年
9 金乃高;侯剛;王學(xué)輝;李非墨;;基于主動感知的音視頻聯(lián)合說話人跟蹤方法[A];2010年通信理論與信號處理學(xué)術(shù)年會論文集[C];2010年
10 周瑜;金怡珠;李桂蓮;;基于HMM-BIC的說話人日志系統(tǒng)[A];第十一屆全國人機語音通訊學(xué)術(shù)會議論文集(二)[C];2011年
相關(guān)重要報紙文章 前7條
1 北京大學(xué)信息科學(xué)中心視覺與聽覺信息處理國家重點實驗室 吳璽宏;聲紋識別聽聲辨人[N];計算機世界;2001年
2 清華大學(xué) 劉加;識別語音的幾種依據(jù)[N];計算機世界;2006年
3 王向東 欒煥博 林守勛 錢躍良;語音識別:抗噪音能力有待加強[N];計算機世界;2006年
4 中科院自動化所生物特征認(rèn)證與測評中心 白俊梅;聽到的真實嗎?[N];計算機世界;2003年
5 清華大學(xué) 劉加;語音識別應(yīng)用促進技術(shù)發(fā)展[N];計算機世界;2006年
6 IBM中國研究中心 秦勇;IBM電話語音技術(shù)及其應(yīng)用(一)[N];光明日報;2000年
7 ;人機對話無障礙[N];中國計算機報;2002年
相關(guān)博士學(xué)位論文 前10條
1 楊繼臣;說話人信息分析及其在多媒體檢索中的應(yīng)用研究[D];華南理工大學(xué);2010年
2 陳凌輝;說話人轉(zhuǎn)換建模方法研究[D];中國科學(xué)技術(shù)大學(xué);2013年
3 何俊;聲紋身份識別中非常態(tài)語音應(yīng)對方法研究[D];華南理工大學(xué);2012年
4 潘逸倩;聲紋密碼技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2012年
5 雙志偉;個性化語音生成研究[D];中國科學(xué)技術(shù)大學(xué);2011年
6 金乃高;音視頻聯(lián)合說話人定位與跟蹤方法研究[D];大連理工大學(xué);2008年
7 王志鋒;基于信道信息的數(shù)字音頻盲取證關(guān)鍵問題研究[D];華南理工大學(xué);2013年
8 吳強;基于聽覺感知與張量模型的魯棒語音特征提取方法研究[D];上海交通大學(xué);2010年
9 徐望;連續(xù)語音識別的穩(wěn)健性技術(shù)研究[D];解放軍信息工程大學(xué);2006年
10 周文君;艦船VDR人聲識別技術(shù)研究[D];哈爾濱工程大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 陸亮;多信道條件下的說話人認(rèn)證[D];北京郵電大學(xué);2010年
2 張力;說話人分段與聚類技術(shù)研究[D];解放軍信息工程大學(xué);2012年
3 高婭;說話人轉(zhuǎn)變檢測的研究與實現(xiàn)[D];南京郵電大學(xué);2013年
4 趙洪剛;基于對話型語音的說話人在線識別技術(shù)研究[D];黑龍江大學(xué);2010年
5 毛永剛;基于相關(guān)向量機的說話人判別研究[D];電子科技大學(xué);2012年
6 徐晨;基于支持向量機的說話人辨別研究[D];陜西師范大學(xué);2013年
7 陳芝;基于人工神經(jīng)網(wǎng)絡(luò)模型的說話人轉(zhuǎn)換算法研究[D];南京郵電大學(xué);2011年
8 張琪;復(fù)雜環(huán)境下特定說話人的語音識別研究[D];武漢紡織大學(xué);2012年
9 凌錦雯;基于多特征的說話人分割與聚類的研究[D];中國科學(xué)技術(shù)大學(xué);2011年
10 吳亮春;基于小波變換的說話人語音特征研究[D];西華大學(xué);2010年
,本文編號:1938253
本文鏈接:http://sikaile.net/kejilunwen/wltx/1938253.html