天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

Haar聲學(xué)特征超向量生成及大規(guī)模說話人識別技術(shù)研究

發(fā)布時間:2016-11-25 21:20

  本文關(guān)鍵詞:2D-Haar聲學(xué)特征超向量生成及大規(guī)模說話人識別技術(shù)研究,由筆耕文化傳播整理發(fā)布。


《北京理工大學(xué)》 2015年

2D-Haar聲學(xué)特征超向量生成及大規(guī)模說話人識別技術(shù)研究

謝爾曼  

【摘要】:隨著信息技術(shù)的發(fā)展,信息系統(tǒng)越來越深入地融入社會生活,信息安全的重要性日益凸顯。在身份認證和敏感信息監(jiān)控領(lǐng)域,生物識別技術(shù)正得到越來越多的研究與應(yīng)用。說話人識別(Speaker Recognition, SR,又稱聲紋識別)由于部署簡單、成本低廉,一直是生物識別技術(shù)的一個重要分支。 近年來,隨著各類模式識別算法(例如模板匹配法、概率統(tǒng)計法、機器學(xué)習(xí)分類器方法等)以及特征向量處理技術(shù)(例如基于機器學(xué)習(xí)和數(shù)據(jù)挖掘方法的特征篩選、特征向量構(gòu)造等)研究的日益深入,各類說話人識別系統(tǒng)的準確性逐漸提高,應(yīng)用不斷擴展。 在目前的說話人識別研究中,當目標說話人的規(guī)模不斷增加時,說話人識別的準確率隨之衰減。本文針對該問題,研究相應(yīng)的特征向量生成方法、說話人分類器的訓(xùn)練方法以及說話人識別的并行計算方法,論文的主要工作成果和創(chuàng)新包括: 1.提出了一種利用聲學(xué)特征圖,聲學(xué)特征可篩選,能有效提高識別準確率的2D-Haar聲學(xué)特征超向量生成方法 目前常見的音頻特征向量生成方法,難以進行時序信息與跨維度信息的聯(lián)合分析。通過對一定數(shù)量的連續(xù)音頻幀的常用聲學(xué)幀特征值進行跨維度、跨幀的加減運算,建立維數(shù)達到數(shù)十萬的聲學(xué)特征Haar-like模式,再根據(jù)不同的音頻識別任務(wù),用機器學(xué)習(xí)算法在高維Haar-like模式空間中進行特征篩選,即可生成2D-Haar聲學(xué)特征超向量。該特征超向量的潛在維數(shù)可以更高,并可針對具體的識別應(yīng)用篩選出不同的Haar-like模式,提升特征向量的表達能力,從而提高識別準確率。實驗結(jié)果表明,在音頻事件識別、說話人識別、說話人性別識別三種應(yīng)用中,2D-Haar聲學(xué)特征超向量都獲得了比常用聲學(xué)幀特征更高的總體準確率,可使SVM、AdaBoost、C5.0三種算法的總體準確率最高獲得4.2%到9.5%的提升。 2.提出了一種利用隨機模式篩選特征的2D-Haar聲學(xué)特征超向量生成快速計算方法 2D-Haar聲學(xué)特征超向量生成過程中,聲學(xué)特征的Haar-like模式的篩選耗時較長,可通過優(yōu)化Haar-like模式的篩選過程以提升計算效率,即在每輪迭代過程中,并不是對所有的Haar-like模式進行篩選,而是對隨機選定的、特定個數(shù)的Haar-like模式進行迭代運算,在保證識別效果的前提下精簡篩選過程、提升計算速度。實驗結(jié)果表明,,與常用聲學(xué)幀特征相比,快速計算方法的訓(xùn)練速度是前者的2.9-6.8倍,識別速度是前者的4.9-8.9倍,并可獲最高4.8%-8.8%的準確率提升。 3.提出了一種通過兩次迭代訓(xùn)練能有效降低目標說話人規(guī)模對識別準確率影響的說話人識別方法 隨著目標說話人規(guī)模的增加,特征空間中的樣本密度持續(xù)提高,從而造成識別準確率不斷衰減。提出一種通過兩次迭代訓(xùn)練能有效降低目標說話人規(guī)模對識別準確率影響的說話人識別方法。在特征向量生成環(huán)節(jié),針對不同說話人篩選出不同的Haar-like模式組合,生成因人而異的2D-Haar聲學(xué)特征超向量,代替常用聲學(xué)幀特征以提高不同說話人特征向量之間的差異、降低特征空間中的樣本密度。在說話人分類器訓(xùn)練環(huán)節(jié),利用AdaBoost.MH算法“當弱分類器個數(shù)大于特征維數(shù)時準確率更優(yōu)”的特性,訓(xùn)練一個弱分類器個數(shù)大于2D-Haar聲學(xué)特征超向量維數(shù)的說話人分類器,提高說話人分類器樣本劃分的準確性。實驗結(jié)果表明,與GMM-SVM算法相比,該方法的識別速度更快,準確率更高,識別準確率隨說話人規(guī)模增加而衰減的趨勢更緩,在不同目標說話人規(guī)模下,該方法的平均識別準確率比GMM-SVM算法高2.5%。 4.提出了一種利用CPU多核技術(shù),支持大規(guī)模目標說話人識別應(yīng)用的說話人識別并行處理方法 CPU多核技術(shù)可提升大規(guī)模說話人的識別效率,提出ERF算法,構(gòu)建說話人識別并行處理方法。ERF算法不存在貫穿始終的迭代運算,可通過程序并行化獲得更高的效率提升。利用操作系統(tǒng)腳本進行16核并行運算時,并行ERF方法的訓(xùn)練倍速為5.53,是并行GMM-SVM方法的2.3倍、并行Turbo-Boost方法的2.2倍;并行ERF方法的識別倍速為8.33,是并行GMM-SVM方法的1.9倍、并行Turbo-Boost方法的1.3倍。此外,ERF算法在訓(xùn)練開始前對非目標說話人的特征超向量進行有放回隨機取樣,平衡訓(xùn)練集內(nèi)非目標說話人與目標說話人的數(shù)據(jù)量,能夠緩解大規(guī)模說話人分類器訓(xùn)練樣本數(shù)據(jù)的不平衡問題。實驗結(jié)果表明,隨著說話人規(guī)模的不斷增加,所提方法識別準確率的衰減趨勢更緩;不同目標說話人規(guī)模下,該方法平均識別準確率比采用GMM-SVM算法提高2.7%。

【關(guān)鍵詞】:
【學(xué)位授予單位】:北京理工大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:TN912.34
【目錄】:

下載全文 更多同類文獻

CAJ全文下載

(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)

CAJViewer閱讀器支持CAJ、PDF文件格式


【參考文獻】

中國期刊全文數(shù)據(jù)庫 前9條

1 羅森林;李金玉;潘麗敏;;特定類型音頻流泛化識別方法[J];北京理工大學(xué)學(xué)報;2011年10期

2 陳存寶;趙力;;嵌入自聯(lián)想神經(jīng)網(wǎng)絡(luò)的高斯混合模型說話人辨認[J];電子與信息學(xué)報;2010年03期

3 ;SJ/T 11380-2008《自動聲紋識別(說話人識別)技術(shù)規(guī)范》概述[J];信息技術(shù)與標準化;2008年08期

4 忻棟,楊瑩春,吳朝暉;基于SVM-HMM混合模型的說話人確認[J];計算機輔助設(shè)計與圖形學(xué)學(xué)報;2002年11期

5 黃偉;戴蓓蒨;李輝;;基于分類高斯混合模型和神經(jīng)網(wǎng)絡(luò)融合的與文本無關(guān)的說話人識別[J];模式識別與人工智能;2003年04期

6 劉明輝;戴蓓蒨;解焱陸;;基于GMM多維概率輸出的SVM話者確認[J];模式識別與人工智能;2008年01期

7 栗志意;張衛(wèi)強;何亮;劉加;;基于核函數(shù)的IVEC-SVM說話人識別系統(tǒng)研究[J];自動化學(xué)報;2014年04期

8 楊世清;戴蓓蒨;許敏強;劉青松;;基于自適應(yīng)高斯混合模型特征映射的說話人確認[J];模式識別與人工智能;2009年03期

9 張玲華,楊震,鄭寶玉;基于模糊分類器及多層前饋神經(jīng)網(wǎng)絡(luò)混合結(jié)構(gòu)的說話人辨認[J];通信學(xué)報;2005年11期

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 許東星;基于GMM和高層信息特征的文本無關(guān)說話人識別研究[D];中國科學(xué)技術(shù)大學(xué);2009年

【共引文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 蔡坤琪;;基于相關(guān)鑒別分析和隨機森林的人臉識別方法[J];安徽電子信息職業(yè)技術(shù)學(xué)院學(xué)報;2012年01期

2 董建明;劉明柱;劉方圓;丁素玲;;地下水動態(tài)預(yù)測模型研究[J];安徽農(nóng)業(yè)科學(xué);2011年29期

3 李飛;高小榕;高上凱;;基于隨機森林算法的高維腦電特征優(yōu)選[J];北京生物醫(yī)學(xué)工程;2007年04期

4 陳建新;西廣成;王偉;趙慧輝;陳靜;;數(shù)據(jù)挖掘分類算法在冠心病臨床應(yīng)用的比較[J];北京生物醫(yī)學(xué)工程;2008年03期

5 熊文;王樅;;改進粒子群與支持向量機混合的特征變換[J];北京郵電大學(xué)學(xué)報;2009年06期

6 孔浩;楊勇;王國胤;;基于多分類器融合的語音識別方法研究[J];重慶郵電大學(xué)學(xué)報(自然科學(xué)版);2011年04期

7 蔡金錠;鄢仁武;;基于小波分析與隨機森林算法的電力電子電路故障診斷[J];電力科學(xué)與技術(shù)學(xué)報;2011年02期

8 洪英;韓周安;;偏亞高斯語音信號有效分離ICA方法研究[J];電子科技大學(xué)學(xué)報;2008年05期

9 胥海威;何寬;;改進隨機決策樹群算法在監(jiān)督分類中的應(yīng)用[J];地理與地理信息科學(xué);2010年06期

10 張郴;張捷;;中國入境旅游需求預(yù)測的神經(jīng)網(wǎng)絡(luò)集成模型研究[J];地理科學(xué);2011年10期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 顧小軍;楊世錫;錢蘇翔;;基于支持向量機的旋轉(zhuǎn)機械多類故障識別研究[A];第二十六屆中國控制會議論文集[C];2007年

2 賈少春;胡秀珍;;A Method of Predicting theβ-hairpin Motifs in Proteins[A];第四屆全國生物信息學(xué)與系統(tǒng)生物學(xué)學(xué)術(shù)大會論文集[C];2010年

3 李勝朋;王洪禮;馮劍豐;;基于不連續(xù)回歸樹的最大李雅譜諾夫指數(shù)計算方法[A];第九屆全國振動理論及應(yīng)用學(xué)術(shù)會議論文集[C];2007年

4 謝程利;王金橋;盧漢清;;核森林及其在目標檢測中的應(yīng)用[A];第六屆和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2010)、第19屆全國多媒體學(xué)術(shù)會議(NCMT2010)、第6屆全國人機交互學(xué)術(shù)會議(CHCI2010)、第5屆全國普適計算學(xué)術(shù)會議(PCC2010)論文集[C];2010年

5 何新;史迎春;黃兵;周獻中;;基于SVM/HMM混合模型的音頻分類方法[A];2005中國控制與決策學(xué)術(shù)年會論文集(下)[C];2005年

6 張紅梅;;基于粗糙集特征約簡的SVM集成入侵檢測模型[A];2009中國控制與決策會議論文集(3)[C];2009年

7 楊丹;徐彬;王旭;;一種基于聽覺特性的語譜算法研究[A];2009全國虛擬儀器大會論文集(二)[C];2009年

8 何選森;尹許梅;劉福星;;語音檢測與識別的特征提取方法[A];2010中國儀器儀表與測控技術(shù)大會論文集[C];2010年

9 曹東升;許青松;梁逸曾;陳憲;李洪東;;組合樹的集合體和后向消除策略去分類P-糖蛋白化合物[A];第十屆全國計算(機)化學(xué)學(xué)術(shù)會議論文摘要集[C];2009年

10 曹東升;許青松;梁逸曾;;Computer-Aided Prediction of Toxicity with Substructure Pattern and Random Forest[A];第十一屆全國計算(機)化學(xué)學(xué)術(shù)會議論文摘要集[C];2011年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 于化龍;基于DNA微陣列數(shù)據(jù)的癌癥分類技術(shù)研究[D];哈爾濱工程大學(xué);2010年

2 李書艷;單點氨基酸多態(tài)性與疾病相關(guān)關(guān)系的預(yù)測及其機制研究[D];蘭州大學(xué);2010年

3 姚志明;基于步態(tài)觸覺信息的身份識別研究[D];中國科學(xué)技術(shù)大學(xué);2010年

4 單振宇;情感說話人識別及其解決方法的研究[D];浙江大學(xué);2010年

5 杜方;復(fù)雜網(wǎng)絡(luò)系統(tǒng)間相似性識別及其應(yīng)用[D];浙江大學(xué);2010年

6 甘良志;核學(xué)習(xí)算法與集成方法研究[D];浙江大學(xué);2010年

7 王樹云;基于Bayes方法和圖限制下正規(guī)化方法的變量選擇問題及其在基因組數(shù)據(jù)中的應(yīng)用[D];山東大學(xué);2010年

8 韓曉明;基于符號有向圖和支持向量機的故障診斷方法的研究[D];太原理工大學(xué);2011年

9 王中鋒;樹型貝葉斯網(wǎng)絡(luò)分類器鑒別式訓(xùn)練研究[D];北京交通大學(xué);2011年

10 聶黎;基于基因表達式編程的車間動態(tài)調(diào)度方法研究[D];華中科技大學(xué);2011年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 馬冉冉;集成學(xué)習(xí)算法研究[D];山東科技大學(xué);2010年

2 石國強;基于規(guī)則的組合分類器的研究[D];鄭州大學(xué);2010年

3 陳松峰;利用PCA和AdaBoost建立基于貝葉斯的組合分類器[D];鄭州大學(xué);2010年

4 李曉光;數(shù)據(jù)挖掘技術(shù)在高校招生和教務(wù)管理中的應(yīng)用[D];哈爾濱工程大學(xué);2010年

5 李紅;數(shù)據(jù)挖掘中特征選擇與聚類算法研究[D];大連理工大學(xué);2010年

6 張峰;基于支持向量機的網(wǎng)站發(fā)布系統(tǒng)設(shè)計與實現(xiàn)[D];大連理工大學(xué);2010年

7 李海燕;互信息特征選擇的研究及在代謝組學(xué)中的應(yīng)用[D];大連理工大學(xué);2010年

8 朱新榮;徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)集成算法的研究及應(yīng)用[D];大連理工大學(xué);2010年

9 嚴康;基于支持向量機的特征選擇算法研究[D];大連理工大學(xué);2010年

10 唐曉敏;基于霍夫變換及條件概率模型的多目標檢測[D];大連理工大學(xué);2010年

【二級參考文獻】

中國期刊全文數(shù)據(jù)庫 前7條

1 甄斌,吳璽宏,劉志敏,遲惠生;語音識別和說話人識別中各倒譜分量的相對重要性[J];北京大學(xué)學(xué)報(自然科學(xué)版);2001年03期

2 付強,易克初;語音信號的Bark子波變換及其在語音識別中的應(yīng)用[J];電子學(xué)報;2000年10期

3 張玲華;鄭寶玉;楊震;;基于語音諧波結(jié)構(gòu)的魯棒特征參數(shù)及其在說話人識別中的應(yīng)用[J];電子與信息學(xué)報;2006年10期

4 邵央,劉丙哲,李宗葛;基于MFCC和加權(quán)矢量量化的說話人識別系統(tǒng)[J];計算機工程與應(yīng)用;2002年05期

5 劉勇,趙斌,夏紹瑋;模糊超橢球分類算法及其在無約束手寫體數(shù)字識別中的應(yīng)用[J];清華大學(xué)學(xué)報(自然科學(xué)版);2000年09期

6 栗志意;何亮;張衛(wèi)強;劉加;;基于鑒別性i-vector局部距離保持映射的說話人識別[J];清華大學(xué)學(xué)報(自然科學(xué)版);2012年05期

7 鮑長春,樊昌信;基于歸一化互相關(guān)函數(shù)的基音檢測算法[J];通信學(xué)報;1998年10期

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 解焱陸;基于特征變換和分類的文本無關(guān)電話語音說話人識別研究[D];中國科學(xué)技術(shù)大學(xué);2007年

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 覃愛娜,韓華;說話人識別技術(shù)及其在工廠自動控制系統(tǒng)中的應(yīng)用[J];長沙電力學(xué)院學(xué)報(自然科學(xué)版);2003年02期

2 楊海燕,楊斌,景新幸;說話人識別技術(shù)在智能家居中的應(yīng)用[J];電聲技術(shù);2004年05期

3 王晶晶,陳中柱,薛文濤,江紅英;一種與文本有關(guān)的說話人識別系統(tǒng)設(shè)計與實現(xiàn)[J];計算機仿真;2004年06期

4 戴紅霞,趙力;采用幀概率變換的與文本無關(guān)說話人識別系統(tǒng)的實現(xiàn)[J];電聲技術(shù);2004年09期

5 葉蕾,方鵬,楊震;基于因特網(wǎng)的說話人識別技術(shù)研究[J];南京郵電學(xué)院學(xué)報;2004年03期

6 孫林慧,葉蕾,楊震;說話人識別中測試時長與識別率關(guān)系研究[J];計算機仿真;2005年05期

7 陸小珊,王俊法,田嵐;音高特征在說話人識別中的可分性及應(yīng)用研究[J];山東大學(xué)學(xué)報(工學(xué)版);2005年04期

8 芮賢義,俞一彪;基于小波變換的魯棒型特征提取及說話人識別[J];電路與系統(tǒng)學(xué)報;2005年05期

9 劉雅琴,杜海明;基于矢量量化的說話人識別[J];洛陽師范學(xué)院學(xué)報;2005年05期

10 陳立偉;趙春暉;姜海麗;;一種基于混合神經(jīng)網(wǎng)絡(luò)的說話人識別系統(tǒng)[J];哈爾濱工程大學(xué)學(xué)報;2005年06期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 鮑福良;方志剛;徐潔;;說話人識別綜述[A];第六屆全國信息獲取與處理學(xué)術(shù)會議論文集(2)[C];2008年

2 孫帆;遲惠生;;循環(huán)網(wǎng)絡(luò)說話人識別[A];第二屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1992年

3 肖劍;歐貴文;;多層前饋神經(jīng)網(wǎng)絡(luò)組的文本無關(guān)說話人識別[A];第七屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年

4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類算法及其在說話人識別中的應(yīng)用研究[A];第八屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2005年

5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關(guān)說話人識別[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會議論文集(上冊)[C];2007年

6 戴紅霞;趙力;;文本無關(guān)說話人識別系統(tǒng)的研究[A];2007’促進西部發(fā)展聲學(xué)學(xué)術(shù)交流會論文集[C];2007年

7 陳聯(lián)武;郭武;戴禮榮;;說話人識別系統(tǒng)中多樣訓(xùn)練的應(yīng)用[A];第十一屆全國人機語音通訊學(xué)術(shù)會議論文集(一)[C];2011年

8 崔玉紅;胡光銳;;基于神經(jīng)網(wǎng)絡(luò)特征維數(shù)壓縮方法及其在說話人識別中的應(yīng)用[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年

9 吳麗麗;;基于仿生模式識別的說話人識別學(xué)習(xí)模型研究[A];第二屆中國科學(xué)院博士后學(xué)術(shù)年會暨高新技術(shù)前沿與發(fā)展學(xué)術(shù)會議程序冊[C];2010年

10 張晶;董金明;馮文全;;說話人識別系統(tǒng)研究與實現(xiàn)[A];全國第二屆信號處理與應(yīng)用學(xué)術(shù)會議?痆C];2008年

中國重要報紙全文數(shù)據(jù)庫 前3條

1 汪永安;[N];安徽日報;2008年

2 吳長鋒;[N];科技日報;2008年

3 新城;[N];計算機世界;2006年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 單振宇;情感說話人識別及其解決方法的研究[D];浙江大學(xué);2010年

2 陸偉;基于缺失特征的文本無關(guān)說話人識別魯棒性研究[D];中國科學(xué)技術(shù)大學(xué);2008年

3 劉鏑;說話人識別中信息融合算法的研究[D];北京交通大學(xué);2011年

4 付中華;說話人識別系統(tǒng)魯棒性研究[D];西北工業(yè)大學(xué);2004年

5 林琳;基于模糊聚類與遺傳算法的說話人識別理論研究及應(yīng)用[D];吉林大學(xué);2007年

6 邱政權(quán);在噪聲環(huán)境下的說話人識別[D];華南理工大學(xué);2007年

7 郭武;復(fù)雜信道下的說話人識別[D];中國科學(xué)技術(shù)大學(xué);2007年

8 錢博;基于漢語元音映射的說話人識別技術(shù)研究[D];南京理工大學(xué);2007年

9 姜濤;網(wǎng)絡(luò)環(huán)境下說話人識別關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2011年

10 俞一彪;基于互信息理論的說話人識別研究[D];上海大學(xué);2004年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 王冠星;基于特定說話人識別的門禁系統(tǒng)研究[D];中南大學(xué);2008年

2 王穎;基于小波變換的說話人識別方法研究[D];長春理工大學(xué);2009年

3 何金瑞;說話人識別中的模式匹配方法研究[D];西華大學(xué);2009年

4 趙劍;說話人識別魯棒性增強研究[D];北京郵電大學(xué);2009年

5 周暢宇;基于支持向量機的說話人識別研究[D];中南大學(xué);2009年

6 王發(fā)智;說話人識別方法的研究[D];哈爾濱工程大學(xué);2008年

7 于明剛;噪聲環(huán)境下說話人識別研究[D];哈爾濱工程大學(xué);2008年

8 李軼杰;說話人識別中的信道補償[D];中國科學(xué)技術(shù)大學(xué);2009年

9 王佳毅;噪音環(huán)境下說話人識別方法[D];上海交通大學(xué);2009年

10 危國騰;基于說話人識別的門禁系統(tǒng)的設(shè)計[D];沈陽航空工業(yè)學(xué)院;2010年


  本文關(guān)鍵詞:2D-Haar聲學(xué)特征超向量生成及大規(guī)模說話人識別技術(shù)研究,由筆耕文化傳播整理發(fā)布。



本文編號:192878

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/192878.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a5164***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com