天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類博士論文 >

基于幀級和段級稀疏表示的說話人識別研究

發(fā)布時間:2018-10-12 20:33
【摘要】:經(jīng)過研究者的不懈努力,說話人識別的研究工作已經(jīng)取得了重大進(jìn)步,然而距離具體實用還有一定差距。不斷提高說話人識別系統(tǒng)的性能是一個重要的研究課題。說話人識別對于人類聽覺系統(tǒng)而言是一個非常簡單的任務(wù),但是對于計算機聽覺系統(tǒng)而言,現(xiàn)有識別算法的性能還遠(yuǎn)沒有達(dá)到人類聽覺系統(tǒng)的水平。理解人耳的工作機理從而構(gòu)建一套自動的識別系統(tǒng)來模擬人類的聽覺能力,具有重要的意義。在信號處理領(lǐng)域,稀疏表示模擬了人耳的聽覺特性,對噪聲具有較好的魯棒性。因此,本論文以在信號處理和神經(jīng)科學(xué)領(lǐng)域受到廣泛關(guān)注的稀疏表示模型為理論基礎(chǔ),從稀疏表示的字典構(gòu)建入手,分別研究使用短時和長時信號特征來構(gòu)建幀級和段級字典,并基于兩類字典來進(jìn)行說話人識別的方法。本文的主要研究工作如下:1、為反映聽覺神經(jīng)元對輸入語音信號的響應(yīng),首先對基于幀級字典分解后的每幀稀疏表示系數(shù)向量進(jìn)行量化處理,利用量化處理后與各稀疏表示系數(shù)相對應(yīng)原子的激活情況來反映聽覺神經(jīng)元對輸入的響應(yīng)。接著,將隨時間變化的多幀語音序列的原子激活情況作為原子的整體活躍度來代表說話人的整體信息。為了避免說話人數(shù)據(jù)量少時,使用高斯混合模型無法有效刻畫說話人的原子活躍度的分布問題,通過使用kurtosis高階統(tǒng)計量來計算原子活躍度的分布情況,并以此作為模型來進(jìn)行說話人識別。2、為提取噪聲環(huán)境下魯棒的說話人特征,利用判別字典學(xué)習(xí),將學(xué)習(xí)獲得的幀級語音字典和幀級噪聲字典合并構(gòu)建成聯(lián)合字典。對帶噪語音的每幀特征在聯(lián)合字典上進(jìn)行稀疏分解后,忽略掉在噪聲字典上分解后的系數(shù),而只將在語音字典上分解后的稀疏表示系數(shù)向量作為該幀的特征。進(jìn)一步地,對多幀語音序列的稀疏表示系數(shù)向量組進(jìn)行最大值池化操作和平均值池化操作,從而獲得說話人的全局特征表示,進(jìn)而來進(jìn)行說話人識別。3、為增加多類說話人識別中不同類別字典間的差異,以改進(jìn)說話人識別性能,將判別學(xué)習(xí)準(zhǔn)則引入到段級字典構(gòu)建上。在字典學(xué)習(xí)時,一方面考慮每類字典的類別信息,以最小化同類字典表示訓(xùn)練樣本時的重構(gòu)誤差,另一方面通過引入Fisher判別準(zhǔn)則,能使稀疏表示系數(shù)的類內(nèi)誤差最小、類間誤差最大。進(jìn)而獲得更具判別能力的段級字典。同時,也保留每類訓(xùn)練樣本在其學(xué)得的段級字典上稀疏分解后的系數(shù)的均值作為一種先驗信息,在進(jìn)行識別時將這種信息與重構(gòu)誤差一起作為識別結(jié)果判定的依據(jù)。4、為充分利用多類說話人信息,由于語音在不同類別字典拼接所形成的字典上進(jìn)行稀疏分解時,所獲得的稀疏表示系數(shù)間具有連續(xù)分組的結(jié)構(gòu),且同組內(nèi)稀疏表示系數(shù)間具有相關(guān)性,我們通過使用塊稀疏貝葉斯分解算法來對語音信號進(jìn)行稀疏分解,從而能有效利用上述稀疏表示系數(shù)之間的先驗信息,進(jìn)而提高說話人識別的性能。
[Abstract]:......
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號】:TN912.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張新鵬;王朔中;;基于稀疏表示的密寫編碼[J];電子學(xué)報;2007年10期

2 李映;張艷寧;許星;;基于信號稀疏表示的形態(tài)成分分析:進(jìn)展和展望[J];電子學(xué)報;2009年01期

3 趙瑞珍;王飛;羅阿理;張彥霞;;基于稀疏表示的譜線自動提取方法[J];光譜學(xué)與光譜分析;2009年07期

4 楊蜀秦;寧紀(jì)鋒;何東健;;基于稀疏表示的大米品種識別[J];農(nóng)業(yè)工程學(xué)報;2011年03期

5 史加榮;楊威;魏宗田;;基于非負(fù)稀疏表示的人臉識別[J];計算機工程與設(shè)計;2012年05期

6 高志榮;熊承義;笪邦友;;改進(jìn)的基于殘差加權(quán)的稀疏表示人臉識別[J];中南民族大學(xué)學(xué)報(自然科學(xué)版);2012年03期

7 朱杰;楊萬扣;唐振民;;基于字典學(xué)習(xí)的核稀疏表示人臉識別方法[J];模式識別與人工智能;2012年05期

8 耿耀君;張軍英;袁細(xì)國;;一種基于稀疏表示系數(shù)的特征相關(guān)性測度[J];模式識別與人工智能;2013年01期

9 張疆勤;廖海斌;李原;;基于因子分析與稀疏表示的多姿態(tài)人臉識別[J];計算機工程與應(yīng)用;2013年05期

10 李正周;王會改;劉梅;丁浩;金鋼;;基于形態(tài)成分稀疏表示的紅外小弱目標(biāo)檢測[J];彈箭與制導(dǎo)學(xué)報;2013年04期

相關(guān)會議論文 前3條

1 何愛香;劉玉春;魏廣芬;;基于稀疏表示的煤矸界面識別研究[A];虛擬運營與云計算——第十八屆全國青年通信學(xué)術(shù)年會論文集(上冊)[C];2013年

2 樊亞翔;孫浩;周石琳;鄒煥新;;基于元樣本稀疏表示的多視角目標(biāo)識別[A];2013年中國智能自動化學(xué)術(shù)會議論文集(第五分冊)[C];2013年

3 葛鳳翔;任歲玲;郭鑫;郭良浩;孫波;;微弱信號處理及其研究進(jìn)展[A];中國聲學(xué)學(xué)會水聲學(xué)分會2013年全國水聲學(xué)學(xué)術(shù)會議論文集[C];2013年

相關(guān)博士學(xué)位論文 前10條

1 王偉;基于幀級和段級稀疏表示的說話人識別研究[D];哈爾濱工業(yè)大學(xué);2016年

2 李進(jìn)明;基于稀疏表示的圖像超分辨率重建方法研究[D];重慶大學(xué);2015年

3 王亞寧;基于信號稀疏表示的電機故障診斷研究[D];河北工業(yè)大學(xué);2014年

4 姚明海;視頻異常事件檢測與認(rèn)證方法研究[D];東北師范大學(xué);2015年

5 黃國華;蛋白質(zhì)翻譯后修飾位點與藥物適應(yīng)癥預(yù)測方法研究[D];上海大學(xué);2015年

6 王瑾;基于稀疏表示的數(shù)據(jù)收集、復(fù)原與壓縮研究[D];北京工業(yè)大學(xué);2015年

7 王文卿;基于融合框架與稀疏表示的遙感影像銳化[D];西安電子科技大學(xué);2015年

8 解虎;高維小樣本陣列自適應(yīng)信號處理方法研究[D];西安電子科技大學(xué);2015年

9 秦振濤;基于稀疏表示及字典學(xué)習(xí)遙感圖像處理關(guān)鍵技術(shù)研究[D];成都理工大學(xué);2015年

10 薛明;基于稀疏表示的在線目標(biāo)跟蹤研究[D];上海交通大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 王道文;基于稀疏表示的目標(biāo)跟蹤算法研究[D];華南理工大學(xué);2015年

2 李哲;基于稀疏表示和LS-SVM的心電信號分類[D];河北大學(xué);2015年

3 孫雪青;Shearlet變換和稀疏表示相結(jié)合的甲狀腺結(jié)節(jié)圖像融合[D];河北大學(xué);2015年

4 吳麗璇;基于稀疏表示的微聚焦X射線圖像去噪方法[D];華南理工大學(xué);2015年

5 趙孝磊;基于圖像分塊稀疏表示的人臉識別算法研究[D];南京信息工程大學(xué);2015年

6 黃志明;基于辨別式稀疏字典學(xué)習(xí)的視覺追蹤算法研究[D];華南理工大學(xué);2015年

7 張鈴華;非約束環(huán)境下的稀疏表示人臉識別算法研究[D];南京信息工程大學(xué);2015年

8 賀妍斐;基于稀疏表示與自適應(yīng)倒易晶胞的遙感圖像復(fù)原方法研究[D];南京信息工程大學(xué);2015年

9 楊爍;電能質(zhì)量擾動信號的稀疏表示/壓縮采樣研究[D];西南交通大學(xué);2015年

10 應(yīng)艷麗;基于低秩稀疏表示的目標(biāo)跟蹤算法研究[D];西南交通大學(xué);2015年

,

本文編號:2267508

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/2267508.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶90853***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com