聲源辨別及定位的并行化方法的研究與實(shí)現(xiàn)
本文關(guān)鍵詞:聲源辨別及定位的并行化方法的研究與實(shí)現(xiàn)
更多相關(guān)文章: 聲源定位 聲紋辨別 深度神經(jīng)網(wǎng)絡(luò) CUDA并行化 拾音陣列
【摘要】:隨著“互聯(lián)網(wǎng)+”和大數(shù)據(jù)時(shí)代的到來,智能終端的語音交互體驗(yàn)廣受關(guān)注,三維立體聲音在實(shí)時(shí)人機(jī)交互中占有重要地位,聲源辨別及定位技術(shù)被廣泛應(yīng)用于民用和軍事領(lǐng)域,具有良好的發(fā)展前景。聲源辨別定位算法較高的計(jì)算復(fù)雜度與較大的數(shù)據(jù)處理規(guī)模,制約了其應(yīng)用的實(shí)時(shí)性。為此本文設(shè)計(jì)了聲源辨別及定位的并行化方法,基于拾音陣列和GPU并行計(jì)算開展了如下工作:(1)以現(xiàn)有聲源辨別及定位方法為基礎(chǔ),研究了語音信號(hào)預(yù)處理的相關(guān)技術(shù),介紹了聲紋辨別與聲源定位的常用方法,分析了基于拾音陣列的聲源辨別及定位模型。(2)在傳統(tǒng)聲紋辨別神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,引入深度學(xué)習(xí)技術(shù),設(shè)計(jì)了基于深度信念網(wǎng)絡(luò)(DBN)的聲紋辨別模型,克服了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)能力不足的缺點(diǎn);給出了針對(duì)目標(biāo)范圍內(nèi)聲源辨別的改進(jìn)方法。(3)在原有TDOA聲源定位模型中,將信號(hào)的包絡(luò)分析技術(shù)融入時(shí)延估計(jì)算法中,設(shè)計(jì)了基于包絡(luò)匹配法的廣義互相關(guān)時(shí)延估計(jì)算法,研究對(duì)比了不同聲源定位模型的位置解算方法及其性能;利用拾音陣列的位置特性,研究了基于時(shí)頻掩蔽的目標(biāo)語音分離和增強(qiáng)方法。(4)針對(duì)語音信號(hào)處理具有獨(dú)立性強(qiáng)、方法一致的特點(diǎn),使用基于CUDA架構(gòu)的并行計(jì)算方法,分別對(duì)DBN模型的訓(xùn)練過程、時(shí)延估計(jì)中的信號(hào)分析和信號(hào)融合的時(shí)頻掩蔽算法等操作進(jìn)行并行化改進(jìn),提高了辨別定位方法的處理速度。實(shí)驗(yàn)表明,基于拾音陣列的聲源辨別及定位的并行化方法能有效實(shí)現(xiàn)對(duì)目標(biāo)聲源身份的辨別和位置的確定,抗噪性能較好,并行算法的效率有了明顯提高,滿足實(shí)時(shí)性的需求。該方法為大數(shù)據(jù)環(huán)境下語音信號(hào)的高性能處理提供了一種實(shí)現(xiàn)方式。
【關(guān)鍵詞】:聲源定位 聲紋辨別 深度神經(jīng)網(wǎng)絡(luò) CUDA并行化 拾音陣列
【學(xué)位授予單位】:江蘇科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.3
【目錄】:
- 摘要5-6
- Abstract6-14
- 第1章 緒論14-22
- 1.1 課題研究背景和意義14-15
- 1.2 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢15-17
- 1.2.1 聲紋辨別發(fā)展歷史與現(xiàn)狀15
- 1.2.2 聲源定位發(fā)展歷史與現(xiàn)狀15-16
- 1.2.3 聲源辨別定位技術(shù)存在的不足及發(fā)展趨勢16-17
- 1.3 GPU及其通用計(jì)算架構(gòu)CUDA17-18
- 1.4 本文主要內(nèi)容和結(jié)構(gòu)安排18-20
- 1.4.1 論文主要研究內(nèi)容18-19
- 1.4.2 論文結(jié)構(gòu)安排19-20
- 1.5 本章小結(jié)20-22
- 第2章 聲源辨別及定位的常用方法22-31
- 2.1 聲源辨別定位模型的設(shè)計(jì)目標(biāo)與方法22-23
- 2.2 語音信號(hào)的預(yù)處理23-27
- 2.2.1 預(yù)濾波23
- 2.2.2 預(yù)加重23-24
- 2.2.3 加窗分幀24-25
- 2.2.4 端點(diǎn)檢測25-27
- 2.3 聲紋辨別常用方法概述27-28
- 2.4 聲源定位常用方法概述28-30
- 2.4.1 基于聲壓幅度比的定位方法28
- 2.4.2 基于最大輸出功率的可控波束形成技術(shù)28-29
- 2.4.3 基于聲達(dá)時(shí)間差的聲源定位技術(shù)29-30
- 2.5 本章小結(jié)30-31
- 第3章 基于并行化深度神經(jīng)網(wǎng)絡(luò)的聲紋辨別模型31-47
- 3.1 語音信號(hào)的特征提取31-35
- 3.1.1 線性預(yù)測系數(shù)與其倒譜系數(shù)31-32
- 3.1.2 梅爾頻率倒譜系數(shù)32-34
- 3.1.3 線性預(yù)測梅爾倒譜系數(shù)34-35
- 3.2 基于深度信念網(wǎng)絡(luò)的聲紋辨別模型35-39
- 3.2.1 深度神經(jīng)網(wǎng)絡(luò)概述35-36
- 3.2.2 深度信念網(wǎng)絡(luò)(DBN)36-38
- 3.2.3 聲紋辨別的深度信念網(wǎng)絡(luò)模型38-39
- 3.3 基于CUDA的并行DBN優(yōu)化模型39-42
- 3.4 實(shí)驗(yàn)與分析42-46
- 3.4.1 實(shí)驗(yàn)環(huán)境與評(píng)估標(biāo)準(zhǔn)42-43
- 3.4.2 實(shí)驗(yàn)數(shù)據(jù)分析43-46
- 3.5 本章小結(jié)46-47
- 第4章 基于并行化時(shí)延估計(jì)的聲源定位模型47-63
- 4.1 基于包絡(luò)分析的時(shí)延估計(jì)47-53
- 4.1.1 時(shí)延的物理意義47-48
- 4.1.2 廣義互相關(guān)時(shí)延估計(jì)方法48-50
- 4.1.3 基于包絡(luò)信號(hào)的廣義互相關(guān)算法50-53
- 4.2 基于TDOA的定位算法模型53-56
- 4.2.1 平面雙曲線算法模型53-54
- 4.2.2 平面四元陣算法模型54-56
- 4.3 基于CUDA并行化的聲源定位算法優(yōu)化56-59
- 4.3.1 并行化的FFT與IFFT算法57-58
- 4.3.2 并行化的互功率譜密度算法58-59
- 4.4 實(shí)驗(yàn)與分析59-61
- 4.5 本章小結(jié)61-63
- 第5章 聲源辨別及定位的并行化方法的優(yōu)化與測試63-77
- 5.1 聲源辨別定位的并行化模型設(shè)計(jì)63-64
- 5.2 系統(tǒng)模型存在的問題及改進(jìn)方案64-69
- 5.2.1 系統(tǒng)模型存在的問題64
- 5.2.2 針對(duì)目標(biāo)范圍聲源辨別的改進(jìn)方法64-66
- 5.2.3 CUDA編程的存儲(chǔ)優(yōu)化方案66-67
- 5.2.4 目標(biāo)聲紋分離提取的并行化方法67-69
- 5.3 系統(tǒng)測試與分析69-75
- 5.3.1 測試環(huán)境69-70
- 5.3.2 目標(biāo)語音分離增強(qiáng)效果測試70-72
- 5.3.3 并行化方法模型整體測試72-74
- 5.3.4 誤差分析74-75
- 5.4 本章小結(jié)75-77
- 總結(jié)與展望77-79
- 參考文獻(xiàn)79-83
- 攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)成果83-85
- 致謝85-86
- 詳細(xì)摘要86-90
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 沈常宇;郭寶金;姜守軍;蔣坤軍;;小區(qū)域高精度實(shí)時(shí)三維聲源定位系統(tǒng)[J];聲學(xué)技術(shù);2007年05期
2 鄭珍珍;馮華君;沈常宇;丁馳竹;李奇;;基于坐標(biāo)系變換的三維聲源定位算法[J];浙江大學(xué)學(xué)報(bào)(工學(xué)版);2008年02期
3 李彥翔;劉慶華;;高斯條件下基于粒子濾波的聲源定位[J];電聲技術(shù);2009年10期
4 楊杰;張明路;;一種改進(jìn)的聲源目標(biāo)成型波定位方法的研究[J];河北工業(yè)大學(xué)學(xué)報(bào);2009年05期
5 袁余民;廖海龍;;可移動(dòng)聲源定位系統(tǒng)的研究與實(shí)現(xiàn)[J];信息系統(tǒng)工程;2010年01期
6 趙立業(yè);李宏生;;噪聲與共振環(huán)境下的數(shù)字助聽器魯棒聲源定位法(英文)[J];Transactions of Nanjing University of Aeronautics & Astronautics;2010年02期
7 李彥翔;劉慶華;;基于粒子濾波的聲源定位方法[J];計(jì)算機(jī)工程與應(yīng)用;2010年30期
8 陳益如;王博;鄔楊波;;基于聲音導(dǎo)引的聲源定位系統(tǒng)設(shè)計(jì)[J];工業(yè)控制計(jì)算機(jī);2010年10期
9 張志勇;高寶成;;一種分布式的聲源定位系統(tǒng)[J];數(shù)據(jù)采集與處理;2010年S1期
10 雷斌;孫舟;;分布式聲源定位算法實(shí)現(xiàn)[J];西安工業(yè)大學(xué)學(xué)報(bào);2011年02期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 汪增福;劉克輝;王東;韓文善;;基于聲壓幅度比的聲源定位[A];2001年中國智能自動(dòng)化會(huì)議論文集(下冊(cè))[C];2001年
2 饒丹;謝菠蓀;;聲源指向性對(duì)雙耳可聽化質(zhì)量的影響[A];2005年聲頻工程學(xué)術(shù)交流會(huì)論文集[C];2005年
3 饒丹;謝菠蓀;;聲源指向性對(duì)雙耳可聽化質(zhì)量的影響[A];中國聲學(xué)學(xué)會(huì)2007年青年學(xué)術(shù)會(huì)議論文集(上)[C];2007年
4 沈常宇;郭寶金;姜守軍;蔣坤軍;;小區(qū)域高精度實(shí)時(shí)三維聲源定位系統(tǒng)[A];中國聲學(xué)學(xué)會(huì)2007年青年學(xué)術(shù)會(huì)議論文集(上)[C];2007年
5 原晶晶;;3-7歲正常兒童聲源定位能力的研究[A];2010全國耳鼻咽喉頭頸外科中青年學(xué)術(shù)會(huì)議論文匯編[C];2010年
6 全海英;張旭;鄧軍民;于紅玉;徐瑾;孫涌;何寶新;水玉海;王寧宇;;聲源定位測聽系統(tǒng)的設(shè)計(jì)[A];中國生物醫(yī)學(xué)工程進(jìn)展——2007中國生物醫(yī)學(xué)工程聯(lián)合學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2007年
7 劉哲;陳日林;羅倫楷;滕鵬曉;楊亦春;;探測距離對(duì)聲源定位精度的影響[A];泛在信息社會(huì)中的聲學(xué)——中國聲學(xué)學(xué)會(huì)2010年全國會(huì)員代表大會(huì)暨學(xué)術(shù)會(huì)議論文集[C];2010年
8 黃益旺;楊士莪;呂錢浩;;基于時(shí)延的匹配場聲源定位[A];中國聲學(xué)學(xué)會(huì)2002年全國聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2002年
9 劉紅云;劉桂禮;羅倩;;基于改進(jìn)時(shí)延估計(jì)的聲源定位方法實(shí)現(xiàn)[A];2011年通信與信息技術(shù)新進(jìn)展——第八屆中國通信學(xué)會(huì)學(xué)術(shù)年會(huì)論文集[C];2011年
10 朱勝佳;任海鵬;;基于混沌共軛梯度法的二維聲源定位方法研究[A];2010振動(dòng)與噪聲測試峰會(huì)論文集[C];2010年
中國重要報(bào)紙全文數(shù)據(jù)庫 前1條
1 李函;人是如何定位聲源的?[N];科技日?qǐng)?bào);2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王子騰;高速車輛的聲源定量識(shí)別方法[D];清華大學(xué);2014年
2 丁浩;可識(shí)別聲源深度的三維聲聚焦波束形成方法研究[D];浙江工業(yè)大學(xué);2013年
3 楊志國;馬爾可夫狀態(tài)—空間模型下的聲源定位與跟蹤[D];浙江大學(xué);2013年
4 周成;人耳聲源定位與編碼技術(shù)研究[D];武漢大學(xué);2011年
5 劉松;基于相位共軛方法進(jìn)行聲源識(shí)別和定位[D];大連理工大學(xué);2011年
6 黃益旺;淺海遠(yuǎn)距離匹配場聲源定位研究[D];哈爾濱工程大學(xué);2005年
7 張承云;虛擬聽覺環(huán)境實(shí)時(shí)繪制系統(tǒng)平臺(tái)研究[D];華南理工大學(xué);2012年
8 陳韶華;海洋聲源信息獲取與傳輸技術(shù)研究[D];西北工業(yè)大學(xué);2006年
9 徐勤奇;基于正四面體傳聲器陣列的機(jī)器人聲源定位方法研究[D];河北工業(yè)大學(xué);2014年
10 饒丹;雙耳可聽化質(zhì)量及其影響因素的研究[D];華南理工大學(xué);2009年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 李賀;基于波束形成算法的聲源定位研究及DSP實(shí)現(xiàn)[D];南京信息工程大學(xué);2015年
2 劉慧珠;基于麥克風(fēng)陣列的聲源方位估計(jì)算法研究[D];西南交通大學(xué);2015年
3 薛偉誠;鋸齒尾緣翼型降噪實(shí)驗(yàn)研究[D];中國科學(xué)院研究生院(工程熱物理研究所);2015年
4 肖駿;基于麥克風(fēng)陣列的實(shí)時(shí)聲源定位技術(shù)研究[D];電子科技大學(xué);2015年
5 劉茜茜;基于人耳聽覺系統(tǒng)的盲聲源分離方法研究[D];電子科技大學(xué);2015年
6 李揚(yáng);基于小型麥克風(fēng)陣列的聲源定位系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2014年
7 李哲;聲源定位系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];河北科技大學(xué);2015年
8 仲維燦;不確定性條件下機(jī)器人聲源定位模型研究[D];河北工業(yè)大學(xué);2015年
9 楊博元;傳感器聲源目標(biāo)定位算法研究[D];西安工業(yè)大學(xué);2013年
10 徐亦達(dá);時(shí)變海洋聲速剖面移動(dòng)聲源反演方法研究[D];浙江大學(xué);2015年
,本文編號(hào):735912
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/735912.html