聲源辨別及定位的并行化方法的研究與實現(xiàn)
本文關鍵詞:聲源辨別及定位的并行化方法的研究與實現(xiàn)
更多相關文章: 聲源定位 聲紋辨別 深度神經(jīng)網(wǎng)絡 CUDA并行化 拾音陣列
【摘要】:隨著“互聯(lián)網(wǎng)+”和大數(shù)據(jù)時代的到來,智能終端的語音交互體驗廣受關注,三維立體聲音在實時人機交互中占有重要地位,聲源辨別及定位技術被廣泛應用于民用和軍事領域,具有良好的發(fā)展前景。聲源辨別定位算法較高的計算復雜度與較大的數(shù)據(jù)處理規(guī)模,制約了其應用的實時性。為此本文設計了聲源辨別及定位的并行化方法,基于拾音陣列和GPU并行計算開展了如下工作:(1)以現(xiàn)有聲源辨別及定位方法為基礎,研究了語音信號預處理的相關技術,介紹了聲紋辨別與聲源定位的常用方法,分析了基于拾音陣列的聲源辨別及定位模型。(2)在傳統(tǒng)聲紋辨別神經(jīng)網(wǎng)絡的基礎上,引入深度學習技術,設計了基于深度信念網(wǎng)絡(DBN)的聲紋辨別模型,克服了傳統(tǒng)神經(jīng)網(wǎng)絡學習能力不足的缺點;給出了針對目標范圍內(nèi)聲源辨別的改進方法。(3)在原有TDOA聲源定位模型中,將信號的包絡分析技術融入時延估計算法中,設計了基于包絡匹配法的廣義互相關時延估計算法,研究對比了不同聲源定位模型的位置解算方法及其性能;利用拾音陣列的位置特性,研究了基于時頻掩蔽的目標語音分離和增強方法。(4)針對語音信號處理具有獨立性強、方法一致的特點,使用基于CUDA架構的并行計算方法,分別對DBN模型的訓練過程、時延估計中的信號分析和信號融合的時頻掩蔽算法等操作進行并行化改進,提高了辨別定位方法的處理速度。實驗表明,基于拾音陣列的聲源辨別及定位的并行化方法能有效實現(xiàn)對目標聲源身份的辨別和位置的確定,抗噪性能較好,并行算法的效率有了明顯提高,滿足實時性的需求。該方法為大數(shù)據(jù)環(huán)境下語音信號的高性能處理提供了一種實現(xiàn)方式。
【關鍵詞】:聲源定位 聲紋辨別 深度神經(jīng)網(wǎng)絡 CUDA并行化 拾音陣列
【學位授予單位】:江蘇科技大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TN912.3
【目錄】:
- 摘要5-6
- Abstract6-14
- 第1章 緒論14-22
- 1.1 課題研究背景和意義14-15
- 1.2 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢15-17
- 1.2.1 聲紋辨別發(fā)展歷史與現(xiàn)狀15
- 1.2.2 聲源定位發(fā)展歷史與現(xiàn)狀15-16
- 1.2.3 聲源辨別定位技術存在的不足及發(fā)展趨勢16-17
- 1.3 GPU及其通用計算架構CUDA17-18
- 1.4 本文主要內(nèi)容和結構安排18-20
- 1.4.1 論文主要研究內(nèi)容18-19
- 1.4.2 論文結構安排19-20
- 1.5 本章小結20-22
- 第2章 聲源辨別及定位的常用方法22-31
- 2.1 聲源辨別定位模型的設計目標與方法22-23
- 2.2 語音信號的預處理23-27
- 2.2.1 預濾波23
- 2.2.2 預加重23-24
- 2.2.3 加窗分幀24-25
- 2.2.4 端點檢測25-27
- 2.3 聲紋辨別常用方法概述27-28
- 2.4 聲源定位常用方法概述28-30
- 2.4.1 基于聲壓幅度比的定位方法28
- 2.4.2 基于最大輸出功率的可控波束形成技術28-29
- 2.4.3 基于聲達時間差的聲源定位技術29-30
- 2.5 本章小結30-31
- 第3章 基于并行化深度神經(jīng)網(wǎng)絡的聲紋辨別模型31-47
- 3.1 語音信號的特征提取31-35
- 3.1.1 線性預測系數(shù)與其倒譜系數(shù)31-32
- 3.1.2 梅爾頻率倒譜系數(shù)32-34
- 3.1.3 線性預測梅爾倒譜系數(shù)34-35
- 3.2 基于深度信念網(wǎng)絡的聲紋辨別模型35-39
- 3.2.1 深度神經(jīng)網(wǎng)絡概述35-36
- 3.2.2 深度信念網(wǎng)絡(DBN)36-38
- 3.2.3 聲紋辨別的深度信念網(wǎng)絡模型38-39
- 3.3 基于CUDA的并行DBN優(yōu)化模型39-42
- 3.4 實驗與分析42-46
- 3.4.1 實驗環(huán)境與評估標準42-43
- 3.4.2 實驗數(shù)據(jù)分析43-46
- 3.5 本章小結46-47
- 第4章 基于并行化時延估計的聲源定位模型47-63
- 4.1 基于包絡分析的時延估計47-53
- 4.1.1 時延的物理意義47-48
- 4.1.2 廣義互相關時延估計方法48-50
- 4.1.3 基于包絡信號的廣義互相關算法50-53
- 4.2 基于TDOA的定位算法模型53-56
- 4.2.1 平面雙曲線算法模型53-54
- 4.2.2 平面四元陣算法模型54-56
- 4.3 基于CUDA并行化的聲源定位算法優(yōu)化56-59
- 4.3.1 并行化的FFT與IFFT算法57-58
- 4.3.2 并行化的互功率譜密度算法58-59
- 4.4 實驗與分析59-61
- 4.5 本章小結61-63
- 第5章 聲源辨別及定位的并行化方法的優(yōu)化與測試63-77
- 5.1 聲源辨別定位的并行化模型設計63-64
- 5.2 系統(tǒng)模型存在的問題及改進方案64-69
- 5.2.1 系統(tǒng)模型存在的問題64
- 5.2.2 針對目標范圍聲源辨別的改進方法64-66
- 5.2.3 CUDA編程的存儲優(yōu)化方案66-67
- 5.2.4 目標聲紋分離提取的并行化方法67-69
- 5.3 系統(tǒng)測試與分析69-75
- 5.3.1 測試環(huán)境69-70
- 5.3.2 目標語音分離增強效果測試70-72
- 5.3.3 并行化方法模型整體測試72-74
- 5.3.4 誤差分析74-75
- 5.4 本章小結75-77
- 總結與展望77-79
- 參考文獻79-83
- 攻讀碩士學位期間發(fā)表的學術成果83-85
- 致謝85-86
- 詳細摘要86-90
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 沈常宇;郭寶金;姜守軍;蔣坤軍;;小區(qū)域高精度實時三維聲源定位系統(tǒng)[J];聲學技術;2007年05期
2 鄭珍珍;馮華君;沈常宇;丁馳竹;李奇;;基于坐標系變換的三維聲源定位算法[J];浙江大學學報(工學版);2008年02期
3 李彥翔;劉慶華;;高斯條件下基于粒子濾波的聲源定位[J];電聲技術;2009年10期
4 楊杰;張明路;;一種改進的聲源目標成型波定位方法的研究[J];河北工業(yè)大學學報;2009年05期
5 袁余民;廖海龍;;可移動聲源定位系統(tǒng)的研究與實現(xiàn)[J];信息系統(tǒng)工程;2010年01期
6 趙立業(yè);李宏生;;噪聲與共振環(huán)境下的數(shù)字助聽器魯棒聲源定位法(英文)[J];Transactions of Nanjing University of Aeronautics & Astronautics;2010年02期
7 李彥翔;劉慶華;;基于粒子濾波的聲源定位方法[J];計算機工程與應用;2010年30期
8 陳益如;王博;鄔楊波;;基于聲音導引的聲源定位系統(tǒng)設計[J];工業(yè)控制計算機;2010年10期
9 張志勇;高寶成;;一種分布式的聲源定位系統(tǒng)[J];數(shù)據(jù)采集與處理;2010年S1期
10 雷斌;孫舟;;分布式聲源定位算法實現(xiàn)[J];西安工業(yè)大學學報;2011年02期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 汪增福;劉克輝;王東;韓文善;;基于聲壓幅度比的聲源定位[A];2001年中國智能自動化會議論文集(下冊)[C];2001年
2 饒丹;謝菠蓀;;聲源指向性對雙耳可聽化質(zhì)量的影響[A];2005年聲頻工程學術交流會論文集[C];2005年
3 饒丹;謝菠蓀;;聲源指向性對雙耳可聽化質(zhì)量的影響[A];中國聲學學會2007年青年學術會議論文集(上)[C];2007年
4 沈常宇;郭寶金;姜守軍;蔣坤軍;;小區(qū)域高精度實時三維聲源定位系統(tǒng)[A];中國聲學學會2007年青年學術會議論文集(上)[C];2007年
5 原晶晶;;3-7歲正常兒童聲源定位能力的研究[A];2010全國耳鼻咽喉頭頸外科中青年學術會議論文匯編[C];2010年
6 全海英;張旭;鄧軍民;于紅玉;徐瑾;孫涌;何寶新;水玉海;王寧宇;;聲源定位測聽系統(tǒng)的設計[A];中國生物醫(yī)學工程進展——2007中國生物醫(yī)學工程聯(lián)合學術年會論文集(上冊)[C];2007年
7 劉哲;陳日林;羅倫楷;滕鵬曉;楊亦春;;探測距離對聲源定位精度的影響[A];泛在信息社會中的聲學——中國聲學學會2010年全國會員代表大會暨學術會議論文集[C];2010年
8 黃益旺;楊士莪;呂錢浩;;基于時延的匹配場聲源定位[A];中國聲學學會2002年全國聲學學術會議論文集[C];2002年
9 劉紅云;劉桂禮;羅倩;;基于改進時延估計的聲源定位方法實現(xiàn)[A];2011年通信與信息技術新進展——第八屆中國通信學會學術年會論文集[C];2011年
10 朱勝佳;任海鵬;;基于混沌共軛梯度法的二維聲源定位方法研究[A];2010振動與噪聲測試峰會論文集[C];2010年
中國重要報紙全文數(shù)據(jù)庫 前1條
1 李函;人是如何定位聲源的?[N];科技日報;2008年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 王子騰;高速車輛的聲源定量識別方法[D];清華大學;2014年
2 丁浩;可識別聲源深度的三維聲聚焦波束形成方法研究[D];浙江工業(yè)大學;2013年
3 楊志國;馬爾可夫狀態(tài)—空間模型下的聲源定位與跟蹤[D];浙江大學;2013年
4 周成;人耳聲源定位與編碼技術研究[D];武漢大學;2011年
5 劉松;基于相位共軛方法進行聲源識別和定位[D];大連理工大學;2011年
6 黃益旺;淺海遠距離匹配場聲源定位研究[D];哈爾濱工程大學;2005年
7 張承云;虛擬聽覺環(huán)境實時繪制系統(tǒng)平臺研究[D];華南理工大學;2012年
8 陳韶華;海洋聲源信息獲取與傳輸技術研究[D];西北工業(yè)大學;2006年
9 徐勤奇;基于正四面體傳聲器陣列的機器人聲源定位方法研究[D];河北工業(yè)大學;2014年
10 饒丹;雙耳可聽化質(zhì)量及其影響因素的研究[D];華南理工大學;2009年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 李賀;基于波束形成算法的聲源定位研究及DSP實現(xiàn)[D];南京信息工程大學;2015年
2 劉慧珠;基于麥克風陣列的聲源方位估計算法研究[D];西南交通大學;2015年
3 薛偉誠;鋸齒尾緣翼型降噪實驗研究[D];中國科學院研究生院(工程熱物理研究所);2015年
4 肖駿;基于麥克風陣列的實時聲源定位技術研究[D];電子科技大學;2015年
5 劉茜茜;基于人耳聽覺系統(tǒng)的盲聲源分離方法研究[D];電子科技大學;2015年
6 李揚;基于小型麥克風陣列的聲源定位系統(tǒng)設計與實現(xiàn)[D];哈爾濱工業(yè)大學;2014年
7 李哲;聲源定位系統(tǒng)的設計與實現(xiàn)[D];河北科技大學;2015年
8 仲維燦;不確定性條件下機器人聲源定位模型研究[D];河北工業(yè)大學;2015年
9 楊博元;傳感器聲源目標定位算法研究[D];西安工業(yè)大學;2013年
10 徐亦達;時變海洋聲速剖面移動聲源反演方法研究[D];浙江大學;2015年
,本文編號:735912
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/735912.html