智能數(shù)字助聽器中聲場(chǎng)景分類的研究
發(fā)布時(shí)間:2020-08-27 08:09
【摘要】:隨著社會(huì)的不斷發(fā)展,老齡化問題越來越突出,這促使了人們對(duì)耳聾問題的關(guān)注,助聽器的發(fā)展開始受到人們的普遍重視。聲場(chǎng)景分類作為智能數(shù)字助聽器的核心技術(shù),其算法處于信號(hào)處理的前端,能夠識(shí)別出助聽器使用者當(dāng)前的聽覺場(chǎng)景,自適應(yīng)地調(diào)用相應(yīng)的處理程序,實(shí)現(xiàn)針對(duì)不同場(chǎng)景聲信號(hào)的個(gè)性化處理。本質(zhì)上講,聲場(chǎng)景分類屬于環(huán)境聲識(shí)別問題,主要包括兩個(gè)方面:特征提取和分類。特征提取是對(duì)聲信號(hào)進(jìn)行維數(shù)約減,提取出能代表原始信號(hào)的數(shù)據(jù);而分類是指通過一定方法編碼聲特征,并與模板數(shù)據(jù)庫進(jìn)行比對(duì)以確定聲信號(hào)所屬類別。本文主要圍繞選擇性注意模型、傳統(tǒng)的HMM模型和深度學(xué)習(xí)模型來展開對(duì)聲場(chǎng)景分類的研究。在特征提取方面,本文通過對(duì)聲信號(hào)的語譜圖做顯著性分析,提取出顯著圖特征,再將其與傳統(tǒng)的MFCC特征進(jìn)行混合,形成混合特征。在分類器方面,本文分別使用傳統(tǒng)的HMM模型和深度學(xué)習(xí)模型進(jìn)行分類。本文所做的工作主要有以下幾項(xiàng):1.闡述了聲場(chǎng)景分類技術(shù)的研究背景和研究現(xiàn)狀,分析了現(xiàn)有聲場(chǎng)景分類技術(shù)的優(yōu)缺點(diǎn),并對(duì)當(dāng)前有待深入研究和急需解決的問題進(jìn)行了說明。2.概述了聲場(chǎng)景分類的理論基礎(chǔ),介紹了聲場(chǎng)景分類的幾個(gè)模塊,包括預(yù)處理模塊、特征提取模塊、分類器訓(xùn)練模塊和測(cè)試模塊,并介紹了聲場(chǎng)景分類特征提取和分類器設(shè)計(jì)方面的相關(guān)知識(shí)。3.深入研究了選擇性注意模型,包括選擇性注意模型的理論和視覺選擇性注意模型中的兩種常用模型——Itti模型和GBVS模型,并將視覺理論應(yīng)用于聲學(xué)中,完成了對(duì)聲信號(hào)語譜圖的顯著性分析,提取出了聲信號(hào)的顯著圖參數(shù)。4.利用提取出的顯著圖參數(shù)得到用于分類的特征向量,再提取出聲信號(hào)的MFCC特征,將二者進(jìn)行混合,組成混合特征,再利用傳統(tǒng)的HMM分類器分別使用單獨(dú)的顯著圖特征、單獨(dú)的MFCC特征和混合特征完成對(duì)聲場(chǎng)景的分類,并比較各自的分類效果。5.簡(jiǎn)述了深度學(xué)習(xí)的發(fā)展歷程、主要模型和應(yīng)用,介紹了深度學(xué)習(xí)常用方法,包括自動(dòng)編碼器、稀疏自動(dòng)編碼器和受限玻爾茲曼機(jī),介紹了 Gibbs采樣過程和對(duì)比散度算法,將深度學(xué)習(xí)模型應(yīng)用于聲場(chǎng)景分類過程中,采用兩種常用深度學(xué)習(xí)模型——稀疏自動(dòng)編碼器和深度置信網(wǎng)絡(luò)組成混合模型,該模型共包括三個(gè)部分:前面使用兩層稀疏自動(dòng)編碼器進(jìn)行構(gòu)造,中間使用一個(gè)三層深度置信網(wǎng)絡(luò)實(shí)現(xiàn),最后使用Softmax回歸作為分類器,再分別利用顯著圖特征、MFCC特征和混合特征進(jìn)行實(shí)驗(yàn),比較各自的分類結(jié)果。
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TH785.1
【圖文】:
統(tǒng)、模式識(shí)別、人工智能、統(tǒng)計(jì)學(xué)習(xí)等[17)。該領(lǐng)域當(dāng)前的研宄重點(diǎn)主要集中在特征分析逡逑與提取和分類器的選擇這兩個(gè)方面。逡逑由圖2-1可知,聲場(chǎng)景分類系統(tǒng)主要由以下幾個(gè)模塊所組成:預(yù)處理模塊、特征提逡逑取模塊、分類器訓(xùn)練模塊和測(cè)試模塊。逡逑預(yù)處理 ̄]——■^特征提取邐逡逑預(yù)處理 ̄]——特征提取邐逡逑圖2-1聲場(chǎng)景分類系統(tǒng)結(jié)構(gòu)圖逡逑預(yù)處理模塊主要是為后面的信號(hào)處理過程做準(zhǔn)備。人耳聽到的原始聲音都是模擬信逡逑號(hào),但計(jì)算機(jī)只能處理數(shù)字信號(hào),因此要將原始信號(hào)轉(zhuǎn)換為計(jì)算機(jī)可以處理的數(shù)字信號(hào)。逡逑此外,為了保持一致性,還需要將輸入信號(hào)轉(zhuǎn)換為統(tǒng)一的規(guī)格和存儲(chǔ)格式。同時(shí),原始逡逑信號(hào)中噪聲的存在也會(huì)影響分類的結(jié)果,因此也需要進(jìn)行相應(yīng)的預(yù)處理。預(yù)處理主要包逡逑括端點(diǎn)檢測(cè)、預(yù)加重、分幀和加窗等。逡逑特征提取模塊在整個(gè)系統(tǒng)中處于核心地位。該模塊的主要功能在于研[偛⑻崛》從沖義仙藕諾奶卣韃問3【胺擲嘀諧S玫奶卣髦饕ǘ淌蹦芰、过零率、緫K袈、基频、辶x掀燈字行摹⒑托扯、讍养能量、MFCC及茲态矄桚、线性预测系数LPV櫌LPC敌M紫靛義鮮蹋校茫謾⑾咂錐圓問蹋櫻小⒍淌逼燈綴凸艙穹迤德實(shí)齲郟福蕁e義戲擲嗥餮盜紡?櫚鬧饕δ蓯茄≡窈鮮實(shí)姆擲嗥髂P停褂靡歡ㄊ康納【靶藕佩義獻(xiàn)魑盜費(fèi)荊源死慈范ǚ擲嗥髦械牟問。臍ぐ,基又o臣頗P偷姆擲嗥骶e義銜蠖嗍難繡癡咚褂,诊剣繑S嗥髦饕嗷冢牽停偷姆擲嗥鰲粲冢粒危蔚膩義戲擲嗥鰲⒒冢櫻鄭偷姆擲嗥骱突冢齲停偷姆擲嗥鰨睿梗薄4送
本文編號(hào):2805847
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TH785.1
【圖文】:
統(tǒng)、模式識(shí)別、人工智能、統(tǒng)計(jì)學(xué)習(xí)等[17)。該領(lǐng)域當(dāng)前的研宄重點(diǎn)主要集中在特征分析逡逑與提取和分類器的選擇這兩個(gè)方面。逡逑由圖2-1可知,聲場(chǎng)景分類系統(tǒng)主要由以下幾個(gè)模塊所組成:預(yù)處理模塊、特征提逡逑取模塊、分類器訓(xùn)練模塊和測(cè)試模塊。逡逑預(yù)處理 ̄]——■^特征提取邐逡逑預(yù)處理 ̄]——特征提取邐逡逑圖2-1聲場(chǎng)景分類系統(tǒng)結(jié)構(gòu)圖逡逑預(yù)處理模塊主要是為后面的信號(hào)處理過程做準(zhǔn)備。人耳聽到的原始聲音都是模擬信逡逑號(hào),但計(jì)算機(jī)只能處理數(shù)字信號(hào),因此要將原始信號(hào)轉(zhuǎn)換為計(jì)算機(jī)可以處理的數(shù)字信號(hào)。逡逑此外,為了保持一致性,還需要將輸入信號(hào)轉(zhuǎn)換為統(tǒng)一的規(guī)格和存儲(chǔ)格式。同時(shí),原始逡逑信號(hào)中噪聲的存在也會(huì)影響分類的結(jié)果,因此也需要進(jìn)行相應(yīng)的預(yù)處理。預(yù)處理主要包逡逑括端點(diǎn)檢測(cè)、預(yù)加重、分幀和加窗等。逡逑特征提取模塊在整個(gè)系統(tǒng)中處于核心地位。該模塊的主要功能在于研[偛⑻崛》從沖義仙藕諾奶卣韃問3【胺擲嘀諧S玫奶卣髦饕ǘ淌蹦芰、过零率、緫K袈、基频、辶x掀燈字行摹⒑托扯、讍养能量、MFCC及茲态矄桚、线性预测系数LPV櫌LPC敌M紫靛義鮮蹋校茫謾⑾咂錐圓問蹋櫻小⒍淌逼燈綴凸艙穹迤德實(shí)齲郟福蕁e義戲擲嗥餮盜紡?櫚鬧饕δ蓯茄≡窈鮮實(shí)姆擲嗥髂P停褂靡歡ㄊ康納【靶藕佩義獻(xiàn)魑盜費(fèi)荊源死慈范ǚ擲嗥髦械牟問。臍ぐ,基又o臣頗P偷姆擲嗥骶e義銜蠖嗍難繡癡咚褂,诊剣繑S嗥髦饕嗷冢牽停偷姆擲嗥鰲粲冢粒危蔚膩義戲擲嗥鰲⒒冢櫻鄭偷姆擲嗥骱突冢齲停偷姆擲嗥鰨睿梗薄4送
本文編號(hào):2805847
本文鏈接:http://sikaile.net/kejilunwen/yiqiyibiao/2805847.html
最近更新
教材專著