人工耳蝸新型編碼方案的研究與仿真
發(fā)布時間:2017-12-24 08:20
本文關鍵詞:人工耳蝸新型編碼方案的研究與仿真 出處:《南方醫(yī)科大學》2013年碩士論文 論文類型:學位論文
更多相關文章: 人工耳蝸 聽生理 語音編碼 刺激脈沖序列 數(shù)字信號處理器
【摘要】:人工耳蝸是一種為聾人恢復或獲得聽力的電子裝置,此裝置能把聲音信號轉(zhuǎn)變?yōu)殡娦盘栔苯哟碳ぢ犐窠?jīng)纖維,激發(fā)生物電流,從而在大腦皮層形成聽覺。 對正常聽力的人來說,聲波的振動被耳廓收集,通過外耳道到達鼓膜,經(jīng)聽小骨傳至內(nèi)耳外淋巴,引起基底膜的振動;啄ど厦毎睦w毛產(chǎn)生扭曲引起細胞膜的電位變化,從而釋放出神經(jīng)遞質(zhì),進而使位于毛細胞底部的聽神經(jīng)末梢纖維產(chǎn)生電位變化,這種電位變化經(jīng)螺旋神經(jīng)節(jié)細胞傳至中樞,產(chǎn)生聽覺。感音性耳聾病人有不同程度的毛細胞病變或減少,但還是保留著一定數(shù)量的聽神經(jīng)纖維和螺旋神經(jīng)節(jié)細胞,因此通過電刺激的方法可以恢復聽覺。 人工耳蝸就是對耳蝸功能的模仿,根據(jù)耳蝸部位編碼的原理,把一組電極通過手術植入到耳蝸的鼓階內(nèi),體外語音處理器對語音信號進行編碼處理產(chǎn)生相應電極的電刺激脈沖序列,并傳入體內(nèi)。體內(nèi)植入裝置接受電刺激脈沖序列,并直接興奮耳蝸內(nèi)不同部位電極附近的聽神經(jīng),使患者產(chǎn)生類似于真實聽覺的感受,從而達到恢復聽覺的目的。 現(xiàn)在世界上主要的三大人工耳蝸生產(chǎn)商分別是澳大利亞的Cochlear公司,奧地利的MED-EL公司和美國的Advanced Bionics公司。至2010年初,全世界有十幾萬聾人使用了人工耳蝸,其中半數(shù)以上是兒童。 語音編碼方案是人工耳蝸的關鍵技術之一。人工耳蝸所使用的語音編碼方案大致分為兩類,即包絡特征方案(Coarse feature)和精細特征方案(Fine feature)。 包絡特征方案包括頻域包絡顯性特征提取和時域包絡顯性特征提取這兩種。頻域包絡顯性特征是把語音信號的基頻和共振峰等參數(shù)提取出來,然后合成相應的刺激脈沖來刺激聽神經(jīng)。共振峰是語音信號的譜峰,一般取前3個峰值(F1,F2,F3),其頻點位置與刺激電極的位置相對應,其幅度大小決定刺激脈沖的幅度。共振峰頻率越高,所選電極越靠近蝸底,反之,越靠近蝸頂。刺激頻率越高,電極越靠近蝸底,反之,越靠近蝸頂。這類編碼方案主要包括FO/F2、FO/F1/F2和MPEAK (Multi-peaks,多峰)方案。 時域包絡顯性特征提取是基于聽覺模型的帶通濾波器組的方法,將語音信號預處理后通過多個帶通濾波器,再經(jīng)過一系列的處理,最后得到各個電極的刺激脈沖序列。這類方案又可分為模擬刺激(Analog Stimulation)方案(如SAS方案)和脈沖刺激(Pulsatile Stimulation)方案(如CIS方案、SPEAK方案、ACE方案等),F(xiàn)在的人工耳蝸產(chǎn)品中以CIS (Continuous Interleaved Sampling,連續(xù)相間采樣)方案、SPEAK方案、ACE (Advanced Confined Encoding,高級結(jié)合編碼)方案為主。其中,效果最為突出的是美國學者Wilson在1991年在Nature上的一篇文章中提出了對壓縮模擬(CA)法的改進方案,稱為CIS方案和澳大利亞Cochlear公司使用的ACE方案。 精細特征方案(Fine feature)主要包括頻域精細結(jié)構(gòu)(Spectral fine structure)方案和時域精細結(jié)構(gòu)(Temporal fine structure)方案,分別對應美國Advanced Bionics公司的HiRes90K使用的虛擬通道(Virtual channels)方案和奧地利人工耳蝸的FAME (Frequency Amplitude Modulation Encoding)方案。 現(xiàn)有的人工耳蝸語音編碼方法基本上只是考慮了語音信號到電信號的一個數(shù)學物理轉(zhuǎn)換過程,而沒有從人體生理方面出發(fā)。因為絕大多數(shù)感音神經(jīng)性耳聾病理基礎源于毛細胞的喪失或功能缺陷,人工耳蝸就是一種為了取代毛細胞的功能,把聲音信號轉(zhuǎn)變?yōu)殡娦盘栔苯哟碳ぢ犐窠?jīng)纖維的裝置。而耳蝸毛細胞的功能則是將聲波的機械能轉(zhuǎn)換為生物性電能和釋放神經(jīng)遞質(zhì)觸發(fā)聽神經(jīng)產(chǎn)生神經(jīng)動作電位。正常的聽覺過程是:首先聲音經(jīng)過傳聲系統(tǒng)使耳蝸毛細胞產(chǎn)生感受器電位(電1),然后毛細胞釋放化學遞質(zhì)使突觸產(chǎn)生突觸電位(電2),最后聽神經(jīng)纖維興奮產(chǎn)生神經(jīng)沖動(電3)并傳至聽覺中樞產(chǎn)生聽覺感受。而從聲音傳入到聽神經(jīng)產(chǎn)生神經(jīng)動作電位其中有兩個環(huán)節(jié)有生物電變化(電1和電2),但是由于感受器傳輸特性的非線性,兩種電位的參數(shù)特性是不同的。目前的人工耳蝸所使用的語音編碼方案把聲信號轉(zhuǎn)換成電信號直接刺激聽神經(jīng),其輸出的電信號只是與正常聽覺的感受器電位(電1)接近,卻與突觸電位(電2)不太一樣,這樣產(chǎn)生的聽覺感受與正常聽覺顯然是有一定區(qū)別的。如果給予聲音刺激的話,聽神經(jīng)的反應會隨著聲音強度的增大,產(chǎn)生動作電位的潛伏期會減小,但是給予電刺激的話,只要是閾上刺激,聽神經(jīng)會同時響應,F(xiàn)有的人工耳蝸編碼方案忽略了突觸的時間編碼效應,也就忽略了聽覺中樞的時間編碼、傳遞和處理特性,而這種時間編碼的特性恰恰是聽覺中樞編碼信息最重要特性之一,這也有可能是現(xiàn)有人工耳蝸無法使患者獲得理想聽覺的主要原因。 本文從以上問題出發(fā),對人工耳蝸編碼方案展開研究,主要內(nèi)容安排如下: 首先本文對國際上主流的三種人工耳蝸編碼方案(CIS、SPEAK和ACE)進行了MATLAB仿真,這三種編碼方案都可以歸類為nofm濾波器組方案,把經(jīng)過預處理的聲音通過m個帶通濾波器濾波得到m個輸出,再把m個輸出分別提取包絡獲得其振幅(A1,A2,…,Am),最后選出其中n個最大的振幅來對其相應的電極進行刺激。CIS方案m值與n值相同,取8或者12。SPEAK方案m值為20,n值為5-10,平均為6。ACE方案m值為22,n值為1-20,平均為8。它們都采用雙向脈沖相間調(diào)制,所有電極的脈沖刺激均不重疊,呈相間分布,就是說同一時刻只有一個通道被刺激,這樣可避免不同通道電極間的相互干擾。CIS方案的刺激速率一般選擇900Hz,SPEAK方案的電脈沖刺激速率在180到300Hz不等,平均為250Hz,當聲音頻譜越寬時,所選的通道數(shù)目越多,刺激速率就會越低,相反,當聲音頻譜越窄,所選的通道數(shù)目越少,刺激速率反而越高。ACE方案的通道選擇方法和刺激關系與SPEAK方案類似,不同的是刺激速率大幅提升,供選擇的有250、500、700、900、1200、1800、及2400Hz,平均約為900Hz。這三種方案有個明顯的缺點,不管是CIS,還是SPEAK或者ACE,只要它們調(diào)制的通道數(shù)和刺激速率固定下來,它們的刺激時間間隔都是不變的。而不會隨著刺激聲音強度的變化實時變化,即聲音強度變大時,刺激間隔就會變短,反之,刺激間隔就會變長。 然后,針對上述問題,本文結(jié)合聽覺生理刺激產(chǎn)生的機制,把毛細胞和聽神經(jīng)纖維形成的突觸的時間編碼作用考慮進去,提出一種使用膜電位積分放電(Membrane Potential Integrate-and-Fire,簡稱MPIF)來改善人工耳蝸音質(zhì)的語音編碼方案,在原有語音信號帶通整流提取包絡的前提下,以膜電位積分放電來生成刺激脈沖序列,也就是以動作電位作為刺激脈沖來刺激耳蝸聽神經(jīng),以期能從新的角度為人工耳蝸用戶改善聲音感覺的質(zhì)量,獲得聽覺效果的提升。MPIF方案的流程是:把經(jīng)過預處理的聲音通過8(可擴展為12或者16)個濾波器濾波得到8個輸出,再把8個輸出分別提取包絡獲得其振幅(A1,A2,…,A8),接著把各個振幅進行非線性壓縮得到膜電位,之后進行膜電位積分,當膜電位積分達到閾值就產(chǎn)生一個刺激,膜電位也瞬時下降為零進行下一次積分(如果有幾個通道同時達到閾值,則取積分時間最短的通道進行刺激,這幾個通道的膜電位同時下降為零進行下一次積分),這樣就產(chǎn)生了一連串的刺激序列。只要積分步長合適,就可以既減小同時達到閾值的通道數(shù),又可以避免通道間刺激電極間的相互干擾。對MPIF方案在MATLAB平臺上做了仿真,并與CIS方案進行對比,結(jié)果表明MPIF方案結(jié)合了耳蝸的聲電轉(zhuǎn)換作用和突觸的時間編碼作用,能夠隨著聲音強度的增加,生成的刺激序列的刺激速率也越大,能夠有效的解決聽覺信息發(fā)放序列的動態(tài)結(jié)構(gòu)在聽覺中樞的作用問題,使得刺激脈沖和時間編碼有機的集合起來,有效的保證刺激脈沖時間的相干性和相關性。 之后對MPIF方案進行了進一步的研究,加入了抑制性電流來表示神經(jīng)元動作電位的不應期,仿真結(jié)果表明,加入抑制性電流,生成的刺激速率會相對更低,刺激速率與輸入聲音強度的關系也更加符合生理上的原理。 最后,本文應用艾睿合眾SEED_DEC138開發(fā)板,設計了人工耳蝸體外語音處理器。此語音處理器可以通過麥克風采集聲音信號,進行抗混疊濾波,AD轉(zhuǎn)換輸入OMAP-L138對采集到的信號進行MPIF算法處理并保存處理結(jié)果。整個信號采集處理流程是:語音信號經(jīng)音頻采樣芯片PCM4201進行AD采樣,得到采樣頻率為32kHz,采樣位數(shù)為24bit,數(shù)據(jù)率為728kbps的單聲道語音數(shù)據(jù),再通過McBSP送到DSP進行處理,由EDMA方式進行傳輸。數(shù)據(jù)存儲采用乒乓緩沖架構(gòu),當一個緩存區(qū)滿的時候則存儲到另外一個緩存區(qū),同時進入EDMA傳輸完成中斷處理已滿緩存區(qū)的數(shù)據(jù),實施交替處理,就可以實時快速的處理采集到的數(shù)據(jù)。然后對采集到的聲音信號進行FIR帶通濾波,整流,FIR低通濾波提取包絡,再進行MPIF算法的處理得到8個通道的刺激序列,最后把得到的刺激序列EDMA傳輸保存到SDRAM上。
【學位授予單位】:南方醫(yī)科大學
【學位級別】:碩士
【學位授予年份】:2013
【分類號】:R318.18
【參考文獻】
相關期刊論文 前3條
1 陳學民,陳開浚,李孝光;細胞內(nèi)記錄白血病人骨髓細胞膜的電學特性[J];生物化學與生物物理進展;1989年06期
2 高翠云,江朝暉;利用MAX291實現(xiàn)抗混疊濾波[J];現(xiàn)代電子技術;2004年10期
3 遲先煊,馮鑒強,任俊,陳培熹;小腦皮質(zhì)神經(jīng)元K~+單通道電流的生理特性[J];中國應用生理學雜志;1997年04期
,本文編號:1327563
本文鏈接:http://sikaile.net/yixuelunwen/swyx/1327563.html
最近更新
教材專著