低信噪比條件下的語音端點(diǎn)檢測(cè)算法研究
發(fā)布時(shí)間:2021-12-11 21:52
語音端點(diǎn)檢測(cè)作為各種語音信號(hào)處理系統(tǒng)的前端操作,在語音信號(hào)處理領(lǐng)域中具有重要的意義。低信噪比條件下的語音端點(diǎn)檢測(cè)是語音處理領(lǐng)域的一個(gè)技術(shù)難題,阻礙了語音處理技術(shù)向嘈雜環(huán)境、短波通信等應(yīng)用領(lǐng)域的拓展。為探尋一種理想的語音端點(diǎn)檢測(cè)算法,既能夠保證在低信噪比的環(huán)境下?lián)碛休^好的正確率,又能夠滿足較少的先驗(yàn)知識(shí)與運(yùn)算量的要求。本文對(duì)低信噪比條件下的語音端點(diǎn)算法進(jìn)行了研究,并提出相應(yīng)解決思路。本文總結(jié)歸納了近幾十年來語音端點(diǎn)檢測(cè)研究的進(jìn)展和成果,從語音端點(diǎn)檢測(cè)的準(zhǔn)確性、穩(wěn)定性、自適應(yīng)性和運(yùn)算量上對(duì)常用的幾種語音端點(diǎn)算法進(jìn)行分析,發(fā)現(xiàn)在低信噪比條件下,傳統(tǒng)的語音端點(diǎn)檢測(cè)算法都存在檢測(cè)準(zhǔn)確率急劇下降的問題。針對(duì)這一問題,本文從提升降噪效果、提升端點(diǎn)檢測(cè)算法魯棒性兩方面開展研究。在語音降噪方面,本文提出了一種改進(jìn)的譜減降噪算法,該算法采用端點(diǎn)檢測(cè)、分段噪聲估計(jì)、動(dòng)態(tài)參數(shù)調(diào)整等辦法,解決了常規(guī)譜減算法存在的無話段估計(jì)困難、噪聲估計(jì)不精確、音樂噪聲較大等問題。在端點(diǎn)檢測(cè)方面,本文提出了一種改進(jìn)的子帶能熵比端點(diǎn)檢測(cè)算法,該算法采用子帶劃分、優(yōu)化能量計(jì)算方式、優(yōu)化譜熵計(jì)算、兩級(jí)平滑處理方式等辦法,有效提升了算法...
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:72 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
幀長與幀移的示例
圖 2-3 端點(diǎn)判決規(guī)則分類圖處理的主要作用是對(duì)端點(diǎn)判決后的結(jié)果進(jìn)行平滑處理,輸出更加準(zhǔn)確在制定平滑規(guī)則時(shí),我們需要把握以下幾個(gè)原則:第一,避免前端Clipping),由于語音信號(hào)處理往往對(duì)語音的起點(diǎn)要求較高,為了防導(dǎo)致語音的丟失,我們一般需要將語音端點(diǎn)判決的結(jié)果適當(dāng)前推(MSC, Middlespeech Clipping),為了避免將連續(xù)語音中的短暫停,我們可以通過比較靜默長度與最短靜默音幀數(shù)的關(guān)系設(shè)置拖延(OVER),我們還要避免檢測(cè)語音終止點(diǎn)相對(duì)真實(shí)終止點(diǎn)后移導(dǎo)題。短時(shí)能量和短時(shí)過零率的雙門限端點(diǎn)檢測(cè)法原理
華南理工大學(xué)工程碩士學(xué)位論文樣精度 16bit,單聲道,實(shí)驗(yàn)采用的噪聲文件為 NoiseX-92 噪聲庫中選擇較有代表性的white、factory1、hfChannel 等幾類噪聲。實(shí)驗(yàn)一:同一噪聲在不同信噪比條件下對(duì)語音文件的影響。具體步驟為選擇比較有代表性的高斯白噪聲與純凈語音文件疊加并生成信噪比為 10dB、0dB、-10dB 的三種帶噪語音文件,并繪制帶噪語音文件的波形圖與語譜圖。實(shí)驗(yàn)結(jié)果如下:
【參考文獻(xiàn)】:
期刊論文
[1]基于譜減法的語音信號(hào)降噪改進(jìn)算法[J]. 金薛冬,李東新. 國外電子測(cè)量技術(shù). 2018(05)
[2]語音端點(diǎn)檢測(cè)技術(shù)研究進(jìn)展[J]. 韓立華,王博,段淑鳳. 計(jì)算機(jī)應(yīng)用研究. 2010(04)
[3]基于熵函數(shù)的語音端點(diǎn)檢測(cè)算法研究[J]. 王博,郭英,韓立峰. 信號(hào)處理. 2009(03)
[4]低信噪比下基于譜熵的語音端點(diǎn)檢測(cè)算法[J]. 李曄,張仁智,崔慧娟,唐昆. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2005(10)
[5]基于子帶能量特征的最優(yōu)化語音端點(diǎn)檢測(cè)算法研究[J]. 陳振標(biāo),徐波. 聲學(xué)學(xué)報(bào). 2005(02)
[6]端點(diǎn)檢測(cè)中的一種新的對(duì)數(shù)能量特征[J]. 肖述才,王作英. 電聲技術(shù). 2004(06)
[7]一種基于特征空間能量熵的語音信號(hào)端點(diǎn)檢測(cè)算法[J]. 徐望,丁琦,王炳錫. 通信學(xué)報(bào). 2003(11)
[8]支持向量機(jī)在語音激活檢測(cè)中的應(yīng)用研究[J]. 董恩清,趙鶴鳴,周亞同,張曉娣. 通信學(xué)報(bào). 2003(03)
[9]3G系統(tǒng)中復(fù)雜背景噪聲環(huán)境下話音激活檢測(cè)算法性能分析[J]. 陳東,匡鏡明. 北京理工大學(xué)學(xué)報(bào). 2001(02)
[10]噪聲環(huán)境中基于HMM模型的語音信號(hào)端點(diǎn)檢測(cè)方法[J]. 朱杰,韋曉東. 上海交通大學(xué)學(xué)報(bào). 1998(10)
博士論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的語音識(shí)別模型研究[D]. 張仕良.中國科學(xué)技術(shù)大學(xué) 2017
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的語音識(shí)別研究[D]. 楊穎.華南理工大學(xué) 2018
[2]噪聲環(huán)境下的語音端點(diǎn)檢測(cè)方法研究[D]. 李嘉安娜.華南理工大學(xué) 2015
本文編號(hào):3535463
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:72 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
幀長與幀移的示例
圖 2-3 端點(diǎn)判決規(guī)則分類圖處理的主要作用是對(duì)端點(diǎn)判決后的結(jié)果進(jìn)行平滑處理,輸出更加準(zhǔn)確在制定平滑規(guī)則時(shí),我們需要把握以下幾個(gè)原則:第一,避免前端Clipping),由于語音信號(hào)處理往往對(duì)語音的起點(diǎn)要求較高,為了防導(dǎo)致語音的丟失,我們一般需要將語音端點(diǎn)判決的結(jié)果適當(dāng)前推(MSC, Middlespeech Clipping),為了避免將連續(xù)語音中的短暫停,我們可以通過比較靜默長度與最短靜默音幀數(shù)的關(guān)系設(shè)置拖延(OVER),我們還要避免檢測(cè)語音終止點(diǎn)相對(duì)真實(shí)終止點(diǎn)后移導(dǎo)題。短時(shí)能量和短時(shí)過零率的雙門限端點(diǎn)檢測(cè)法原理
華南理工大學(xué)工程碩士學(xué)位論文樣精度 16bit,單聲道,實(shí)驗(yàn)采用的噪聲文件為 NoiseX-92 噪聲庫中選擇較有代表性的white、factory1、hfChannel 等幾類噪聲。實(shí)驗(yàn)一:同一噪聲在不同信噪比條件下對(duì)語音文件的影響。具體步驟為選擇比較有代表性的高斯白噪聲與純凈語音文件疊加并生成信噪比為 10dB、0dB、-10dB 的三種帶噪語音文件,并繪制帶噪語音文件的波形圖與語譜圖。實(shí)驗(yàn)結(jié)果如下:
【參考文獻(xiàn)】:
期刊論文
[1]基于譜減法的語音信號(hào)降噪改進(jìn)算法[J]. 金薛冬,李東新. 國外電子測(cè)量技術(shù). 2018(05)
[2]語音端點(diǎn)檢測(cè)技術(shù)研究進(jìn)展[J]. 韓立華,王博,段淑鳳. 計(jì)算機(jī)應(yīng)用研究. 2010(04)
[3]基于熵函數(shù)的語音端點(diǎn)檢測(cè)算法研究[J]. 王博,郭英,韓立峰. 信號(hào)處理. 2009(03)
[4]低信噪比下基于譜熵的語音端點(diǎn)檢測(cè)算法[J]. 李曄,張仁智,崔慧娟,唐昆. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2005(10)
[5]基于子帶能量特征的最優(yōu)化語音端點(diǎn)檢測(cè)算法研究[J]. 陳振標(biāo),徐波. 聲學(xué)學(xué)報(bào). 2005(02)
[6]端點(diǎn)檢測(cè)中的一種新的對(duì)數(shù)能量特征[J]. 肖述才,王作英. 電聲技術(shù). 2004(06)
[7]一種基于特征空間能量熵的語音信號(hào)端點(diǎn)檢測(cè)算法[J]. 徐望,丁琦,王炳錫. 通信學(xué)報(bào). 2003(11)
[8]支持向量機(jī)在語音激活檢測(cè)中的應(yīng)用研究[J]. 董恩清,趙鶴鳴,周亞同,張曉娣. 通信學(xué)報(bào). 2003(03)
[9]3G系統(tǒng)中復(fù)雜背景噪聲環(huán)境下話音激活檢測(cè)算法性能分析[J]. 陳東,匡鏡明. 北京理工大學(xué)學(xué)報(bào). 2001(02)
[10]噪聲環(huán)境中基于HMM模型的語音信號(hào)端點(diǎn)檢測(cè)方法[J]. 朱杰,韋曉東. 上海交通大學(xué)學(xué)報(bào). 1998(10)
博士論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的語音識(shí)別模型研究[D]. 張仕良.中國科學(xué)技術(shù)大學(xué) 2017
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的語音識(shí)別研究[D]. 楊穎.華南理工大學(xué) 2018
[2]噪聲環(huán)境下的語音端點(diǎn)檢測(cè)方法研究[D]. 李嘉安娜.華南理工大學(xué) 2015
本文編號(hào):3535463
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3535463.html
最近更新
教材專著