病態(tài)嗓音特征提取及識(shí)別研究
發(fā)布時(shí)間:2021-07-31 22:43
嗓音是人類進(jìn)行溝通與交流的重要工具,嗓音好壞對(duì)人們的言語表達(dá)有直接的影響。聲帶作為發(fā)聲系統(tǒng)的重要組成部分,其病變是導(dǎo)致嗓音出現(xiàn)問題的重要原因。采用聲學(xué)分析技術(shù)對(duì)病理嗓音信號(hào)進(jìn)行分析和研究,可以實(shí)現(xiàn)對(duì)嗓音質(zhì)量的客觀評(píng)估,對(duì)喉部疾病的診斷和治療具有臨床指導(dǎo)意義。隨著研究的深入,臨床上對(duì)聲帶類嗓音疾病細(xì)分類的研究已成為病理性嗓音檢測的熱點(diǎn)。隨著計(jì)算機(jī)處理能力的提升,深度學(xué)習(xí)在語音識(shí)別領(lǐng)域取得了顯著效果。本文針對(duì)聲帶類嗓音疾病的分類問題和利用卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)嗓音疾病的分類問題上進(jìn)行了相關(guān)研究,主要包括以下三個(gè)方面的內(nèi)容。1.本文針對(duì)聲帶類疾病分類時(shí)參數(shù)選擇存在的局限性,從非線性和統(tǒng)計(jì)學(xué)角度出發(fā),提出了小波包多尺度分析的嗓音特征提取方法,以提高聲帶類嗓音疾病的識(shí)別率。首先,使用小波包技術(shù)將原始嗓音信號(hào)進(jìn)行分解,得到不同頻段的子信號(hào),然后從不同頻帶中提取非線性特征Hurst指數(shù)、2-Rényi熵、計(jì)盒維數(shù)和吸引子用以評(píng)估每個(gè)頻帶在檢測和分類病理嗓音過程中的貢獻(xiàn)。將提取的多尺度特征進(jìn)行組合,使用支持向量機(jī)(Support Vector Machine,SVM)對(duì)不同數(shù)據(jù)庫的正常和病態(tài)嗓音信號(hào)進(jìn)行二分...
【文章來源】:廣西師范大學(xué)廣西壯族自治區(qū)
【文章頁數(shù)】:68 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
最優(yōu)分類超平面
圖 4-9 采用延遲時(shí)間嵌入理論重構(gòu)的 3 維狀態(tài)空間號(hào)的相空間重構(gòu)軌跡圖像程中,在使用 CNN 對(duì)兩類嗓音信號(hào)進(jìn)行分類時(shí),輸入到網(wǎng)絡(luò)中的樣本,首先要將重構(gòu)的三維空間軌跡圖在二維平面上進(jìn)行投影,得到二維軌跡的二維圖像進(jìn)行一定的預(yù)處理操作,將背景設(shè)置為黑色,去除坐標(biāo)軸,分辨率設(shè)置為 224*224,經(jīng)過預(yù)處理的圖像將作為 CNN 的輸入,通過有常和病理聲音的分類。以 MEEI 數(shù)據(jù)庫中正常和病態(tài)嗓音信號(hào)為例,投像如圖 4-10 所示,從投影得到的二維軌跡圖可以看出,其二維圖像仍保的基本形狀和分類特征。
本文編號(hào):3314313
【文章來源】:廣西師范大學(xué)廣西壯族自治區(qū)
【文章頁數(shù)】:68 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
最優(yōu)分類超平面
圖 4-9 采用延遲時(shí)間嵌入理論重構(gòu)的 3 維狀態(tài)空間號(hào)的相空間重構(gòu)軌跡圖像程中,在使用 CNN 對(duì)兩類嗓音信號(hào)進(jìn)行分類時(shí),輸入到網(wǎng)絡(luò)中的樣本,首先要將重構(gòu)的三維空間軌跡圖在二維平面上進(jìn)行投影,得到二維軌跡的二維圖像進(jìn)行一定的預(yù)處理操作,將背景設(shè)置為黑色,去除坐標(biāo)軸,分辨率設(shè)置為 224*224,經(jīng)過預(yù)處理的圖像將作為 CNN 的輸入,通過有常和病理聲音的分類。以 MEEI 數(shù)據(jù)庫中正常和病態(tài)嗓音信號(hào)為例,投像如圖 4-10 所示,從投影得到的二維軌跡圖可以看出,其二維圖像仍保的基本形狀和分類特征。
本文編號(hào):3314313
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3314313.html
最近更新
教材專著