基于節(jié)拍譜的語(yǔ)音音樂(lè)分類(lèi)模型
發(fā)布時(shí)間:2021-11-21 03:40
語(yǔ)音音樂(lè)分類(lèi)是語(yǔ)音信號(hào)處理領(lǐng)域的重要研究方向。針對(duì)以往方法通過(guò)提取短時(shí)能量、短時(shí)幅度等特征參數(shù)來(lái)區(qū)分語(yǔ)音和音樂(lè)而忽視音樂(lè)具有節(jié)拍的特性,為此提出了基于節(jié)拍譜的話音分類(lèi)模型。此模型在針對(duì)語(yǔ)音和音樂(lè)兩類(lèi)信號(hào)中,先對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理,并對(duì)待分類(lèi)的信號(hào)計(jì)算得到梅爾頻率倒譜系數(shù),再計(jì)算梅爾頻率倒譜系數(shù)的相似矩陣和相似矩陣的自相關(guān),得到待分類(lèi)信號(hào)的節(jié)拍譜,最后通過(guò)閾值判斷待信號(hào)類(lèi)別。經(jīng)試驗(yàn)結(jié)果證明,此模型對(duì)比傳統(tǒng)分類(lèi)模型,分類(lèi)準(zhǔn)確率提高到98%。
【文章來(lái)源】:通信技術(shù). 2020,53(11)
【文章頁(yè)數(shù)】:5 頁(yè)
【部分圖文】:
模型流程
圖1 模型流程步驟2:基于文獻(xiàn)[8],用余弦相似度計(jì)算MFCC參數(shù)兩兩之間的相似性,可得到一個(gè)相似矩陣。其中,語(yǔ)音信號(hào)的節(jié)拍沒(méi)有周期性規(guī)律,音樂(lè)信號(hào)會(huì)周期性形成峰值。實(shí)驗(yàn)使用MATLAB的cos函數(shù)計(jì)算得到特征向量的相似性。余弦距離更多從方向上區(qū)分差異,而對(duì)絕對(duì)的數(shù)值不敏感。正因?yàn)橛嘞蚁嗨贫仍跀?shù)值上的不敏感,只能分辨?zhèn)體在維度之間的差異,沒(méi)法衡量每個(gè)維數(shù)值的差異,所以得到的相似矩陣更能體現(xiàn)出節(jié)拍的周期性規(guī)律。
步驟3:用相似矩陣的自相關(guān)性得到節(jié)拍譜。基于文獻(xiàn)[9]中關(guān)于節(jié)拍的特征,它能夠反映節(jié)奏的周期性變化規(guī)律。節(jié)拍譜不依賴(lài)于能量或頻率等特定屬性,因此適用于任何類(lèi)型的音樂(lè)或音頻,反映了節(jié)拍周期性變化規(guī)律。實(shí)驗(yàn)使用MATLAB的xcorr函數(shù)計(jì)算其自相關(guān)。節(jié)拍譜中的峰值對(duì)應(yīng)于音樂(lè)信號(hào)中的主要節(jié)奏成分,不同峰的相對(duì)振幅反映了其對(duì)應(yīng)韻律成分的強(qiáng)弱。一些擁有強(qiáng)烈節(jié)奏感的音樂(lè)節(jié)拍譜的峰值變化會(huì)比較明顯,而節(jié)奏感比較弱的峰值變化稍弱。圖3為音樂(lè)的節(jié)拍譜圖,可以看到有明顯的起伏。步驟4:歸一化。歸一化的目的是把得到的數(shù)據(jù)限制在一定區(qū)間內(nèi),使得各個(gè)音頻的數(shù)據(jù)易于后續(xù)的處理,且可以消除奇異樣本數(shù)據(jù)導(dǎo)致的不良影響。歸一化公式為:
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)時(shí)頻比的語(yǔ)音音樂(lè)信號(hào)分離[J]. 郭偉,于鳳芹. 計(jì)算機(jī)工程. 2015(03)
[2]快速準(zhǔn)確的自動(dòng)音樂(lè)/語(yǔ)音分段方法[J]. 萬(wàn)玉龍,周若華,顏永紅. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(06)
[3]基于MLER和GMM的語(yǔ)音音樂(lè)分類(lèi)[J]. 陳紅紅,劉加. 電聲技術(shù). 2011(10)
[4]基于MLER的語(yǔ)音/音樂(lè)分類(lèi)方法[J]. 胡艷芳,吳及,劉慧星. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2008(S1)
[5]基于EMGDHMM的音頻自動(dòng)分類(lèi)[J]. 王超,吳亞鋒. 電聲技術(shù). 2007(11)
[6]基于短時(shí)能量的語(yǔ)音/音樂(lè)快速分類(lèi)[J]. 陳功,王振力,張建兵. 電子技術(shù)應(yīng)用. 2006(01)
[7]基于隱馬爾可夫模型的音頻自動(dòng)分類(lèi)[J]. 盧堅(jiān),陳毅松,孫正興,張福炎. 軟件學(xué)報(bào). 2002(08)
本文編號(hào):3508698
【文章來(lái)源】:通信技術(shù). 2020,53(11)
【文章頁(yè)數(shù)】:5 頁(yè)
【部分圖文】:
模型流程
圖1 模型流程步驟2:基于文獻(xiàn)[8],用余弦相似度計(jì)算MFCC參數(shù)兩兩之間的相似性,可得到一個(gè)相似矩陣。其中,語(yǔ)音信號(hào)的節(jié)拍沒(méi)有周期性規(guī)律,音樂(lè)信號(hào)會(huì)周期性形成峰值。實(shí)驗(yàn)使用MATLAB的cos函數(shù)計(jì)算得到特征向量的相似性。余弦距離更多從方向上區(qū)分差異,而對(duì)絕對(duì)的數(shù)值不敏感。正因?yàn)橛嘞蚁嗨贫仍跀?shù)值上的不敏感,只能分辨?zhèn)體在維度之間的差異,沒(méi)法衡量每個(gè)維數(shù)值的差異,所以得到的相似矩陣更能體現(xiàn)出節(jié)拍的周期性規(guī)律。
步驟3:用相似矩陣的自相關(guān)性得到節(jié)拍譜。基于文獻(xiàn)[9]中關(guān)于節(jié)拍的特征,它能夠反映節(jié)奏的周期性變化規(guī)律。節(jié)拍譜不依賴(lài)于能量或頻率等特定屬性,因此適用于任何類(lèi)型的音樂(lè)或音頻,反映了節(jié)拍周期性變化規(guī)律。實(shí)驗(yàn)使用MATLAB的xcorr函數(shù)計(jì)算其自相關(guān)。節(jié)拍譜中的峰值對(duì)應(yīng)于音樂(lè)信號(hào)中的主要節(jié)奏成分,不同峰的相對(duì)振幅反映了其對(duì)應(yīng)韻律成分的強(qiáng)弱。一些擁有強(qiáng)烈節(jié)奏感的音樂(lè)節(jié)拍譜的峰值變化會(huì)比較明顯,而節(jié)奏感比較弱的峰值變化稍弱。圖3為音樂(lè)的節(jié)拍譜圖,可以看到有明顯的起伏。步驟4:歸一化。歸一化的目的是把得到的數(shù)據(jù)限制在一定區(qū)間內(nèi),使得各個(gè)音頻的數(shù)據(jù)易于后續(xù)的處理,且可以消除奇異樣本數(shù)據(jù)導(dǎo)致的不良影響。歸一化公式為:
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)時(shí)頻比的語(yǔ)音音樂(lè)信號(hào)分離[J]. 郭偉,于鳳芹. 計(jì)算機(jī)工程. 2015(03)
[2]快速準(zhǔn)確的自動(dòng)音樂(lè)/語(yǔ)音分段方法[J]. 萬(wàn)玉龍,周若華,顏永紅. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(06)
[3]基于MLER和GMM的語(yǔ)音音樂(lè)分類(lèi)[J]. 陳紅紅,劉加. 電聲技術(shù). 2011(10)
[4]基于MLER的語(yǔ)音/音樂(lè)分類(lèi)方法[J]. 胡艷芳,吳及,劉慧星. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2008(S1)
[5]基于EMGDHMM的音頻自動(dòng)分類(lèi)[J]. 王超,吳亞鋒. 電聲技術(shù). 2007(11)
[6]基于短時(shí)能量的語(yǔ)音/音樂(lè)快速分類(lèi)[J]. 陳功,王振力,張建兵. 電子技術(shù)應(yīng)用. 2006(01)
[7]基于隱馬爾可夫模型的音頻自動(dòng)分類(lèi)[J]. 盧堅(jiān),陳毅松,孫正興,張福炎. 軟件學(xué)報(bào). 2002(08)
本文編號(hào):3508698
本文鏈接:http://sikaile.net/kejilunwen/wltx/3508698.html
最近更新
教材專(zhuān)著