基于CNN的鋼琴音樂自動記譜算法的研究與實現(xiàn)
發(fā)布時間:2020-08-10 20:28
【摘要】:隨著生活水平的提高,人們學(xué)習(xí)鋼琴演奏的熱情不斷高漲,興起了鋼琴教育的熱潮。鋼琴音樂自動記譜技術(shù)可以檢測鋼琴音樂聲音信號中各個音符的音高和起始點,可以用于自動、客觀地評價鋼琴演奏的正確性,幫助鋼琴學(xué)習(xí)者及時發(fā)現(xiàn)自己的演奏錯誤,提高學(xué)習(xí)效率。但是實現(xiàn)一種準(zhǔn)確的鋼琴音樂自動記譜算法仍然是一個具有挑戰(zhàn)性的問題。本文研究并實現(xiàn)了一種基于卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)的鋼琴音樂自動記譜算法。對輸入的鋼琴音樂聲音信號,首先進行時頻分析,將鋼琴音樂聲音信號的原始時域波形變換為頻率分布隨時間變化的表示;然后進行音符起始點檢測;最后進行多基音檢測,分別檢測各個音符起始點處新彈奏的音符的音高。本文的主要工作包括:(1)對國內(nèi)外的研究現(xiàn)狀與相關(guān)工作進行了廣泛的調(diào)研,并對自動音樂記譜技術(shù)進行了綜述;(2)分別實現(xiàn)了短時傅里葉變換和常數(shù)Q變換時頻分析方法,并且基于CNN模型分別實現(xiàn)了音符起始點檢測和多基音檢測,對CNN的網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練方法和后處理方法進行了優(yōu)化;(3)實驗對比了分別采用不同的輸入時頻表示和不同的訓(xùn)練方法時CNN網(wǎng)絡(luò)的準(zhǔn)確度,并分析了本文算法的檢測錯誤。本文提出的鋼琴音樂自動記譜算法在MAPS ENSTDkCl中鋼琴曲的前30s上的F值為86.80%(音符起始點允許偏差范圍取±100ms)。測試表明,本文實現(xiàn)的算法的準(zhǔn)確度是目前基于CNN的鋼琴音樂自動記譜算法中最高的,為實現(xiàn)計算機輔助鋼琴教學(xué)提供了技術(shù)支持。
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:J624.1;TP183
【圖文】:
中B科學(xué)院語言聲學(xué)與內(nèi)容理解重點實驗室邐周若華、顏永紅等逡逑電子科技大學(xué)邐郭奕[24]、陳靜P5】、嚴(yán)亮w等逡逑西南交通大學(xué)邐|壬建英、陳強唐靜_、楊靜p9]等逡逑多音杳樂的基音檢測仍然是一個具有挑戰(zhàn)性的問題。因為多音音樂的聲耆#比較復(fù)雜,多個音符在時域重疊,并且在頻域互相影響。此外,多音組合的輸出空非常大,進一*ki加大了建模難度。音樂信息檢索領(lǐng)域的頂級國際比賽MIREX邋(MusiInformation邋Retrieval邋Evaluation邋eXchange)邋1邋是^悖嘸蔥隼中畔⒓燜饗低稱淚芄攀滴蹋ǎ桑睿簦澹潁睿幔簦椋錚睿幔戾澹停酰螅椋沐澹桑睿媯錚潁恚幔簦椋錚鑠澹遙澹簦潁椋澹觶幔戾澹櫻螅簦澹恚簀澹牛觶幔歟酰幔簦椋錚鑠澹蹋幔猓錚潁幔簦錚潁澹桑停桑遙櫻牛蹋┲靼斕。MI_b牛乇熱衾中畔⒓燜髁煊虻畝嘀秩撾裉峁┝送騁、正箣光c啦餛教。辶x希咤澹玻埃埃紡昶穡停桑遙牛乇熱屑尤肓碩嗷倒蘭樸敫偃撾瘢渲邪智僖衾鄭叨瞧鬃尤撾。哇E保備雋隋澹停桑遙牛乇熱懈智僖衾腫遠(yuǎn)瞧茲撾衩磕輳罾氳鈉瀾峁ǎ停桑遙牛厥菁蘭凼敝豢悸且舴鶚嫉愕惱沸,不考虑w符的結(jié)束時刻),逡逑其中最高的F值為81.99%。最近幾年,AMT算法的準(zhǔn)確度似乎已經(jīng)集體到達了一.穩(wěn)定水平。逡逑
2.2音樂信號時頻分析逡逑AMT算法逋常先將音樂信號前原始時域波形變換為時頻表示,STFT和CQT是逡逑廣泛使用的兩種時頻分析方法^逡逑2.2.1短時傅里葉變換逡逑因為離散傅里葉變換(Discrete邋Fourier邋Transform,DFT)是數(shù)字信號處理領(lǐng)域最逡逑常用的分析方法之一,詳細(xì)的介紹可以參看相關(guān)的書籍(比如《數(shù)字信號處理》[42])。逡逑長度為#的信號的DFT表達式為逡逑N-l邐-i—kn逡逑Vx(n)Q邋N邋,邋Q<k<N_\逡逑雄)邋=邋DFT_=臺、;邐,邐(2.2)逡逑0,邐其它逡逑X(々)表浪aず牛ǎ浚┑鈉燈,第A?庚_愣雜Φ鈉德飾義
本文編號:2788571
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:J624.1;TP183
【圖文】:
中B科學(xué)院語言聲學(xué)與內(nèi)容理解重點實驗室邐周若華、顏永紅等逡逑電子科技大學(xué)邐郭奕[24]、陳靜P5】、嚴(yán)亮w等逡逑西南交通大學(xué)邐|壬建英、陳強唐靜_、楊靜p9]等逡逑多音杳樂的基音檢測仍然是一個具有挑戰(zhàn)性的問題。因為多音音樂的聲耆#比較復(fù)雜,多個音符在時域重疊,并且在頻域互相影響。此外,多音組合的輸出空非常大,進一*ki加大了建模難度。音樂信息檢索領(lǐng)域的頂級國際比賽MIREX邋(MusiInformation邋Retrieval邋Evaluation邋eXchange)邋1邋是^悖嘸蔥隼中畔⒓燜饗低稱淚芄攀滴蹋ǎ桑睿簦澹潁睿幔簦椋錚睿幔戾澹停酰螅椋沐澹桑睿媯錚潁恚幔簦椋錚鑠澹遙澹簦潁椋澹觶幔戾澹櫻螅簦澹恚簀澹牛觶幔歟酰幔簦椋錚鑠澹蹋幔猓錚潁幔簦錚潁澹桑停桑遙櫻牛蹋┲靼斕。MI_b牛乇熱衾中畔⒓燜髁煊虻畝嘀秩撾裉峁┝送騁、正箣光c啦餛教。辶x希咤澹玻埃埃紡昶穡停桑遙牛乇熱屑尤肓碩嗷倒蘭樸敫偃撾瘢渲邪智僖衾鄭叨瞧鬃尤撾。哇E保備雋隋澹停桑遙牛乇熱懈智僖衾腫遠(yuǎn)瞧茲撾衩磕輳罾氳鈉瀾峁ǎ停桑遙牛厥菁蘭凼敝豢悸且舴鶚嫉愕惱沸,不考虑w符的結(jié)束時刻),逡逑其中最高的F值為81.99%。最近幾年,AMT算法的準(zhǔn)確度似乎已經(jīng)集體到達了一.穩(wěn)定水平。逡逑
2.2音樂信號時頻分析逡逑AMT算法逋常先將音樂信號前原始時域波形變換為時頻表示,STFT和CQT是逡逑廣泛使用的兩種時頻分析方法^逡逑2.2.1短時傅里葉變換逡逑因為離散傅里葉變換(Discrete邋Fourier邋Transform,DFT)是數(shù)字信號處理領(lǐng)域最逡逑常用的分析方法之一,詳細(xì)的介紹可以參看相關(guān)的書籍(比如《數(shù)字信號處理》[42])。逡逑長度為#的信號的DFT表達式為逡逑N-l邐-i—kn逡逑Vx(n)Q邋N邋,邋Q<k<N_\逡逑雄)邋=邋DFT_=臺、;邐,邐(2.2)逡逑0,邐其它逡逑X(々)表浪aず牛ǎ浚┑鈉燈,第A?庚_愣雜Φ鈉德飾義
本文編號:2788571
本文鏈接:http://sikaile.net/wenyilunwen/mzqiyue/2788571.html
最近更新
教材專著