基于CNN的鋼琴音樂自動記譜算法的研究與實(shí)現(xiàn)
發(fā)布時間:2020-08-10 20:28
【摘要】:隨著生活水平的提高,人們學(xué)習(xí)鋼琴演奏的熱情不斷高漲,興起了鋼琴教育的熱潮。鋼琴音樂自動記譜技術(shù)可以檢測鋼琴音樂聲音信號中各個音符的音高和起始點(diǎn),可以用于自動、客觀地評價鋼琴演奏的正確性,幫助鋼琴學(xué)習(xí)者及時發(fā)現(xiàn)自己的演奏錯誤,提高學(xué)習(xí)效率。但是實(shí)現(xiàn)一種準(zhǔn)確的鋼琴音樂自動記譜算法仍然是一個具有挑戰(zhàn)性的問題。本文研究并實(shí)現(xiàn)了一種基于卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)的鋼琴音樂自動記譜算法。對輸入的鋼琴音樂聲音信號,首先進(jìn)行時頻分析,將鋼琴音樂聲音信號的原始時域波形變換為頻率分布隨時間變化的表示;然后進(jìn)行音符起始點(diǎn)檢測;最后進(jìn)行多基音檢測,分別檢測各個音符起始點(diǎn)處新彈奏的音符的音高。本文的主要工作包括:(1)對國內(nèi)外的研究現(xiàn)狀與相關(guān)工作進(jìn)行了廣泛的調(diào)研,并對自動音樂記譜技術(shù)進(jìn)行了綜述;(2)分別實(shí)現(xiàn)了短時傅里葉變換和常數(shù)Q變換時頻分析方法,并且基于CNN模型分別實(shí)現(xiàn)了音符起始點(diǎn)檢測和多基音檢測,對CNN的網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練方法和后處理方法進(jìn)行了優(yōu)化;(3)實(shí)驗(yàn)對比了分別采用不同的輸入時頻表示和不同的訓(xùn)練方法時CNN網(wǎng)絡(luò)的準(zhǔn)確度,并分析了本文算法的檢測錯誤。本文提出的鋼琴音樂自動記譜算法在MAPS ENSTDkCl中鋼琴曲的前30s上的F值為86.80%(音符起始點(diǎn)允許偏差范圍取±100ms)。測試表明,本文實(shí)現(xiàn)的算法的準(zhǔn)確度是目前基于CNN的鋼琴音樂自動記譜算法中最高的,為實(shí)現(xiàn)計算機(jī)輔助鋼琴教學(xué)提供了技術(shù)支持。
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:J624.1;TP183
【圖文】:
中B科學(xué)院語言聲學(xué)與內(nèi)容理解重點(diǎn)實(shí)驗(yàn)室邐周若華、顏永紅等逡逑電子科技大學(xué)邐郭奕[24]、陳靜P5】、嚴(yán)亮w等逡逑西南交通大學(xué)邐|壬建英、陳強(qiáng)唐靜_、楊靜p9]等逡逑多音杳樂的基音檢測仍然是一個具有挑戰(zhàn)性的問題。因?yàn)槎嘁粢魳返穆曣龋1容^復(fù)雜,多個音符在時域重疊,并且在頻域互相影響。此外,多音組合的輸出空非常大,進(jìn)一*ki加大了建模難度。音樂信息檢索領(lǐng)域的頂級國際比賽MIREX邋(MusiInformation邋Retrieval邋Evaluation邋eXchange)邋1邋是^悖嘸蔥隼中畔⒓燜饗低稱淚芄攀滴蹋ǎ桑睿簦澹潁睿幔簦椋錚睿幔戾澹停酰螅椋沐澹桑睿媯錚潁恚幔簦椋錚鑠澹遙澹簦潁椋澹觶幔戾澹櫻螅簦澹恚簀澹牛觶幔歟酰幔簦椋錚鑠澹蹋幔猓錚潁幔簦錚潁,邋IMI_b櫻牛蹋┲靼斕。MI_b牛乇熱衾中畔⒓燜髁煊虻畝嘀秩撾裉峁┝送騁、正箣光c啦餛教。辶x希咤澹玻埃埃紡昶穡停桑遙牛乇熱屑尤肓碩嗷倒蘭樸敫偃撾,其中包含钢琴音类嵾动记谱子葥腭。哇E保備雋隋澹停桑遙牛乇熱懈智僖衾腫遠(yuǎn)瞧茲撾衩磕輳罾氳鈉瀾峁ǎ停桑遙牛厥菁,铺m凼敝豢悸且舴鶚嫉愕惱沸,不考虑w符的結(jié)束時刻),逡逑其中最高的F值為81.99%。最近幾年,AMT算法的準(zhǔn)確度似乎已經(jīng)集體到達(dá)了一.穩(wěn)定水平。逡逑
2.2音樂信號時頻分析逡逑AMT算法逋常先將音樂信號前原始時域波形變換為時頻表示,STFT和CQT是逡逑廣泛使用的兩種時頻分析方法^逡逑2.2.1短時傅里葉變換逡逑因?yàn)殡x散傅里葉變換(Discrete邋Fourier邋Transform,DFT)是數(shù)字信號處理領(lǐng)域最逡逑常用的分析方法之一,詳細(xì)的介紹可以參看相關(guān)的書籍(比如《數(shù)字信號處理》[42])。逡逑長度為#的信號的DFT表達(dá)式為逡逑N-l邐-i—kn逡逑Vx(n)Q邋N邋,邋Q<k<N_\逡逑雄)邋=邋DFT_=臺、;邐,邐(2.2)逡逑0,邐其它逡逑X(々)表浪aず牛?)碘c燈,第A?庚_愣雜Φ鈉德飾義
本文編號:2788571
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:J624.1;TP183
【圖文】:
中B科學(xué)院語言聲學(xué)與內(nèi)容理解重點(diǎn)實(shí)驗(yàn)室邐周若華、顏永紅等逡逑電子科技大學(xué)邐郭奕[24]、陳靜P5】、嚴(yán)亮w等逡逑西南交通大學(xué)邐|壬建英、陳強(qiáng)唐靜_、楊靜p9]等逡逑多音杳樂的基音檢測仍然是一個具有挑戰(zhàn)性的問題。因?yàn)槎嘁粢魳返穆曣龋1容^復(fù)雜,多個音符在時域重疊,并且在頻域互相影響。此外,多音組合的輸出空非常大,進(jìn)一*ki加大了建模難度。音樂信息檢索領(lǐng)域的頂級國際比賽MIREX邋(MusiInformation邋Retrieval邋Evaluation邋eXchange)邋1邋是^悖嘸蔥隼中畔⒓燜饗低稱淚芄攀滴蹋ǎ桑睿簦澹潁睿幔簦椋錚睿幔戾澹停酰螅椋沐澹桑睿媯錚潁恚幔簦椋錚鑠澹遙澹簦潁椋澹觶幔戾澹櫻螅簦澹恚簀澹牛觶幔歟酰幔簦椋錚鑠澹蹋幔猓錚潁幔簦錚潁,邋IMI_b櫻牛蹋┲靼斕。MI_b牛乇熱衾中畔⒓燜髁煊虻畝嘀秩撾裉峁┝送騁、正箣光c啦餛教。辶x希咤澹玻埃埃紡昶穡停桑遙牛乇熱屑尤肓碩嗷倒蘭樸敫偃撾,其中包含钢琴音类嵾动记谱子葥腭。哇E保備雋隋澹停桑遙牛乇熱懈智僖衾腫遠(yuǎn)瞧茲撾衩磕輳罾氳鈉瀾峁ǎ停桑遙牛厥菁,铺m凼敝豢悸且舴鶚嫉愕惱沸,不考虑w符的結(jié)束時刻),逡逑其中最高的F值為81.99%。最近幾年,AMT算法的準(zhǔn)確度似乎已經(jīng)集體到達(dá)了一.穩(wěn)定水平。逡逑
2.2音樂信號時頻分析逡逑AMT算法逋常先將音樂信號前原始時域波形變換為時頻表示,STFT和CQT是逡逑廣泛使用的兩種時頻分析方法^逡逑2.2.1短時傅里葉變換逡逑因?yàn)殡x散傅里葉變換(Discrete邋Fourier邋Transform,DFT)是數(shù)字信號處理領(lǐng)域最逡逑常用的分析方法之一,詳細(xì)的介紹可以參看相關(guān)的書籍(比如《數(shù)字信號處理》[42])。逡逑長度為#的信號的DFT表達(dá)式為逡逑N-l邐-i—kn逡逑Vx(n)Q邋N邋,邋Q<k<N_\逡逑雄)邋=邋DFT_=臺、;邐,邐(2.2)逡逑0,邐其它逡逑X(々)表浪aず牛?)碘c燈,第A?庚_愣雜Φ鈉德飾義
本文編號:2788571
本文鏈接:http://sikaile.net/wenyilunwen/mzqiyue/2788571.html
最近更新
教材專著