天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 文藝論文 > 民族器樂論文 >

基于深度學(xué)習(xí)的哼唱音頻樂譜識(shí)別技術(shù)研究

發(fā)布時(shí)間:2020-05-27 14:21
【摘要】:哼唱識(shí)別是當(dāng)前音樂信息提取研究中的一大熱點(diǎn),其目標(biāo)是根據(jù)用戶的哼唱,識(shí)別出用戶哼唱的歌曲。由于其交互形式友好,在移動(dòng)設(shè)備上使用便利,相關(guān)技術(shù)在音樂檢索、音樂推薦等領(lǐng)域具有廣闊的應(yīng)用前景。本文針對哼唱音頻信號(hào)自動(dòng)識(shí)別問題,研究了深度學(xué)習(xí)研究中常用方法和手段,將深度學(xué)習(xí)方法應(yīng)用到哼唱識(shí)別中,結(jié)合傳統(tǒng)音頻信號(hào)處理方法,提出了一種基于深度學(xué)習(xí)框架的識(shí)別方法,設(shè)計(jì)了一個(gè)哼唱音頻識(shí)別深度學(xué)習(xí)框架,實(shí)現(xiàn)對人聲哼唱的音樂信號(hào)進(jìn)行識(shí)別。本文還基于此實(shí)現(xiàn)了一個(gè)具有實(shí)用價(jià)值、可擴(kuò)展性強(qiáng)的哼唱音頻樂譜識(shí)別系統(tǒng),通過實(shí)驗(yàn)驗(yàn)證了所提出的基于深度學(xué)習(xí)的哼唱識(shí)別算法的可行性。論文的研究工作主要包括:(1)研究了哼唱音頻數(shù)據(jù)處理方法,包括音頻濾波、預(yù)加重、加窗分幀、音符起始點(diǎn)檢測、音頻信號(hào)特征表示等方法,對比了不同方法之間的區(qū)別和優(yōu)缺點(diǎn),針對深度學(xué)習(xí)數(shù)據(jù)集的要求選取了合適的方法進(jìn)行深入研究和實(shí)踐。(2)深入研究了當(dāng)前深度學(xué)習(xí)研究的理論基礎(chǔ)與常用方法,包括常用神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)與訓(xùn)練方法,應(yīng)用廣泛的各類神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的原理與優(yōu)缺點(diǎn)等。基于此設(shè)計(jì)了一個(gè)卷積循環(huán)神經(jīng)網(wǎng)絡(luò)模型,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)在局部特征提取和循環(huán)神經(jīng)網(wǎng)絡(luò)在歸納序列數(shù)據(jù)特征方面的優(yōu)勢,提高哼唱音頻信號(hào)識(shí)別的準(zhǔn)確率。(3)利用開源深度學(xué)習(xí)平臺(tái)與工具,對所提出的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行了實(shí)驗(yàn)與論證。通過在測試數(shù)據(jù)集上進(jìn)行訓(xùn)練和測試,反復(fù)調(diào)整模型,得到了效果較好的模型參數(shù)。并通過在測試數(shù)據(jù)集上的評估測試,驗(yàn)證了所提出的神經(jīng)網(wǎng)絡(luò)模型的可行性和有效性,并對模型性能進(jìn)行了分析和評估。(4)基于所提出的深度學(xué)習(xí)框架,利用服務(wù)端和移動(dòng)端開發(fā)技術(shù),設(shè)計(jì)實(shí)現(xiàn)了一個(gè)哼唱音頻樂譜識(shí)別原型系統(tǒng),包括服務(wù)端的音頻識(shí)別服務(wù)、移動(dòng)端的音頻錄制、音頻上傳等功能模塊。
【圖文】:

識(shí)別問題,技術(shù)路線,論文,音頻


逡逑總體的技術(shù)路線如圖1.1所示。逡逑哼唱音頻數(shù)據(jù)集逡逑0邋0邋0逡逑DSD100邋MedleyDB邋自行錄制逡逑邐邋Y逡逑哼唱音頻處理逡逑y逡逑哼唱識(shí)別神經(jīng)網(wǎng)絡(luò)模型逡逑卷積層邋循環(huán)層邋批量歸一化逡逑ReLU邐Dropout邋?邋?邋?逡逑邐邋邐^邋r邐逡逑卜此恮叫邐,目鴨識(shí)別.逡逑Bottle邋框架邐^邐Web邋服務(wù)邐邐逡逑邐?哼唱識(shí)別系統(tǒng)逡逑React邋Native框架邐^邋D邋SSffl邋H逡逑圖1.1本文技術(shù)路線逡逑1.4論文組織結(jié)構(gòu)逡逑本文主要研究基于深度學(xué)習(xí)的哼唱音頻識(shí)別問題,將闡述研宄中使用到的相逡逑關(guān)技術(shù)的原理和理論基礎(chǔ)、實(shí)驗(yàn)使用的網(wǎng)絡(luò)模型以及實(shí)驗(yàn)和結(jié)果分析。論文分為逡逑六個(gè)章節(jié),每章的內(nèi)容如下:逡逑第一章緒論,提出論文的研究背景和研究意義,分析國內(nèi)外當(dāng)前的研究情況,逡逑介紹本文的研究目標(biāo)和研宄內(nèi)容,制定整體的技術(shù)路線。逡逑第二章為論文的理論基礎(chǔ),概括了深度學(xué)習(xí)的概念,介紹了深度學(xué)習(xí)研宄的逡逑一般方法及其應(yīng)用,重?

可視化,配置文件,視覺學(xué),代碼


TensorFlow還具備高度移植性,基于TensorFlow編寫的代碼可以在幾乎不逡逑經(jīng)過修改的情況下,部署到多種終端上,即使不同設(shè)備可能擁有不同的CPU或逡逑GPU數(shù)量、不同的操作系統(tǒng)和硬件環(huán)境。同時(shí)TensorFlow的編譯速度極快,在逡逑探索網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)時(shí),付出的時(shí)間代價(jià)非常小。逡逑2.5.2邋Caffe逡逑Caffe是一個(gè)被廣泛使用的開源深度學(xué)習(xí)框架,由伯克利視覺學(xué)中心進(jìn)行維逡逑護(hù)。Caffe的主要優(yōu)勢包括:逡逑(1)可以快速開始,網(wǎng)絡(luò)結(jié)構(gòu)都是以配置文件形式定義,不需要用代碼設(shè)逡逑計(jì)網(wǎng)絡(luò)。逡逑(2)擁有大量訓(xùn)練好的經(jīng)典模型。逡逑(3)高度模塊化的算法,擴(kuò)展性和可重用性高。逡逑Caffe的核心概念是Layer,,每一個(gè)神經(jīng)網(wǎng)絡(luò)的模塊都是一個(gè)Layer,Layer逡逑接收輸入數(shù)據(jù),同時(shí)經(jīng)過內(nèi)部計(jì)算產(chǎn)生輸出數(shù)據(jù),設(shè)計(jì)網(wǎng)絡(luò)結(jié)構(gòu)時(shí),只需要通過逡逑配置文件把各個(gè)Layer拼接在一起構(gòu)成完成的網(wǎng)絡(luò)[4()]。如圖2.4所示,展示了一逡逑
【學(xué)位授予單位】:武漢大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:J613.2;TP181

【參考文獻(xiàn)】

相關(guān)期刊論文 前8條

1 余凱;賈磊;陳雨強(qiáng);徐偉;;深度學(xué)習(xí)的昨天、今天和明天[J];計(jì)算機(jī)研究與發(fā)展;2013年09期

2 曹輝;徐晨;趙曉;吳勝舉;;說話人識(shí)別中的Mel特征頻率倒譜系數(shù)[J];西北大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年02期

3 侯玨;劉軼;鄭方;蔣丹寧;秦勇;黃石磊;劉勇;;基于VP樹結(jié)構(gòu)的多層匹配算法在哼唱識(shí)別中的應(yīng)用[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年S1期

4 曹文曉;劉軼;鄭方;蔣丹寧;秦勇;;用于哼唱識(shí)別精確匹配的線性伸縮動(dòng)態(tài)規(guī)劃算法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年S1期

5 馮雅中,莊越挺,潘云鶴;一種啟發(fā)式的用哼唱檢索音樂的層次化方法[J];計(jì)算機(jī)研究與發(fā)展;2004年02期

6 李揚(yáng),吳亞棟,劉寶龍;一種新的近似旋律匹配方法及其在哼唱檢索系統(tǒng)中的應(yīng)用[J];計(jì)算機(jī)研究與發(fā)展;2003年11期

7 覃光華,丁晶,陳彬兵;預(yù)防過擬合現(xiàn)象的人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練策略及其應(yīng)用[J];長江科學(xué)院院報(bào);2002年03期

8 劉曙光;鄭崇勛;劉明遠(yuǎn);;前饋神經(jīng)網(wǎng)絡(luò)中的反向傳播算法及其改進(jìn):進(jìn)展與展望[J];計(jì)算機(jī)科學(xué);1996年01期

相關(guān)碩士學(xué)位論文 前5條

1 王公友;基于內(nèi)容的音頻分析與場景識(shí)別[D];南京大學(xué);2013年

2 王京輝;語音信號(hào)處理技術(shù)研究[D];山東大學(xué);2008年

3 李晨;結(jié)合語音識(shí)別技術(shù)的音樂哼唱檢索研究[D];西北大學(xué);2008年

4 陳家紅;哼唱檢索中哼唱信息處理方法的研究[D];南京理工大學(xué);2008年

5 陳旭;基于內(nèi)容的音頻哼唱識(shí)別及檢索系統(tǒng)[D];上海交通大學(xué);2008年



本文編號(hào):2683660

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/mzqiyue/2683660.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶50033***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com