天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于神經(jīng)網(wǎng)絡的音樂音頻自動合成的研究與實現(xiàn)

發(fā)布時間:2020-10-09 18:26
   音樂與人類生活息息相關,是人們抒發(fā)情感、歌唱生活的一種重要的表達方式。而隨著人工智能在近年來的飛速進度以及滲入到各個領域的應用,也給計算機音樂帶來了不小的發(fā)展,其中算法作曲是計算機音樂的一個重要研究分支,旨在利用計算機技術使創(chuàng)作者在作曲的過程中的人為因素降到最低,從而達到自動化作曲的目的。計算作曲通常是以樂譜為研究對象,利用算法通過某種策略控制生成音符序列,進而組成音樂旋律,最終得到完整樂譜。此類的方法存在的問題是,它們需要基于大量的音樂知識規(guī)則:只有當樂理規(guī)則引入量足夠大時,才能使算法變得有效;且當我們想獲得直觀聽覺感受時,只用通過演奏家的演奏或利用MIDI設備來實現(xiàn)。而以音頻為研究對象進行人工智能(Artificial Intelligence,AI)作曲,可以使計算機自動生成音樂片段的排列組合,以生成新的音樂音頻�;谝纛l的AI作曲不依賴大量的音樂知識規(guī)則,同時又能傳遞給聽眾以直觀感受。因此,該類算法比傳統(tǒng)基于樂譜的作曲方法更具有實用性。本文就將以音樂音頻作為研究對象,基于遞歸神經(jīng)網(wǎng)絡提出一種新的自動合成樂曲算法。以音頻為研究對象的音樂自動合成的框架主要包括了音頻文件解析,音樂音頻特征以及應用于自動作曲的模型。在音頻文件解析部分詳細介紹了音頻文件的結構組成,以及其中與本實驗相關的重要參數(shù),為之后順利進行實驗操作打下基礎;在音樂音頻特征部分,介紹了包括梅爾頻率倒譜系數(shù)、線性預測編碼、過零率、短時能量值等特征;在應用于自動作曲的模型中,著重介紹了人工神經(jīng)網(wǎng)絡中在自動作曲算法領域最活躍的循環(huán)神經(jīng)網(wǎng)絡以及長短時記憶模型和門控循環(huán)單元模型兩種變體,這也是本文所研究的基礎模型。其次詳細描述了基于神經(jīng)網(wǎng)絡的音樂音頻自動合成算法,首先將音樂音頻自動合成問題進行了形式化的描述,提出了單位音樂,單位音樂向量,AI生成音樂等概念,將音樂創(chuàng)作表示成為可過程化的問題;然后對提取單位音樂的音頻特征及其過程進行了詳細的描述;之后詳細描述了音樂音頻的預測和合成過程,并給出了算法描述;最后,將直接影響到聽眾直觀聽覺感受的音頻拼接合成部分進行了介紹,提出了先行削弱和增強的方法進行疊加拼接,從而達到平滑拼接的效果。最后本文對算法模型進行了一系列的實驗,包括了基于LSTM模型的音樂音頻自動合成實驗,加入了人機交互的實驗以及基于GRU的音樂音頻自動合成實驗,實驗結果標明,基于LSTM的實驗所生成的音樂中,得分最高的通常是被大眾所熟知的如致愛麗絲的曲目,而在除了熟知度更高的曲目外,模型生成曲目與人工作曲曲目排名分布均勻,表明聽眾并不能區(qū)分人工與智能作曲的區(qū)別,達到了本實驗的目的。
【學位單位】:吉林大學
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:TN912.3;TP183
【文章目錄】:
摘要
abstract
第1章 緒論
    1.1 研究意義與背景
    1.2 研究現(xiàn)狀
    1.3 研究內容
    1.4 本文的組織結構
第2章 音樂音頻自動合成框架概述
    2.1 音頻文件解析
        2.1.1 音頻文件參數(shù)
        2.1.2 格式化音頻數(shù)據(jù)
    2.2 基于聽覺的音頻特征
        2.2.1 梅爾頻率倒譜系數(shù)(MFCC)
        2.2.2 其它音樂特征
    2.3 應用于自動作曲及音樂合成的模型概述
        2.3.1 隱馬爾科夫模型(HMM)
        2.3.2 人工神經(jīng)網(wǎng)絡
    2.4 本章小結
第3章 基于循環(huán)神經(jīng)網(wǎng)絡的音樂音頻自動合成算法
    3.1 形式化描述
    3.2 自動作曲模型
        3.2.1 訓練數(shù)據(jù)集組織
        3.2.2 模型訓練與預測
    3.3 音樂合成
    3.4 本章小結
第4章 實驗結果及分析
    4.1 基于LSTM的音樂音頻自動合成實驗
        4.1.1 測試數(shù)據(jù)與參數(shù)設置
        4.1.2 測試實驗
    4.2 基于神經(jīng)網(wǎng)絡的音樂音頻自動合成的人機交互實驗
    4.3 基于GRU的音樂音頻自動合成實驗
        4.3.1 基于GRU模型的訓練和預測
        4.3.2 測試實驗
    4.4 本章小結
第5章 總結與展望
    5.1 總結
    5.2 展望
參考文獻
作者簡介及研究成果
致謝

【參考文獻】

相關期刊論文 前9條

1 吳艷花;;語音短時幅度和短時過零率分析與應用[J];電腦知識與技術;2009年33期

2 崔學敏;張力;趙文靖;;常用多媒體視頻、音頻文件格式綜述[J];山西電子技術;2007年03期

3 蘇彤;;數(shù)字音頻文件格式[J];圖書館學刊;2006年04期

4 劉澗泉;;第三種作曲方式——論計算機音樂創(chuàng)作的新思維[J];中國音樂;2006年03期

5 馮寅;周昌樂;;算法作曲的研究進展[J];軟件學報;2006年02期

6 陳功;王振力;張建兵;;基于短時能量的語音/音樂快速分類[J];電子技術應用;2006年01期

7 余立功,卜佳俊,陳純;計算機音樂研究初探[J];計算機工程與應用;2005年04期

8 史水平,李世作;線性預測編碼(LPC)技術及其在音頻文件上的應用[J];現(xiàn)代電子技術;2004年04期

9 王尚武;語音壓縮中的線性預測編碼技術[J];微機發(fā)展;2002年06期



本文編號:2834038

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2834038.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶32fdb***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
青青操成人免费在线视频| 最近的中文字幕一区二区| 日韩精品免费一区三区| 日韩精品免费一区二区三区| 欧美不卡一区二区在线视频| 91精品国产综合久久精品 | 黄色片一区二区在线观看| 亚洲一区精品二人人爽久久| 亚洲一级二级三级精品| 亚洲一区二区三区国产| 久久永久免费一区二区| 亚洲黑人精品一区二区欧美| 日韩免费av一区二区三区| 99国产精品国产精品九九| 国产精品一区二区视频| 久久精视频免费视频观看| 欧美不雅视频午夜福利| 国语久精品在视频在线观看| 九九热这里有精品20| 国产日产欧美精品视频| 亚洲国产精品久久综合网| 一区二区福利在线视频| 国产一级不卡视频在线观看| 国产传媒精品视频一区| 精品国产日韩一区三区| 亚洲第一区欧美日韩在线| 91久久国产福利自产拍 | 日本女优一色一伦一区二区三区| 日韩中文字幕欧美亚洲| 亚洲一区二区久久观看| 午夜视频成人在线免费| 免费观看成人免费视频| 亚洲国产另类久久精品| 国产高清视频一区不卡| 高清国产日韩欧美熟女| 男人把女人操得嗷嗷叫| 日本中文字幕在线精品| 成人日韩在线播放视频| 亚洲乱妇熟女爽的高潮片| 黑人巨大精品欧美一区二区区| 在线视频三区日本精品|