天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于深度學(xué)習(xí)的音樂(lè)信息檢索算法研究

發(fā)布時(shí)間:2024-03-17 03:33
  網(wǎng)絡(luò)多媒體音頻數(shù)量與日俱增,如何能夠高效地檢索出所需目標(biāo),現(xiàn)已成為音樂(lè)信息檢索技術(shù)的一個(gè)關(guān)鍵性問(wèn)題,歌曲匹配作為音樂(lè)信息檢索的一個(gè)子任務(wù),也越來(lái)越受到人們的重視,近年來(lái),深度學(xué)習(xí)方法的興起促進(jìn)了人工智能的發(fā)展,也為音樂(lè)檢索提供了一個(gè)新的思路。深度學(xué)習(xí)技術(shù)在語(yǔ)音信號(hào)處理等領(lǐng)域取得了一系列成功。本文借鑒深度學(xué)習(xí)在語(yǔ)音信號(hào)處理方面的研究成果,在音樂(lè)信息檢索與深度學(xué)習(xí)理論相結(jié)合的基礎(chǔ)之上針對(duì)如何更好的利用深度學(xué)習(xí)來(lái)研究更加適用于音樂(lè)信息檢索這一問(wèn)題的方法主要研究?jī)?nèi)容有:1.提取了 WAVE音樂(lè)庫(kù)中標(biāo)準(zhǔn)的音高信息。在綜合考慮算法精度與時(shí)間復(fù)雜度后本文采用了新的方法BP神經(jīng)網(wǎng)絡(luò)對(duì)音樂(lè)信號(hào)音符切分及清濁音區(qū)分,在此基礎(chǔ)上使用倒譜分析進(jìn)行基音周期的估計(jì)。2.建立了以音符為基礎(chǔ)的HMM模型,進(jìn)行了模型訓(xùn)練與識(shí)別,通過(guò)HMM算法實(shí)現(xiàn)了音樂(lè)信息的檢索。3.在限制玻爾茲曼機(jī)的基礎(chǔ)上介紹了卷積深度置信網(wǎng)絡(luò)模型,并將卷積深度置信網(wǎng)絡(luò)算法應(yīng)用到音樂(lè)信息檢索中。首先通過(guò)非監(jiān)督貪婪逐層算法進(jìn)行了預(yù)訓(xùn)練,然后,通過(guò)有監(jiān)督的網(wǎng)絡(luò)訓(xùn)練方法對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行了微調(diào),通過(guò)調(diào)整網(wǎng)絡(luò)參數(shù)提高了模型的識(shí)別能力。通過(guò)實(shí)驗(yàn)得出歌曲樣本長(zhǎng)度為3...

【文章頁(yè)數(shù)】:66 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖2.1分幀圖??Fig.?2.1?The?diagram?of?frame??

圖2.1分幀圖??Fig.?2.1?The?diagram?of?frame??

以是交疊的,也可以是連續(xù)的,兩個(gè)相鄰幀之間可以有交疊,重疊的這一部分??我們稱之為幀移。幀移長(zhǎng)度一般會(huì)取幀長(zhǎng)的1/3到1/2,這個(gè)取值具體要看實(shí)際??應(yīng)用。分幀中幀長(zhǎng)和幀移如圖2.1。分幀一般與加窗[46]—起使用。對(duì)于每一幀數(shù)??據(jù),幀長(zhǎng)取N,然后將窗函數(shù)與原來(lái)的輸入信號(hào)彳《)....


圖2.2端點(diǎn)檢測(cè)流程??Fig.?2.2?The?process?of?endpoint?detection??

圖2.2端點(diǎn)檢測(cè)流程??Fig.?2.2?The?process?of?endpoint?detection??

過(guò)了高門(mén)限,就能確信進(jìn)入語(yǔ)音段。處于語(yǔ)音段時(shí),若兩個(gè)參數(shù)的數(shù)值降低到??了低門(mén)限以下,而且總的計(jì)時(shí)長(zhǎng)度小于最短時(shí)間門(mén)限,則是一段噪音,然后掃??描以后的語(yǔ)音數(shù)據(jù)。否則,標(biāo)記好結(jié)束端點(diǎn),并返回。圖2.2所示為端點(diǎn)檢測(cè)流??程圖:??設(shè)置各初始值????計(jì)算短義量、?N???調(diào)雜1丨....


圖2.4人工神經(jīng)元模型??Fi.?2.4?Artificial?neural?model??

圖2.4人工神經(jīng)元模型??Fi.?2.4?Artificial?neural?model??

?音頻特征提取??圖2.3是一段哼唱歌曲的短時(shí)能量與過(guò)零率結(jié)果圖??Wave?form??1?i?I???i?i?i?r??■g??|?0?一?卜_?■丨?n? ̄ ̄^一????<??1?I?I?I????i???i?i??0.5?1?1.5?2?2.5??Short-time?e....


圖2.3短時(shí)能量與過(guò)零率結(jié)果圖??Fig.?2.3?The?result?diagram?of?short-time?energy?and?zero?crossing?rate??

圖2.3短時(shí)能量與過(guò)零率結(jié)果圖??Fig.?2.3?The?result?diagram?of?short-time?energy?and?zero?crossing?rate??

?音頻特征提取??圖2.3是一段哼唱歌曲的短時(shí)能量與過(guò)零率結(jié)果圖??Wave?form??1?i?I???i?i?i?r??■g??|?0?一?卜_?■丨?n? ̄ ̄^一????<??1?I?I?I????i???i?i??0.5?1?1.5?2?2.5??Short-time?e....



本文編號(hào):3930448

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3930448.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6be10***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com