基于深度學(xué)習(xí)的音樂(lè)信息檢索算法研究
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1分幀圖??Fig.?2.1?The?diagram?of?frame??
以是交疊的,也可以是連續(xù)的,兩個(gè)相鄰幀之間可以有交疊,重疊的這一部分??我們稱之為幀移。幀移長(zhǎng)度一般會(huì)取幀長(zhǎng)的1/3到1/2,這個(gè)取值具體要看實(shí)際??應(yīng)用。分幀中幀長(zhǎng)和幀移如圖2.1。分幀一般與加窗[46]—起使用。對(duì)于每一幀數(shù)??據(jù),幀長(zhǎng)取N,然后將窗函數(shù)與原來(lái)的輸入信號(hào)彳《)....
圖2.2端點(diǎn)檢測(cè)流程??Fig.?2.2?The?process?of?endpoint?detection??
過(guò)了高門(mén)限,就能確信進(jìn)入語(yǔ)音段。處于語(yǔ)音段時(shí),若兩個(gè)參數(shù)的數(shù)值降低到??了低門(mén)限以下,而且總的計(jì)時(shí)長(zhǎng)度小于最短時(shí)間門(mén)限,則是一段噪音,然后掃??描以后的語(yǔ)音數(shù)據(jù)。否則,標(biāo)記好結(jié)束端點(diǎn),并返回。圖2.2所示為端點(diǎn)檢測(cè)流??程圖:??設(shè)置各初始值????計(jì)算短義量、?N???調(diào)雜1丨....
圖2.4人工神經(jīng)元模型??Fi.?2.4?Artificial?neural?model??
?音頻特征提取??圖2.3是一段哼唱歌曲的短時(shí)能量與過(guò)零率結(jié)果圖??Wave?form??1?i?I???i?i?i?r??■g??|?0?一?卜_?■丨?n? ̄ ̄^一????<??1?I?I?I????i???i?i??0.5?1?1.5?2?2.5??Short-time?e....
圖2.3短時(shí)能量與過(guò)零率結(jié)果圖??Fig.?2.3?The?result?diagram?of?short-time?energy?and?zero?crossing?rate??
?音頻特征提取??圖2.3是一段哼唱歌曲的短時(shí)能量與過(guò)零率結(jié)果圖??Wave?form??1?i?I???i?i?i?r??■g??|?0?一?卜_?■丨?n? ̄ ̄^一????<??1?I?I?I????i???i?i??0.5?1?1.5?2?2.5??Short-time?e....
本文編號(hào):3930448
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3930448.html