視唱自動評價系統(tǒng)的研究與實現(xiàn)
發(fā)布時間:2022-01-03 03:39
視唱是指視唱者看到樂譜時,將樂譜中的音符轉化為相應音調并演唱,對于初學者通常要求其視唱音符完整、音高準確。但傳統(tǒng)的視唱教學評價方法嚴重依賴人工,無法實現(xiàn)批量化、自動化評判,而現(xiàn)有的自動評價系統(tǒng)大多對樂曲輸出整體的主觀性評價,而缺乏音符級正誤的客觀反饋。因此,研究客觀的、音符級的視唱自動評價系統(tǒng)具有重要意義,F(xiàn)有的視唱自動評價系統(tǒng)通常輸入一段視唱音頻,系統(tǒng)對視唱音頻進行音高、音量、旋律等音頻特征的提取,并與標準音頻進行特征比對,最終輸出視唱評價。本文設計并實現(xiàn)的視唱自動評價系統(tǒng),輸入為視唱音頻與標準樂譜音符序列,系統(tǒng)將視唱音頻按照音符進行切分獲取視唱音符序列,并將視唱音符序列與標準樂譜的音符序列對齊,并進行音高的逐一比對,最終輸出音符級的正誤評價。本文所提出的系統(tǒng)涉及音符起始點檢測、音高提取及音符序列對齊三個技術點,論文重點研究了人聲的起始點檢測問題和音符序列的對齊問題,并結合樣本分析設計實現(xiàn)了相應算法。本文的創(chuàng)新內容主要有以下幾方面:(1)針對基于傳統(tǒng)聲學模型的人聲演唱音符起始點檢測方法準確率低的問題,設計了基于CNN的人聲音符起始點檢測模型。該模型在本文自建并公開數(shù)據(jù)集HUST-So...
【文章來源】:華中科技大學湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【部分圖文】:
人聲的頻譜圖
圖 2-2 CQT 中帶寬與中心頻率的的關系若 ( )為離散時域信號,則其 CQT 變換為 ( ) ∑ ( ) ( ) ( k(¢) ¤( )(, 是第 個點的中心頻率, 是每個八度的頻率點數(shù), 是第 個點的窗 成反比,其比值為Q, 是采樣頻率, ( )是長度為 為窗函數(shù)。公式中的 (¢)的復共軛, ( )也被稱為時頻原子。中心頻率 可以被定義為: (, 是最低頻率點的中心頻率。在實際應用中, 是非常重要的參數(shù),它通了時頻分辨率。對應的窗長由如下公式給出:
28圖 4-4 一幀音頻的頻譜 4-3 視唱音頻片段頻譜圖所示,圖中黃色代表能量值,顏色越深頭指向基頻及其諧波,可以看到黑框部分的基頻的能量要弱于三的頻譜如圖 4-4 一幀音頻的頻譜所示,其中三次諧波在頻譜中的此使用式中的壓縮因子 h 可以降低高次諧波在置信度計算中的權以有效抑制倍頻現(xiàn)象,同時消除半頻的影響。本步驟設置壓縮因 使得諧波次數(shù)與權重成反比。出置信度后,將所有候選基頻的置信度比較,選取置信度最高的頻
【參考文獻】:
期刊論文
[1]基于權值分配的音符識別研究[J]. 卞毓偉,郭玲. 計算機與現(xiàn)代化. 2017(03)
[2]基于語句特征的音樂哼唱快速檢索技術[J]. 王培培,楊曉春,王斌,王曉曄. 東北大學學報(自然科學版). 2017(03)
[3]基于高頻加權CQT譜的音符起始點檢測[J]. 林靜,賀前華,李新超,楊繼臣. 計算機工程與設計. 2015(09)
[4]一種結合端點檢測可檢錯的DTW樂譜跟隨算法[J]. 吳康妍,李鏘,關欣. 計算機應用與軟件. 2015(03)
[5]基于特征比對的音樂學唱系統(tǒng)設計與實現(xiàn)[J]. 劉清堂,敖歡歡,李浩. 計算機工程與設計. 2014(07)
[6]基于音樂內容分析的音頻認證算法[J]. 汪竹蓉,李偉,朱碧磊,李曉強. 計算機研究與發(fā)展. 2012(01)
[7]幾種音樂識別算法比較[J]. 顧亦然,秦軍,王鎖萍,楊靈. 南京郵電學院學報. 1998(02)
本文編號:3565490
【文章來源】:華中科技大學湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【部分圖文】:
人聲的頻譜圖
圖 2-2 CQT 中帶寬與中心頻率的的關系若 ( )為離散時域信號,則其 CQT 變換為 ( ) ∑ ( ) ( ) ( k(¢) ¤( )(, 是第 個點的中心頻率, 是每個八度的頻率點數(shù), 是第 個點的窗 成反比,其比值為Q, 是采樣頻率, ( )是長度為 為窗函數(shù)。公式中的 (¢)的復共軛, ( )也被稱為時頻原子。中心頻率 可以被定義為: (, 是最低頻率點的中心頻率。在實際應用中, 是非常重要的參數(shù),它通了時頻分辨率。對應的窗長由如下公式給出:
28圖 4-4 一幀音頻的頻譜 4-3 視唱音頻片段頻譜圖所示,圖中黃色代表能量值,顏色越深頭指向基頻及其諧波,可以看到黑框部分的基頻的能量要弱于三的頻譜如圖 4-4 一幀音頻的頻譜所示,其中三次諧波在頻譜中的此使用式中的壓縮因子 h 可以降低高次諧波在置信度計算中的權以有效抑制倍頻現(xiàn)象,同時消除半頻的影響。本步驟設置壓縮因 使得諧波次數(shù)與權重成反比。出置信度后,將所有候選基頻的置信度比較,選取置信度最高的頻
【參考文獻】:
期刊論文
[1]基于權值分配的音符識別研究[J]. 卞毓偉,郭玲. 計算機與現(xiàn)代化. 2017(03)
[2]基于語句特征的音樂哼唱快速檢索技術[J]. 王培培,楊曉春,王斌,王曉曄. 東北大學學報(自然科學版). 2017(03)
[3]基于高頻加權CQT譜的音符起始點檢測[J]. 林靜,賀前華,李新超,楊繼臣. 計算機工程與設計. 2015(09)
[4]一種結合端點檢測可檢錯的DTW樂譜跟隨算法[J]. 吳康妍,李鏘,關欣. 計算機應用與軟件. 2015(03)
[5]基于特征比對的音樂學唱系統(tǒng)設計與實現(xiàn)[J]. 劉清堂,敖歡歡,李浩. 計算機工程與設計. 2014(07)
[6]基于音樂內容分析的音頻認證算法[J]. 汪竹蓉,李偉,朱碧磊,李曉強. 計算機研究與發(fā)展. 2012(01)
[7]幾種音樂識別算法比較[J]. 顧亦然,秦軍,王鎖萍,楊靈. 南京郵電學院學報. 1998(02)
本文編號:3565490
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3565490.html