視唱自動(dòng)評(píng)價(jià)系統(tǒng)的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2022-01-03 03:39
視唱是指視唱者看到樂譜時(shí),將樂譜中的音符轉(zhuǎn)化為相應(yīng)音調(diào)并演唱,對(duì)于初學(xué)者通常要求其視唱音符完整、音高準(zhǔn)確。但傳統(tǒng)的視唱教學(xué)評(píng)價(jià)方法嚴(yán)重依賴人工,無法實(shí)現(xiàn)批量化、自動(dòng)化評(píng)判,而現(xiàn)有的自動(dòng)評(píng)價(jià)系統(tǒng)大多對(duì)樂曲輸出整體的主觀性評(píng)價(jià),而缺乏音符級(jí)正誤的客觀反饋。因此,研究客觀的、音符級(jí)的視唱自動(dòng)評(píng)價(jià)系統(tǒng)具有重要意義,F(xiàn)有的視唱自動(dòng)評(píng)價(jià)系統(tǒng)通常輸入一段視唱音頻,系統(tǒng)對(duì)視唱音頻進(jìn)行音高、音量、旋律等音頻特征的提取,并與標(biāo)準(zhǔn)音頻進(jìn)行特征比對(duì),最終輸出視唱評(píng)價(jià)。本文設(shè)計(jì)并實(shí)現(xiàn)的視唱自動(dòng)評(píng)價(jià)系統(tǒng),輸入為視唱音頻與標(biāo)準(zhǔn)樂譜音符序列,系統(tǒng)將視唱音頻按照音符進(jìn)行切分獲取視唱音符序列,并將視唱音符序列與標(biāo)準(zhǔn)樂譜的音符序列對(duì)齊,并進(jìn)行音高的逐一比對(duì),最終輸出音符級(jí)的正誤評(píng)價(jià)。本文所提出的系統(tǒng)涉及音符起始點(diǎn)檢測、音高提取及音符序列對(duì)齊三個(gè)技術(shù)點(diǎn),論文重點(diǎn)研究了人聲的起始點(diǎn)檢測問題和音符序列的對(duì)齊問題,并結(jié)合樣本分析設(shè)計(jì)實(shí)現(xiàn)了相應(yīng)算法。本文的創(chuàng)新內(nèi)容主要有以下幾方面:(1)針對(duì)基于傳統(tǒng)聲學(xué)模型的人聲演唱音符起始點(diǎn)檢測方法準(zhǔn)確率低的問題,設(shè)計(jì)了基于CNN的人聲音符起始點(diǎn)檢測模型。該模型在本文自建并公開數(shù)據(jù)集HUST-So...
【文章來源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:67 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
人聲的頻譜圖
圖 2-2 CQT 中帶寬與中心頻率的的關(guān)系若 ( )為離散時(shí)域信號(hào),則其 CQT 變換為 ( ) ∑ ( ) ( ) ( k(¢) ¤( )(, 是第 個(gè)點(diǎn)的中心頻率, 是每個(gè)八度的頻率點(diǎn)數(shù), 是第 個(gè)點(diǎn)的窗 成反比,其比值為Q, 是采樣頻率, ( )是長度為 為窗函數(shù)。公式中的 (¢)的復(fù)共軛, ( )也被稱為時(shí)頻原子。中心頻率 可以被定義為: (, 是最低頻率點(diǎn)的中心頻率。在實(shí)際應(yīng)用中, 是非常重要的參數(shù),它通了時(shí)頻分辨率。對(duì)應(yīng)的窗長由如下公式給出:
28圖 4-4 一幀音頻的頻譜 4-3 視唱音頻片段頻譜圖所示,圖中黃色代表能量值,顏色越深頭指向基頻及其諧波,可以看到黑框部分的基頻的能量要弱于三的頻譜如圖 4-4 一幀音頻的頻譜所示,其中三次諧波在頻譜中的此使用式中的壓縮因子 h 可以降低高次諧波在置信度計(jì)算中的權(quán)以有效抑制倍頻現(xiàn)象,同時(shí)消除半頻的影響。本步驟設(shè)置壓縮因 使得諧波次數(shù)與權(quán)重成反比。出置信度后,將所有候選基頻的置信度比較,選取置信度最高的頻
【參考文獻(xiàn)】:
期刊論文
[1]基于權(quán)值分配的音符識(shí)別研究[J]. 卞毓偉,郭玲. 計(jì)算機(jī)與現(xiàn)代化. 2017(03)
[2]基于語句特征的音樂哼唱快速檢索技術(shù)[J]. 王培培,楊曉春,王斌,王曉曄. 東北大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(03)
[3]基于高頻加權(quán)CQT譜的音符起始點(diǎn)檢測[J]. 林靜,賀前華,李新超,楊繼臣. 計(jì)算機(jī)工程與設(shè)計(jì). 2015(09)
[4]一種結(jié)合端點(diǎn)檢測可檢錯(cuò)的DTW樂譜跟隨算法[J]. 吳康妍,李鏘,關(guān)欣. 計(jì)算機(jī)應(yīng)用與軟件. 2015(03)
[5]基于特征比對(duì)的音樂學(xué)唱系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J]. 劉清堂,敖歡歡,李浩. 計(jì)算機(jī)工程與設(shè)計(jì). 2014(07)
[6]基于音樂內(nèi)容分析的音頻認(rèn)證算法[J]. 汪竹蓉,李偉,朱碧磊,李曉強(qiáng). 計(jì)算機(jī)研究與發(fā)展. 2012(01)
[7]幾種音樂識(shí)別算法比較[J]. 顧亦然,秦軍,王鎖萍,楊靈. 南京郵電學(xué)院學(xué)報(bào). 1998(02)
本文編號(hào):3565490
【文章來源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:67 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
人聲的頻譜圖
圖 2-2 CQT 中帶寬與中心頻率的的關(guān)系若 ( )為離散時(shí)域信號(hào),則其 CQT 變換為 ( ) ∑ ( ) ( ) ( k(¢) ¤( )(, 是第 個(gè)點(diǎn)的中心頻率, 是每個(gè)八度的頻率點(diǎn)數(shù), 是第 個(gè)點(diǎn)的窗 成反比,其比值為Q, 是采樣頻率, ( )是長度為 為窗函數(shù)。公式中的 (¢)的復(fù)共軛, ( )也被稱為時(shí)頻原子。中心頻率 可以被定義為: (, 是最低頻率點(diǎn)的中心頻率。在實(shí)際應(yīng)用中, 是非常重要的參數(shù),它通了時(shí)頻分辨率。對(duì)應(yīng)的窗長由如下公式給出:
28圖 4-4 一幀音頻的頻譜 4-3 視唱音頻片段頻譜圖所示,圖中黃色代表能量值,顏色越深頭指向基頻及其諧波,可以看到黑框部分的基頻的能量要弱于三的頻譜如圖 4-4 一幀音頻的頻譜所示,其中三次諧波在頻譜中的此使用式中的壓縮因子 h 可以降低高次諧波在置信度計(jì)算中的權(quán)以有效抑制倍頻現(xiàn)象,同時(shí)消除半頻的影響。本步驟設(shè)置壓縮因 使得諧波次數(shù)與權(quán)重成反比。出置信度后,將所有候選基頻的置信度比較,選取置信度最高的頻
【參考文獻(xiàn)】:
期刊論文
[1]基于權(quán)值分配的音符識(shí)別研究[J]. 卞毓偉,郭玲. 計(jì)算機(jī)與現(xiàn)代化. 2017(03)
[2]基于語句特征的音樂哼唱快速檢索技術(shù)[J]. 王培培,楊曉春,王斌,王曉曄. 東北大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(03)
[3]基于高頻加權(quán)CQT譜的音符起始點(diǎn)檢測[J]. 林靜,賀前華,李新超,楊繼臣. 計(jì)算機(jī)工程與設(shè)計(jì). 2015(09)
[4]一種結(jié)合端點(diǎn)檢測可檢錯(cuò)的DTW樂譜跟隨算法[J]. 吳康妍,李鏘,關(guān)欣. 計(jì)算機(jī)應(yīng)用與軟件. 2015(03)
[5]基于特征比對(duì)的音樂學(xué)唱系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J]. 劉清堂,敖歡歡,李浩. 計(jì)算機(jī)工程與設(shè)計(jì). 2014(07)
[6]基于音樂內(nèi)容分析的音頻認(rèn)證算法[J]. 汪竹蓉,李偉,朱碧磊,李曉強(qiáng). 計(jì)算機(jī)研究與發(fā)展. 2012(01)
[7]幾種音樂識(shí)別算法比較[J]. 顧亦然,秦軍,王鎖萍,楊靈. 南京郵電學(xué)院學(xué)報(bào). 1998(02)
本文編號(hào):3565490
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3565490.html
最近更新
教材專著