基于節(jié)拍和關(guān)鍵背景模型的音頻分類與分割
發(fā)布時(shí)間:2022-01-27 05:46
音頻數(shù)據(jù)分類分割是音頻數(shù)據(jù)處理系統(tǒng)最常用、最重要的預(yù)處理技術(shù),顯著地影響系統(tǒng)的性能和效果,具有重要的研究?jī)r(jià)值。在音頻樣例檢索系統(tǒng)中,需要為操作人員提供便捷、高效的樣例提取工具,從多媒體文件中截取音頻片段,作為查詢的樣例數(shù)據(jù)。截取的樣例一般是包含操作人員感興趣、含有重要信息、內(nèi)容具有一定完整性的片段。盡管音頻信息無(wú)法快速瀏覽,但如果在操作人員截取音頻樣例之前,先使用音頻分割分類技術(shù)獲取音頻文件內(nèi)容的結(jié)構(gòu)化信息,然后采用可視化技術(shù)呈現(xiàn)給操作人員,將便于操作人員快速瀏覽文件內(nèi)容、便捷、高效地選取音頻片段,完成樣例制作任務(wù)。本文以音頻樣例提取為應(yīng)用背景,研究并實(shí)現(xiàn)了基于多級(jí)分類的音頻數(shù)據(jù)分類與分割算法,并將該算法用于樣例提取,提高操作人員工作效率,具體工作如下:(1)采用隨機(jī)森林算法實(shí)現(xiàn)音頻的粗分類,將音頻數(shù)據(jù)分為音樂、純語(yǔ)音、含背景音樂語(yǔ)音、含背景噪音語(yǔ)音和背景音,共五類。采用基于音頻段的分割方法實(shí)現(xiàn)音頻的粗分割,將音頻數(shù)據(jù)分為音樂、語(yǔ)音和背景音三大段。(2)對(duì)于音樂類數(shù)據(jù),針對(duì)操作人員更多關(guān)注有歌聲音樂而非純音樂的特點(diǎn),提出了基于節(jié)拍的分類方法,將音樂類數(shù)據(jù)細(xì)分為純音樂與有歌聲音樂兩種。實(shí)...
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省211工程院校985工程院校
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究目的和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀與分析
1.2.1 音頻分類技術(shù)的研究進(jìn)展
1.2.2 音頻分割技術(shù)的研究進(jìn)展
1.2.3 目前方法存在的問(wèn)題
1.3 研究?jī)?nèi)容和組織結(jié)構(gòu)
第2章 音頻分類分割概述
2.1 引言
2.2 音頻信號(hào)預(yù)處理
2.2.1 預(yù)加重處理
2.2.2 分幀處理
2.2.3 加窗處理
2.3 特征計(jì)算
2.3.1 時(shí)域特征
2.3.2 頻域特征
2.4 性能評(píng)價(jià)標(biāo)準(zhǔn)
2.5 本章小結(jié)
第3章 基于隨機(jī)森林的音頻多分類
3.1 引言
3.2 基于隨機(jī)森林的音頻分類
3.2.1 隨機(jī)森林簡(jiǎn)介
3.2.2 音頻分類方法
3.3 基于音頻段的音頻分割
3.4 實(shí)驗(yàn)結(jié)果與分析
3.4.1 實(shí)驗(yàn)數(shù)據(jù)與設(shè)置
3.4.2 實(shí)驗(yàn)結(jié)果與分析
3.5 本章小結(jié)
第4章 基于節(jié)拍的歌唱音樂與純音樂分類
4.1 引言
4.2 節(jié)拍概述
4.3 節(jié)拍跟蹤
4.3.1 起音包絡(luò)計(jì)算
4.3.2 速度估計(jì)
4.3.3 節(jié)拍跟蹤
4.4 基于節(jié)拍的分類方法
4.5 實(shí)驗(yàn)結(jié)果與分析
4.5.1 實(shí)驗(yàn)數(shù)據(jù)與設(shè)置
4.5.2 實(shí)驗(yàn)結(jié)果與分析
4.6 本章小結(jié)
第5章 基于關(guān)鍵背景模型的語(yǔ)音分割
5.1 引言
5.2 GSSG分割方法
5.3 模型訓(xùn)練
5.3.1 模型訓(xùn)練算法
5.3.2 高斯模型距離準(zhǔn)則
5.4 GSH特征計(jì)算
5.5 聚類算法
5.5.1 簇初始化
5.5.2 聚類算法
5.5.3 最優(yōu)聚類個(gè)數(shù)確定
5.6 實(shí)驗(yàn)結(jié)果與分析
5.6.1 實(shí)驗(yàn)數(shù)據(jù)及設(shè)置
5.6.2 實(shí)驗(yàn)結(jié)果及分析
5.7 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
本文編號(hào):3611884
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省211工程院校985工程院校
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究目的和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀與分析
1.2.1 音頻分類技術(shù)的研究進(jìn)展
1.2.2 音頻分割技術(shù)的研究進(jìn)展
1.2.3 目前方法存在的問(wèn)題
1.3 研究?jī)?nèi)容和組織結(jié)構(gòu)
第2章 音頻分類分割概述
2.1 引言
2.2 音頻信號(hào)預(yù)處理
2.2.1 預(yù)加重處理
2.2.2 分幀處理
2.2.3 加窗處理
2.3 特征計(jì)算
2.3.1 時(shí)域特征
2.3.2 頻域特征
2.4 性能評(píng)價(jià)標(biāo)準(zhǔn)
2.5 本章小結(jié)
第3章 基于隨機(jī)森林的音頻多分類
3.1 引言
3.2 基于隨機(jī)森林的音頻分類
3.2.1 隨機(jī)森林簡(jiǎn)介
3.2.2 音頻分類方法
3.3 基于音頻段的音頻分割
3.4 實(shí)驗(yàn)結(jié)果與分析
3.4.1 實(shí)驗(yàn)數(shù)據(jù)與設(shè)置
3.4.2 實(shí)驗(yàn)結(jié)果與分析
3.5 本章小結(jié)
第4章 基于節(jié)拍的歌唱音樂與純音樂分類
4.1 引言
4.2 節(jié)拍概述
4.3 節(jié)拍跟蹤
4.3.1 起音包絡(luò)計(jì)算
4.3.2 速度估計(jì)
4.3.3 節(jié)拍跟蹤
4.4 基于節(jié)拍的分類方法
4.5 實(shí)驗(yàn)結(jié)果與分析
4.5.1 實(shí)驗(yàn)數(shù)據(jù)與設(shè)置
4.5.2 實(shí)驗(yàn)結(jié)果與分析
4.6 本章小結(jié)
第5章 基于關(guān)鍵背景模型的語(yǔ)音分割
5.1 引言
5.2 GSSG分割方法
5.3 模型訓(xùn)練
5.3.1 模型訓(xùn)練算法
5.3.2 高斯模型距離準(zhǔn)則
5.4 GSH特征計(jì)算
5.5 聚類算法
5.5.1 簇初始化
5.5.2 聚類算法
5.5.3 最優(yōu)聚類個(gè)數(shù)確定
5.6 實(shí)驗(yàn)結(jié)果與分析
5.6.1 實(shí)驗(yàn)數(shù)據(jù)及設(shè)置
5.6.2 實(shí)驗(yàn)結(jié)果及分析
5.7 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
本文編號(hào):3611884
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3611884.html
最近更新
教材專著