天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向音頻檢索的音頻特征分析方法研究

發(fā)布時(shí)間:2024-01-29 12:06
  隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和手持錄像、錄音設(shè)備的普及,普通用戶(hù)可以獲取的多媒體數(shù)據(jù)呈現(xiàn)爆炸式增長(zhǎng)。為了實(shí)現(xiàn)對(duì)海量多媒體數(shù)據(jù)的管理和檢索,基于內(nèi)容的檢索技術(shù)成為了研究熱點(diǎn)。這種檢索方法要求用戶(hù)直接給出反映查詢(xún)意圖的樣例,系統(tǒng)從中提取反映內(nèi)容信息的底層特征后在數(shù)據(jù)庫(kù)中搜索相似的樣本,因此該方法依賴(lài)于具有區(qū)分力的特征以及快速的檢索算法。本文針對(duì)多媒體數(shù)據(jù)中的音頻部分,以基于內(nèi)容的音頻檢索為研究目標(biāo),以提取底層音頻特征為核心研究?jī)?nèi)容,借鑒人腦對(duì)聲音的感知方式,探索了基于稀疏表示的多種音頻特征,提出了基于倒排索引的音頻內(nèi)容檢索算法。本文主要工作及貢獻(xiàn)如下:(1)基于人腦對(duì)諧波結(jié)構(gòu)的感知特點(diǎn),提出了一種基于諧波分量的頻譜分解方法。設(shè)計(jì)一個(gè)能夠在頻域表達(dá)諧波結(jié)構(gòu)的字典,該字典利用諧波基頻、共振峰頻率和泛音能量衰減速率等參數(shù)描述諧波結(jié)構(gòu);谒O(shè)計(jì)字典,采用匹配追蹤算法對(duì)信號(hào)頻譜進(jìn)行稀疏表示,然后將分解后原子參數(shù)的統(tǒng)計(jì)特性作為音頻特征。16類(lèi)閉集音效分類(lèi)實(shí)驗(yàn)結(jié)果中,提出的諧波分量特征獲得64.8%的分類(lèi)效果,相對(duì)MFCC特征和譜特征,分別提升了7.4%和3.9%;與MFCC結(jié)合后,分類(lèi)效果達(dá)到66.3%。(...

【文章頁(yè)數(shù)】:144 頁(yè)

【學(xué)位級(jí)別】:博士

【文章目錄】:
摘要
Abstract
主要縮寫(xiě)對(duì)照表
第一章 緒論
    1.1 音頻檢索的研究意義
    1.2 音頻檢索的研究現(xiàn)狀
        1.2.1 音頻特征提取和音效分類(lèi)的發(fā)展現(xiàn)狀
        1.2.2 多媒體檢索發(fā)展現(xiàn)狀
    1.3 論文的主要工作及章節(jié)安排
第二章 基于諧波分量的音頻特征
    2.1 音頻的頻域特征
    2.2 諧波字典
        2.2.1 人腦對(duì)諧波信號(hào)的感知
        2.2.2 諧波字典
    2.3 基于匹配追蹤的頻譜分解
        2.3.1 稀疏表示的基本概念
        2.3.2 稀疏表示的求解算法
        2.3.3 頻譜分解
        2.3.4 音頻特征的表示
    2.4 實(shí)驗(yàn)與結(jié)果分析
        2.4.1 數(shù)據(jù)庫(kù)和實(shí)驗(yàn)平臺(tái)
        2.4.2 實(shí)驗(yàn)及結(jié)果分析
    2.5 本章小結(jié)
第三章 基于感知子空間的時(shí)-頻特征提取
    3.1 基于心理聲學(xué)的感知子空間劃分
        3.1.1 人腦對(duì)瞬變信號(hào)的感知
        3.1.2 基于感知子空間的分解模型
    3.2 感知子空間的數(shù)學(xué)描述
        3.2.1 諧波子空間的數(shù)學(xué)定義
        3.2.2 瞬時(shí)子空間的數(shù)學(xué)定義
        3.2.3 殘差子空間的數(shù)學(xué)定義
    3.3 音頻信號(hào)的分解
        3.3.1 基于匹配追蹤的音頻信號(hào)分解
        3.3.2 音頻特征的表示
    3.4 實(shí)驗(yàn)與結(jié)果分析
        3.4.1 實(shí)驗(yàn)設(shè)置
        3.4.2 子空間分解實(shí)例
        3.4.3 子空間分類(lèi)效果
        3.4.4 與其他特征比較結(jié)果
    3.5 本章小結(jié)
第四章 基于系數(shù)張量的時(shí)-頻特征提取
    4.1 張量的概念及其基本運(yùn)算
        4.1.1 張量的定義
        4.1.2 張量的展開(kāi)
        4.1.3 張量的運(yùn)算
        4.1.4 張量的秩
    4.2 張量分解模型
        4.2.1 非負(fù)稀疏矩陣分解
        4.2.2 PARAFAC模型
        4.2.3 Tucker模型
    4.3 基于系數(shù)張量的音頻特征提取
        4.3.1 系數(shù)張量
        4.3.2 非負(fù)稀疏張量分解
    4.4 計(jì)算復(fù)雜度分析
    4.5 實(shí)驗(yàn)與結(jié)果分析
        4.5.1 系數(shù)張量實(shí)例
        4.5.2 張量分解
        4.5.3 閉集測(cè)試結(jié)果
        4.5.4 開(kāi)集測(cè)試結(jié)果
    4.6 本章小結(jié)
第五章 基于倒排索引的音頻檢索
    5.1 基于不相鄰數(shù)據(jù)窗的說(shuō)話人分割
        5.1.1 說(shuō)話人改變檢測(cè)
        5.1.2 相鄰數(shù)據(jù)窗的方法對(duì)噪音的敏感性
        5.1.3 不相鄰數(shù)據(jù)窗
    5.2 基于多層結(jié)構(gòu)的音頻分割算法
        5.2.1 基于能量的分割
        5.2.2 基于內(nèi)容的分割
        5.2.3 基于一階、二階統(tǒng)計(jì)量的分割
    5.3 基于倒排索引的音頻內(nèi)容檢索
        5.3.1 檢索算法
        5.3.2 半監(jiān)督的音頻字典和音頻字量化
        5.3.3 倒排索引的建立
        5.3.4 基于倒排索引的檢索
    5.4 實(shí)驗(yàn)與結(jié)果分析
        5.4.1 基于不相鄰窗的說(shuō)話人改變檢測(cè)
        5.4.2 內(nèi)容檢索數(shù)據(jù)庫(kù)及實(shí)驗(yàn)設(shè)置
        5.4.3 查詢(xún)樣本時(shí)長(zhǎng)和返回結(jié)果個(gè)數(shù)對(duì)查詢(xún)結(jié)果的影響
        5.4.4 與其他檢索算法的比較結(jié)果
    5.5 本章小結(jié)
第六章 總結(jié)與展望
    研究總結(jié)
    后續(xù)工作展望
參考文獻(xiàn)
攻讀博士學(xué)位期間取得的研究成果
致謝
附件



本文編號(hào):3888157

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3888157.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)60c8d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com