基于哈希的音頻指紋提取算法的研究

發(fā)布時間：2017-11-19 09:06

本文關(guān)鍵詞：基于哈希的音頻指紋提取算法的研究

【摘要】：近年來,隨著多媒體技術(shù)的不斷發(fā)展和互聯(lián)網(wǎng)的普及,各式各樣的多媒體應(yīng)用也層出不窮,也越來越深入人們的日常生活。特別是音樂識別類應(yīng)用,人們通常希望能識別出未知音頻的詳細信息,例如歌曲的名字,歌曲的演唱者、作曲人等。由于網(wǎng)絡(luò)環(huán)境的包容性和復(fù)雜性,音頻文件通常會經(jīng)過壓縮、編輯等操作,導(dǎo)致音頻文件的失真或不完整,另外,在音頻的傳輸過程中還可能產(chǎn)生噪音,如何在各種環(huán)境下魯棒而又高效的識別大量的音頻文件成了音頻指紋技術(shù)中的一大難點。音頻指紋技術(shù)通過提取音頻信號的特征對音頻進行識別。音頻指紋是數(shù)字音頻信號經(jīng)過哈希函數(shù)壓縮后的一種緊致表現(xiàn),能唯一的標(biāo)識音頻信號。本文對哈希函數(shù)的發(fā)展以及在音頻指紋領(lǐng)域的應(yīng)用進行了總結(jié),闡述了音頻哈希函數(shù)從傳統(tǒng)哈希函數(shù)到感知哈希函數(shù)的進化歷程。感知哈希函數(shù)繼承了傳統(tǒng)哈希函數(shù)的優(yōu)點,通過模擬人耳聽覺特性,使得生成的指紋具有抗內(nèi)容保持操作、對內(nèi)容篡改操作的敏感性。梅爾域就是一種模擬人耳聽覺系統(tǒng)的數(shù)據(jù)模型。本文提出了一種基于梅爾濾波器的哈希構(gòu)造方法,指紋具有感知特性,并且加入了動態(tài)特征系數(shù)以及平均能量值,提高了指紋的識別性和魯棒性。在指紋的后處理當(dāng)中應(yīng)用了哈爾小波變換,有效的減小了音頻指紋的體積。針對新提出的指紋算法,本文還提出了一種新的雙因子匹配算法,將音頻指紋從方向和距離兩個維度來比較相似度,提高匹配的效率及準(zhǔn)確率。我們對提出的新算法進行了實驗。實驗表明,本文提出的算法提取出的指紋具有較高的精度、較小的體積,能有效的減小指紋數(shù)據(jù)庫的空間,匹配過程中的雙因子系數(shù)能提高指紋匹配率,適用于音頻文件退化或者有一定噪音背景的場景。
【學(xué)位授予單位】：湖南師范大學(xué)
【學(xué)位級別】：碩士
【學(xué)位授予年份】：2016
【分類號】：TN912.34
，

本文編號：1202998

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/xinxigongchenglunwen/1202998.html

上一篇：固態(tài)振動陀螺建模及誤差分析
下一篇：希達P1.875 LED屏幕在新聞直播中的應(yīng)用探索

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于哈希的音頻指紋提取算法的研究