基于哈希的音頻指紋提取算法的研究
發(fā)布時間:2017-11-19 09:06
本文關(guān)鍵詞:基于哈希的音頻指紋提取算法的研究
更多相關(guān)文章: 音頻指紋 哈希函數(shù) 梅爾倒譜 小波函數(shù)
【摘要】:近年來,隨著多媒體技術(shù)的不斷發(fā)展和互聯(lián)網(wǎng)的普及,各式各樣的多媒體應(yīng)用也層出不窮,也越來越深入人們的日常生活。特別是音樂識別類應(yīng)用,人們通常希望能識別出未知音頻的詳細信息,例如歌曲的名字,歌曲的演唱者、作曲人等。由于網(wǎng)絡(luò)環(huán)境的包容性和復(fù)雜性,音頻文件通常會經(jīng)過壓縮、編輯等操作,導(dǎo)致音頻文件的失真或不完整,另外,在音頻的傳輸過程中還可能產(chǎn)生噪音,如何在各種環(huán)境下魯棒而又高效的識別大量的音頻文件成了音頻指紋技術(shù)中的一大難點。音頻指紋技術(shù)通過提取音頻信號的特征對音頻進行識別。音頻指紋是數(shù)字音頻信號經(jīng)過哈希函數(shù)壓縮后的一種緊致表現(xiàn),能唯一的標(biāo)識音頻信號。本文對哈希函數(shù)的發(fā)展以及在音頻指紋領(lǐng)域的應(yīng)用進行了總結(jié),闡述了音頻哈希函數(shù)從傳統(tǒng)哈希函數(shù)到感知哈希函數(shù)的進化歷程。感知哈希函數(shù)繼承了傳統(tǒng)哈希函數(shù)的優(yōu)點,通過模擬人耳聽覺特性,使得生成的指紋具有抗內(nèi)容保持操作、對內(nèi)容篡改操作的敏感性。梅爾域就是一種模擬人耳聽覺系統(tǒng)的數(shù)據(jù)模型。本文提出了一種基于梅爾濾波器的哈希構(gòu)造方法,指紋具有感知特性,并且加入了動態(tài)特征系數(shù)以及平均能量值,提高了指紋的識別性和魯棒性。在指紋的后處理當(dāng)中應(yīng)用了哈爾小波變換,有效的減小了音頻指紋的體積。針對新提出的指紋算法,本文還提出了一種新的雙因子匹配算法,將音頻指紋從方向和距離兩個維度來比較相似度,提高匹配的效率及準(zhǔn)確率。我們對提出的新算法進行了實驗。實驗表明,本文提出的算法提取出的指紋具有較高的精度、較小的體積,能有效的減小指紋數(shù)據(jù)庫的空間,匹配過程中的雙因子系數(shù)能提高指紋匹配率,適用于音頻文件退化或者有一定噪音背景的場景。
【學(xué)位授予單位】:湖南師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TN912.34
,
本文編號:1202998
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1202998.html
最近更新
教材專著