基于哈希的音頻指紋提取算法的研究
發(fā)布時(shí)間:2017-11-19 09:06
本文關(guān)鍵詞:基于哈希的音頻指紋提取算法的研究
更多相關(guān)文章: 音頻指紋 哈希函數(shù) 梅爾倒譜 小波函數(shù)
【摘要】:近年來,隨著多媒體技術(shù)的不斷發(fā)展和互聯(lián)網(wǎng)的普及,各式各樣的多媒體應(yīng)用也層出不窮,也越來越深入人們的日常生活。特別是音樂識(shí)別類應(yīng)用,人們通常希望能識(shí)別出未知音頻的詳細(xì)信息,例如歌曲的名字,歌曲的演唱者、作曲人等。由于網(wǎng)絡(luò)環(huán)境的包容性和復(fù)雜性,音頻文件通常會(huì)經(jīng)過壓縮、編輯等操作,導(dǎo)致音頻文件的失真或不完整,另外,在音頻的傳輸過程中還可能產(chǎn)生噪音,如何在各種環(huán)境下魯棒而又高效的識(shí)別大量的音頻文件成了音頻指紋技術(shù)中的一大難點(diǎn)。音頻指紋技術(shù)通過提取音頻信號(hào)的特征對(duì)音頻進(jìn)行識(shí)別。音頻指紋是數(shù)字音頻信號(hào)經(jīng)過哈希函數(shù)壓縮后的一種緊致表現(xiàn),能唯一的標(biāo)識(shí)音頻信號(hào)。本文對(duì)哈希函數(shù)的發(fā)展以及在音頻指紋領(lǐng)域的應(yīng)用進(jìn)行了總結(jié),闡述了音頻哈希函數(shù)從傳統(tǒng)哈希函數(shù)到感知哈希函數(shù)的進(jìn)化歷程。感知哈希函數(shù)繼承了傳統(tǒng)哈希函數(shù)的優(yōu)點(diǎn),通過模擬人耳聽覺特性,使得生成的指紋具有抗內(nèi)容保持操作、對(duì)內(nèi)容篡改操作的敏感性。梅爾域就是一種模擬人耳聽覺系統(tǒng)的數(shù)據(jù)模型。本文提出了一種基于梅爾濾波器的哈希構(gòu)造方法,指紋具有感知特性,并且加入了動(dòng)態(tài)特征系數(shù)以及平均能量值,提高了指紋的識(shí)別性和魯棒性。在指紋的后處理當(dāng)中應(yīng)用了哈爾小波變換,有效的減小了音頻指紋的體積。針對(duì)新提出的指紋算法,本文還提出了一種新的雙因子匹配算法,將音頻指紋從方向和距離兩個(gè)維度來比較相似度,提高匹配的效率及準(zhǔn)確率。我們對(duì)提出的新算法進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)表明,本文提出的算法提取出的指紋具有較高的精度、較小的體積,能有效的減小指紋數(shù)據(jù)庫的空間,匹配過程中的雙因子系數(shù)能提高指紋匹配率,適用于音頻文件退化或者有一定噪音背景的場(chǎng)景。
【學(xué)位授予單位】:湖南師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.34
,
本文編號(hào):1202998
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1202998.html
最近更新
教材專著