基于壓縮感知和音頻指紋的固定音頻檢索方法
發(fā)布時間:2022-01-13 20:15
針對現(xiàn)有音頻檢索中樣本音頻特征庫數(shù)據(jù)量較大且檢索速率慢問題,本文提出一種基于壓縮感知和音頻指紋降維的固定音頻檢索方法.在音頻檢索的訓練階段,首先,對樣本音頻信號進行稀疏化處理,并通過壓縮感知算法對稀疏化后的音頻數(shù)據(jù)進行壓縮;其次,提取壓縮信號的音頻指紋;再次,引入音頻指紋離散基尼系數(shù)通過計算音頻指紋各維度的離散基尼系數(shù)對指紋實施降維,最終得到檢索特征庫.在音頻檢索階段用和訓練階段相同的算法提取待檢音頻的特征與音頻特征庫數(shù)據(jù)匹配得出檢索結論.實驗結果表明,所提音頻檢索方法在確保較好的檢索準確率的基礎上,大幅度減小了樣本音頻數(shù)據(jù)庫的存儲量,提高了音頻的檢索速率.
【文章來源】:計算機系統(tǒng)應用. 2020,29(08)
【文章頁數(shù)】:8 頁
【參考文獻】:
期刊論文
[1]基于人工智能識別的音樂片段指紋檢索技術研究[J]. 王暉楠,魏嬌. 自動化與儀器儀表. 2019(05)
[2]基于壓縮感知的信號時頻表示重構[J]. 李秀梅,呂軍. 計算機系統(tǒng)應用. 2016(07)
[3]基于壓縮感知的魯棒性說話人識別參數(shù)研究[J]. 于云,周偉棟. 計算機技術與發(fā)展. 2016(03)
[4]利用紋理信息的圖像分塊自適應壓縮感知[J]. 王蓉芳,焦李成,劉芳,楊淑媛. 電子學報. 2013(08)
[5]行階梯觀測矩陣、對偶仿射尺度內點重構算法下的語音壓縮感知[J]. 葉蕾,楊震,王天荊,孫林慧. 電子學報. 2012(03)
[6]基于K-L距離的兩步固定音頻檢索方法[J]. 齊曉倩,陳鴻昶,黃海. 計算機工程. 2011(19)
[7]一種基于仿生模式識別思想的固定音頻檢索方法[J]. 張衛(wèi)強,劉加,陳恩慶. 自然科學進展. 2008(07)
[8]網(wǎng)絡音頻數(shù)據(jù)檢索技術[J]. 張衛(wèi)強,劉加. 通信學報. 2007(12)
本文編號:3587077
【文章來源】:計算機系統(tǒng)應用. 2020,29(08)
【文章頁數(shù)】:8 頁
【參考文獻】:
期刊論文
[1]基于人工智能識別的音樂片段指紋檢索技術研究[J]. 王暉楠,魏嬌. 自動化與儀器儀表. 2019(05)
[2]基于壓縮感知的信號時頻表示重構[J]. 李秀梅,呂軍. 計算機系統(tǒng)應用. 2016(07)
[3]基于壓縮感知的魯棒性說話人識別參數(shù)研究[J]. 于云,周偉棟. 計算機技術與發(fā)展. 2016(03)
[4]利用紋理信息的圖像分塊自適應壓縮感知[J]. 王蓉芳,焦李成,劉芳,楊淑媛. 電子學報. 2013(08)
[5]行階梯觀測矩陣、對偶仿射尺度內點重構算法下的語音壓縮感知[J]. 葉蕾,楊震,王天荊,孫林慧. 電子學報. 2012(03)
[6]基于K-L距離的兩步固定音頻檢索方法[J]. 齊曉倩,陳鴻昶,黃海. 計算機工程. 2011(19)
[7]一種基于仿生模式識別思想的固定音頻檢索方法[J]. 張衛(wèi)強,劉加,陳恩慶. 自然科學進展. 2008(07)
[8]網(wǎng)絡音頻數(shù)據(jù)檢索技術[J]. 張衛(wèi)強,劉加. 通信學報. 2007(12)
本文編號:3587077
本文鏈接:http://sikaile.net/kejilunwen/wltx/3587077.html
最近更新
教材專著