基于信號與內(nèi)容特征的音頻判決系統(tǒng)的研究與實(shí)現(xiàn)
發(fā)布時間:2017-07-17 22:12
本文關(guān)鍵詞:基于信號與內(nèi)容特征的音頻判決系統(tǒng)的研究與實(shí)現(xiàn)
更多相關(guān)文章: 廣播電臺 音頻判決系統(tǒng) 質(zhì)量檢測 內(nèi)容檢測
【摘要】:隨著我國廣播電臺事業(yè)的發(fā)展,音頻節(jié)目播出作為其中一個產(chǎn)物,改變了廣播電臺的業(yè)務(wù)流程。對音頻的判決是音頻節(jié)目播出前必不可少的環(huán)節(jié),它肩負(fù)著節(jié)目播出質(zhì)量和安全的重任。音頻判決能夠?qū)﹄娕_播出的音頻節(jié)目進(jìn)行靜音檢測、電平偏移超標(biāo)檢測、VU超標(biāo)檢測、立體聲相位反相檢測、不可聽檢測、削波檢測等。它還可以對電臺節(jié)目的內(nèi)容進(jìn)行檢測,檢測音頻中是否包含敏感信息并且對其進(jìn)行定位,確保電臺節(jié)目的安全播出。廣播節(jié)目信號質(zhì)量和內(nèi)容的檢測如果依靠傳統(tǒng)的人工方式開展,將面臨諸多困難,人耳無法辨識以高倍速播放的聲音內(nèi)容,容易造成漏檢誤檢,并且整個過程需要投入大量的人力和物力。本文針對上述問題,在對音頻判決的背景進(jìn)行了解和系統(tǒng)需求進(jìn)行分析后,以音頻節(jié)目為研究對象,結(jié)合數(shù)理統(tǒng)計(jì)方法、數(shù)字信號處理、語音識別等技術(shù),設(shè)計(jì)并實(shí)現(xiàn)了音頻判決系統(tǒng)。與傳統(tǒng)方法相比,音頻判決系統(tǒng)有著效率高、速度快、漏檢率低等特點(diǎn)。本文對音頻素材的質(zhì)量和內(nèi)容分別進(jìn)行檢測,完成的工作主要包括以下幾點(diǎn):1)運(yùn)用FFmpeg技術(shù)對音頻文件進(jìn)行解碼,獲取音頻信號參數(shù)如采樣率、比特率、聲道數(shù)、采樣格式等。為后續(xù)的判決工作提供前期準(zhǔn)備。2)詳細(xì)研究并實(shí)現(xiàn)了基于信號特征的音頻判決模塊,模塊主要完成音頻質(zhì)量檢測部分,包括靜音檢測、電平偏移超標(biāo)檢測、VU超標(biāo)檢測、立體聲反相檢測、不可聽檢測、削波檢測等。通過音頻Wave文件提供的信息以及對音頻采樣數(shù)據(jù)進(jìn)行處理或變換來實(shí)現(xiàn)音頻質(zhì)量的檢測。3)詳細(xì)研究并實(shí)現(xiàn)了基于內(nèi)容特征的音頻判決模塊,模塊主要完成對音頻內(nèi)容的檢測;诳拼笥嶏w移動語音平臺,并結(jié)合語音識別技術(shù)對打開的音頻文件進(jìn)行全文識別,給出相應(yīng)的識別結(jié)果,再從這些文本結(jié)果檢索給定的關(guān)鍵詞,最后對出現(xiàn)的關(guān)鍵詞進(jìn)行定位。本文實(shí)現(xiàn)的音頻判決系統(tǒng)能夠在實(shí)驗(yàn)環(huán)境下測試完成良好,能夠精確檢測出質(zhì)量不合格的音頻并且能夠定位出現(xiàn)關(guān)鍵詞的音頻段,從而達(dá)到初期目標(biāo)。
【關(guān)鍵詞】:廣播電臺 音頻判決系統(tǒng) 質(zhì)量檢測 內(nèi)容檢測
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TN931;TN912.3
【目錄】:
- 摘要5-6
- ABSTRACT6-10
- 第一章 緒論10-14
- 1.1 研究背景10
- 1.2 研究現(xiàn)狀10-12
- 1.3 本文的主要研究內(nèi)容12
- 1.4 本文的結(jié)構(gòu)安排12-14
- 第二章 音頻判決系統(tǒng)的需求分析與總體設(shè)計(jì)14-33
- 2.1 相關(guān)背景知識14-21
- 2.1.1 人類聽覺特性14-15
- 2.1.2 PCM編碼及Wave文件15-16
- 2.1.3 數(shù)字信號處理16-18
- 2.1.4 FFmpeg多媒體處理技術(shù)18-19
- 2.1.5 多線程技術(shù)19-20
- 2.1.6 語音識別20-21
- 2.2 系統(tǒng)概述21-24
- 2.3 系統(tǒng)需求分析24-27
- 2.3.1 功能需求分析24-26
- 2.3.2 性能需求分析26-27
- 2.4 系統(tǒng)總體方案設(shè)計(jì)27-32
- 2.4.1 系統(tǒng)模塊劃分27-29
- 2.4.2 基于信號特征的音頻判決模塊的設(shè)計(jì)29-31
- 2.4.3 基于內(nèi)容特征的音頻判決模塊的設(shè)計(jì)31-32
- 2.5 本章小結(jié)32-33
- 第三章 基于信號特征的音頻判決模塊的設(shè)計(jì)與實(shí)現(xiàn)33-60
- 3.1 基于信號特征的音頻判決模塊的流程設(shè)計(jì)33-42
- 3.1.1 模塊的工作流程33-35
- 3.1.2 子模塊的工作流程35-42
- 3.2 模塊接.設(shè)計(jì)42-46
- 3.2.1 UML模型設(shè)計(jì)42-43
- 3.2.2 模塊外部接.設(shè)計(jì)43-46
- 3.3 基于信號特征的音頻判決模塊的實(shí)現(xiàn)46-55
- 3.3.1 靜音檢測46-48
- 3.3.2 立體聲相位反相檢測48-49
- 3.3.3 不可聽檢測49-50
- 3.3.4 VU超標(biāo)檢測50-52
- 3.3.5 電平偏移超標(biāo)檢測52-54
- 3.3.6 削波檢測54-55
- 3.4 模塊測評55-59
- 3.4.1 測評環(huán)境配置55-56
- 3.4.2 測評內(nèi)容及結(jié)果56-59
- 3.5 本章小結(jié)59-60
- 第四章 基于內(nèi)容特征的音頻判決模塊的設(shè)計(jì)與實(shí)現(xiàn)60-81
- 4.1 基于內(nèi)容特征的音頻判決模塊的流程設(shè)計(jì)60-68
- 4.1.1 模塊的工作流程60-62
- 4.1.2 子模塊的工作流程62-68
- 4.2 模塊接.設(shè)計(jì)68-72
- 4.2.1 UML模型設(shè)計(jì)68-69
- 4.2.2 模塊外部接.設(shè)計(jì)69-72
- 4.3 基于內(nèi)容特征的音頻判決模塊的實(shí)現(xiàn)72-76
- 4.3.1 基于科大訊飛MSP的語音識別的實(shí)現(xiàn)72-74
- 4.3.2 關(guān)鍵詞搜索74-75
- 4.3.3 關(guān)鍵詞定位75-76
- 4.4 模塊測評76-80
- 4.4.1 測評方法的定義76-77
- 4.4.2 測評內(nèi)容及結(jié)果77-80
- 4.5 本章小結(jié)80-81
- 第五章 總結(jié)與展望81-83
- 5.1 全文總結(jié)81-82
- 5.2 研究展望82-83
- 致謝83-84
- 參考文獻(xiàn)84-86
- 作者攻碩期間取得的研究成果86-87
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 陳彪;丁鵬;徐波;;一種基于語音關(guān)鍵詞識別的廣播電視內(nèi)容監(jiān)測系統(tǒng)[J];廣播與電視技術(shù);2009年12期
2 譚強(qiáng),沈雁;一種快速字符串匹配搜索算法[J];計(jì)算機(jī)應(yīng)用;2003年S2期
,本文編號:554848
本文鏈接:http://sikaile.net/kejilunwen/wltx/554848.html
最近更新
教材專著