基于信號(hào)與內(nèi)容特征的音頻判決系統(tǒng)的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2017-07-17 22:12
本文關(guān)鍵詞:基于信號(hào)與內(nèi)容特征的音頻判決系統(tǒng)的研究與實(shí)現(xiàn)
更多相關(guān)文章: 廣播電臺(tái) 音頻判決系統(tǒng) 質(zhì)量檢測(cè) 內(nèi)容檢測(cè)
【摘要】:隨著我國(guó)廣播電臺(tái)事業(yè)的發(fā)展,音頻節(jié)目播出作為其中一個(gè)產(chǎn)物,改變了廣播電臺(tái)的業(yè)務(wù)流程。對(duì)音頻的判決是音頻節(jié)目播出前必不可少的環(huán)節(jié),它肩負(fù)著節(jié)目播出質(zhì)量和安全的重任。音頻判決能夠?qū)﹄娕_(tái)播出的音頻節(jié)目進(jìn)行靜音檢測(cè)、電平偏移超標(biāo)檢測(cè)、VU超標(biāo)檢測(cè)、立體聲相位反相檢測(cè)、不可聽檢測(cè)、削波檢測(cè)等。它還可以對(duì)電臺(tái)節(jié)目的內(nèi)容進(jìn)行檢測(cè),檢測(cè)音頻中是否包含敏感信息并且對(duì)其進(jìn)行定位,確保電臺(tái)節(jié)目的安全播出。廣播節(jié)目信號(hào)質(zhì)量和內(nèi)容的檢測(cè)如果依靠傳統(tǒng)的人工方式開展,將面臨諸多困難,人耳無(wú)法辨識(shí)以高倍速播放的聲音內(nèi)容,容易造成漏檢誤檢,并且整個(gè)過程需要投入大量的人力和物力。本文針對(duì)上述問題,在對(duì)音頻判決的背景進(jìn)行了解和系統(tǒng)需求進(jìn)行分析后,以音頻節(jié)目為研究對(duì)象,結(jié)合數(shù)理統(tǒng)計(jì)方法、數(shù)字信號(hào)處理、語(yǔ)音識(shí)別等技術(shù),設(shè)計(jì)并實(shí)現(xiàn)了音頻判決系統(tǒng)。與傳統(tǒng)方法相比,音頻判決系統(tǒng)有著效率高、速度快、漏檢率低等特點(diǎn)。本文對(duì)音頻素材的質(zhì)量和內(nèi)容分別進(jìn)行檢測(cè),完成的工作主要包括以下幾點(diǎn):1)運(yùn)用FFmpeg技術(shù)對(duì)音頻文件進(jìn)行解碼,獲取音頻信號(hào)參數(shù)如采樣率、比特率、聲道數(shù)、采樣格式等。為后續(xù)的判決工作提供前期準(zhǔn)備。2)詳細(xì)研究并實(shí)現(xiàn)了基于信號(hào)特征的音頻判決模塊,模塊主要完成音頻質(zhì)量檢測(cè)部分,包括靜音檢測(cè)、電平偏移超標(biāo)檢測(cè)、VU超標(biāo)檢測(cè)、立體聲反相檢測(cè)、不可聽檢測(cè)、削波檢測(cè)等。通過音頻Wave文件提供的信息以及對(duì)音頻采樣數(shù)據(jù)進(jìn)行處理或變換來(lái)實(shí)現(xiàn)音頻質(zhì)量的檢測(cè)。3)詳細(xì)研究并實(shí)現(xiàn)了基于內(nèi)容特征的音頻判決模塊,模塊主要完成對(duì)音頻內(nèi)容的檢測(cè);诳拼笥嶏w移動(dòng)語(yǔ)音平臺(tái),并結(jié)合語(yǔ)音識(shí)別技術(shù)對(duì)打開的音頻文件進(jìn)行全文識(shí)別,給出相應(yīng)的識(shí)別結(jié)果,再?gòu)倪@些文本結(jié)果檢索給定的關(guān)鍵詞,最后對(duì)出現(xiàn)的關(guān)鍵詞進(jìn)行定位。本文實(shí)現(xiàn)的音頻判決系統(tǒng)能夠在實(shí)驗(yàn)環(huán)境下測(cè)試完成良好,能夠精確檢測(cè)出質(zhì)量不合格的音頻并且能夠定位出現(xiàn)關(guān)鍵詞的音頻段,從而達(dá)到初期目標(biāo)。
【關(guān)鍵詞】:廣播電臺(tái) 音頻判決系統(tǒng) 質(zhì)量檢測(cè) 內(nèi)容檢測(cè)
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN931;TN912.3
【目錄】:
- 摘要5-6
- ABSTRACT6-10
- 第一章 緒論10-14
- 1.1 研究背景10
- 1.2 研究現(xiàn)狀10-12
- 1.3 本文的主要研究?jī)?nèi)容12
- 1.4 本文的結(jié)構(gòu)安排12-14
- 第二章 音頻判決系統(tǒng)的需求分析與總體設(shè)計(jì)14-33
- 2.1 相關(guān)背景知識(shí)14-21
- 2.1.1 人類聽覺特性14-15
- 2.1.2 PCM編碼及Wave文件15-16
- 2.1.3 數(shù)字信號(hào)處理16-18
- 2.1.4 FFmpeg多媒體處理技術(shù)18-19
- 2.1.5 多線程技術(shù)19-20
- 2.1.6 語(yǔ)音識(shí)別20-21
- 2.2 系統(tǒng)概述21-24
- 2.3 系統(tǒng)需求分析24-27
- 2.3.1 功能需求分析24-26
- 2.3.2 性能需求分析26-27
- 2.4 系統(tǒng)總體方案設(shè)計(jì)27-32
- 2.4.1 系統(tǒng)模塊劃分27-29
- 2.4.2 基于信號(hào)特征的音頻判決模塊的設(shè)計(jì)29-31
- 2.4.3 基于內(nèi)容特征的音頻判決模塊的設(shè)計(jì)31-32
- 2.5 本章小結(jié)32-33
- 第三章 基于信號(hào)特征的音頻判決模塊的設(shè)計(jì)與實(shí)現(xiàn)33-60
- 3.1 基于信號(hào)特征的音頻判決模塊的流程設(shè)計(jì)33-42
- 3.1.1 模塊的工作流程33-35
- 3.1.2 子模塊的工作流程35-42
- 3.2 模塊接.設(shè)計(jì)42-46
- 3.2.1 UML模型設(shè)計(jì)42-43
- 3.2.2 模塊外部接.設(shè)計(jì)43-46
- 3.3 基于信號(hào)特征的音頻判決模塊的實(shí)現(xiàn)46-55
- 3.3.1 靜音檢測(cè)46-48
- 3.3.2 立體聲相位反相檢測(cè)48-49
- 3.3.3 不可聽檢測(cè)49-50
- 3.3.4 VU超標(biāo)檢測(cè)50-52
- 3.3.5 電平偏移超標(biāo)檢測(cè)52-54
- 3.3.6 削波檢測(cè)54-55
- 3.4 模塊測(cè)評(píng)55-59
- 3.4.1 測(cè)評(píng)環(huán)境配置55-56
- 3.4.2 測(cè)評(píng)內(nèi)容及結(jié)果56-59
- 3.5 本章小結(jié)59-60
- 第四章 基于內(nèi)容特征的音頻判決模塊的設(shè)計(jì)與實(shí)現(xiàn)60-81
- 4.1 基于內(nèi)容特征的音頻判決模塊的流程設(shè)計(jì)60-68
- 4.1.1 模塊的工作流程60-62
- 4.1.2 子模塊的工作流程62-68
- 4.2 模塊接.設(shè)計(jì)68-72
- 4.2.1 UML模型設(shè)計(jì)68-69
- 4.2.2 模塊外部接.設(shè)計(jì)69-72
- 4.3 基于內(nèi)容特征的音頻判決模塊的實(shí)現(xiàn)72-76
- 4.3.1 基于科大訊飛MSP的語(yǔ)音識(shí)別的實(shí)現(xiàn)72-74
- 4.3.2 關(guān)鍵詞搜索74-75
- 4.3.3 關(guān)鍵詞定位75-76
- 4.4 模塊測(cè)評(píng)76-80
- 4.4.1 測(cè)評(píng)方法的定義76-77
- 4.4.2 測(cè)評(píng)內(nèi)容及結(jié)果77-80
- 4.5 本章小結(jié)80-81
- 第五章 總結(jié)與展望81-83
- 5.1 全文總結(jié)81-82
- 5.2 研究展望82-83
- 致謝83-84
- 參考文獻(xiàn)84-86
- 作者攻碩期間取得的研究成果86-87
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 陳彪;丁鵬;徐波;;一種基于語(yǔ)音關(guān)鍵詞識(shí)別的廣播電視內(nèi)容監(jiān)測(cè)系統(tǒng)[J];廣播與電視技術(shù);2009年12期
2 譚強(qiáng),沈雁;一種快速字符串匹配搜索算法[J];計(jì)算機(jī)應(yīng)用;2003年S2期
,本文編號(hào):554848
本文鏈接:http://sikaile.net/kejilunwen/wltx/554848.html
最近更新
教材專著