基于音頻內(nèi)容重復(fù)性的廣播廣告檢測(cè)
發(fā)布時(shí)間:2020-11-14 21:58
在現(xiàn)如今,廣播是人們接收新聞、歌曲、娛樂(lè)節(jié)目等信息的重要途徑。由于廣播具有受眾面廣,影響力大的特點(diǎn),對(duì)于廣播節(jié)目中的廣告檢測(cè)具有很重要的現(xiàn)實(shí)意義。廣告檢測(cè)對(duì)于政府監(jiān)管,媒體運(yùn)營(yíng),廣告投放等工作都具有很大的幫助作用。針對(duì)上述實(shí)際需求,本文提出了一種基于音頻內(nèi)容重復(fù)性的廣播中廣告檢測(cè)方法。該方法的主要思想是結(jié)合廣播節(jié)目中同一廣告在固定時(shí)段出現(xiàn)頻率高、數(shù)量大的特性,通過(guò)找出廣播中音頻內(nèi)容的重復(fù)段來(lái)確定廣告及其位置。本文提出的這種方法具有計(jì)算速度快,無(wú)需大量人力投入等特點(diǎn)。本文的主要工作如下:1.對(duì)目標(biāo)音頻進(jìn)行自相似性矩陣的計(jì)算。通過(guò)自相似性矩陣得到音頻中內(nèi)容相似重復(fù)的音頻段作為相似段,并對(duì)出現(xiàn)多次的相似段進(jìn)行剔除,得到最終的廣告和起止時(shí)間。2.使用基于音頻分類分割的方法對(duì)廣告檢測(cè)算法進(jìn)行優(yōu)化。使用支持向量機(jī)對(duì)未知音頻進(jìn)行分類,共分為語(yǔ)音,含噪語(yǔ)音,背景音,音樂(lè)共四類,并對(duì)支持向量機(jī)分類得到的分類結(jié)果進(jìn)行平滑,并根據(jù)平滑后的結(jié)果得到音頻分割點(diǎn)。3.使用梯度提升樹對(duì)廣告音頻與非廣告音頻進(jìn)行分類,基于音頻重復(fù)性的廣告檢測(cè)算法存在局限性,未重復(fù)出現(xiàn)的廣告不能通過(guò)該方法檢測(cè)出來(lái)。因此本文使用基于梯度提升樹的廣告檢測(cè)算法檢測(cè)音頻段中未重復(fù)出現(xiàn)的廣告。最后將兩種方法的檢測(cè)結(jié)果結(jié)合起來(lái)。
【學(xué)位單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TN931
【部分圖文】:
本節(jié)對(duì)第 2 章中涉及到的音頻特征進(jìn)行實(shí)驗(yàn)以區(qū)分上述四種音頻內(nèi)容。本節(jié)所用的實(shí)驗(yàn)數(shù)據(jù)時(shí)長(zhǎng) 4 分鐘、語(yǔ)音、含噪語(yǔ)音、背景音四種內(nèi)容類型。每種類型的音 分鐘。四個(gè)音頻片段在時(shí)間上按照歌曲、語(yǔ)音、含噪語(yǔ)音次拼接。實(shí)驗(yàn)數(shù)據(jù)為單聲道音頻文件,采樣率為 8000Hz。 50ms,幀移為 25ms。通過(guò)實(shí)驗(yàn)數(shù)據(jù)對(duì)過(guò)零率、短時(shí)能量、能量熵、頻譜中心、通量、頻譜滾降點(diǎn)、譜熵這 8 種特征在四種音頻內(nèi)容的區(qū)本節(jié)將使用實(shí)驗(yàn)音頻計(jì)算每一種音頻特征。并將計(jì)算結(jié)果坐標(biāo),音頻特征數(shù)值為縱坐標(biāo)的坐標(biāo)系中。 過(guò)零率音頻數(shù)據(jù)的過(guò)零率曲線如圖 4-1 所示,不同類型音頻通過(guò)。在時(shí)間軸上從左到右的音頻分別屬于音樂(lè)、語(yǔ)音、含噪
背景音與語(yǔ)音的過(guò)零率居中,音樂(lè)的過(guò)零率最低。區(qū)分含有語(yǔ)音的音頻段與音樂(lè)段。高過(guò)零率比率是關(guān)于過(guò)由于音樂(lè)和噪聲的幀過(guò)零率普遍較低,故音樂(lè)和噪音的高 0。因此高過(guò)零率比率同樣可以很好的區(qū)分語(yǔ)音與非語(yǔ)音高過(guò)零率比率特征適用于上述四種類型音頻的分類任務(wù)。 短時(shí)能量 4-2 中我們可以發(fā)現(xiàn),語(yǔ)音的平均短時(shí)能量最高,音樂(lè)其均短時(shí)能量較語(yǔ)音和音樂(lè)相比顯著減少。背景音的短時(shí)能 0。由于四種類型的音頻在短時(shí)能量特征上的顯著差異,分類模型使用的特征之一。低能幀比率是短時(shí)能量的統(tǒng)計(jì)能將不同類型音頻短時(shí)能量特征上的差異進(jìn)一步的放大。以作為分類器使用的特征。
能量熵對(duì)比圖
【參考文獻(xiàn)】
本文編號(hào):2883995
【學(xué)位單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TN931
【部分圖文】:
本節(jié)對(duì)第 2 章中涉及到的音頻特征進(jìn)行實(shí)驗(yàn)以區(qū)分上述四種音頻內(nèi)容。本節(jié)所用的實(shí)驗(yàn)數(shù)據(jù)時(shí)長(zhǎng) 4 分鐘、語(yǔ)音、含噪語(yǔ)音、背景音四種內(nèi)容類型。每種類型的音 分鐘。四個(gè)音頻片段在時(shí)間上按照歌曲、語(yǔ)音、含噪語(yǔ)音次拼接。實(shí)驗(yàn)數(shù)據(jù)為單聲道音頻文件,采樣率為 8000Hz。 50ms,幀移為 25ms。通過(guò)實(shí)驗(yàn)數(shù)據(jù)對(duì)過(guò)零率、短時(shí)能量、能量熵、頻譜中心、通量、頻譜滾降點(diǎn)、譜熵這 8 種特征在四種音頻內(nèi)容的區(qū)本節(jié)將使用實(shí)驗(yàn)音頻計(jì)算每一種音頻特征。并將計(jì)算結(jié)果坐標(biāo),音頻特征數(shù)值為縱坐標(biāo)的坐標(biāo)系中。 過(guò)零率音頻數(shù)據(jù)的過(guò)零率曲線如圖 4-1 所示,不同類型音頻通過(guò)。在時(shí)間軸上從左到右的音頻分別屬于音樂(lè)、語(yǔ)音、含噪
背景音與語(yǔ)音的過(guò)零率居中,音樂(lè)的過(guò)零率最低。區(qū)分含有語(yǔ)音的音頻段與音樂(lè)段。高過(guò)零率比率是關(guān)于過(guò)由于音樂(lè)和噪聲的幀過(guò)零率普遍較低,故音樂(lè)和噪音的高 0。因此高過(guò)零率比率同樣可以很好的區(qū)分語(yǔ)音與非語(yǔ)音高過(guò)零率比率特征適用于上述四種類型音頻的分類任務(wù)。 短時(shí)能量 4-2 中我們可以發(fā)現(xiàn),語(yǔ)音的平均短時(shí)能量最高,音樂(lè)其均短時(shí)能量較語(yǔ)音和音樂(lè)相比顯著減少。背景音的短時(shí)能 0。由于四種類型的音頻在短時(shí)能量特征上的顯著差異,分類模型使用的特征之一。低能幀比率是短時(shí)能量的統(tǒng)計(jì)能將不同類型音頻短時(shí)能量特征上的差異進(jìn)一步的放大。以作為分類器使用的特征。
能量熵對(duì)比圖
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 張玉珍;夏肇霖;王建宇;戴躍偉;;基于音頻和文本融合的廣告單元分割[J];南京理工大學(xué)學(xué)報(bào);2012年03期
2 姜洪臣;任曉磊;趙耀宏;徐波;;基于音頻語(yǔ)譜圖像識(shí)別的廣告檢索[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年09期
3 劉祥樓;賈東旭;李輝;姜繼玉;;說(shuō)話人識(shí)別中支持向量機(jī)核函數(shù)參數(shù)優(yōu)化研究[J];科學(xué)技術(shù)與工程;2010年07期
相關(guān)碩士學(xué)位論文 前4條
1 熊晨輝;基于音頻匹配的廣告監(jiān)播技術(shù)研究[D];電子科技大學(xué);2016年
2 曹雪昭;音頻廣告檢測(cè)算法研究[D];上海交通大學(xué);2015年
3 張楊;基于內(nèi)容的相似音視頻檢測(cè)及廣告檢測(cè)[D];北京郵電大學(xué);2014年
4 聶華;基于音頻指紋的廣告檢測(cè)技術(shù)研究[D];湘潭大學(xué);2011年
本文編號(hào):2883995
本文鏈接:http://sikaile.net/kejilunwen/wltx/2883995.html
最近更新
教材專著