基于凝聚信息瓶頸的音頻事件聚類(lèi)方法
【圖文】:
合概率分布表示數(shù)據(jù),以互信息(MutualInformation)作為度量手段,刻畫(huà)樣本和樣本屬性的相關(guān)性,不需要對(duì)樣本之間的距離函數(shù)做任何假設(shè)[20,21].它可以描述為:給定源變量X和相關(guān)變量Y的聯(lián)合概率分布P(X,Y),把源變量X(待聚類(lèi)樣本)所包含信息壓縮到目標(biāo)變量C(聚類(lèi)結(jié)果)時(shí),最大化保留目標(biāo)變量C與相關(guān)變量Y之間的互信息I(Y,C)即盡可能保留相關(guān)結(jié)構(gòu),同時(shí)盡量壓縮源變量X與目標(biāo)變量C之間的互信息I(C,X)即盡可能壓縮數(shù)據(jù).在壓縮數(shù)據(jù)和保留相關(guān)結(jié)構(gòu)的過(guò)程中,目標(biāo)變量C就相當(dāng)于源變量X和相關(guān)變量Y之間的瓶頸,如圖1所示.信息瓶頸方法試圖尋找關(guān)于相關(guān)變量Y的信息最大壓縮與最大保留之間的折衷,相當(dāng)于最大化下述目標(biāo)函數(shù):F=I(Y,C)-1βI(C,X)(1)其中β是拉格朗日乘子,用來(lái)平衡互信息I(Y,C)和互信息I(C,X)使得目標(biāo)函數(shù)F達(dá)到最大.I(Y,C)和I(C,X)分別定義為:I(Y,C)=∑y∈Y,c∈Cp(c)p(y|c)logp(y|c)p(y)(2)I(C,X)=∑x∈X,c∈Cp(x)p(c|x)logp(c|x)p(c)(3)隨機(jī)變量X~p(x)的熵H(X)定義為:H(X)=H[p(x)]=-∑x∈Xp(x)logp(x)(4)二維隨機(jī)變量(X,C)~p(x,c)的二維聯(lián)合熵H(X,C)定義為:H(X,C)=H[p(x,c)]=-∑x∈X∑c∈Cp(x,c)logp(x,c)(5)在給定X時(shí),關(guān)于X的條件熵H(C|X)定義為:H(C|X)=-∑x∈X∑c∈Cp(x,c)logp(c|x)=-∑x∈Xp(x)∑c∈Cp(c|x)logp(c|x)(6)互信息I(X,C)與熵的關(guān)系:I(X,C)=H(C)-H(C|X)=H(X)-H(X|C)(7)目標(biāo)函數(shù)F的解空間(詳見(jiàn)文獻(xiàn)[19]):1065
第 5 期 李艷雄: 基于凝聚信息瓶頸的音頻事件聚類(lèi)方法4. 2 實(shí)驗(yàn)結(jié)果采用表 2 調(diào)參數(shù)據(jù)集確定各方法參數(shù)最優(yōu)值,測(cè)試數(shù)據(jù)集用于評(píng)估各方法性能. 基于特征距離和基于模型距離的譜聚類(lèi)方法的尺度因子 σ 分別為 2 和 15.基于 AHC + BIC 方法的 BIC 懲罰系數(shù)為 2.4. 2. 1 本文方法參數(shù)的確定拉格朗日乘子 β 用來(lái)平衡聚類(lèi)過(guò)程中信息的保留與壓縮程度,其取值影響聚類(lèi)結(jié)果. K 與 β 的關(guān)系如圖2 所示. 隨著 β 的變化,K 值跟著變化,當(dāng) β = 11 時(shí),獲得最高的 K 值.間值時(shí)( 例如 β = 11) ,K 值隨著 Nc的變化也會(huì)出現(xiàn)較大變化. 在 Nc取值為[12 20],,K 值很高,且當(dāng) Nc= 14時(shí),K 值達(dá)到最大. 最優(yōu)聚類(lèi)類(lèi)別數(shù) Nc為 14. 圖 4 給出了 K 值與門(mén)限 TI的關(guān)系. 當(dāng) TI= 0. 63 時(shí),K 值達(dá)到最大. 因此,本文方法的參數(shù)設(shè)置為: 拉格朗日乘子 β =11,互信息比值門(mén)限 TI= 0. 63,聚類(lèi)后最大的類(lèi)別數(shù)Nmax= 20. Nmax的取值不小于最優(yōu)聚類(lèi)類(lèi)別數(shù)( Nc= 14) .1069
【作者單位】: 華南理工大學(xué)電子與信息學(xué)院;
【基金】:國(guó)家自然科學(xué)基金(No.61101160) 中央高;究蒲袠I(yè)務(wù)費(fèi)專(zhuān)項(xiàng)資金重點(diǎn)項(xiàng)目(No.2015ZZ102) 廣州市珠江科技新星專(zhuān)項(xiàng)(No.2013J2200070)
【分類(lèi)號(hào)】:TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 ;音頻軟件面面觀(guān)[J];信息技術(shù)教育;2005年04期
2 冰河;;看高清別忘了音頻設(shè)置[J];電腦迷;2009年06期
3 明廷堂;;一種音頻指紋構(gòu)建與搜索架構(gòu)的實(shí)現(xiàn)[J];電腦編程技巧與維護(hù);2013年07期
4 ;新型音頻編解碼軟件驅(qū)動(dòng)器改善音頻能力[J];電子設(shè)計(jì)技術(shù);2006年11期
5 唐秀林;;Nuendo音頻片段的編輯[J];音響技術(shù);2007年08期
6 郭華帥;王暉;李傳珍;;音頻原聲變速軟件的設(shè)計(jì)與應(yīng)用[J];廣播與電視技術(shù);2008年01期
7 張德成;;巧用Nero Wave Editor進(jìn)行音頻編輯[J];中小學(xué)電教;2005年12期
8 馮樹(shù)奐;張金豐;;音頻軟件的教學(xué)應(yīng)用[J];信息技術(shù)教育;2006年12期
9 王廣科;;幾種常用的音頻處理方法[J];中小學(xué)電教;2011年03期
10 ;電腦前的“口述實(shí)錄”——音頻的錄制與編輯[J];新電腦;2004年02期
相關(guān)碩士學(xué)位論文 前10條
1 尹翠微;初級(jí)音頻處理軟件界面設(shè)計(jì)的圖形語(yǔ)言研究[D];北京理工大學(xué);2015年
2 林平;基于音樂(lè)特征解析的音樂(lè)噴泉展示系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
3 王宇;新聞通訊社音頻移動(dòng)報(bào)道系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];天津大學(xué);2014年
4 李樹(shù)春;廣播音頻編輯與制作軟件的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2009年
5 王潤(rùn)濤;海量音頻指紋數(shù)據(jù)的存儲(chǔ)與檢索研究[D];天津大學(xué);2014年
6 潘敏;音頻盾的設(shè)計(jì)與實(shí)現(xiàn)[D];中國(guó)科學(xué)院大學(xué)(工程管理與信息技術(shù)學(xué)院);2014年
7 王運(yùn)生;基于內(nèi)容的海量音頻高效檢索[D];太原理工大學(xué);2014年
8 王曉霞;基于音頻特征的收視率調(diào)查系統(tǒng)及檢索算法研究[D];山東大學(xué);2011年
9 盧曉晶;廣播電臺(tái)音頻節(jié)目采集與管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];東北大學(xué);2010年
10 孟建華;基于聽(tīng)覺(jué)濾波器的音頻感知哈希算法及其在音樂(lè)檢索中的應(yīng)用[D];華東理工大學(xué);2015年
本文編號(hào):2521947
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2521947.html