基于凝聚信息瓶頸的音頻事件聚類方法
【圖文】:
合概率分布表示數(shù)據(jù),以互信息(MutualInformation)作為度量手段,刻畫樣本和樣本屬性的相關性,不需要對樣本之間的距離函數(shù)做任何假設[20,21].它可以描述為:給定源變量X和相關變量Y的聯(lián)合概率分布P(X,Y),把源變量X(待聚類樣本)所包含信息壓縮到目標變量C(聚類結果)時,最大化保留目標變量C與相關變量Y之間的互信息I(Y,C)即盡可能保留相關結構,同時盡量壓縮源變量X與目標變量C之間的互信息I(C,X)即盡可能壓縮數(shù)據(jù).在壓縮數(shù)據(jù)和保留相關結構的過程中,目標變量C就相當于源變量X和相關變量Y之間的瓶頸,如圖1所示.信息瓶頸方法試圖尋找關于相關變量Y的信息最大壓縮與最大保留之間的折衷,相當于最大化下述目標函數(shù):F=I(Y,C)-1βI(C,X)(1)其中β是拉格朗日乘子,用來平衡互信息I(Y,C)和互信息I(C,X)使得目標函數(shù)F達到最大.I(Y,C)和I(C,X)分別定義為:I(Y,C)=∑y∈Y,c∈Cp(c)p(y|c)logp(y|c)p(y)(2)I(C,X)=∑x∈X,c∈Cp(x)p(c|x)logp(c|x)p(c)(3)隨機變量X~p(x)的熵H(X)定義為:H(X)=H[p(x)]=-∑x∈Xp(x)logp(x)(4)二維隨機變量(X,C)~p(x,c)的二維聯(lián)合熵H(X,C)定義為:H(X,C)=H[p(x,c)]=-∑x∈X∑c∈Cp(x,c)logp(x,c)(5)在給定X時,關于X的條件熵H(C|X)定義為:H(C|X)=-∑x∈X∑c∈Cp(x,c)logp(c|x)=-∑x∈Xp(x)∑c∈Cp(c|x)logp(c|x)(6)互信息I(X,C)與熵的關系:I(X,C)=H(C)-H(C|X)=H(X)-H(X|C)(7)目標函數(shù)F的解空間(詳見文獻[19]):1065
第 5 期 李艷雄: 基于凝聚信息瓶頸的音頻事件聚類方法4. 2 實驗結果采用表 2 調(diào)參數(shù)據(jù)集確定各方法參數(shù)最優(yōu)值,測試數(shù)據(jù)集用于評估各方法性能. 基于特征距離和基于模型距離的譜聚類方法的尺度因子 σ 分別為 2 和 15.基于 AHC + BIC 方法的 BIC 懲罰系數(shù)為 2.4. 2. 1 本文方法參數(shù)的確定拉格朗日乘子 β 用來平衡聚類過程中信息的保留與壓縮程度,其取值影響聚類結果. K 與 β 的關系如圖2 所示. 隨著 β 的變化,K 值跟著變化,當 β = 11 時,獲得最高的 K 值.間值時( 例如 β = 11) ,K 值隨著 Nc的變化也會出現(xiàn)較大變化. 在 Nc取值為[12 20],,K 值很高,且當 Nc= 14時,K 值達到最大. 最優(yōu)聚類類別數(shù) Nc為 14. 圖 4 給出了 K 值與門限 TI的關系. 當 TI= 0. 63 時,K 值達到最大. 因此,本文方法的參數(shù)設置為: 拉格朗日乘子 β =11,互信息比值門限 TI= 0. 63,聚類后最大的類別數(shù)Nmax= 20. Nmax的取值不小于最優(yōu)聚類類別數(shù)( Nc= 14) .1069
【作者單位】: 華南理工大學電子與信息學院;
【基金】:國家自然科學基金(No.61101160) 中央高;究蒲袠I(yè)務費專項資金重點項目(No.2015ZZ102) 廣州市珠江科技新星專項(No.2013J2200070)
【分類號】:TP311.13
【相似文獻】
相關期刊論文 前10條
1 ;音頻軟件面面觀[J];信息技術教育;2005年04期
2 冰河;;看高清別忘了音頻設置[J];電腦迷;2009年06期
3 明廷堂;;一種音頻指紋構建與搜索架構的實現(xiàn)[J];電腦編程技巧與維護;2013年07期
4 ;新型音頻編解碼軟件驅動器改善音頻能力[J];電子設計技術;2006年11期
5 唐秀林;;Nuendo音頻片段的編輯[J];音響技術;2007年08期
6 郭華帥;王暉;李傳珍;;音頻原聲變速軟件的設計與應用[J];廣播與電視技術;2008年01期
7 張德成;;巧用Nero Wave Editor進行音頻編輯[J];中小學電教;2005年12期
8 馮樹奐;張金豐;;音頻軟件的教學應用[J];信息技術教育;2006年12期
9 王廣科;;幾種常用的音頻處理方法[J];中小學電教;2011年03期
10 ;電腦前的“口述實錄”——音頻的錄制與編輯[J];新電腦;2004年02期
相關碩士學位論文 前10條
1 尹翠微;初級音頻處理軟件界面設計的圖形語言研究[D];北京理工大學;2015年
2 林平;基于音樂特征解析的音樂噴泉展示系統(tǒng)的設計與實現(xiàn)[D];電子科技大學;2014年
3 王宇;新聞通訊社音頻移動報道系統(tǒng)設計與實現(xiàn)[D];天津大學;2014年
4 李樹春;廣播音頻編輯與制作軟件的設計與實現(xiàn)[D];電子科技大學;2009年
5 王潤濤;海量音頻指紋數(shù)據(jù)的存儲與檢索研究[D];天津大學;2014年
6 潘敏;音頻盾的設計與實現(xiàn)[D];中國科學院大學(工程管理與信息技術學院);2014年
7 王運生;基于內(nèi)容的海量音頻高效檢索[D];太原理工大學;2014年
8 王曉霞;基于音頻特征的收視率調(diào)查系統(tǒng)及檢索算法研究[D];山東大學;2011年
9 盧曉晶;廣播電臺音頻節(jié)目采集與管理系統(tǒng)的設計與實現(xiàn)[D];東北大學;2010年
10 孟建華;基于聽覺濾波器的音頻感知哈希算法及其在音樂檢索中的應用[D];華東理工大學;2015年
本文編號:2521947
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2521947.html