用于跨庫語音情感識別的DBN特征融合方法
[Abstract]:In cross-database speech emotion recognition, it is a difficult technology to fuse emotion features extracted from different scales. In this paper, a method of feature level fusion based on deep belief network is proposed by using the deep belief model in the field of deep learning. The emotional information implied in the speech spectrum is taken as the image feature and fused with the traditional emotional feature. This paper studies and solves the technical difficulties of fusion of emotion features extracted from different scales in cross-database speech emotion recognition. The STB/Itti model is used to analyze the spectrogram, and a new feature is extracted from three aspects: color, brightness and direction. Then the improved DBN network model is studied and the traditional acoustic features and the newly extracted spectral features are fused into the feature layer to enhance the scale of the feature subset and enhance the ability of emotional representation. The experimental results on ABC database and Chinese database show that the new feature subset after feature fusion is better than the traditional speech emotion feature, and the result of cross-database recognition is obviously improved.
【作者單位】: 東南大學水聲信號處理教育部重點實驗室;煙臺大學計算機與控制工程學院;
【基金】:國家自然科學基金項目(61673108,61231002,61375028) 山東省自然科學基金(ZR2014FQ016)
【分類號】:TN912.34
【相似文獻】
相關期刊論文 前10條
1 趙力;黃程韋;;實用語音情感識別中的若干關鍵技術[J];數(shù)據采集與處理;2014年02期
2 王茜;;一個語音情感識別系統(tǒng)的設計與實現(xiàn)[J];大眾科技;2006年08期
3 孫亞;;遠程教學中語音情感識別系統(tǒng)的研究與實現(xiàn)[J];長春理工大學學報(高教版);2008年02期
4 章國寶;宋清華;費樹岷;趙艷;;語音情感識別研究[J];計算機技術與發(fā)展;2009年01期
5 石瑛;胡學鋼;方磊;;基于決策樹的多特征語音情感識別[J];計算機技術與發(fā)展;2009年01期
6 張石清;趙知勁;;噪聲背景下的語音情感識別[J];西南交通大學學報;2009年03期
7 黃程韋;金峗;王青云;趙艷;趙力;;基于特征空間分解與融合的語音情感識別[J];信號處理;2010年06期
8 余華;徐開軍;;基于模糊集理論的語音情感識別[J];信息化研究;2011年02期
9 曾光菊;;基于粗神經網絡的語音情感識別[J];四川理工學院學報(自然科學版);2011年04期
10 韓文靜;李海峰;馬琳;;考慮情感程度相對順序的維度語音情感識別[J];信號處理;2011年11期
相關會議論文 前8條
1 陳建廈;;語音情感識別綜述[A];第一屆中國情感計算及智能交互學術會議論文集[C];2003年
2 楊桃香;楊鑒;畢福昆;;基于模糊聚類的語音情感識別[A];第三屆和諧人機環(huán)境聯(lián)合學術會議(HHME2007)論文集[C];2007年
3 羅武駿;包永強;趙力;;基于模糊支持向量機的語音情感識別方法[A];2012'中國西部聲學學術交流會論文集(Ⅱ)[C];2012年
4 王青;謝波;陳根才;;基于神經網絡的漢語語音情感識別[A];第一屆中國情感計算及智能交互學術會議論文集[C];2003年
5 張鼎天;徐明星;;基于調制頻譜特征的自動語音情感識別[A];第十二屆全國人機語音通訊學術會議(NCMMSC'2013)論文集[C];2013年
6 童燦;;基于boosting HMM的語音情感識別[A];2008年中國高校通信類院系學術研討會論文集(下冊)[C];2009年
7 戴明洋;楊大利;徐明星;;語音情感識別中UBM訓練集的組成研究[A];第十一屆全國人機語音通訊學術會議論文集(一)[C];2011年
8 張衛(wèi);張雪英;孫穎;;基于HHT邊際Teager能量譜的語音情感識別[A];第十二屆全國人機語音通訊學術會議(NCMMSC'2013)論文集[C];2013年
相關博士學位論文 前4條
1 孫亞新;語音情感識別中的特征提取與識別算法研究[D];華南理工大學;2015年
2 王坤俠;語音情感識別方法研究[D];合肥工業(yè)大學;2015年
3 韓文靜;語音情感識別關鍵技術研究[D];哈爾濱工業(yè)大學;2013年
4 謝波;普通話語音情感識別關鍵技術研究[D];浙江大學;2006年
相關碩士學位論文 前10條
1 陳曉東;基于卷積神經網絡的語音情感識別[D];華南理工大學;2015年
2 孫志鋒;語音情感識別研究[D];陜西師范大學;2015年
3 譚發(fā)曾;語音情感狀態(tài)模糊識別研究[D];電子科技大學;2015年
4 陳鑫;相空間重構在語音情感識別中的研究[D];長沙理工大學;2014年
5 李昌群;基于特征選擇的語音情感識別[D];合肥工業(yè)大學;2015年
6 陳文汐;基于核函數(shù)的語音情感識別技術的研究[D];東南大學;2015年
7 薛文韜;基于深度學習和遷移學習的語音情感識別方法研究[D];江蘇大學;2016年
8 宋明虎;電力行業(yè)電話電話客服語音情感識別[D];昆明理工大學;2016年
9 陳肖;基于多粒度特征融合的維度語音情感識別方法研究[D];哈爾濱工業(yè)大學;2016年
10 任浩;基于多級分類的語音情感識別[D];哈爾濱工業(yè)大學;2016年
,本文編號:2413146
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/2413146.html