基于特征選擇和優(yōu)化的語音情感識別研究
發(fā)布時間:2021-01-09 09:34
隨著人工智能的發(fā)展,人們對機器的智能化研究更加深入,使機器具備和人一樣的情感和思維是人機交互的重要難題。語音情感識別是情感識別領域中很重要的分支,在科學研究和商業(yè)應用這兩個方面都存在很大的潛在價值。根據(jù)語音情感識別的科研與商業(yè)需要,本文基于特征選擇和優(yōu)化研究了語音情感識別這個課題。具體研究內容如下:提取語音中與情感相關的特征。包括四個韻律學特征:語速、基音頻率、短時平均能量和短時平均過零率,一個音質特征:共振峰頻率,以及一個頻譜相關特征:梅爾頻率倒譜系數(shù)。并獲取了上述特征的統(tǒng)計參數(shù)。研究了基于隨機森林的語音情感特征選擇算法。根據(jù)提取到的語音情感特征,研究了幾種情感相關特征對不同情感語音的識別準確率。根據(jù)基于隨機森林的特征選擇算法,得到四種情感語音的最優(yōu)特征組合,對四種情感兩兩組合獲得的六種情感組合,針對每種情感組合得到其最優(yōu)的特征組合。研究了基于卷積神經網絡的語音情感識別算法。首先,將MFCC與隨機森林特征選擇得到的特征組合起來作為輸入特征,根據(jù)輸入特征尺寸構建卷積神經網絡模型,然后訓練卷積神經網絡,最終得到不同情感類別的語音的情感識別準確率。實驗結果表明:使用卷積神經網絡作為最終分類...
【文章來源】:西安電子科技大學陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:86 頁
【學位級別】:碩士
【部分圖文】:
圖4.2兩種情感特征輸入時matlab仿真的網絡結構
高興和傷心40個特征輸入的情感識別率訓練結果圖
高興和傷心46個特征輸入的情感識別率訓練結果圖
【參考文獻】:
期刊論文
[1]語音情感特征提取及其降維方法綜述[J]. 劉振燾,徐建平,吳敏,曹衛(wèi)華,陳略峰,丁學文,郝曼,謝橋. 計算機學報. 2018(12)
[2]語音情感識別分類算法研究綜述[J]. 李銀河,李雪暉,徐楠,鐘文雅,趙新仕,程曉燕,孫峰,袁鍵. 南陽師范學院學報. 2017(06)
[3]用于跨庫語音情感識別的DBN特征融合方法[J]. 張昕然,巨曉正,宋鵬,查誠,趙力. 信號處理. 2017(05)
[4]基于情感維度理論的教師效果評價方法[J]. 高鑫鑫. 林區(qū)教學. 2017(03)
[5]中國人工智能40年[J]. 蔡自興. 科技導報. 2016(15)
[6]基于卷積神經網絡的語音情感識別方法[J]. 邵兵,杜鵬飛. 科技創(chuàng)新導報. 2016(06)
[7]大數(shù)據(jù)網絡環(huán)境下輿情信息情感維度模型構建研究[J]. 劉英杰,黃微,李瑞. 情報理論與實踐. 2016(04)
[8]基于經驗模態(tài)分解結合傅氏變換與Wigner分布的Mel頻率倒譜系數(shù)提取[J]. 曾以成,陳雨鶯,毛燕湖,謝小娟. 湘潭大學自然科學學報. 2015(02)
[9]基于隨機森林的不平衡特征選擇算法[J]. 尹華,胡玉平. 中山大學學報(自然科學版). 2014(05)
[10]語音情感識別研究進展綜述[J]. 韓文靜,李海峰,阮華斌,馬琳. 軟件學報. 2014(01)
碩士論文
[1]基于神經網絡的語音情感識別算法研究[D]. 喬文婷.西安電子科技大學 2018
[2]基于深度學習的語音情感識別方法的研究[D]. 朱從賢.東南大學 2016
[3]基于隨機森林的語音情感識別研究[D]. 劉進華.華南理工大學 2013
本文編號:2966398
【文章來源】:西安電子科技大學陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:86 頁
【學位級別】:碩士
【部分圖文】:
圖4.2兩種情感特征輸入時matlab仿真的網絡結構
高興和傷心40個特征輸入的情感識別率訓練結果圖
高興和傷心46個特征輸入的情感識別率訓練結果圖
【參考文獻】:
期刊論文
[1]語音情感特征提取及其降維方法綜述[J]. 劉振燾,徐建平,吳敏,曹衛(wèi)華,陳略峰,丁學文,郝曼,謝橋. 計算機學報. 2018(12)
[2]語音情感識別分類算法研究綜述[J]. 李銀河,李雪暉,徐楠,鐘文雅,趙新仕,程曉燕,孫峰,袁鍵. 南陽師范學院學報. 2017(06)
[3]用于跨庫語音情感識別的DBN特征融合方法[J]. 張昕然,巨曉正,宋鵬,查誠,趙力. 信號處理. 2017(05)
[4]基于情感維度理論的教師效果評價方法[J]. 高鑫鑫. 林區(qū)教學. 2017(03)
[5]中國人工智能40年[J]. 蔡自興. 科技導報. 2016(15)
[6]基于卷積神經網絡的語音情感識別方法[J]. 邵兵,杜鵬飛. 科技創(chuàng)新導報. 2016(06)
[7]大數(shù)據(jù)網絡環(huán)境下輿情信息情感維度模型構建研究[J]. 劉英杰,黃微,李瑞. 情報理論與實踐. 2016(04)
[8]基于經驗模態(tài)分解結合傅氏變換與Wigner分布的Mel頻率倒譜系數(shù)提取[J]. 曾以成,陳雨鶯,毛燕湖,謝小娟. 湘潭大學自然科學學報. 2015(02)
[9]基于隨機森林的不平衡特征選擇算法[J]. 尹華,胡玉平. 中山大學學報(自然科學版). 2014(05)
[10]語音情感識別研究進展綜述[J]. 韓文靜,李海峰,阮華斌,馬琳. 軟件學報. 2014(01)
碩士論文
[1]基于神經網絡的語音情感識別算法研究[D]. 喬文婷.西安電子科技大學 2018
[2]基于深度學習的語音情感識別方法的研究[D]. 朱從賢.東南大學 2016
[3]基于隨機森林的語音情感識別研究[D]. 劉進華.華南理工大學 2013
本文編號:2966398
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2966398.html
最近更新
教材專著