基于特征篩選和決策樹SVM的語音情感識別技術(shù)研究
發(fā)布時間:2023-05-11 02:45
語音作為人類日常生活交流的主要方式,承載著說話人豐富的情感信息。真正意義上的人工智能需要機(jī)器從情感層面充分理解人類的意圖,因此語音情感識別在未來的人工智能領(lǐng)域具有廣闊的應(yīng)用前景。目前,在語音情感識別的基本框架下,尋找一種具有高區(qū)分度的語音情感特征和構(gòu)建高效的識別模型是當(dāng)今研究的熱點(diǎn)問題,它們的好壞直接影響著整個系統(tǒng)的識別效果。本文針對多種情感識別的情況,從特征參數(shù)和模型兩個方面出發(fā),提出了基于特征篩選和決策樹SVM的語音情感識別方法以及基于DNN-決策樹SVM的語音情感識別方法。本文的主要研究工作如下:(1)通過對語音情感識別的研究背景以及研究現(xiàn)狀的充分學(xué)習(xí),熟練掌握了語音情感識別的基本框架以及常用的識別方法。本文介紹了語音情感識別領(lǐng)域中的常用語料庫、語音預(yù)處理技術(shù)以及常用的特征參數(shù),并分析了各類特征參數(shù)的特性。除此之外,本文還介紹了特征參數(shù)的統(tǒng)計變量計算方法以及歸一化方法,為后續(xù)的研究工作打下了扎實(shí)的基礎(chǔ)。(2)在多種情感的識別任務(wù)中,由于情感間的混淆度增大而導(dǎo)致系統(tǒng)的整體識別率降低。針對此問題,本文提出了Fisher特征篩選決策樹支持向量機(jī)(SVM)模型的語音情感識別方法。該方法首...
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
專用術(shù)語注釋表
第一章 緒論
1.1 研究背景
1.2 研究現(xiàn)狀
1.3 本文研究內(nèi)容與安排
第二章 語音情感識別技術(shù)概述
2.1 語音情感識別系統(tǒng)的基本結(jié)構(gòu)
2.2 常用的情感語料庫
2.2.1 離散情感語料庫
2.2.2 維度情感語料庫
2.3 語音信號的預(yù)處理技術(shù)
2.3.1 預(yù)加重
2.3.2 分幀與加窗
2.3.3 端點(diǎn)檢測
2.4 語音情感識別中的常用特征參數(shù)
2.4.1 能量
2.4.2 短時過零率
2.4.3 基音頻率
2.4.4 梅爾倒譜系數(shù)
2.4.5 傅里葉系數(shù)
2.5 統(tǒng)計特性
2.6 歸一化方法
2.7 本章小結(jié)
第三章 基于特征篩選決策樹SVM的語音情感識別
3.1 引言
3.2 支持向量機(jī)
3.3 決策樹SVM的構(gòu)建策略
3.4 SVM參數(shù)尋優(yōu)算法
3.4.1 粒子群優(yōu)化算法
3.4.2 遺傳算法
3.5 特征篩選方法
3.5.1 主成分分析法
3.5.2 Fisher判決準(zhǔn)則
3.6 基于特征篩選決策樹SVM模型的構(gòu)建
3.7 實(shí)驗仿真與結(jié)果分析
3.7.1 實(shí)驗語料庫及實(shí)驗環(huán)境
3.7.2 特征參數(shù)篩選及維數(shù)選擇
3.7.3 本章方法與其他方法的性能比較
3.7.4 SVM參數(shù)對識別性能的影響
3.8 本章小結(jié)
第四章 基于DNN-決策樹SVM的語音情感識別系統(tǒng)
4.1 引言
4.2 深度學(xué)習(xí)發(fā)展史
4.3 深度學(xué)習(xí)理論基礎(chǔ)
4.3.1 基于RBM的預(yù)訓(xùn)練
4.3.2 精細(xì)調(diào)整
4.4 深度神經(jīng)網(wǎng)絡(luò)的參數(shù)說明
4.4.1 預(yù)處理方式
4.4.2 批量塊大小的選擇
4.4.3 學(xué)習(xí)速率
4.4.4 網(wǎng)絡(luò)結(jié)構(gòu)
4.5 提取瓶頸特征的DNN網(wǎng)絡(luò)
4.6 基于DNN-決策樹SVM的語音情感識別系統(tǒng)
4.7 實(shí)驗仿真與結(jié)果分析
4.7.1 實(shí)驗數(shù)據(jù)及實(shí)驗環(huán)境
4.7.2 不同網(wǎng)絡(luò)參數(shù)值的對比實(shí)驗
4.7.3 瓶頸層特征與傳統(tǒng)特征的對比實(shí)驗
4.7.4 DNN-SVM網(wǎng)絡(luò)與DNN-決策樹SVM網(wǎng)絡(luò)的對比實(shí)驗
4.8 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間撰寫的論文
附錄2 攻讀碩士學(xué)位期間參加的科研項目
致謝
本文編號:3814000
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
專用術(shù)語注釋表
第一章 緒論
1.1 研究背景
1.2 研究現(xiàn)狀
1.3 本文研究內(nèi)容與安排
第二章 語音情感識別技術(shù)概述
2.1 語音情感識別系統(tǒng)的基本結(jié)構(gòu)
2.2 常用的情感語料庫
2.2.1 離散情感語料庫
2.2.2 維度情感語料庫
2.3 語音信號的預(yù)處理技術(shù)
2.3.1 預(yù)加重
2.3.2 分幀與加窗
2.3.3 端點(diǎn)檢測
2.4 語音情感識別中的常用特征參數(shù)
2.4.1 能量
2.4.2 短時過零率
2.4.3 基音頻率
2.4.4 梅爾倒譜系數(shù)
2.4.5 傅里葉系數(shù)
2.5 統(tǒng)計特性
2.6 歸一化方法
2.7 本章小結(jié)
第三章 基于特征篩選決策樹SVM的語音情感識別
3.1 引言
3.2 支持向量機(jī)
3.3 決策樹SVM的構(gòu)建策略
3.4 SVM參數(shù)尋優(yōu)算法
3.4.1 粒子群優(yōu)化算法
3.4.2 遺傳算法
3.5 特征篩選方法
3.5.1 主成分分析法
3.5.2 Fisher判決準(zhǔn)則
3.6 基于特征篩選決策樹SVM模型的構(gòu)建
3.7 實(shí)驗仿真與結(jié)果分析
3.7.1 實(shí)驗語料庫及實(shí)驗環(huán)境
3.7.2 特征參數(shù)篩選及維數(shù)選擇
3.7.3 本章方法與其他方法的性能比較
3.7.4 SVM參數(shù)對識別性能的影響
3.8 本章小結(jié)
第四章 基于DNN-決策樹SVM的語音情感識別系統(tǒng)
4.1 引言
4.2 深度學(xué)習(xí)發(fā)展史
4.3 深度學(xué)習(xí)理論基礎(chǔ)
4.3.1 基于RBM的預(yù)訓(xùn)練
4.3.2 精細(xì)調(diào)整
4.4 深度神經(jīng)網(wǎng)絡(luò)的參數(shù)說明
4.4.1 預(yù)處理方式
4.4.2 批量塊大小的選擇
4.4.3 學(xué)習(xí)速率
4.4.4 網(wǎng)絡(luò)結(jié)構(gòu)
4.5 提取瓶頸特征的DNN網(wǎng)絡(luò)
4.6 基于DNN-決策樹SVM的語音情感識別系統(tǒng)
4.7 實(shí)驗仿真與結(jié)果分析
4.7.1 實(shí)驗數(shù)據(jù)及實(shí)驗環(huán)境
4.7.2 不同網(wǎng)絡(luò)參數(shù)值的對比實(shí)驗
4.7.3 瓶頸層特征與傳統(tǒng)特征的對比實(shí)驗
4.7.4 DNN-SVM網(wǎng)絡(luò)與DNN-決策樹SVM網(wǎng)絡(luò)的對比實(shí)驗
4.8 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間撰寫的論文
附錄2 攻讀碩士學(xué)位期間參加的科研項目
致謝
本文編號:3814000
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/3814000.html
最近更新
教材專著