基于神經(jīng)網(wǎng)絡(luò)的語音情感識別算法研究
發(fā)布時間:2023-03-18 21:37
在計算機(jī)技術(shù)領(lǐng)域,未來的目標(biāo)將是減少人與機(jī)器的溝通障礙。提取信號中蘊(yùn)含的情感特征來判斷情緒波動的語音情感研究已成為一個很有發(fā)展?jié)摿Φ难芯空n題。結(jié)合語音情感識別的廣泛需求,本文研究了基于神經(jīng)網(wǎng)絡(luò)的語音情感識別算法。具體研究內(nèi)容如下:提取了四種不同情感的語音特征。四種不同情感為生氣、害怕、快樂和傷心。首先提取了語速、短時平均能量、短時平均過零率和基音頻率四個韻律學(xué)特征;然后提取了音質(zhì)特征共振峰;最后提取了基于譜的相關(guān)特征梅爾頻率倒譜系數(shù)。研究了基于BP神經(jīng)網(wǎng)絡(luò)的語音情感識別算法。首先對BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,其中輸入為不同語音特征組成的行向量,最后對不同情感類別的語音進(jìn)行識別;贐P神經(jīng)網(wǎng)絡(luò)的語音情感識別實(shí)驗(yàn)主要從迭代訓(xùn)練次數(shù)、學(xué)習(xí)率、隱含層神經(jīng)元個數(shù)、樣本集個數(shù)、不同特征組合和情感種類數(shù)六個方面展開。實(shí)驗(yàn)結(jié)果表明:當(dāng)對四種不同的情感兩兩組合時,語音情感識別率在65.85%到91.00%之間;本文對四種不同情感的識別率比選用支持向量機(jī)算法提高了5.47%。研究了基于卷積神經(jīng)網(wǎng)絡(luò)的語音情感識別算法。首先對卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,其中特征輸入為一個梅爾頻率倒譜系數(shù)情感特征組成的矩陣,最終對不同情...
【文章頁數(shù)】:91 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號對照表
縮略語對照表
第一章 緒論
1.1 課題研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文研究內(nèi)容及章節(jié)安排
第二章 語音情感識別的基本理論
2.1 語音情感研究的基本流程
2.2 情感理論
2.2.1 情緒的有限狀態(tài)集和維度空間
2.2.2 語音情感理論
2.2.3 語音情感語料庫簡介
2.3 語音信號預(yù)處理
2.3.1 語音信號預(yù)加重
2.3.2 語音信號分幀和加窗
2.4 語音特征分類
2.5 語音情感分類器
2.6 本章小結(jié)
第三章 語音情感特征的分析及提取
3.1 語音韻律學(xué)情感特征的分析及提取
3.2 語音音質(zhì)情感特征的分析及提取
3.3 語音譜相關(guān)情感特征的分析及提取
3.4 語音特征的統(tǒng)計學(xué)參數(shù)
3.5 本章小結(jié)
第四章 基于BP神經(jīng)網(wǎng)絡(luò)的語音情感識別算法研究
4.1 BP神經(jīng)網(wǎng)絡(luò)基礎(chǔ)
4.1.1 BP神經(jīng)網(wǎng)絡(luò)的基本原理
4.1.2 BP神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)表達(dá)
4.1.3 BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練步驟
4.2 BP神經(jīng)網(wǎng)絡(luò)算法用于語音情感識別的方案設(shè)計
4.2.1 BP神經(jīng)網(wǎng)絡(luò)算法的特征輸入
4.2.2 BP神經(jīng)網(wǎng)絡(luò)算法的參數(shù)設(shè)置
4.3 基于BP神經(jīng)網(wǎng)絡(luò)的語音情感識別實(shí)驗(yàn)
4.3.1 迭代訓(xùn)練次數(shù)對BP神經(jīng)網(wǎng)絡(luò)識別性能的影響
4.3.2 學(xué)習(xí)率對BP神經(jīng)網(wǎng)絡(luò)識別性能的影響
4.3.3 隱含層神經(jīng)元個數(shù)對BP神經(jīng)網(wǎng)絡(luò)識別性能的影響
4.3.4 樣本集個數(shù)對語音情感識別率的影響
4.3.5 不同特征組合的BP神經(jīng)網(wǎng)絡(luò)識別率比較
4.3.6 情感種類對BP神經(jīng)網(wǎng)絡(luò)識別率的影響
4.3.7 實(shí)驗(yàn)分析
4.4 本章小結(jié)
第五章 基于卷積神經(jīng)網(wǎng)絡(luò)的語音情感識別算法研究
5.1 卷積神經(jīng)網(wǎng)絡(luò)實(shí)驗(yàn)工具簡介
5.2 卷積神經(jīng)網(wǎng)絡(luò)的基本理論
5.2.1 卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)
5.2.2 卷積神經(jīng)網(wǎng)絡(luò)的求解和訓(xùn)練過程
5.3 卷積神經(jīng)網(wǎng)絡(luò)算法用于語音情感識別的方案設(shè)計
5.3.1 卷積神經(jīng)網(wǎng)絡(luò)算法的特征輸入
5.3.2 卷積神經(jīng)網(wǎng)絡(luò)算法的參數(shù)設(shè)置
5.3.3 卷積神經(jīng)網(wǎng)絡(luò)算法的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計
5.4 基于卷積神經(jīng)網(wǎng)絡(luò)的語音情感識別實(shí)驗(yàn)
5.4.1 卷積神經(jīng)網(wǎng)絡(luò)算法的訓(xùn)練過程
5.4.2 情感種類對卷積神經(jīng)網(wǎng)絡(luò)識別率的影響
5.4.3 訓(xùn)練集個數(shù)對情感識別率的影響
5.4.4 卷積神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)兩種語音情感識別算法比較
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
作者簡介
本文編號:3763916
【文章頁數(shù)】:91 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號對照表
縮略語對照表
第一章 緒論
1.1 課題研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文研究內(nèi)容及章節(jié)安排
第二章 語音情感識別的基本理論
2.1 語音情感研究的基本流程
2.2 情感理論
2.2.1 情緒的有限狀態(tài)集和維度空間
2.2.2 語音情感理論
2.2.3 語音情感語料庫簡介
2.3 語音信號預(yù)處理
2.3.1 語音信號預(yù)加重
2.3.2 語音信號分幀和加窗
2.4 語音特征分類
2.5 語音情感分類器
2.6 本章小結(jié)
第三章 語音情感特征的分析及提取
3.1 語音韻律學(xué)情感特征的分析及提取
3.2 語音音質(zhì)情感特征的分析及提取
3.3 語音譜相關(guān)情感特征的分析及提取
3.4 語音特征的統(tǒng)計學(xué)參數(shù)
3.5 本章小結(jié)
第四章 基于BP神經(jīng)網(wǎng)絡(luò)的語音情感識別算法研究
4.1 BP神經(jīng)網(wǎng)絡(luò)基礎(chǔ)
4.1.1 BP神經(jīng)網(wǎng)絡(luò)的基本原理
4.1.2 BP神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)表達(dá)
4.1.3 BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練步驟
4.2 BP神經(jīng)網(wǎng)絡(luò)算法用于語音情感識別的方案設(shè)計
4.2.1 BP神經(jīng)網(wǎng)絡(luò)算法的特征輸入
4.2.2 BP神經(jīng)網(wǎng)絡(luò)算法的參數(shù)設(shè)置
4.3 基于BP神經(jīng)網(wǎng)絡(luò)的語音情感識別實(shí)驗(yàn)
4.3.1 迭代訓(xùn)練次數(shù)對BP神經(jīng)網(wǎng)絡(luò)識別性能的影響
4.3.2 學(xué)習(xí)率對BP神經(jīng)網(wǎng)絡(luò)識別性能的影響
4.3.3 隱含層神經(jīng)元個數(shù)對BP神經(jīng)網(wǎng)絡(luò)識別性能的影響
4.3.4 樣本集個數(shù)對語音情感識別率的影響
4.3.5 不同特征組合的BP神經(jīng)網(wǎng)絡(luò)識別率比較
4.3.6 情感種類對BP神經(jīng)網(wǎng)絡(luò)識別率的影響
4.3.7 實(shí)驗(yàn)分析
4.4 本章小結(jié)
第五章 基于卷積神經(jīng)網(wǎng)絡(luò)的語音情感識別算法研究
5.1 卷積神經(jīng)網(wǎng)絡(luò)實(shí)驗(yàn)工具簡介
5.2 卷積神經(jīng)網(wǎng)絡(luò)的基本理論
5.2.1 卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)
5.2.2 卷積神經(jīng)網(wǎng)絡(luò)的求解和訓(xùn)練過程
5.3 卷積神經(jīng)網(wǎng)絡(luò)算法用于語音情感識別的方案設(shè)計
5.3.1 卷積神經(jīng)網(wǎng)絡(luò)算法的特征輸入
5.3.2 卷積神經(jīng)網(wǎng)絡(luò)算法的參數(shù)設(shè)置
5.3.3 卷積神經(jīng)網(wǎng)絡(luò)算法的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計
5.4 基于卷積神經(jīng)網(wǎng)絡(luò)的語音情感識別實(shí)驗(yàn)
5.4.1 卷積神經(jīng)網(wǎng)絡(luò)算法的訓(xùn)練過程
5.4.2 情感種類對卷積神經(jīng)網(wǎng)絡(luò)識別率的影響
5.4.3 訓(xùn)練集個數(shù)對情感識別率的影響
5.4.4 卷積神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)兩種語音情感識別算法比較
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
作者簡介
本文編號:3763916
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3763916.html
最近更新
教材專著