基于改進LSTM的兒童語音情感識別模型
發(fā)布時間:2022-12-08 02:20
為實現(xiàn)不同兒童情感需求狀態(tài)下幀級語音特征的有效獲取,建立一種基于改進長短時記憶(LSTM)網(wǎng)絡(luò)的兒童語音情感識別模型。采用幀級語音特征代替?zhèn)鹘y(tǒng)統(tǒng)計特征以保留原始語音中的時序關(guān)系,通過引入注意力機制將傳統(tǒng)遺忘門和輸入門轉(zhuǎn)換為注意力門,并根據(jù)自定義的深度策略計算得到深度注意力門,從而提高語音情感識別性能。實驗結(jié)果表明,在Fau Aibo兒童情感數(shù)據(jù)語料庫及嬰兒哭聲情感需求數(shù)據(jù)庫上,該模型在召回率和F1分數(shù)上相比基于傳統(tǒng)LSTM的識別模型分別提高了3.14%、5.50%和1.84%、5.49%,在CASIA中文情感數(shù)據(jù)庫上,其相比基于傳統(tǒng)LSTM和GRU的識別模型訓練時間更短、兒童語音情感識別率更高。
【文章頁數(shù)】:10 頁
【文章目錄】:
0 概述
1 相關(guān)工作
1.1 LSTM網(wǎng)絡(luò)
1.2 注意力機制
2 改進的深度注意力門
2.1 注意力門
2.2 深度注意力門
2.3 訓練整體框架
3 實驗設(shè)置與分析
3.1 實驗設(shè)置
3.2 幀級特征的選擇
3.3 實驗參數(shù)設(shè)置
4 算法性能分析
4.1 深度的性能分析
4.2 注意力門的時間和性能分析
5 結(jié)束語
【參考文獻】:
期刊論文
[1]基于注意力CNLSTM模型的新聞文本分類[J]. 劉月,翟東海,任慶寧. 計算機工程. 2019(07)
[2]情感語音數(shù)據(jù)庫綜述[J]. 韓文靜,李海峰. 智能計算機與應(yīng)用. 2013(01)
[3]兒童情緒調(diào)節(jié)的發(fā)展研究[J]. 陸芳,陳國鵬. 心理科學. 2003(05)
碩士論文
[1]基于表情和語音雙模態(tài)的兒童情感識別研究[D]. 戴惟嘉.東南大學 2016
本文編號:3713346
【文章頁數(shù)】:10 頁
【文章目錄】:
0 概述
1 相關(guān)工作
1.1 LSTM網(wǎng)絡(luò)
1.2 注意力機制
2 改進的深度注意力門
2.1 注意力門
2.2 深度注意力門
2.3 訓練整體框架
3 實驗設(shè)置與分析
3.1 實驗設(shè)置
3.2 幀級特征的選擇
3.3 實驗參數(shù)設(shè)置
4 算法性能分析
4.1 深度的性能分析
4.2 注意力門的時間和性能分析
5 結(jié)束語
【參考文獻】:
期刊論文
[1]基于注意力CNLSTM模型的新聞文本分類[J]. 劉月,翟東海,任慶寧. 計算機工程. 2019(07)
[2]情感語音數(shù)據(jù)庫綜述[J]. 韓文靜,李海峰. 智能計算機與應(yīng)用. 2013(01)
[3]兒童情緒調(diào)節(jié)的發(fā)展研究[J]. 陸芳,陳國鵬. 心理科學. 2003(05)
碩士論文
[1]基于表情和語音雙模態(tài)的兒童情感識別研究[D]. 戴惟嘉.東南大學 2016
本文編號:3713346
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3713346.html
最近更新
教材專著