天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

基于深度學習的語音分離算法研究與設計

發(fā)布時間:2021-02-02 12:57
  經(jīng)過幾十年的發(fā)展語音分離技術已經(jīng)取得了長足進步,目前深度學習的興起,極大地推動語音分離技術的進一步發(fā)展。本文對單通道情況下語音分離算法進行了研究,即從單個麥克風采集到的混合語音中分離出目標人聲語音。本文主要研究利用深度學習技術對語音分離算法進行改進,在對當前語音分離算法的建模思想進行深入分析后,主要發(fā)現(xiàn)了兩點可以進行改進的地方:第一,在人聲和噪聲分離場景下,多層感知機在處理語音具有強大的特征提取能力,但一般采用固定有限的上下窗口對語音數(shù)據(jù)進行建模,不僅增加了輸入數(shù)據(jù)的維度,還忽視了語音的時序相關性關系,對混合語音信號中所包含的特征信息利用不夠充分;第二,在分離兩人同時發(fā)聲的混合語音時,目前分離算法大多需要同時追蹤到混合語音中的兩類語音特征,對于人耳來說其實很難同時聽清兩個人的語音,與常見的人類聽覺認知的方式不同,難以設計出有效的分離模型。本文針對上述問題進行研究,提出了相應的解決方案,主要貢獻如下:1.深入研究了語音分離算法的建模方式,對不同神經(jīng)網(wǎng)絡結構特性進行了探討,提出了一種基于深度循環(huán)神經(jīng)網(wǎng)絡的人聲和噪聲分離算法。在使用復合神經(jīng)網(wǎng)絡的基礎上,設計實現(xiàn)了一種基于注意力機制的特征幀拼... 

【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:75 頁

【學位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 研究背景與意義
        1.1.1 研究背景
        1.1.2 研究意義
    1.2 研究歷史與現(xiàn)狀
        1.2.1 傳統(tǒng)語音分離方法
        1.2.2 深度學習語音分離
    1.3 擬解決的關鍵問題
    1.4 本文的主要貢獻與創(chuàng)新
    1.5 本論文的結構安排
第二章 相關技術背景及算法
    2.1 語音的產(chǎn)生與感知
        2.1.1 語音產(chǎn)生原理
        2.1.2 頻域轉換方法
    2.2 有監(jiān)督語音分離框架
        2.2.1 語音特征
        2.2.2 學習模型
        2.2.3 訓練目標
        2.2.4 評估指標
    2.3 本章小結
第三章 基于深度循環(huán)神經(jīng)網(wǎng)絡的語音分離算法
    3.1 問題描述
    3.2 算法描述
        3.2.1 算法設計思路
        3.2.2 算法實現(xiàn)細節(jié)
    3.3 實驗與討論
        3.3.1 實驗環(huán)境
        3.3.2 實驗數(shù)據(jù)
        3.3.3 實驗方法與評估指標
        3.3.4 循環(huán)連接層結構有效性分析
        3.3.5 注意力機制中感知機層數(shù)有效性分析
        3.3.6 不同注意力計算范圍的分析
        3.3.7 已知噪聲條件下的模型性能分析
        3.3.8 未知噪聲條件下模型泛化性分析
    3.4 本章小結
第四章 基于多層注意力機制的語音分離算法
    4.1 問題描述
    4.2 算法描述
        4.2.1 算法設計思路
        4.2.2 算法實現(xiàn)細節(jié)
    4.3 實驗與討論
        4.3.1 實驗環(huán)境
        4.3.2 實驗數(shù)據(jù)
        4.3.3 實驗方法與評估指標
        4.3.4 模型多層結構的有效性分析
        4.3.5 兩個說話人混合場景下的分離結果分析
        4.3.6 三個說話人混合場景下的分離結果分析
    4.4 本章小結
第五章 總結與展望
    5.1 全文總結
    5.2 工作展望
致謝
參考文獻
攻讀碩士學位期間取得的成果


【參考文獻】:
期刊論文
[1]雞尾酒會問題與相關聽覺模型的研究現(xiàn)狀與展望[J]. 黃雅婷,石晶,許家銘,徐波.  自動化學報. 2019(02)
[2]Recent Progresses in Deep Learning Based Acoustic Models[J]. Dong Yu,Jinyu Li.  IEEE/CAA Journal of Automatica Sinica. 2017(03)



本文編號:3014734

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3014734.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶3c13a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com