面向會議場景的聲紋識別技術(shù)研究與系統(tǒng)實(shí)現(xiàn)
發(fā)布時(shí)間:2022-10-06 19:56
傳統(tǒng)的會議記錄方式存在記錄時(shí)間周期長、記錄內(nèi)容不準(zhǔn)確、難以分辨說話人等問題。在機(jī)器學(xué)習(xí)迅速發(fā)展的今天,利用機(jī)器學(xué)習(xí)技術(shù)改進(jìn)傳統(tǒng)的會議記錄方式,并通過對會議語音的智能記錄,最終形成準(zhǔn)確的會議記錄報(bào)告。這種新的會議記錄方式滿足了會議場景下對會議記錄的諸多要求,將具有非常大的實(shí)用價(jià)值與市場競爭力。立足于此,本文采用聲紋識別技術(shù)實(shí)現(xiàn)對會議的智能記錄、研究并開發(fā)面向會議場景的聲紋識別系統(tǒng),本文工作簡述如下:一、研究聲紋識別系統(tǒng)的基礎(chǔ)理論:首先,研究聲紋識別系統(tǒng)的基本概念、發(fā)展歷史、基本步驟、基本特點(diǎn);其次,研究聲紋識別系統(tǒng)目前的理論研究進(jìn)展和系統(tǒng)開發(fā)進(jìn)展,為下文提出的兩種算法與系統(tǒng)開發(fā)提供理論依據(jù)和開發(fā)指導(dǎo)。二、研究小樣本條件下準(zhǔn)確聲紋識別算法:首先,研究會議場景下小樣本訓(xùn)練產(chǎn)生的原因,并分析小樣本訓(xùn)練存在的問題;其次,提出新型特征提取方法和基于會議場景模型訓(xùn)練方法用于小樣本條件下提高系統(tǒng)識別準(zhǔn)確率;再次,將算法融入到聲紋識別系統(tǒng)中,并介紹算法的執(zhí)行流程;最后,對算法的有效性進(jìn)行驗(yàn)證分析,為小樣本條件下實(shí)現(xiàn)準(zhǔn)確的聲紋識別目標(biāo)提供理論依據(jù)和實(shí)際開發(fā)指導(dǎo)經(jīng)驗(yàn)。三、研究強(qiáng)噪條件下可靠聲紋識別算法:首先...
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.2 聲紋識別問題概述
1.2.1 基本概念
1.2.2 發(fā)展歷史
1.2.3 基本步驟
1.2.4 基本特點(diǎn)
1.3 聲紋識別研究綜述
1.3.1 相關(guān)理論研究進(jìn)展
1.3.2 相關(guān)系統(tǒng)開發(fā)進(jìn)展
1.4 主要工作與內(nèi)容安排
第二章 小樣本條件下準(zhǔn)確聲紋識別算法
2.1 問題描述
2.2 新型特征提取方法
2.2.1 訓(xùn)練階段特征提取方法
2.2.2 識別階段特征提取方法
2.3 基于會議場景模型訓(xùn)練方法
2.3.1 訓(xùn)練會議場景下的UBM
2.3.2 會議場景模型再訓(xùn)練
2.4 算法流程
2.5 實(shí)驗(yàn)結(jié)果
2.6 本章小結(jié)
第三章 強(qiáng)噪條件下可靠聲紋識別算法
3.1 問題描述
3.2 新型分類噪聲去除方法
3.2.1 雙MIC降噪
3.2.2 小波降噪
3.2.3 SOX降噪
3.2.4 PCA降噪
3.3 基于學(xué)習(xí)補(bǔ)償?shù)谋尘霸肼暼コ椒?br> 3.3.1 基于場景的噪聲分類
3.3.2 背景噪聲估計(jì)
3.3.3 噪聲補(bǔ)償
3.4 算法流程
3.5 實(shí)驗(yàn)結(jié)果
3.6 本章小結(jié)
第四章 面向會議場景的智能會議記錄系統(tǒng)實(shí)現(xiàn)與測試
4.1 需求分析
4.2 系統(tǒng)架構(gòu)
4.3 系統(tǒng)實(shí)現(xiàn)
4.3.1 終端側(cè)模塊
4.3.2 通信模塊
4.3.3 服務(wù)器側(cè)模塊
4.4 系統(tǒng)測試
4.4.1 功能測試
4.4.2 性能測試
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 本文總結(jié)
5.2 未來展望
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間申請的發(fā)明專利和軟件著作權(quán)
附錄2 攻讀碩士學(xué)位期間參加的科研項(xiàng)目
致謝
【參考文獻(xiàn)】:
期刊論文
[1]語音識別技術(shù)前景廣闊[J]. 劉聰,高建清,萬根順,陳怡敏. 高科技與產(chǎn)業(yè)化. 2018(03)
[2]基于數(shù)據(jù)驅(qū)動(dòng)缺失特征檢測與重建的聲紋識別[J]. 尹海明,王金明,李歡歡. 計(jì)算機(jī)工程與應(yīng)用. 2016(22)
[3]基于MATLAB的語音信號采集和語譜圖分析[J]. 劉博. 電腦知識與技術(shù). 2015(11)
[4]噪聲相關(guān)情況下說話人跟蹤方法[J]. 李軍,曹潔,李偉. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2014(12)
[5]基于小波語譜圖分析的語音去噪技術(shù)[J]. 鄭黨,鮑鴻,張晶. 計(jì)算機(jī)工程與應(yīng)用. 2016(04)
[6]聲紋識別技術(shù)在金剛石壓機(jī)頂錘防護(hù)中的應(yīng)用[J]. 李煒恒,王林生. 金剛石與磨料磨具工程. 2013(03)
[7]基于自然語言處理的聲紋優(yōu)化識別算法研究[J]. 熊婷,汪偉,張炘. 計(jì)算機(jī)仿真. 2013(06)
[8]一種基于語譜圖分析的語音增強(qiáng)算法[J]. 肖純智,孫大飛,高勇. 電聲技術(shù). 2012(09)
[9]偏相干分析識別噪聲源的計(jì)算[J]. 趙海瀾,汪鴻振. 噪聲與振動(dòng)控制. 2005(05)
[10]聲紋識別技術(shù)中特征語音參數(shù)選取的相關(guān)問題[J]. 谷志新,王述洋,田仲富. 林業(yè)勞動(dòng)安全. 2005(02)
碩士論文
[1]聲紋識別相關(guān)技術(shù)研究及應(yīng)用[D]. 張芝旖.南京航空航天大學(xué) 2016
本文編號:3687308
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.2 聲紋識別問題概述
1.2.1 基本概念
1.2.2 發(fā)展歷史
1.2.3 基本步驟
1.2.4 基本特點(diǎn)
1.3 聲紋識別研究綜述
1.3.1 相關(guān)理論研究進(jìn)展
1.3.2 相關(guān)系統(tǒng)開發(fā)進(jìn)展
1.4 主要工作與內(nèi)容安排
第二章 小樣本條件下準(zhǔn)確聲紋識別算法
2.1 問題描述
2.2 新型特征提取方法
2.2.1 訓(xùn)練階段特征提取方法
2.2.2 識別階段特征提取方法
2.3 基于會議場景模型訓(xùn)練方法
2.3.1 訓(xùn)練會議場景下的UBM
2.3.2 會議場景模型再訓(xùn)練
2.4 算法流程
2.5 實(shí)驗(yàn)結(jié)果
2.6 本章小結(jié)
第三章 強(qiáng)噪條件下可靠聲紋識別算法
3.1 問題描述
3.2 新型分類噪聲去除方法
3.2.1 雙MIC降噪
3.2.2 小波降噪
3.2.3 SOX降噪
3.2.4 PCA降噪
3.3 基于學(xué)習(xí)補(bǔ)償?shù)谋尘霸肼暼コ椒?br> 3.3.1 基于場景的噪聲分類
3.3.2 背景噪聲估計(jì)
3.3.3 噪聲補(bǔ)償
3.4 算法流程
3.5 實(shí)驗(yàn)結(jié)果
3.6 本章小結(jié)
第四章 面向會議場景的智能會議記錄系統(tǒng)實(shí)現(xiàn)與測試
4.1 需求分析
4.2 系統(tǒng)架構(gòu)
4.3 系統(tǒng)實(shí)現(xiàn)
4.3.1 終端側(cè)模塊
4.3.2 通信模塊
4.3.3 服務(wù)器側(cè)模塊
4.4 系統(tǒng)測試
4.4.1 功能測試
4.4.2 性能測試
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 本文總結(jié)
5.2 未來展望
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間申請的發(fā)明專利和軟件著作權(quán)
附錄2 攻讀碩士學(xué)位期間參加的科研項(xiàng)目
致謝
【參考文獻(xiàn)】:
期刊論文
[1]語音識別技術(shù)前景廣闊[J]. 劉聰,高建清,萬根順,陳怡敏. 高科技與產(chǎn)業(yè)化. 2018(03)
[2]基于數(shù)據(jù)驅(qū)動(dòng)缺失特征檢測與重建的聲紋識別[J]. 尹海明,王金明,李歡歡. 計(jì)算機(jī)工程與應(yīng)用. 2016(22)
[3]基于MATLAB的語音信號采集和語譜圖分析[J]. 劉博. 電腦知識與技術(shù). 2015(11)
[4]噪聲相關(guān)情況下說話人跟蹤方法[J]. 李軍,曹潔,李偉. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2014(12)
[5]基于小波語譜圖分析的語音去噪技術(shù)[J]. 鄭黨,鮑鴻,張晶. 計(jì)算機(jī)工程與應(yīng)用. 2016(04)
[6]聲紋識別技術(shù)在金剛石壓機(jī)頂錘防護(hù)中的應(yīng)用[J]. 李煒恒,王林生. 金剛石與磨料磨具工程. 2013(03)
[7]基于自然語言處理的聲紋優(yōu)化識別算法研究[J]. 熊婷,汪偉,張炘. 計(jì)算機(jī)仿真. 2013(06)
[8]一種基于語譜圖分析的語音增強(qiáng)算法[J]. 肖純智,孫大飛,高勇. 電聲技術(shù). 2012(09)
[9]偏相干分析識別噪聲源的計(jì)算[J]. 趙海瀾,汪鴻振. 噪聲與振動(dòng)控制. 2005(05)
[10]聲紋識別技術(shù)中特征語音參數(shù)選取的相關(guān)問題[J]. 谷志新,王述洋,田仲富. 林業(yè)勞動(dòng)安全. 2005(02)
碩士論文
[1]聲紋識別相關(guān)技術(shù)研究及應(yīng)用[D]. 張芝旖.南京航空航天大學(xué) 2016
本文編號:3687308
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3687308.html
最近更新
教材專著