基于稀疏表示的魯棒性說話人識別技術(shù)研究
本文關(guān)鍵詞:基于稀疏表示的魯棒性說話人識別技術(shù)研究
更多相關(guān)文章: 說話人識別 稀疏表示 魯棒性 全局補(bǔ)償 超向量
【摘要】:經(jīng)過了幾十年的研究發(fā)展,說話人識別技術(shù)憑借其快速、簡便的優(yōu)勢,在人機(jī)接入領(lǐng)域得到了大家廣泛的關(guān)注和研究。匹配模型是說話人識別研究中的關(guān)鍵技術(shù),模型性能的優(yōu)劣對識別系統(tǒng)識別率的影響重大。信號的稀疏表示技術(shù)近幾年被廣泛應(yīng)用于說話人識別之中,它與高斯混合模型相結(jié)合,顯著提高了識別系統(tǒng)的準(zhǔn)確率。目前,說話人識別研究的主要方向是進(jìn)一步提高系統(tǒng)的魯棒性,具體表現(xiàn)為解決信道失配問題和環(huán)境噪聲問題;另一方面,在智能終端廣泛普及情況下,借助智能終端進(jìn)行快速準(zhǔn)確的身份識別,需要進(jìn)一步解決系統(tǒng)復(fù)雜性問題。本文主要對基于稀疏表示的魯棒性說話人識別技術(shù)進(jìn)行了深入研究,在此基礎(chǔ)上,本文主要工作和創(chuàng)新如下:(1)在訓(xùn)練基于高斯混合模型均值超向量的稀疏表示字典時,需要大量的訓(xùn)練語音以達(dá)到字典冗余的條件,本文提出使用高斯混合模型均值矩陣代替均值超向量進(jìn)行字典訓(xùn)練來解決這個問題,同時,每個說話人即可形成一個冗余字典進(jìn)行說話人識別,識別時的計(jì)算量也得到了降低。(2)對比了樣本字典和學(xué)習(xí)字典這兩種字典在干凈語音環(huán)境與有噪語音環(huán)境下的性能,發(fā)現(xiàn)學(xué)習(xí)字典的抗噪能力要弱于樣本字典,并且提出在訓(xùn)練語音中加入噪聲以減小識別環(huán)境和訓(xùn)練環(huán)境的差異,從而提高識別率。(3)針對識別時的環(huán)境噪聲問題,提出一種適用于稀疏表示說話人識別的全局補(bǔ)償方法。該方法對不同階特征參數(shù)進(jìn)行逐一分析,目的是為了找出被噪聲影響最嚴(yán)重的一階參數(shù)并去除之,以此增強(qiáng)測試語音與訓(xùn)練語音之間的相關(guān)性,提高了識別系統(tǒng)適應(yīng)不同噪聲環(huán)境的魯棒性。仿真實(shí)驗(yàn)結(jié)果表明本文方法明顯加強(qiáng)了說話人識別系統(tǒng)的抗噪能力,在背景噪聲為白噪聲,信噪比為15dB的情況下,識別率可達(dá)到96%,與無噪環(huán)境下的識別率相差無幾。
【關(guān)鍵詞】:說話人識別 稀疏表示 魯棒性 全局補(bǔ)償 超向量
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TN912.34
【目錄】:
- 摘要4-5
- Abstract5-8
- 縮略詞注釋表8-9
- 第一章 緒論9-16
- 1.1 背景及意義9
- 1.2 說話人識別的研究歷史9-11
- 1.3 說話人識別的研究趨勢11-12
- 1.4 說話人識別研究的挑戰(zhàn)和熱點(diǎn)12-13
- 1.5 說話人識別的應(yīng)用13-14
- 1.6 論文內(nèi)容和結(jié)構(gòu)安排14-16
- 第二章 說話人識別理論基礎(chǔ)16-31
- 2.1 說話人識別系統(tǒng)流程16-17
- 2.2 語音預(yù)處理17
- 2.3 常用的特征參數(shù)17-22
- 2.3.1 線性預(yù)測系數(shù)及線性預(yù)測倒譜系數(shù)18-19
- 2.3.2 Mel頻率倒譜系數(shù)19-21
- 2.3.3 差分特征(Delta特征)21-22
- 2.4 常用的識別模型22-29
- 2.4.1 高斯混合模型(GMM)22-26
- 2.4.2 隱馬爾可夫模型HMM26-27
- 2.4.3 矢量量化模型(VQ)27-28
- 2.4.4 支持向量機(jī)模型(SVM)28-29
- 2.5 系統(tǒng)性能評價(jià)29-30
- 2.6 本章小結(jié)30-31
- 第三章 基于稀疏表示與GMM均值矩陣的識別模型研究31-44
- 3.1 稀疏表示31-33
- 3.1.1 稀疏表示基礎(chǔ)理論31-32
- 3.1.2 常用稀疏表示算法32-33
- 3.2 基于稀疏表示的說話人識別33-35
- 3.3 基于稀疏表示與GMM均值矩陣的識別模型35-38
- 3.3.1 說話人識別模型建立35-36
- 3.3.2 識別過程36-38
- 3.4 仿真實(shí)驗(yàn)語音庫和參數(shù)設(shè)置38-39
- 3.4.1 語音庫38
- 3.4.2 實(shí)驗(yàn)參數(shù)設(shè)置38-39
- 3.5 識別仿真39-42
- 3.5.1 實(shí)驗(yàn)一:稀疏度對識別率的影響39-40
- 3.5.2 實(shí)驗(yàn)二:字典大小對識別率的影響40
- 3.5.3 實(shí)驗(yàn)三:高斯混合度對識別率的影響40-42
- 3.5.4 實(shí)驗(yàn)四:測試語音長度對識別率的影響42
- 3.6 本章小結(jié)42-44
- 第四章 稀疏表示字典性能研究44-49
- 4.1 字典分類44-45
- 4.1.1 樣本字典44
- 4.1.2 K-SVD學(xué)習(xí)字典44-45
- 4.2 字典性能對比45-48
- 4.2.1 無噪環(huán)境下性能對比46
- 4.2.2 有噪環(huán)境下性能對比46-47
- 4.2.3 有噪環(huán)境下識別字典的設(shè)計(jì)47-48
- 4.3 本章小結(jié)48-49
- 第五章 噪聲環(huán)境下基于稀疏表示的說話人識別49-61
- 5.1 基于稀疏表示的全局補(bǔ)償方法50-51
- 5.2 全局補(bǔ)償方法51-54
- 5.2.1 字典訓(xùn)練51-52
- 5.2.2 識別過程52-54
- 5.3 仿真實(shí)驗(yàn)54-59
- 5.3.1 實(shí)驗(yàn)一:噪聲環(huán)境下不同方法的識別率對比55-57
- 5.3.2 實(shí)驗(yàn)二:添加不同噪聲進(jìn)行字典訓(xùn)練效果對比57-58
- 5.3.3 實(shí)驗(yàn)三:稀疏度對識別結(jié)果的影響58-59
- 5.3.4 實(shí)驗(yàn)四:多階去除59
- 5.4 本章小結(jié)59-61
- 第六章 總結(jié)與展望61-63
- 6.1 論文總結(jié)61-62
- 6.2 工作展望62-63
- 參考文獻(xiàn)63-68
- 附錄1 攻讀碩士學(xué)位期間撰寫的論文68-69
- 附錄2 攻讀碩士學(xué)位期間參加的科研項(xiàng)目69-70
- 致謝70
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 石艷;王曉曄;;新穎檢測法在說話人識別技術(shù)中的應(yīng)用[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2008年07期
2 劉雪燕;張娜;袁寶玲;;說話人識別綜述[J];電腦知識與技術(shù);2009年01期
3 邱政權(quán);范小春;王俊年;;基于動態(tài)環(huán)境下的說話人識別[J];科學(xué)技術(shù)與工程;2010年02期
4 單進(jìn);;說話人識別技術(shù)研究[J];科技資訊;2010年21期
5 申志生;于明;;說話人識別算法的定點(diǎn)DSP實(shí)現(xiàn)[J];單片機(jī)與嵌入式系統(tǒng)應(yīng)用;2011年03期
6 謝建勛;;淺談?wù)f話人識別技術(shù)[J];電腦知識與技術(shù);2011年11期
7 安茂波;劉建;;一個快速說話人識別系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[J];網(wǎng)絡(luò)新媒體技術(shù);2012年03期
8 楊迪;戚銀城;劉明軍;張華芳子;武軍娜;;說話人識別綜述[J];電子科技;2012年06期
9 武光利;;說話人識別方法概述[J];硅谷;2012年19期
10 曹業(yè)敏,侯風(fēng)雷,王炳錫;說話人識別技術(shù)現(xiàn)狀與進(jìn)展[J];河南科技;1998年09期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 鮑福良;方志剛;徐潔;;說話人識別綜述[A];第六屆全國信息獲取與處理學(xué)術(shù)會議論文集(2)[C];2008年
2 孫帆;遲惠生;;循環(huán)網(wǎng)絡(luò)說話人識別[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1992年
3 肖劍;歐貴文;;多層前饋神經(jīng)網(wǎng)絡(luò)組的文本無關(guān)說話人識別[A];第七屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年
4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類算法及其在說話人識別中的應(yīng)用研究[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關(guān)說話人識別[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會議論文集(上冊)[C];2007年
6 戴紅霞;趙力;;文本無關(guān)說話人識別系統(tǒng)的研究[A];2007’促進(jìn)西部發(fā)展聲學(xué)學(xué)術(shù)交流會論文集[C];2007年
7 陳聯(lián)武;郭武;戴禮榮;;說話人識別系統(tǒng)中多樣訓(xùn)練的應(yīng)用[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集(一)[C];2011年
8 崔玉紅;胡光銳;;基于神經(jīng)網(wǎng)絡(luò)特征維數(shù)壓縮方法及其在說話人識別中的應(yīng)用[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年
9 吳麗麗;;基于仿生模式識別的說話人識別學(xué)習(xí)模型研究[A];第二屆中國科學(xué)院博士后學(xué)術(shù)年會暨高新技術(shù)前沿與發(fā)展學(xué)術(shù)會議程序冊[C];2010年
10 張晶;董金明;馮文全;;說話人識別系統(tǒng)研究與實(shí)現(xiàn)[A];全國第二屆信號處理與應(yīng)用學(xué)術(shù)會議?痆C];2008年
中國重要報(bào)紙全文數(shù)據(jù)庫 前2條
1 汪永安;科大訊飛說話人識別技術(shù)世界領(lǐng)先[N];安徽日報(bào);2008年
2 吳長鋒;科大訊飛勇奪說話人識別國際大賽第一[N];科技日報(bào);2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 單振宇;情感說話人識別及其解決方法的研究[D];浙江大學(xué);2010年
2 陸偉;基于缺失特征的文本無關(guān)說話人識別魯棒性研究[D];中國科學(xué)技術(shù)大學(xué);2008年
3 劉鏑;說話人識別中信息融合算法的研究[D];北京交通大學(xué);2011年
4 付中華;說話人識別系統(tǒng)魯棒性研究[D];西北工業(yè)大學(xué);2004年
5 林琳;基于模糊聚類與遺傳算法的說話人識別理論研究及應(yīng)用[D];吉林大學(xué);2007年
6 邱政權(quán);在噪聲環(huán)境下的說話人識別[D];華南理工大學(xué);2007年
7 郭武;復(fù)雜信道下的說話人識別[D];中國科學(xué)技術(shù)大學(xué);2007年
8 錢博;基于漢語元音映射的說話人識別技術(shù)研究[D];南京理工大學(xué);2007年
9 姜濤;網(wǎng)絡(luò)環(huán)境下說話人識別關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2011年
10 俞一彪;基于互信息理論的說話人識別研究[D];上海大學(xué);2004年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 叢菡菡;基于支持相量機(jī)的穩(wěn)鍵說話人識別[D];電子科技大學(xué);2008年
2 任舒彬;面向手持應(yīng)用的說話人識別算法研究[D];浙江大學(xué);2006年
3 申志生;文本相關(guān)說話人識別嵌入式系統(tǒng)及其關(guān)鍵技術(shù)研究[D];河北工業(yè)大學(xué);2011年
4 汪q,
本文編號:760423
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/760423.html