基于GMM托肯配比相似度校正得分的說話人識別
本文選題:說話人識別 + GMM托肯配比(GTR) ; 參考:《清華大學(xué)學(xué)報(自然科學(xué)版)》2017年01期
【摘要】:該文提出一種基于Gauss混合模型(GMM)托肯配比相似度校正得分(GMM token ratio similarity based score regulation,GTRSR)的說話人識別方法;贕MM-UBM(通用背景模型)識別框架,在自適應(yīng)訓(xùn)練和測試階段計算并保存自適應(yīng)訓(xùn)練語句和測試語句在UBM上使特征幀得分最高的Gauss分量編號(GMM token)出現(xiàn)的比例(配比),然后在測試階段計算測試語句和自適應(yīng)訓(xùn)練語句的GMM托肯分布的配比的相似度GTRS,當(dāng)GTRS小于某閾值時對測試得分乘以一個懲罰因子,將結(jié)果作為測試語句的最終得分。在MASC數(shù)據(jù)庫上進行的實驗表明,該方法能夠使系統(tǒng)識別性能有一定的提升。
[Abstract]:In this paper, a speaker recognition method based on Gauss mixed model (GMM) and Tocken matching similarity correction score (GMM token ratio similarity based score regulation) is proposed.Based on GMM-UBM-based recognition framework,Calculate and save the proportion of adaptive training statements and test statements on the UBM that number the Gauss component with the highest score of feature frames during the adaptive training and test phases (matching ratio), and then calculate the test statements and the test statements during the test phaseThe similarity of the GMM token distribution of an adaptive training statement, where the test score is multiplied by a penalty factor when the GTRS is less than a threshold.Take the result as the final score of the test statement.Experiments on MASC database show that this method can improve the recognition performance of the system.
【作者單位】: 浙江大學(xué)計算機學(xué)院;
【基金】:國家“九七三”重點基礎(chǔ)研究項目(2013CB329504) 國家自然科學(xué)基金面上項目(60970080)
【分類號】:TN912.34
【相似文獻】
相關(guān)期刊論文 前10條
1 石艷;王曉曄;;新穎檢測法在說話人識別技術(shù)中的應(yīng)用[J];現(xiàn)代計算機(專業(yè)版);2008年07期
2 劉雪燕;張娜;袁寶玲;;說話人識別綜述[J];電腦知識與技術(shù);2009年01期
3 邱政權(quán);范小春;王俊年;;基于動態(tài)環(huán)境下的說話人識別[J];科學(xué)技術(shù)與工程;2010年02期
4 單進;;說話人識別技術(shù)研究[J];科技資訊;2010年21期
5 申志生;于明;;說話人識別算法的定點DSP實現(xiàn)[J];單片機與嵌入式系統(tǒng)應(yīng)用;2011年03期
6 謝建勛;;淺談?wù)f話人識別技術(shù)[J];電腦知識與技術(shù);2011年11期
7 安茂波;劉建;;一個快速說話人識別系統(tǒng)的設(shè)計和實現(xiàn)[J];網(wǎng)絡(luò)新媒體技術(shù);2012年03期
8 楊迪;戚銀城;劉明軍;張華芳子;武軍娜;;說話人識別綜述[J];電子科技;2012年06期
9 武光利;;說話人識別方法概述[J];硅谷;2012年19期
10 曹業(yè)敏,侯風(fēng)雷,王炳錫;說話人識別技術(shù)現(xiàn)狀與進展[J];河南科技;1998年09期
相關(guān)會議論文 前10條
1 鮑福良;方志剛;徐潔;;說話人識別綜述[A];第六屆全國信息獲取與處理學(xué)術(shù)會議論文集(2)[C];2008年
2 孫帆;遲惠生;;循環(huán)網(wǎng)絡(luò)說話人識別[A];第二屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1992年
3 肖劍;歐貴文;;多層前饋神經(jīng)網(wǎng)絡(luò)組的文本無關(guān)說話人識別[A];第七屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年
4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類算法及其在說話人識別中的應(yīng)用研究[A];第八屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2005年
5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關(guān)說話人識別[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會議論文集(上冊)[C];2007年
6 戴紅霞;趙力;;文本無關(guān)說話人識別系統(tǒng)的研究[A];2007’促進西部發(fā)展聲學(xué)學(xué)術(shù)交流會論文集[C];2007年
7 陳聯(lián)武;郭武;戴禮榮;;說話人識別系統(tǒng)中多樣訓(xùn)練的應(yīng)用[A];第十一屆全國人機語音通訊學(xué)術(shù)會議論文集(一)[C];2011年
8 崔玉紅;胡光銳;;基于神經(jīng)網(wǎng)絡(luò)特征維數(shù)壓縮方法及其在說話人識別中的應(yīng)用[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年
9 吳麗麗;;基于仿生模式識別的說話人識別學(xué)習(xí)模型研究[A];第二屆中國科學(xué)院博士后學(xué)術(shù)年會暨高新技術(shù)前沿與發(fā)展學(xué)術(shù)會議程序冊[C];2010年
10 張晶;董金明;馮文全;;說話人識別系統(tǒng)研究與實現(xiàn)[A];全國第二屆信號處理與應(yīng)用學(xué)術(shù)會議?痆C];2008年
相關(guān)重要報紙文章 前2條
1 汪永安;科大訊飛說話人識別技術(shù)世界領(lǐng)先[N];安徽日報;2008年
2 吳長鋒;科大訊飛勇奪說話人識別國際大賽第一[N];科技日報;2008年
相關(guān)博士學(xué)位論文 前10條
1 單振宇;情感說話人識別及其解決方法的研究[D];浙江大學(xué);2010年
2 別凡虎;說話人識別中區(qū)分性問題的研究[D];清華大學(xué);2015年
3 謝怡寧;基于稀疏編碼的魯棒說話人識別方法研究[D];哈爾濱理工大學(xué);2016年
4 安冬;噪聲背景下說話人識別的若干關(guān)鍵問題研究[D];東北大學(xué);2013年
5 吳迪;低信噪比環(huán)境下說話人識別研究[D];蘇州大學(xué);2016年
6 陸偉;基于缺失特征的文本無關(guān)說話人識別魯棒性研究[D];中國科學(xué)技術(shù)大學(xué);2008年
7 劉鏑;說話人識別中信息融合算法的研究[D];北京交通大學(xué);2011年
8 付中華;說話人識別系統(tǒng)魯棒性研究[D];西北工業(yè)大學(xué);2004年
9 林琳;基于模糊聚類與遺傳算法的說話人識別理論研究及應(yīng)用[D];吉林大學(xué);2007年
10 邱政權(quán);在噪聲環(huán)境下的說話人識別[D];華南理工大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 叢菡菡;基于支持相量機的穩(wěn)鍵說話人識別[D];電子科技大學(xué);2008年
2 任舒彬;面向手持應(yīng)用的說話人識別算法研究[D];浙江大學(xué);2006年
3 申志生;文本相關(guān)說話人識別嵌入式系統(tǒng)及其關(guān)鍵技術(shù)研究[D];河北工業(yè)大學(xué);2011年
4 汪q,
本文編號:1763042
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/1763042.html