天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

無(wú)線電對(duì)講語(yǔ)音的說(shuō)話人分割聚類(lèi)研究

發(fā)布時(shí)間:2017-08-18 17:28

  本文關(guān)鍵詞:無(wú)線電對(duì)講語(yǔ)音的說(shuō)話人分割聚類(lèi)研究


  更多相關(guān)文章: 信息融合 說(shuō)話人分割聚類(lèi) 聲學(xué)事件檢測(cè)


【摘要】:伴隨著信息爆炸和大數(shù)據(jù)時(shí)代的到來(lái),音頻獲取途徑和數(shù)量迅速增加,音頻管理變得越來(lái)越復(fù)雜,說(shuō)話人分割聚類(lèi)作為音頻管理的一種方式近幾年在國(guó)際上逐漸成為研究熱點(diǎn)。說(shuō)話人分割聚類(lèi)是說(shuō)話人識(shí)別、話者跟蹤、話者自適應(yīng)的前期處理和必要步驟。本文針對(duì)多說(shuō)話人、信道變化、背景噪聲大的無(wú)線電對(duì)講語(yǔ)音,主要進(jìn)行說(shuō)話人分割聚類(lèi)研究。在分析現(xiàn)有無(wú)監(jiān)督說(shuō)話人分割算法的基礎(chǔ)上,使用BIC、GLR和KL2準(zhǔn)則對(duì)音頻進(jìn)行說(shuō)話人分割,通過(guò)移動(dòng)不同尺度的時(shí)間窗來(lái)快速確定存在的說(shuō)話人變化點(diǎn),最佳性能達(dá)到F=65.47%。說(shuō)話人聚類(lèi)是通過(guò)CLR距離的自底向上的層次聚類(lèi)來(lái)實(shí)現(xiàn)的,聚類(lèi)的終止條件是系統(tǒng)中指定的說(shuō)話人個(gè)數(shù)。針對(duì)音頻中包含較大的背景噪聲,使用經(jīng)典的譜減法和維納濾波器對(duì)音頻進(jìn)行語(yǔ)音增強(qiáng),對(duì)增強(qiáng)后的語(yǔ)音進(jìn)行說(shuō)話人分割聚類(lèi)實(shí)驗(yàn)。在以上說(shuō)話人分割算法性能遇到瓶頸時(shí),通過(guò)觀察發(fā)現(xiàn)地面控制中心和飛行員說(shuō)話結(jié)束后會(huì)產(chǎn)生按鍵音。由于按鍵音是說(shuō)話人變化的標(biāo)識(shí),由此提出信息融合的方法進(jìn)行說(shuō)話人分割聚類(lèi)。在研究現(xiàn)有聲學(xué)事件檢測(cè)算法的基礎(chǔ)上,使用時(shí)域分析和模型匹配的方法進(jìn)行聲學(xué)事件檢出。通過(guò)實(shí)驗(yàn)得到高召回率和高準(zhǔn)確率的事件位置后,對(duì)說(shuō)話人分割結(jié)果進(jìn)行修正。實(shí)驗(yàn)表明增加事件檢測(cè)后說(shuō)話人分割算法性能提升到77.18%,比之前單獨(dú)使用最好的BIC方法的綜合性能相對(duì)提升了17.88%,召回率和準(zhǔn)確率分別相對(duì)提升了20.01%和15.50%。
【關(guān)鍵詞】:信息融合 說(shuō)話人分割聚類(lèi) 聲學(xué)事件檢測(cè)
【學(xué)位授予單位】:北京理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TN912.3
【目錄】:
  • 摘要5-6
  • Abstract6-9
  • 第1章 緒論9-16
  • 1.1 課題的研究背景和意義9-10
  • 1.2 研究現(xiàn)狀10-14
  • 1.2.1 說(shuō)話人分割聚類(lèi)10-11
  • 1.2.2 聲學(xué)事件檢測(cè)11-13
  • 1.2.3 信息融合13-14
  • 1.3 本文研究工作與論文組織14-16
  • 第2章 說(shuō)話人分割聚類(lèi)16-30
  • 2.1 說(shuō)話人分割聚類(lèi)概述16-24
  • 2.1.1 語(yǔ)音信號(hào)的預(yù)處理17-19
  • 2.1.2 特征提取19-20
  • 2.1.3 語(yǔ)音活性檢測(cè)20-22
  • 2.1.4 說(shuō)話人分割22-23
  • 2.1.5 說(shuō)話人聚類(lèi)23-24
  • 2.2 實(shí)驗(yàn)數(shù)據(jù)與性能評(píng)估24
  • 2.3 不同距離度量的說(shuō)話人分割算法24-28
  • 2.3.1 GLR距離25-27
  • 2.3.2 BIC距離27
  • 2.3.3 KL2距離27-28
  • 2.4 說(shuō)話人聚類(lèi)28-29
  • 2.5 本章小結(jié)29-30
  • 第3章 語(yǔ)音增強(qiáng)30-38
  • 3.1 語(yǔ)音增強(qiáng)方法概述30-33
  • 3.2 語(yǔ)音增強(qiáng)33-36
  • 3.2.1 譜減法33-35
  • 3.2.2 維納濾波器35-36
  • 3.3 語(yǔ)音增強(qiáng)后說(shuō)話人分割性能36-37
  • 3.4 本章小結(jié)37-38
  • 第4章 聲學(xué)事件檢測(cè)38-44
  • 4.1 聲學(xué)事件檢測(cè)概述38-39
  • 4.2 聲學(xué)事件檢測(cè)實(shí)現(xiàn)39-43
  • 4.2.1 時(shí)域分析法40-41
  • 4.2.2 模型匹配法41-43
  • 4.3 本章小結(jié)43-44
  • 第5章 基于信息融合的說(shuō)話人分割44-49
  • 5.1 信息融合概述44-45
  • 5.2 信息融合的說(shuō)話人分割45-47
  • 5.3 本章小結(jié)47-49
  • 第6章 總結(jié)與展望49-51
  • 6.1 主要工作總結(jié)49
  • 6.2 后期展望49-51
  • 參考文獻(xiàn)51-56
  • 攻讀學(xué)位期間發(fā)表論文與研究成果清單56-57
  • 致謝57

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前3條

1 石自強(qiáng);韓紀(jì)慶;鄭鐵然;;魯棒聲學(xué)事件檢測(cè)綜述[J];智能計(jì)算機(jī)與應(yīng)用;2012年06期

2 王博;郭英;韓立峰;;基于熵函數(shù)的語(yǔ)音端點(diǎn)檢測(cè)算法研究[J];信號(hào)處理;2009年03期

3 潘泉,于昕,程詠梅,張洪才;信息融合理論的基本方法與進(jìn)展[J];自動(dòng)化學(xué)報(bào);2003年04期

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條

1 劉晶;高強(qiáng)度噪聲對(duì)凹耳蛙聽(tīng)覺(jué)的影響[D];廈門(mén)大學(xué);2014年

2 孔鴻運(yùn);行車(chē)環(huán)境下魯棒的聲學(xué)事件檢測(cè)方法[D];哈爾濱工業(yè)大學(xué);2013年

3 凌錦雯;基于多特征的說(shuō)話人分割與聚類(lèi)的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年

4 梁學(xué)戰(zhàn);新聞視頻自動(dòng)切分關(guān)鍵技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2009年

,

本文編號(hào):695829

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/695829.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3fd99***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com