基于LPC倒譜特征融合的法庭說話人識(shí)別方法
發(fā)布時(shí)間:2021-04-17 01:59
為了探究輔音與元音LPC倒譜特征融合后對(duì)法庭說話人識(shí)別性能的影響,對(duì)漢語普通話中輔音/s/與元音/i/的LPC倒譜特征進(jìn)行了特征融合,并使用邏輯回歸方法對(duì)特征融合后的系統(tǒng)輸出得分進(jìn)行校正,同時(shí)在似然比框架內(nèi)基于該融合特征進(jìn)行了說話人識(shí)別的性能測(cè)試。結(jié)果表明,相對(duì)輔音/s/而言,元音/i/的LPC倒譜特征的識(shí)別性能更優(yōu),特征融合后的系統(tǒng)識(shí)別性能比單一使用/s/和/i/的LPC倒譜特征識(shí)別時(shí)有較大提升。LPC倒譜特征融合在提升說話人識(shí)別性能方面具備應(yīng)用潛力。
【文章來源】:中國(guó)刑警學(xué)院學(xué)報(bào). 2020,(05)
【文章頁數(shù)】:5 頁
【部分圖文】:
0~4k Hz頻帶范圍內(nèi)利用/s/LPC倒譜特征進(jìn)行說話人識(shí)別的Tippett圖
圖1 0~4k Hz頻帶范圍內(nèi)利用/s/LPC倒譜特征進(jìn)行說話人識(shí)別的Tippett圖表2的結(jié)果表明,元音/i/的LPC倒譜特征說話人識(shí)別性能明顯優(yōu)于擦音/s/,尤其是在0~4k Hz的信號(hào)頻帶范圍內(nèi),系統(tǒng)的Cllr值為0.61,相比于擦音/s/識(shí)別性能高出29%,提升了近三分之一,EER值降低了38%。在0~8k Hz的頻帶范圍內(nèi),系統(tǒng)的識(shí)別性能更好,Cllr值為0.48,比擦音/s/提升了28%,EER值降低了42%。整體上,元音/i/在高頻范圍內(nèi)的識(shí)別效果更佳,這一點(diǎn)與擦音/s/一致。這充分說明高頻帶語音信號(hào)內(nèi)的話者信息更為豐富。然而,司法實(shí)踐中16k Hz的高采樣率錄音并不多見,實(shí)際案件中語音檢材的采樣率往往是8k Hz。因此,0~4k Hz頻帶范圍內(nèi)的性能更能代表案件現(xiàn)實(shí)條件。
為進(jìn)一步探究特征融合對(duì)系統(tǒng)識(shí)別性能的影響,我們采用邏輯回歸模型對(duì)/s/和/i/的LPC倒譜特征進(jìn)行了特征融合。利用融合特征進(jìn)行說話人識(shí)別的結(jié)果見表3。圖4 0~8k Hz頻帶范圍內(nèi)利用/i/LPC倒譜特征進(jìn)行說話人識(shí)別的Tippett圖
【參考文獻(xiàn)】:
期刊論文
[1]法庭語音證據(jù)評(píng)價(jià)的新范式[J]. 張翠玲. 中國(guó)人民公安大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(01)
[2]法庭說話人識(shí)別語音數(shù)據(jù)庫的構(gòu)建[J]. 張翠玲,Geoffrey Stewart Morrison. 中國(guó)刑警學(xué)院學(xué)報(bào). 2016(04)
[3]似然比在法庭說話人確認(rèn)中的應(yīng)用[J]. 王華朋,楊軍,許勇. 證據(jù)科學(xué). 2012(01)
本文編號(hào):3142590
【文章來源】:中國(guó)刑警學(xué)院學(xué)報(bào). 2020,(05)
【文章頁數(shù)】:5 頁
【部分圖文】:
0~4k Hz頻帶范圍內(nèi)利用/s/LPC倒譜特征進(jìn)行說話人識(shí)別的Tippett圖
圖1 0~4k Hz頻帶范圍內(nèi)利用/s/LPC倒譜特征進(jìn)行說話人識(shí)別的Tippett圖表2的結(jié)果表明,元音/i/的LPC倒譜特征說話人識(shí)別性能明顯優(yōu)于擦音/s/,尤其是在0~4k Hz的信號(hào)頻帶范圍內(nèi),系統(tǒng)的Cllr值為0.61,相比于擦音/s/識(shí)別性能高出29%,提升了近三分之一,EER值降低了38%。在0~8k Hz的頻帶范圍內(nèi),系統(tǒng)的識(shí)別性能更好,Cllr值為0.48,比擦音/s/提升了28%,EER值降低了42%。整體上,元音/i/在高頻范圍內(nèi)的識(shí)別效果更佳,這一點(diǎn)與擦音/s/一致。這充分說明高頻帶語音信號(hào)內(nèi)的話者信息更為豐富。然而,司法實(shí)踐中16k Hz的高采樣率錄音并不多見,實(shí)際案件中語音檢材的采樣率往往是8k Hz。因此,0~4k Hz頻帶范圍內(nèi)的性能更能代表案件現(xiàn)實(shí)條件。
為進(jìn)一步探究特征融合對(duì)系統(tǒng)識(shí)別性能的影響,我們采用邏輯回歸模型對(duì)/s/和/i/的LPC倒譜特征進(jìn)行了特征融合。利用融合特征進(jìn)行說話人識(shí)別的結(jié)果見表3。圖4 0~8k Hz頻帶范圍內(nèi)利用/i/LPC倒譜特征進(jìn)行說話人識(shí)別的Tippett圖
【參考文獻(xiàn)】:
期刊論文
[1]法庭語音證據(jù)評(píng)價(jià)的新范式[J]. 張翠玲. 中國(guó)人民公安大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(01)
[2]法庭說話人識(shí)別語音數(shù)據(jù)庫的構(gòu)建[J]. 張翠玲,Geoffrey Stewart Morrison. 中國(guó)刑警學(xué)院學(xué)報(bào). 2016(04)
[3]似然比在法庭說話人確認(rèn)中的應(yīng)用[J]. 王華朋,楊軍,許勇. 證據(jù)科學(xué). 2012(01)
本文編號(hào):3142590
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/3142590.html
最近更新
教材專著