基于Cortex-A8的變異語音識(shí)別技術(shù)研究
發(fā)布時(shí)間:2021-10-13 02:30
大腦是人類最重要最核心的器官,主導(dǎo)人的意識(shí)和行為。為了使機(jī)器也具有類似人大腦的智能,我們研究和開發(fā)了名為人工智能的新學(xué)科,讓機(jī)器能模擬人的智能而做出回應(yīng),目前在該學(xué)科應(yīng)用比較廣泛的是語音識(shí)別和人臉識(shí)別。語音識(shí)別技術(shù)是使用語音中的特征參數(shù)以及音節(jié)之間的相關(guān)性達(dá)到與數(shù)據(jù)庫(kù)的匹配,從而進(jìn)行語音識(shí)別。與其他人工智能技術(shù)相比,語音識(shí)別具有簡(jiǎn)單、快速的特點(diǎn)。變異語音是指由環(huán)境噪聲、心情變化、信道的改變而對(duì)目標(biāo)語音引起干擾,使得語音識(shí)別系統(tǒng)的識(shí)別率下降。本文從以下兩個(gè)方面展開研究:1.端點(diǎn)檢測(cè)是語音識(shí)別過程中很重要的一部分,檢測(cè)效果將決定識(shí)別結(jié)果的好壞。本文首先對(duì)比分析常用的端點(diǎn)檢測(cè)方法:短時(shí)自相關(guān)函數(shù)最大值法、比例法、短時(shí)能量法、雙門限法。通過分析這幾種方法的優(yōu)缺點(diǎn),本文提出基于多尺度熵的語音信號(hào)端點(diǎn)檢測(cè)方法,它是一種自適應(yīng)的數(shù)據(jù)驅(qū)動(dòng)的信號(hào)處理方法,因?yàn)槟繕?biāo)語音的熵值小于白噪聲,據(jù)此可以過濾掉白噪聲。同時(shí)因?yàn)檎Z音信號(hào)在不同的頻率段其能量不同,求取語音信號(hào)的瞬時(shí)能頻值,將信號(hào)分解成含有復(fù)雜信息的高頻段和含噪聲低頻段;2.傳統(tǒng)的隱馬爾科夫模型,在低信噪比的環(huán)境下,識(shí)別率低,且它的訓(xùn)練參數(shù)容易收斂于局部...
【文章來源】:北方民族大學(xué)寧夏回族自治區(qū)
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
echo音響
曉醫(yī)
以及由初始化數(shù)據(jù)逼近模型參數(shù)的過程,具體流程圖如圖 4-33 所示,部分目標(biāo)函數(shù)的代碼如圖4-34 所示,本設(shè)計(jì)采用 Objective(GAGenome& g)作為目標(biāo)函數(shù),它嘗試匹配 float 數(shù)組中作為userData 傳遞給我們的值,如果基因組中的值映射到接近的值 genome.nPhenotypes(),則返回更好的分?jǐn)?shù)值 value。目標(biāo)函數(shù)子程序執(zhí)行完畢返回遺傳算法主程序繼續(xù)執(zhí)行。開始基因組gnome返回計(jì)算value i<genome.phenotype()是否圖 4-33 目標(biāo)函數(shù)流程圖 4-32 遺傳算法程序流程圖
本文編號(hào):3433785
【文章來源】:北方民族大學(xué)寧夏回族自治區(qū)
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
echo音響
曉醫(yī)
以及由初始化數(shù)據(jù)逼近模型參數(shù)的過程,具體流程圖如圖 4-33 所示,部分目標(biāo)函數(shù)的代碼如圖4-34 所示,本設(shè)計(jì)采用 Objective(GAGenome& g)作為目標(biāo)函數(shù),它嘗試匹配 float 數(shù)組中作為userData 傳遞給我們的值,如果基因組中的值映射到接近的值 genome.nPhenotypes(),則返回更好的分?jǐn)?shù)值 value。目標(biāo)函數(shù)子程序執(zhí)行完畢返回遺傳算法主程序繼續(xù)執(zhí)行。開始基因組gnome返回計(jì)算value i<genome.phenotype()是否圖 4-33 目標(biāo)函數(shù)流程圖 4-32 遺傳算法程序流程圖
本文編號(hào):3433785
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/3433785.html
最近更新
教材專著