基于HMM和RNN的無(wú)人機(jī)語(yǔ)音控制方案與仿真研究
發(fā)布時(shí)間:2021-04-11 02:14
為簡(jiǎn)化無(wú)人機(jī)操作,避免誤操作,設(shè)計(jì)了一套基于隱馬爾可夫模型(Hidden Markov Model,HMM)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)的無(wú)人機(jī)語(yǔ)音控制方案。該方案采用HMM識(shí)別無(wú)人機(jī)語(yǔ)音指令;同時(shí)采用RNN對(duì)多套無(wú)人機(jī)操作指令串進(jìn)行訓(xùn)練,并對(duì)當(dāng)前時(shí)刻指令進(jìn)行預(yù)測(cè),通過(guò)計(jì)算二者的相關(guān)性判斷是否執(zhí)行。仿真結(jié)果表明,該方案對(duì)HMM識(shí)別錯(cuò)誤指令的辨別率達(dá)到61.90%,使整體錯(cuò)誤率降至1.43%,表明該方案具有較為優(yōu)異的性能。
【文章來(lái)源】:系統(tǒng)仿真學(xué)報(bào). 2020,32(03)北大核心CSCD
【文章頁(yè)數(shù)】:8 頁(yè)
【部分圖文】:
語(yǔ)音控制方案工作流程Fig.3Flowchartofspeechcontrolscheme
投?應(yīng)的無(wú)人機(jī)語(yǔ)音指令,即為識(shí)別結(jié)果。3循環(huán)神經(jīng)網(wǎng)絡(luò)近年來(lái),循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)及一些改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò),如長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(Long-ShortTimeMemory,LSTM)和時(shí)延神經(jīng)網(wǎng)絡(luò)(TimeDelayNeuralNetworks,TDNN),已經(jīng)廣泛運(yùn)用于語(yǔ)音識(shí)別的聲學(xué)建模當(dāng)中,并取得了較前饋神經(jīng)網(wǎng)絡(luò)更好的效果[12-16]。循環(huán)神經(jīng)網(wǎng)絡(luò)取得這種優(yōu)勢(shì)的主要原因在于,其記憶能力可以涵蓋完整的語(yǔ)音序列,而前饋神經(jīng)網(wǎng)絡(luò)只能利用一個(gè)有限長(zhǎng)度內(nèi)的信息。循環(huán)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示,時(shí)間展開(kāi)后的結(jié)構(gòu)圖如圖2所示。圖1循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1StructurediagramofRNN圖2循環(huán)神經(jīng)網(wǎng)絡(luò)時(shí)間展開(kāi)圖Fig.2TimeexpansiondiagramofRNN然而,正因?yàn)檠h(huán)神經(jīng)網(wǎng)絡(luò)的記憶能力可以涵蓋整個(gè)語(yǔ)音序列,因此其層間和層內(nèi)需要更為復(fù)雜的連接,這也帶來(lái)了巨大的計(jì)算量,直接限制了循環(huán)神經(jīng)網(wǎng)絡(luò)在實(shí)時(shí)性上的性能。如果直接將無(wú)人機(jī)
出概率,其中概率最大的隱馬爾可夫模型對(duì)應(yīng)的無(wú)人機(jī)語(yǔ)音指令,即為識(shí)別結(jié)果。3循環(huán)神經(jīng)網(wǎng)絡(luò)近年來(lái),循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)及一些改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò),如長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(Long-ShortTimeMemory,LSTM)和時(shí)延神經(jīng)網(wǎng)絡(luò)(TimeDelayNeuralNetworks,TDNN),已經(jīng)廣泛運(yùn)用于語(yǔ)音識(shí)別的聲學(xué)建模當(dāng)中,并取得了較前饋神經(jīng)網(wǎng)絡(luò)更好的效果[12-16]。循環(huán)神經(jīng)網(wǎng)絡(luò)取得這種優(yōu)勢(shì)的主要原因在于,其記憶能力可以涵蓋完整的語(yǔ)音序列,而前饋神經(jīng)網(wǎng)絡(luò)只能利用一個(gè)有限長(zhǎng)度內(nèi)的信息。循環(huán)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示,時(shí)間展開(kāi)后的結(jié)構(gòu)圖如圖2所示。圖1循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1StructurediagramofRNN圖2循環(huán)神經(jīng)網(wǎng)絡(luò)時(shí)間展開(kāi)圖Fig.2TimeexpansiondiagramofRNN然而,正因?yàn)檠h(huán)神經(jīng)網(wǎng)絡(luò)的記憶能力可以涵蓋整個(gè)語(yǔ)音序列,因此其層間和層內(nèi)需要更為復(fù)雜的連接,這也帶來(lái)了巨大的計(jì)算量,直接限制了循環(huán)神經(jīng)網(wǎng)絡(luò)在實(shí)時(shí)性上的性能。如果直接將無(wú)人機(jī)
【參考文獻(xiàn)】:
期刊論文
[1]基于安卓語(yǔ)音識(shí)別的無(wú)人機(jī)控制系統(tǒng)[J]. 應(yīng)捷,韓旭. 軟件導(dǎo)刊. 2017(05)
[2]基于遞歸神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別快速解碼算法[J]. 張舸,張鵬遠(yuǎn),潘接林,顏永紅. 電子與信息學(xué)報(bào). 2017(04)
[3]基于RNN-RBM語(yǔ)言模型的語(yǔ)音識(shí)別研究[J]. 黎亞雄,張堅(jiān)強(qiáng),潘登,胡憚. 計(jì)算機(jī)研究與發(fā)展. 2014(09)
[4]語(yǔ)音端點(diǎn)檢測(cè)的仿真研究[J]. 劉曉明,覃勝,劉宗行,江澤佳. 系統(tǒng)仿真學(xué)報(bào). 2005(08)
碩士論文
[1]RNN-BLSTM聲學(xué)模型的說(shuō)話人自適應(yīng)方法研究[D]. 黃智穎.中國(guó)科學(xué)技術(shù)大學(xué) 2017
[2]基于RNN的手寫(xiě)軌跡序列生成與分類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 賈殊凱.哈爾濱工業(yè)大學(xué) 2016
[3]無(wú)人機(jī)語(yǔ)音指令控制系統(tǒng)技術(shù)研究[D]. 王沖.南京航空航天大學(xué) 2012
[4]基于神經(jīng)網(wǎng)絡(luò)/HMM的語(yǔ)音識(shí)別算法的研究[D]. 張志剛.武漢理工大學(xué) 2006
[5]語(yǔ)音控制的應(yīng)用研究[D]. 何湘智.中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué) 2002
本文編號(hào):3130743
【文章來(lái)源】:系統(tǒng)仿真學(xué)報(bào). 2020,32(03)北大核心CSCD
【文章頁(yè)數(shù)】:8 頁(yè)
【部分圖文】:
語(yǔ)音控制方案工作流程Fig.3Flowchartofspeechcontrolscheme
投?應(yīng)的無(wú)人機(jī)語(yǔ)音指令,即為識(shí)別結(jié)果。3循環(huán)神經(jīng)網(wǎng)絡(luò)近年來(lái),循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)及一些改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò),如長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(Long-ShortTimeMemory,LSTM)和時(shí)延神經(jīng)網(wǎng)絡(luò)(TimeDelayNeuralNetworks,TDNN),已經(jīng)廣泛運(yùn)用于語(yǔ)音識(shí)別的聲學(xué)建模當(dāng)中,并取得了較前饋神經(jīng)網(wǎng)絡(luò)更好的效果[12-16]。循環(huán)神經(jīng)網(wǎng)絡(luò)取得這種優(yōu)勢(shì)的主要原因在于,其記憶能力可以涵蓋完整的語(yǔ)音序列,而前饋神經(jīng)網(wǎng)絡(luò)只能利用一個(gè)有限長(zhǎng)度內(nèi)的信息。循環(huán)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示,時(shí)間展開(kāi)后的結(jié)構(gòu)圖如圖2所示。圖1循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1StructurediagramofRNN圖2循環(huán)神經(jīng)網(wǎng)絡(luò)時(shí)間展開(kāi)圖Fig.2TimeexpansiondiagramofRNN然而,正因?yàn)檠h(huán)神經(jīng)網(wǎng)絡(luò)的記憶能力可以涵蓋整個(gè)語(yǔ)音序列,因此其層間和層內(nèi)需要更為復(fù)雜的連接,這也帶來(lái)了巨大的計(jì)算量,直接限制了循環(huán)神經(jīng)網(wǎng)絡(luò)在實(shí)時(shí)性上的性能。如果直接將無(wú)人機(jī)
出概率,其中概率最大的隱馬爾可夫模型對(duì)應(yīng)的無(wú)人機(jī)語(yǔ)音指令,即為識(shí)別結(jié)果。3循環(huán)神經(jīng)網(wǎng)絡(luò)近年來(lái),循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)及一些改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò),如長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(Long-ShortTimeMemory,LSTM)和時(shí)延神經(jīng)網(wǎng)絡(luò)(TimeDelayNeuralNetworks,TDNN),已經(jīng)廣泛運(yùn)用于語(yǔ)音識(shí)別的聲學(xué)建模當(dāng)中,并取得了較前饋神經(jīng)網(wǎng)絡(luò)更好的效果[12-16]。循環(huán)神經(jīng)網(wǎng)絡(luò)取得這種優(yōu)勢(shì)的主要原因在于,其記憶能力可以涵蓋完整的語(yǔ)音序列,而前饋神經(jīng)網(wǎng)絡(luò)只能利用一個(gè)有限長(zhǎng)度內(nèi)的信息。循環(huán)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示,時(shí)間展開(kāi)后的結(jié)構(gòu)圖如圖2所示。圖1循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1StructurediagramofRNN圖2循環(huán)神經(jīng)網(wǎng)絡(luò)時(shí)間展開(kāi)圖Fig.2TimeexpansiondiagramofRNN然而,正因?yàn)檠h(huán)神經(jīng)網(wǎng)絡(luò)的記憶能力可以涵蓋整個(gè)語(yǔ)音序列,因此其層間和層內(nèi)需要更為復(fù)雜的連接,這也帶來(lái)了巨大的計(jì)算量,直接限制了循環(huán)神經(jīng)網(wǎng)絡(luò)在實(shí)時(shí)性上的性能。如果直接將無(wú)人機(jī)
【參考文獻(xiàn)】:
期刊論文
[1]基于安卓語(yǔ)音識(shí)別的無(wú)人機(jī)控制系統(tǒng)[J]. 應(yīng)捷,韓旭. 軟件導(dǎo)刊. 2017(05)
[2]基于遞歸神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別快速解碼算法[J]. 張舸,張鵬遠(yuǎn),潘接林,顏永紅. 電子與信息學(xué)報(bào). 2017(04)
[3]基于RNN-RBM語(yǔ)言模型的語(yǔ)音識(shí)別研究[J]. 黎亞雄,張堅(jiān)強(qiáng),潘登,胡憚. 計(jì)算機(jī)研究與發(fā)展. 2014(09)
[4]語(yǔ)音端點(diǎn)檢測(cè)的仿真研究[J]. 劉曉明,覃勝,劉宗行,江澤佳. 系統(tǒng)仿真學(xué)報(bào). 2005(08)
碩士論文
[1]RNN-BLSTM聲學(xué)模型的說(shuō)話人自適應(yīng)方法研究[D]. 黃智穎.中國(guó)科學(xué)技術(shù)大學(xué) 2017
[2]基于RNN的手寫(xiě)軌跡序列生成與分類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 賈殊凱.哈爾濱工業(yè)大學(xué) 2016
[3]無(wú)人機(jī)語(yǔ)音指令控制系統(tǒng)技術(shù)研究[D]. 王沖.南京航空航天大學(xué) 2012
[4]基于神經(jīng)網(wǎng)絡(luò)/HMM的語(yǔ)音識(shí)別算法的研究[D]. 張志剛.武漢理工大學(xué) 2006
[5]語(yǔ)音控制的應(yīng)用研究[D]. 何湘智.中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué) 2002
本文編號(hào):3130743
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/3130743.html
最近更新
教材專著