影視動畫配音節(jié)奏特征自動提取系統(tǒng)設(shè)計
發(fā)布時間:2021-10-02 04:39
配音節(jié)奏特征對于影視動畫人物理解與情緒表達尤為重要,基于此,設(shè)計影視動畫配音節(jié)奏特征的自動提取系統(tǒng)。配音采集模塊采用TLV320AIC23音頻接口芯片,該芯片內(nèi)部集成A/D和D/A轉(zhuǎn)換器,可對采集的影視動畫配音音頻進行模數(shù)轉(zhuǎn)換,將獲取的模擬信號傳輸至節(jié)奏特征提取模塊。節(jié)奏特征提取模塊以TMS320VC5509 DSP芯片為核心,采用優(yōu)化后的哈佛結(jié)構(gòu),利用配音節(jié)奏特征提取算法提取影視動畫配音節(jié)奏特征。配音節(jié)奏特征提取算法中,通過快速傅里葉變換確定復(fù)數(shù)域信息,確定發(fā)音點檢測信號,以及各幀發(fā)音點檢測信號函數(shù)的自相關(guān)函數(shù);谏舷挛牡墓(jié)拍周期推導(dǎo)算法推導(dǎo)配音片段節(jié)拍周期;诎l(fā)音點檢測信號函數(shù),通過HMM模型可推算節(jié)拍出現(xiàn)的詳細時間點并進行節(jié)拍跟蹤,確定節(jié)拍速度特征。實驗結(jié)果顯示,所設(shè)計系統(tǒng)可準確劃分影視動畫配音情緒類型,且能耗較低。
【文章來源】:現(xiàn)代電子技術(shù). 2020,43(18)北大核心
【文章頁數(shù)】:5 頁
【部分圖文】:
系統(tǒng)硬件結(jié)構(gòu)設(shè)計
TLV320AIC23單片音頻接口芯片數(shù)據(jù)傳輸字長包括16位、24位和32位,可滿足6~98 kHz之間的采樣頻率。EPM240采用具有非易失性的CPLD架構(gòu),將傳統(tǒng)可編程邏輯成本與功耗分別降低50%和90%,而密度和性能則提升400%和200%。EPM240的具體作用是提供一種解決方案來確保2種總線協(xié)議轉(zhuǎn)換過程中成本最低。在配音采集模塊中AIC23芯片的具體作用為數(shù)據(jù)轉(zhuǎn)換,利用A/D轉(zhuǎn)換器將4路配音信號轉(zhuǎn)換為數(shù)字信號,經(jīng)由數(shù)據(jù)傳輸協(xié)議傳輸至EPM240內(nèi),利用其串并協(xié)議轉(zhuǎn)換,將各AIC23芯片的串行數(shù)據(jù)轉(zhuǎn)換為并行數(shù)據(jù),供MCU讀取處理。處理后的數(shù)據(jù)被EPM240轉(zhuǎn)換為I2S協(xié)議數(shù)據(jù),返回至AIC23芯片內(nèi),利用D/A轉(zhuǎn)換器轉(zhuǎn)為模擬量信號,傳輸至節(jié)奏特征提取模塊內(nèi)。1.3 節(jié)奏特征提取模塊
VC5509與AIC23的連接
【參考文獻】:
期刊論文
[1]一種基于卷積神經(jīng)網(wǎng)絡(luò)特征表征的語音情感識別方法[J]. 姜芃旭,傅洪亮,陶華偉,雷沛之. 電子器件. 2019(04)
[2]利用諧波顯著度和語者音色特征的混合語音中目標人基頻軌跡提取[J]. 后方帥,黎美琪,劉若倫. 聲學技術(shù). 2019(04)
[3]基于注意力機制的LSTM語音情感主要特征選擇[J]. 胡婷婷,馮亞琴,沈凌潔,王蔚. 聲學技術(shù). 2019(04)
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的孤立詞語音識別[J]. 侯一民,李永平. 計算機工程與設(shè)計. 2019(06)
[5]結(jié)合時變?yōu)V波和時頻掩碼的語音增強方法[J]. 成帥,張海劍,孫洪. 信號處理. 2019(04)
[6]基于語譜圖提取深度空間注意特征的語音情感識別算法[J]. 王金華,應(yīng)娜,朱辰都,劉兆森,蔡哲棟. 電信科學. 2019(07)
[7]基于語音心理聲學分析的駕駛疲勞檢測[J]. 李響,李國正,石俊剛,彭理群. 儀器儀表學報. 2018(10)
[8]基于自編碼特征的語音增強聲學特征提取[J]. 張濤,任相贏,劉陽,耿彥章. 計算機科學與探索. 2019(08)
[9]采用低維特征映射的耳語音向正常音轉(zhuǎn)換[J]. 周健,竇云峰,劉榮敏,王華彬,陶亮. 聲學學報. 2018(05)
[10]疲勞及緊張狀態(tài)管制員通話語音反應(yīng)特征研究[J]. 張興儉,袁樂平,趙嶷飛. 中國安全科學學報. 2018(06)
本文編號:3418022
【文章來源】:現(xiàn)代電子技術(shù). 2020,43(18)北大核心
【文章頁數(shù)】:5 頁
【部分圖文】:
系統(tǒng)硬件結(jié)構(gòu)設(shè)計
TLV320AIC23單片音頻接口芯片數(shù)據(jù)傳輸字長包括16位、24位和32位,可滿足6~98 kHz之間的采樣頻率。EPM240采用具有非易失性的CPLD架構(gòu),將傳統(tǒng)可編程邏輯成本與功耗分別降低50%和90%,而密度和性能則提升400%和200%。EPM240的具體作用是提供一種解決方案來確保2種總線協(xié)議轉(zhuǎn)換過程中成本最低。在配音采集模塊中AIC23芯片的具體作用為數(shù)據(jù)轉(zhuǎn)換,利用A/D轉(zhuǎn)換器將4路配音信號轉(zhuǎn)換為數(shù)字信號,經(jīng)由數(shù)據(jù)傳輸協(xié)議傳輸至EPM240內(nèi),利用其串并協(xié)議轉(zhuǎn)換,將各AIC23芯片的串行數(shù)據(jù)轉(zhuǎn)換為并行數(shù)據(jù),供MCU讀取處理。處理后的數(shù)據(jù)被EPM240轉(zhuǎn)換為I2S協(xié)議數(shù)據(jù),返回至AIC23芯片內(nèi),利用D/A轉(zhuǎn)換器轉(zhuǎn)為模擬量信號,傳輸至節(jié)奏特征提取模塊內(nèi)。1.3 節(jié)奏特征提取模塊
VC5509與AIC23的連接
【參考文獻】:
期刊論文
[1]一種基于卷積神經(jīng)網(wǎng)絡(luò)特征表征的語音情感識別方法[J]. 姜芃旭,傅洪亮,陶華偉,雷沛之. 電子器件. 2019(04)
[2]利用諧波顯著度和語者音色特征的混合語音中目標人基頻軌跡提取[J]. 后方帥,黎美琪,劉若倫. 聲學技術(shù). 2019(04)
[3]基于注意力機制的LSTM語音情感主要特征選擇[J]. 胡婷婷,馮亞琴,沈凌潔,王蔚. 聲學技術(shù). 2019(04)
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的孤立詞語音識別[J]. 侯一民,李永平. 計算機工程與設(shè)計. 2019(06)
[5]結(jié)合時變?yōu)V波和時頻掩碼的語音增強方法[J]. 成帥,張海劍,孫洪. 信號處理. 2019(04)
[6]基于語譜圖提取深度空間注意特征的語音情感識別算法[J]. 王金華,應(yīng)娜,朱辰都,劉兆森,蔡哲棟. 電信科學. 2019(07)
[7]基于語音心理聲學分析的駕駛疲勞檢測[J]. 李響,李國正,石俊剛,彭理群. 儀器儀表學報. 2018(10)
[8]基于自編碼特征的語音增強聲學特征提取[J]. 張濤,任相贏,劉陽,耿彥章. 計算機科學與探索. 2019(08)
[9]采用低維特征映射的耳語音向正常音轉(zhuǎn)換[J]. 周健,竇云峰,劉榮敏,王華彬,陶亮. 聲學學報. 2018(05)
[10]疲勞及緊張狀態(tài)管制員通話語音反應(yīng)特征研究[J]. 張興儉,袁樂平,趙嶷飛. 中國安全科學學報. 2018(06)
本文編號:3418022
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3418022.html
最近更新
教材專著