基于MFCC與VQ碼本的不良音頻檢測算法研究
發(fā)布時間:2019-05-19 10:25
【摘要】:隨著信息網(wǎng)絡的快速發(fā)展,對于網(wǎng)絡上不良文化的傳播越來越受到政府和人們的關注,盡管政府已經(jīng)投入了很大的人力和財力來控制不良文化的傳播,但是由于網(wǎng)絡信息的不現(xiàn)實性,資源格式的多樣性,這給不良文化的檢測和阻斷不良文化的傳播帶來了難題,而且色情、暴力、不當言論和不當視頻等不良網(wǎng)絡文化通常以文本、圖片、視頻有些甚至以游戲等方式傳播,傳播的途徑多種多樣,而聲音信號也是傳遞這些不良文化的途徑之一,對聲音信號的研究與檢測也一直都是國內(nèi)外學者們關注的內(nèi)容,隨著信息的發(fā)展和研究的深入,語音檢測和語音設別也被越來越多的運用到實際設備的應用當中,本文即在某一段視頻在播放過程中對該視頻進行提取音頻,生成一個語音文件,對該語音文件進行判斷該音頻是否屬于不良音頻,提出了一種快速準確的檢測方法,同時由于該音頻是從視頻中提取出來的,這對于檢測不良視頻的屬性起到了輔助作用,可以有效提高不良視頻檢測的準確率。本文對不良音頻的提取,檢測算法做了詳細的闡述,在提取音頻的MFCC系數(shù)的基礎上提出了一種新的檢測方法,在音頻檢測過程中由于對于屬于同一類型的音頻,其特征參數(shù)比較近似,根據(jù)這一特征,本文重點提出來一種對音頻進行檢測的算法,其主要分為三個部分,一是提取出視頻中的音頻,并對音頻進行預處理,二是提取音頻文件的特征參數(shù),最后根據(jù)樣本文件訓練一個初步的VQ碼本,在檢測過程中設定一個閥值,并對VQ碼本不斷進行迭代,對預處理之后的音頻提取其MFCC系數(shù)與不斷迭代的VQ碼本進行比較,判斷出音頻的性質(zhì),從而對判斷該段視頻文件是否屬于不良視頻增加了判斷依據(jù),提高了檢測不良視頻的準確率。該算法在Matlab和VC++6.0中得到了實現(xiàn)。
[Abstract]:......
【學位授予單位】:蘭州大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TN912.3
本文編號:2480645
[Abstract]:......
【學位授予單位】:蘭州大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TN912.3
【參考文獻】
相關期刊論文 前1條
1 黃國慶;宋家友;;語音失真測度系統(tǒng)的構(gòu)成與算法實現(xiàn)[J];信陽師范學院學報(自然科學版);2008年02期
,本文編號:2480645
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/2480645.html
最近更新
教材專著