感冒病人嗓音的特征提取與識別研究
本文關鍵詞:感冒病人嗓音的特征提取與識別研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:近年來智能穿戴設備和移動終端在健康管理上的應用越來越多,而感冒這種常見的上呼吸道疾病卻沒有可用于移動設備的檢測方法。感冒發(fā)病率高且容易引發(fā)其他疾病,在診斷感冒患者時,患者的聲音信號能提供很大價值的信息;诟忻安“Y會引起患者聲音變化這一特性,本文采集感冒患者和健康人嗓音,提取可以用于區(qū)分感冒患者嗓音和健康人嗓音的特征參數(shù)。探索出一種便捷的感冒患者嗓音識別方法,結合智能穿戴設備展示了本研究的一個使用場景,本文取得的主要工作內容如下:1. 采集語音樣本。研究語音的產生機理和數(shù)字模型,聯(lián)系感冒的喉痛、鼻塞、咳嗽等病癥,對感冒患者聲音變化作出解釋,為從聲音出發(fā)分析感冒提供了理論上的支撐。2. 對采集到的語音信號做預處理。使用一階高通濾波器加強語音信號的高頻特征,濾除噪聲干擾;使用漢明窗對語音信號做分幀加窗操作,為后續(xù)使用短時分析方法提取特征參數(shù)做準備;使用短時能量為門限對語音做端點識別,剔除語音的空白段。3. 改進傳統(tǒng)病態(tài)嗓音實驗方法。采集實驗對象感冒前后的語音,排除不同人之間性別、說話習慣和聲道個性的干擾,對所提取的參數(shù)做統(tǒng)計分析。實驗結果表明研究對象感冒前后嗓音的基音頻率、共振峰頻率和Mel倒譜系數(shù)具有明顯區(qū)別。4.提出一種感冒患者嗓音識別方法。提取反映聲帶特征的基音頻率、反映聲道形狀的共振峰頻率和基于入耳聽覺模型的Mel倒譜系數(shù)三種特征參數(shù),結合本文的語音庫和所提取特征參數(shù),對基于BP神經網絡的感冒嗓音分類進行了研究。實驗結果表明本文提取的特征向量能夠很好地用于感冒患者嗓音的識別,其中按照傳統(tǒng)病態(tài)嗓音研究方法訓練的神經網絡識別準確率為90.21%,對單個患者感冒訓練的神經網絡識別效果明顯更好,準確率在93.08%~97.95%之間。5.基于智能手表和Android手機實現(xiàn)了一款感冒嗓音識別應用。從語音的角度出發(fā)檢測人體感冒狀況,為移動設備在健康方面的應用提供了新的思路。
【關鍵詞】:感冒 嗓音評估 語音分析 神經網絡 智能穿戴
【學位授予單位】:浙江大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TN912.3
【目錄】:
- 摘要5-6
- ABSTRACT6-11
- 1. 緒論11-21
- 1.1 課題的研究背景及研究意義11-12
- 1.2 課題研究現(xiàn)狀12-19
- 1.2.1 嗓音評估方法12-14
- 1.2.2 特征提取技術14-18
- 1.2.3 模式識別技術18-19
- 1.3 本文結構19-21
- 2. 語音信號的前端處理21-33
- 2.1 語音產生的過程21-22
- 2.2 語音信號的數(shù)字模型22-24
- 2.2.1 激勵模型22-23
- 2.2.2 聲道模型23-24
- 2.2.3 輻射模型24
- 2.3 語音信號的預處理24-31
- 2.3.1 語音的采樣和量化24-25
- 2.3.2 預加重25-28
- 2.3.3 分幀與加窗28-29
- 2.3.4 端點識別29-31
- 2.4 本章小結31-33
- 3. 語音信號的特征提取與研究33-47
- 3.1 語音信號的基音提取33-38
- 3.1.1 基于歸一化互相關函數(shù)的基音檢測33-34
- 3.1.2 基于振幅壓縮濾波器的基音估計算法34-37
- 3.1.3 實驗對象感冒前后語音基頻對比37-38
- 3.2 語音信號共振峰提取38-43
- 3.2.1 基于倒譜法的共振峰檢測38-42
- 3.2.2 共振峰提取結果分析42-43
- 3.3 語音信號的MEL倒譜系數(shù)分析43-46
- 3.3.1 人耳對頻率的感知特性43-44
- 3.3.2 MFCC的提取44-45
- 3.3.3 MFCC提取結果45-46
- 3.4 本章小結46-47
- 4. 感冒嗓音的識別47-55
- 4.1 神經網絡概述47-49
- 4.2 BP神經網絡49-51
- 4.3 基于BP神經網絡的感冒嗓音識別51-53
- 4.3.1 特征的向量的構造51
- 4.3.2 神經網絡模型構建51-53
- 4.3.3 感冒嗓音和正常嗓音的分類結果53
- 4.4 本章小結53-55
- 5. 感冒嗓音識別系統(tǒng)在智能手表上的實現(xiàn)55-65
- 5.1 系統(tǒng)環(huán)境55
- 5.2 系統(tǒng)功能與框架55-58
- 5.3 系統(tǒng)各模塊設計58-64
- 5.3.1 數(shù)據(jù)庫設計58-59
- 5.3.2 Socket Server設計59-60
- 5.3.3 語音識別算法60-61
- 5.3.4 Web接口設計61-62
- 5.3.5 Android客戶端設計62-64
- 5.4 本章小結64-65
- 6. 總結與展望65-67
- 6.1 研究工作總結65-66
- 6.2 未來工作展望66-67
- 參考文獻67-71
- 致謝71-73
- 個人簡歷73-75
- 攻讀學位期間發(fā)表的學術論文與取得的其它研究成果75
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前9條
1 鐘潤蘭;王玉芬;;職業(yè)用聲者嗓音障礙指數(shù)分析[J];江西醫(yī)藥;2014年07期
2 王文娟;楊震;;基于語音壓縮感知觀測序列非重構的清濁音判別法[J];數(shù)據(jù)采集與處理;2013年03期
3 萬程偉;樂永宏;;感冒后咳嗽的治療體會[J];贛南醫(yī)學院學報;2010年04期
4 龍艷花;郭武;戴禮榮;;采用韻律特征的說話人確認系統(tǒng)[J];數(shù)據(jù)采集與處理;2010年01期
5 王麗華;沈偉;趙堅;魏俊;朱靜;楚銅;;嗓音聲學檢測在慢喉喑證候分型中的應用研究[J];聽力學及言語疾病雜志;2009年04期
6 唐曉燕,唐靜雯;體虛感冒合劑治療反復上呼吸道感染80例[J];中醫(yī)研究;2004年04期
7 侯麗珍,韓德民,徐文,張麗;嗓音檢測中元音聲樣的選擇[J];聽力學及言語疾病雜志;2002年01期
8 張志明,楊式鱗;病態(tài)嗓音基頻和音域的變化[J];臨床耳鼻咽喉科雜志;2000年06期
9 魏春生,陳鋒,王薇;國際音標和a:的選擇對聲學測試參數(shù)的影響[J];臨床耳鼻咽喉科雜志;1999年03期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 徐晨;曹輝;;一種語音信號生成的數(shù)字模型的研究[A];第二屆西安-上海兩地聲學學術會議論文集[C];2011年
中國博士學位論文全文數(shù)據(jù)庫 前2條
1 李寧;基于聲學參數(shù)和支持向量機的病理嗓音分類研究[D];華東師范大學;2013年
2 張濤;基于語音特征的帕金森病可視化診斷方法研究[D];燕山大學;2012年
中國碩士學位論文全文數(shù)據(jù)庫 前1條
1 呂霄云;基于MFCC和GMM的異常聲音識別算法研究[D];西南交通大學;2010年
本文關鍵詞:感冒病人嗓音的特征提取與識別研究,由筆耕文化傳播整理發(fā)布。
本文編號:277117
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/277117.html