基于聲診的疾病分類樹構(gòu)建
發(fā)布時間:2021-03-05 03:53
隨著計算機(jī)技術(shù)逐漸應(yīng)用于醫(yī)學(xué)領(lǐng)域中,借助計算機(jī)對患者的嗓音進(jìn)行分析和診斷,成本低且易操作。由于聲診具有簡便快捷、無損傷無痛等優(yōu)勢,越來越多的研究者開始關(guān)注相關(guān)的研究。影響發(fā)聲的疾病主要包括神經(jīng)類、肺病類和發(fā)聲器官病變類,本文針對三大類疾病中的典型疾病,通過分析病態(tài)嗓音與健康嗓音間的差異性,從特征提取、特征選擇和特征融合展開不同類別嗓音間的二分類研究,將多分類問題分解為二分類問題,構(gòu)建基于聲診的疾病分類樹模型。首先,通過分析病態(tài)嗓音與健康嗓音的差異性,提取了基于先驗知識和基于字典學(xué)習(xí)的嗓音特征。針對各類別間嗓音樣本數(shù)量不平衡的問題,分別設(shè)計了健康樣本和肺癌樣本的下采樣、上采樣方案,實驗結(jié)果證明本文中提出方法有效緩解了樣本不平衡導(dǎo)致的少數(shù)類樣本誤分問題。然后,針對提取的嗓音特征維數(shù)過高的問題,采用特征選擇的方式消除冗余特征,選擇最佳的特征子集,在保證分類精度的基礎(chǔ)上有效降低了特征維數(shù)。在單發(fā)音特征優(yōu)化的基礎(chǔ)上,分析不同發(fā)音在各類別間二分類的差異性,提出了特征層和決策層的多發(fā)音融合方案,充分利用不同發(fā)音的特征信息,有效提升了分類的準(zhǔn)確率。最后,針對多分類中少數(shù)類樣本分類精度低的問題,將多分類...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
各類別Mel倒譜系數(shù)圖
圖 2-3 各類別嗓音樣本波形圖本文使用的疾病語音數(shù)據(jù)庫通過與廣東省中醫(yī)院合作采集,采用標(biāo)準(zhǔn)化流程,具有醫(yī)生診斷的真實標(biāo)簽。數(shù)據(jù)庫中包含健康與多種類別疾病的本,每例樣本都包含同一采集人對不同內(nèi)容的持續(xù)發(fā)音,每個錄音持續(xù),在此選取每例樣本都包含的/l /、/wō/、/l /、/yī/四種發(fā)音樣本,各類樣本數(shù)量如表 2-2 中所示。表 2-2 各類別樣本數(shù)量類別 數(shù)量健康 446 例帕金森 122 例感冒 100 例肺癌 30 例 實驗結(jié)果以及分析由于各類別樣本間數(shù)量的不平衡問題,因此只通過準(zhǔn)確率對分類效果進(jìn)
本文編號:3064528
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
各類別Mel倒譜系數(shù)圖
圖 2-3 各類別嗓音樣本波形圖本文使用的疾病語音數(shù)據(jù)庫通過與廣東省中醫(yī)院合作采集,采用標(biāo)準(zhǔn)化流程,具有醫(yī)生診斷的真實標(biāo)簽。數(shù)據(jù)庫中包含健康與多種類別疾病的本,每例樣本都包含同一采集人對不同內(nèi)容的持續(xù)發(fā)音,每個錄音持續(xù),在此選取每例樣本都包含的/l /、/wō/、/l /、/yī/四種發(fā)音樣本,各類樣本數(shù)量如表 2-2 中所示。表 2-2 各類別樣本數(shù)量類別 數(shù)量健康 446 例帕金森 122 例感冒 100 例肺癌 30 例 實驗結(jié)果以及分析由于各類別樣本間數(shù)量的不平衡問題,因此只通過準(zhǔn)確率對分類效果進(jìn)
本文編號:3064528
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3064528.html
最近更新
教材專著