【摘要】:目的:1.通過(guò)前期隊(duì)列研究了解武漢市HBsAg陽(yáng)性孕婦乙型肝炎病毒(hepatitis B virus,HBV)宮內(nèi)感染的流行現(xiàn)狀,明確HBV宮內(nèi)感染的主要影響因素。2.構(gòu)建新生兒HBV宮內(nèi)感染的風(fēng)險(xiǎn)預(yù)測(cè)模型,并評(píng)價(jià)不同模型在HBV宮內(nèi)感染診斷中的泛化能力,以期從宏觀流行病學(xué)方面探討HBV宮內(nèi)感染危險(xiǎn)因素。3.使用公共數(shù)據(jù)庫(kù)對(duì)與HBV宮內(nèi)感染相關(guān)的基因進(jìn)行二次挖掘,以期從生物信息學(xué)方面探討與HBV宮內(nèi)感染相關(guān)的基因。方法:1.第一部分以2012年5月至2016年12月期間進(jìn)入乙肝母嬰傳播隊(duì)列的HBsAg陽(yáng)性孕婦及其新生兒為研究對(duì)象,按照出生時(shí)檢測(cè)新生兒股靜脈HBsAg或HBV DNA為陽(yáng)性作為HBV宮內(nèi)感染診斷標(biāo)準(zhǔn),分析HBsAg陽(yáng)性產(chǎn)婦的年齡、孕期疾病、HBV血清學(xué)暴露因素與HBV宮內(nèi)感染之間的關(guān)系。2.第二部分以新生兒是否發(fā)生HBV宮內(nèi)感染為結(jié)局,采用非條件Logistic回歸模型、決策樹(shù)模型和BP神經(jīng)網(wǎng)絡(luò)模型構(gòu)建新生兒HBV宮內(nèi)感染的風(fēng)險(xiǎn)預(yù)測(cè)模型,并通過(guò)ROC曲線下面積比較三種模型,通過(guò)選取不同預(yù)測(cè)樣本量來(lái)評(píng)價(jià)三種模型的泛化能力。3.結(jié)合前期研究篩選出的HBV宮內(nèi)感染易感基因,使用GEO數(shù)據(jù)庫(kù)中HBV表達(dá)譜芯片GSE51489和GSE83148中按照1.2倍數(shù)改變(fold change,FC)(logFC1.2)和P0.05的標(biāo)準(zhǔn)篩選候選基因。對(duì)GSE51489和GSE83418兩條表達(dá)譜芯片初次篩選的12個(gè)候選基因進(jìn)行GO(Gene Ontology)生物富集分析和KEGG(Kyoto Encyclopedia of Genes and Genomes)通路分析,同時(shí)納入表達(dá)譜芯片GSE65389進(jìn)行驗(yàn)證。結(jié)果:1.在1529名HBsAg陽(yáng)性孕婦分娩的1544名新生兒中,HBV宮內(nèi)感染的發(fā)生率為7.06%(109/1544)。HBeAg陽(yáng)性孕婦分娩的新生兒感染HBV的風(fēng)險(xiǎn)較HBeAg陰性孕婦分娩的新生兒高(RR=3.98,95%CI:2.66-5.94);HBV DNA陽(yáng)性孕婦分娩的新生兒發(fā)生HBV宮內(nèi)感染風(fēng)險(xiǎn)是HBVDNA陰性孕婦的2.961倍(RR=2.96,95%CI:2.00-4.39);新生兒HBV宮內(nèi)感染率隨著孕婦孕晚期HBV DNA載量的升高而升高(χ~2_(CMH)=50.380,P0.001)。2.(1)多因素非條件Logistic回歸模型顯示:母親孕期HBeAg陽(yáng)性(OR=3.14,95%CI:1.96-5.01)、孕晚期HBV DNA載量高(OR=1.88,95%CI:1.19-2.98)均是發(fā)生HBV宮內(nèi)感染的危險(xiǎn)因素;此外,剖宮產(chǎn)與HBV宮內(nèi)感染發(fā)生風(fēng)險(xiǎn)的降低顯著相關(guān)(OR=0.41,95%CI:0.27-0.61)。Logistic回歸模型ROC曲線下面積為0.731(95%CI:0.66-0.80)。(2)決策樹(shù)模型分析結(jié)果顯示:孕期HBeAg、孕晚期HBV DNA和分娩方式進(jìn)入模型。首先進(jìn)入決策樹(shù)模型的因素是孕期HBeAg(χ~2=51.178,P0.001),并形成2個(gè)子集:陰性和陽(yáng)性。其中,第一個(gè)陽(yáng)性子集中,分娩方式進(jìn)入分類樹(shù)(χ~2=20.626,P0.001),并形成2個(gè)亞子集:剖宮產(chǎn)和順產(chǎn)。在剖宮產(chǎn)亞子集中,孕晚期HBVDNA進(jìn)入分類樹(shù)(χ~2=7.621,P0.01),模型的ROC曲線下面積為0.667(95%CI:0.59-0.74)。(3)BP神經(jīng)網(wǎng)絡(luò)模型結(jié)果顯示:有1個(gè)隱藏層,隱藏層中有3個(gè)單位,預(yù)測(cè)變量對(duì)HBV宮內(nèi)感染發(fā)生風(fēng)險(xiǎn)影響的重要性排名前五位的依次為:孕期HBeAg、孕晚期HBV DNA、孕次、月經(jīng)規(guī)律和分娩年齡,模型的ROC曲線下面積為0.668(95%CI:0.58-0.72)。(4)對(duì)三個(gè)模型ROC曲線下面積進(jìn)行兩兩比較,差異無(wú)統(tǒng)計(jì)學(xué)意義(P0.05)。分別使用30%、20%和10%的預(yù)測(cè)樣本量分布評(píng)估三個(gè)模型的泛化能力,發(fā)現(xiàn)每個(gè)模型在不同預(yù)測(cè)樣本量下的AUC比較無(wú)統(tǒng)計(jì)學(xué)意義(P0.05),說(shuō)明預(yù)測(cè)模型較為穩(wěn)定,可以用于HBV宮內(nèi)感染的預(yù)測(cè)。3.GSE51489和GSE83148共同篩選出12個(gè)差異表達(dá)的基因:RGS1、PDE4B、MAFF、PMAIP1、JUND、PHLDA1、FOS、LAIR2、RGCC、CXCL8、SIK1、CCL20。通過(guò)GO分析和KEGG通路分析發(fā)現(xiàn)這12個(gè)候選基因主要富集在與免疫功能相關(guān)的疾病與通路上。PPI網(wǎng)絡(luò)分析發(fā)現(xiàn)候選基因PPI之間關(guān)系非常緊密,并且FOS、JUN、ATF3位于網(wǎng)絡(luò)的中心。在GSE65389中對(duì)PPI網(wǎng)絡(luò)蛋白及前期分子流行病學(xué)研究中篩選出來(lái)的基因進(jìn)行驗(yàn)證,發(fā)現(xiàn)TNFAIP3、CDKN1A、CD44、CXCL8、CCL20、CXCL13、PDCD1、LTA、MARS、TLR3、TLR4、SLC10A1均出現(xiàn)在驗(yàn)證的表達(dá)譜芯片中,且TNFAIP3、PDCD1、LTA和TLR3基因在GSE65389中HBV感染組與正常對(duì)照組表達(dá)差異有統(tǒng)計(jì)學(xué)意義(P0.05)。結(jié)論:1.武漢市HBsAg陽(yáng)性孕婦HBV宮內(nèi)感染的發(fā)生率為7.06%。孕期HBeAg陽(yáng)性、孕晚期HBV DNA陽(yáng)性是HBV宮內(nèi)感染發(fā)生的危險(xiǎn)因素,剖宮產(chǎn)是HBV宮內(nèi)感染的保護(hù)因素。2.三個(gè)預(yù)測(cè)模型均提示母親孕期HBeAg、孕晚期HBV DNA和分娩方式在乙肝宮內(nèi)感染風(fēng)險(xiǎn)預(yù)測(cè)中起著十分重要的作用。本次研究的三個(gè)預(yù)測(cè)模型均可以用于HBV宮內(nèi)感染的預(yù)測(cè)。3.通過(guò)對(duì)HBV感染芯片數(shù)據(jù)的挖掘及生物信息學(xué)分析,篩選出差異表達(dá)基因,發(fā)現(xiàn)這些基因主要富集在與免疫功能相關(guān)的疾病與通路上。結(jié)合前期隊(duì)列研究出的與HBV宮內(nèi)感染相關(guān)的基因,在目標(biāo)表達(dá)譜芯片中驗(yàn)證出TNFAIP3、PDCD1、LTA和TLR3在實(shí)驗(yàn)組和對(duì)照組中表達(dá)差異,為研究HBV感染乃至HBV宮內(nèi)感染的提供新的基因和研究方向。
【圖文】:
次研究建立 Logistic 回歸模型,首先按照一部分篩選出的入到多因素分析中,采用前進(jìn)式逐步回歸的方法,納入標(biāo) 0.10,進(jìn)行多因素非條件 Logistic 回歸分析,構(gòu)建 Logist因素的 OR 值和其上下限的 95%置信區(qū)間(95%CI),并決策樹(shù)模型的構(gòu)建1 基本結(jié)構(gòu)研究決策樹(shù)模型運(yùn)用分類樹(shù)方法(Classification Tree MethCHAID 計(jì)算法則,生成決策樹(shù)。窮舉 CHAID 其中包括了“作用”和“檢驗(yàn)”幾個(gè)核心內(nèi)容[19]!翱ǚ健闭f(shuō)明了統(tǒng)計(jì)學(xué)檢測(cè)作用”說(shuō)明此次檢驗(yàn)預(yù)測(cè)中各個(gè)變量之間關(guān)系;“檢驗(yàn)”指此;“自動(dòng)”指代這項(xiàng)技術(shù)的可操作性。其中心思想是:通過(guò)佳的合并點(diǎn),分類變量采用兩兩比較,連續(xù)變量采用合并策樹(shù)由于數(shù)據(jù)的噪音較多,往往通過(guò)樹(shù)枝剪切來(lái)降低過(guò)分枝可以清晰提示對(duì)結(jié)局變量最有影響的因素。經(jīng)過(guò)剪枝之2-1。

圖 2-2 神經(jīng)元模型描述神經(jīng)元模型的函數(shù)方程式來(lái)如下:{ ∑ =1 ( )其中,Xj(j=1,2,…,n)為從上一節(jié)神經(jīng)元傳入的信號(hào),θj示從神經(jīng)元 i 到 j 的連接權(quán)值。f(xj)為神經(jīng)元的激活函數(shù),通過(guò)神信號(hào)加權(quán)和而產(chǎn)生。②神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu):神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)分為前饋神經(jīng)網(wǎng)絡(luò);反饋組織網(wǎng)絡(luò)。前饋神經(jīng)網(wǎng)絡(luò)為最常見(jiàn)得一種,圖 2-3 展示了多層前饋型,,它分為三層:輸入層、隱含層和輸出層,層層連線表示可以通之間得權(quán)相連接。其中每層權(quán)都不回送到前一層的單元,所以成為絡(luò)。③學(xué)習(xí)規(guī)則:是修改神經(jīng)網(wǎng)絡(luò)參數(shù)的規(guī)則或算法,以便網(wǎng)絡(luò)的給定的輸出。這種學(xué)習(xí)過(guò)程通常相當(dāng)于修改網(wǎng)絡(luò)內(nèi)變量的權(quán)重和閾值。
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類號(hào)】:R714.251
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 梁棟;張鳳琴;陳大武;李小青;王夢(mèng)非;;一種基于決策樹(shù)和遺傳算法-BP神經(jīng)網(wǎng)絡(luò)的組合預(yù)測(cè)模型[J];中國(guó)科技論文;2015年02期
2 王巍;吳福敢;胡肖玲;馬海蘭;陸敏玉;李美玲;;女性乙肝病毒攜帶者體外受精-胚胎移植妊娠結(jié)局分析[J];中國(guó)優(yōu)生與遺傳雜志;2014年06期
3 李力;;“乙型肝炎病毒母嬰傳播預(yù)防臨床指南(第1版)”解讀[J];中華婦幼臨床醫(yī)學(xué)雜志(電子版);2014年02期
4 肖晗;吳旗;艾洪武;;HBsAg陽(yáng)性孕婦宮內(nèi)感染相關(guān)因素研究[J];中華醫(yī)院感染學(xué)雜志;2013年09期
5 趙紫奉;李韶斌;孔抗美;;基于決策樹(shù)算法的疾病診斷分析[J];中國(guó)衛(wèi)生信息管理雜志;2011年05期
6 張芬;余金明;王家宏;毛勇;張李軍;李社昌;戰(zhàn)義強(qiáng);胡大一;;Exhaustive CHAID分類樹(shù)與logistic回歸在腦卒中危險(xiǎn)因素中的應(yīng)用[J];中國(guó)預(yù)防醫(yī)學(xué)雜志;2011年07期
7 杜旦;王睿;王玉;;蘭州市乙肝患者及其家屬乙型肝炎KAP調(diào)查分析[J];中華疾病控制雜志;2011年04期
8 黃克峰;;拉米夫定對(duì)胎盤組織細(xì)胞凋亡的影響[J];藥物流行病學(xué)雜志;2010年05期
9 陳桂蘭,黃天華,謝慶東,王曉梅,熊小芳;卵母細(xì)胞攜帶的HBV DNA在小鼠早期胚胎中的復(fù)制與表達(dá)[J];癌變.畸變.突變;2005年03期
10 ;Presence and integration of HBV DNA in mouse oocytes[J];World Journal of Gastroenterology;2005年19期
相關(guān)博士學(xué)位論文 前10條
1 尹文嬌;乙型肝炎病毒母嬰傳播阻斷的分子流行病學(xué)研究[D];中國(guó)疾病預(yù)防控制中心;2017年
2 倪然;基于流行病學(xué)、臨床癥狀、腫瘤標(biāo)志和影像學(xué)特征的肺癌診斷模型的建立[D];鄭州大學(xué);2016年
3 劉陽(yáng);早期肝癌療效評(píng)價(jià)的貝葉斯網(wǎng)絡(luò)meta分析及用微血管侵犯風(fēng)險(xiǎn)預(yù)測(cè)指導(dǎo)個(gè)體化消融治療[D];第二軍醫(yī)大學(xué);2016年
4 謝道文;基于數(shù)據(jù)挖掘的火災(zāi)分析模型及應(yīng)用研究[D];中南大學(xué);2014年
5 張捷;進(jìn)化算法及智能數(shù)據(jù)挖掘若干問(wèn)題研究[D];西安電子科技大學(xué);2013年
6 楊振艦;可視化數(shù)據(jù)挖掘技術(shù)在城市地下空間GIS中的應(yīng)用研究[D];河北工業(yè)大學(xué);2012年
7 吳波;造紙過(guò)程能源管理系統(tǒng)中數(shù)據(jù)挖掘與能耗預(yù)測(cè)方法的研究[D];華南理工大學(xué);2012年
8 劉太安;基于支持向量機(jī)的空間數(shù)據(jù)挖掘方法及其在旅游地理經(jīng)濟(jì)分析中的應(yīng)用[D];中國(guó)礦業(yè)大學(xué);2012年
9 冉鵬;基于動(dòng)態(tài)數(shù)據(jù)挖掘的電站熱力系統(tǒng)運(yùn)行優(yōu)化方法研究[D];華北電力大學(xué);2012年
10 袁冠;移動(dòng)對(duì)象軌跡數(shù)據(jù)挖掘方法研究[D];中國(guó)礦業(yè)大學(xué);2012年
相關(guān)碩士學(xué)位論文 前2條
1 馮曉蕾;基于人血漿microRNAs的數(shù)據(jù)挖掘技術(shù)構(gòu)建肺癌預(yù)測(cè)系統(tǒng)[D];鄭州大學(xué);2017年
2 劉暢;新生兒乙型肝炎病毒宮內(nèi)感染傳播途徑的分子機(jī)制研究[D];中國(guó)人民解放軍軍事醫(yī)學(xué)科學(xué)院;2016年
本文編號(hào):
2627527
本文鏈接:http://www.sikaile.net/yixuelunwen/fuchankeerkelunwen/2627527.html