天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于粒計(jì)算的疾病差異表達(dá)基因研究

發(fā)布時(shí)間:2020-03-28 23:19
【摘要】:本文基于粒計(jì)算理論,結(jié)合已有的聚類算法以及Logistic Regression、Random Forest等數(shù)據(jù)挖掘算法,對其進(jìn)行改進(jìn)和優(yōu)化,并建立優(yōu)化模型。從NCBI以及GEO數(shù)據(jù)庫中分別下載病毒蛋白質(zhì)序列和基因芯片數(shù)據(jù),通過對其進(jìn)行預(yù)處理與數(shù)字特征化后,應(yīng)用到模型中,結(jié)合實(shí)驗(yàn)結(jié)果,證實(shí)本文提出的模型能為生物信息大數(shù)據(jù)的處理提供新的有效的方法。文章的主要工作內(nèi)容可以概括如下:第二章是準(zhǔn)備知識,對各類聚類算法、粒度空間中的一些基本概念、最小生成樹算法、Logistic Regression模型和Random Forest模型的原理進(jìn)行了介紹。第三章在粒計(jì)算理論的基礎(chǔ)上,進(jìn)行了基于歸一化距離的最小生成樹分類算法研究。首先,根據(jù)統(tǒng)計(jì)學(xué)中類內(nèi)偏差和類間偏差的性質(zhì),定義了新的最優(yōu)聚類指標(biāo),然后在已有的粒度空間生成算法的基礎(chǔ)上,引入最小生成樹以及新的最優(yōu)聚類指標(biāo),給出了最小生成樹分類算法并建立最優(yōu)聚類模型。最后,將最優(yōu)聚類模型應(yīng)用于898條同時(shí)含有HA和NA并且能夠感染人的禽流感病毒的蛋白質(zhì)序列上,基于距離中心最近原則,先后兩次運(yùn)行最小生成樹分類算法,得到了最優(yōu)層次結(jié)構(gòu),相應(yīng)地,選出了6條具有代表性的病毒序列。第四章的研究對象是癌癥,通過將Logistic Regression算法和Random Forest算法進(jìn)行組合,提出了一種新的混合模型——LR-RF模型,基于FWER錯誤測度的Bonferroni檢驗(yàn),將模型應(yīng)用在兩個乳腺癌DNA微陣列數(shù)據(jù)集上,篩選乳腺癌中差異表達(dá)的基因。通過十次重復(fù)隨機(jī)試驗(yàn),本文所提出的LR-RF模型的平均預(yù)測準(zhǔn)確率達(dá)到93.11%,方差低至0.00045。當(dāng)Random Forest算法中基因重要性評分進(jìn)行排序時(shí)選取的閾值?=0.2,預(yù)測準(zhǔn)確率達(dá)到最大值95.57%,并且篩選出來的差異表達(dá)基因數(shù)量相對較少。另外,建立差異表達(dá)基因的相互作用網(wǎng)絡(luò),通過分析基因相互作用網(wǎng)絡(luò),可以發(fā)現(xiàn)本文選擇的前20個基因中的大多數(shù)都涉及乳腺癌的發(fā)生與發(fā)展過程。這些結(jié)果都證明了LR-RF模型的可靠性和有效性。
【圖文】:

流程圖,聚類算法,分裂算法,聚類


第二章 準(zhǔn)備知識類算法簡介類算法與粒計(jì)算有著密切的聯(lián)系,聚類算法是將數(shù)據(jù)樣本進(jìn)行分類,而粒計(jì)算樣本進(jìn)行;。因此,聚類算法將粒計(jì)算思想進(jìn)行具體的實(shí)現(xiàn),而粒計(jì)算是將的思想進(jìn)行了抽象的描述。下面介紹一些常用的聚類算法。于劃分的聚類-means 算法是數(shù)據(jù)挖掘中最常用的一種劃分聚類算法[18]。K-means 算法是在給類數(shù) n 之后,能夠?qū)?shù)據(jù)集分成 n 個簇,,算法需要使得平方誤差達(dá)到最小化,目的是找到我們想要的 n 個簇,并且使得每個簇內(nèi)所有的樣本點(diǎn)之間的相似度。K-means 算法簡單,并且運(yùn)行速度快,適用于大數(shù)據(jù)集,但是算法本身也有,由于初始值選擇的不同,會導(dǎo)致最終的分類結(jié)果也不同,而且 K-means 算法分布的數(shù)據(jù)集也不能得到合理的分類結(jié)果。K-means 算法的流程圖如圖 2-1 所

流程圖,層次聚類算法,流程圖


圖 2-2 層次聚類算法流程圖層次聚類算法形成的類一般通過樹狀圖來表示。層次聚類算法具有不需要預(yù)先數(shù)目、容易發(fā)現(xiàn)類與類之間的層次關(guān)系等優(yōu)點(diǎn),但是層次聚類算法的計(jì)算復(fù)雜且很可能將數(shù)據(jù)樣本聚類成鏈狀。3 基于密度的聚類密度聚類的思想不同于 K-means 算法的思想,但是密度聚類的思想更符合人類密度聚類的基本思想是通過是否緊密相連來判斷數(shù)據(jù)樣本點(diǎn)是否屬于一個簇。度聚類的算法中,比較有代表性的算法是 Density-Based Spatial Clusterilications with Noise (DBSCAN)[20],它基于一組鄰域( , MinPts)來表征整個數(shù)據(jù)處的樣本是否是緊密的,下面是 DBSCAN 的基本算法步驟:
【學(xué)位授予單位】:江南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP311.13;R-05

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 ;MNNG致小鼠肢體異常發(fā)育差異表達(dá)基因的篩選和鑒定[J];癌變.畸變.突變;2001年04期

2 李剛,壽江;尋找差異表達(dá)基因的新方法:mRNA差異顯示[J];國外醫(yī)學(xué)(放射醫(yī)學(xué)核醫(yī)學(xué)分冊);1997年03期

3 趙勇,丁金鳳;尋找差異表達(dá)基因[J];國外醫(yī)學(xué).遺傳學(xué)分冊;2000年02期

4 李煒弘;許嗣立;張?zhí)於?丁維俊;黃禹峰;曾躍琴;譚雪菊;;老齡腎陽虛證差異表達(dá)基因的篩選與鑒定[J];遼寧中醫(yī)雜志;2012年04期

5 劉洪博;劉新龍;蘇火生;陸鑫;徐超華;毛鈞;林秀琴;李純佳;李旭娟;字秋艷;;干旱脅迫下割手密根系轉(zhuǎn)錄組差異表達(dá)分析[J];中國農(nóng)業(yè)科學(xué);2017年06期

6 任麗萍;章琳;洪貴妮;郭政;;基于蛋白質(zhì)互作評價(jià)差異表達(dá)基因的重復(fù)性[J];生物信息學(xué);2011年03期

7 王學(xué),徐靜;一種鑒別基因差異表達(dá)的新方法——差異表達(dá)mRNA呈現(xiàn)技術(shù)[J];生物工程進(jìn)展;1998年03期

8 戴建新,孫樹漢;差示RT-PCR克隆寄生蟲差異表達(dá)基因的新策略[J];中國寄生蟲學(xué)與寄生蟲病雜志;1997年05期

9 蔣定鋒;潘娟娟;趙耐青;;差異表達(dá)基因篩選方法的比較[J];中國衛(wèi)生統(tǒng)計(jì);2006年05期

10 齊魯;丁彥青;;基于差異表達(dá)基因探索大腸癌早期轉(zhuǎn)移相關(guān)分子機(jī)制[J];中國科學(xué):生命科學(xué);2013年07期

相關(guān)會議論文 前10條

1 胡建達(dá);陳曉梨;陳鑫基;祝亮方;楊月玲;陳元仲;呂聯(lián)煌;;抑制性消減雜交法研究初治和復(fù)發(fā)急性淋巴細(xì)胞白血病基因的差異表達(dá)[A];第九屆全國實(shí)驗(yàn)血液學(xué)會議論文摘要匯編[C];2003年

2 尚偉;劉震;來超;謝兆宏;;應(yīng)用抑制性消減雜交技術(shù)篩選癲癇患者外周血的差異表達(dá)基因[A];中華醫(yī)學(xué)會第十七次全國神經(jīng)病學(xué)學(xué)術(shù)會議論文匯編(下)[C];2014年

3 韓愉;喬洪賓;馮金濤;劉金明;李浩;陸珂;金亞美;;正常發(fā)育與發(fā)育阻遏雌蟲差異表達(dá)miRNA分析[A];中國畜牧獸醫(yī)學(xué)會獸醫(yī)寄生蟲學(xué)分會第十三次學(xué)術(shù)研討會論文集[C];2015年

4 狄冉;儲明星;;高通量篩選差異表達(dá)基因技術(shù)簡介[A];中國畜牧獸醫(yī)學(xué)會養(yǎng)羊?qū)W分會全國養(yǎng)羊生產(chǎn)與學(xué)術(shù)研討會議論文集[C];2010年

5 葉波平;邊杉;趙艷景;王穎;奚濤;王;吳梧桐;;鯊魚再生肝組織中差異表達(dá)基因及其產(chǎn)物的活性研究[A];中國海洋生化學(xué)術(shù)會議論文薈萃集[C];2005年

6 李尚偉;龍章富;;性逆轉(zhuǎn)石斑魚性腺中PIN基因的差異表達(dá)及其特征分析(英文)[A];第三屆貴州省自然科學(xué)優(yōu)秀學(xué)術(shù)論文評選獲獎?wù)撐募?010年)[C];2010年

7 張計(jì)育;黃勝男;莫正海;郭忠仁;王剛;宣繼萍;賈曉東;;澇害脅迫下獼猴桃差異表達(dá)基因的轉(zhuǎn)錄組測序及比較分析[A];中國園藝學(xué)會2015年學(xué)術(shù)年會論文摘要集[C];2015年

8 秦國政;田世平;王清;劉嘉;;線粒體蛋白差異表達(dá)及氧化修飾與果實(shí)成熟衰老的關(guān)系[A];第三屆全國植物蛋白質(zhì)組學(xué)大會摘要集[C];2010年

9 余鑫煜;董學(xué)君;張卉;邵健忠;項(xiàng)黎新;;小鼠肝損傷過程中差異表達(dá)基因的cDNA芯片篩選及功能分析[A];2009年浙江省檢驗(yàn)醫(yī)學(xué)學(xué)術(shù)年會論文匯編[C];2009年

10 黨平;聶敏媛;孟慶巖;安鈺;孔磊;董蕊;鄭翰圣;施生根;;基于GO分析的全基因組芯片篩選小鼠牙囊發(fā)育早期差異表達(dá)基因的研究[A];第八次全國口腔修復(fù)學(xué)學(xué)術(shù)年會論文匯編[C];2014年

相關(guān)重要報(bào)紙文章 前1條

1 ;腎癌差異表達(dá)基因鑒定及功能研究[N];中國醫(yī)藥報(bào);2002年

相關(guān)博士學(xué)位論文 前10條

1 唐堯;SEPT家族基因異常表達(dá)在食管鱗癌中的臨床意義及作用機(jī)制[D];北京協(xié)和醫(yī)學(xué)院;2017年

2 姚穎垠;小麥雜交種與親本之間差異表達(dá)基因的分離、克隆與功能鑒定[D];中國農(nóng)業(yè)大學(xué);2005年

3 苑純秀;日本血吸蟲發(fā)育期別差異表達(dá)基因的篩選研究及新基因的克隆分析[D];中國農(nóng)業(yè)科學(xué)院;2005年

4 胡國章;利用生物信息學(xué)方法篩選膠質(zhì)瘤的差異表達(dá)基因及其相關(guān)機(jī)制[D];吉林大學(xué);2015年

5 齊湘杰;高惡性膀胱移行細(xì)胞癌與相應(yīng)正常上皮差異表達(dá)基因的克隆及功能研究[D];天津醫(yī)科大學(xué);2003年

6 張曉文;銀杏雌雄花芽差異表達(dá)基因研究[D];山東農(nóng)業(yè)大學(xué);2014年

7 戚大川;應(yīng)用基因芯片篩選膽管癌相關(guān)差異表達(dá)基因及對其功能的研究[D];蘇州大學(xué);2015年

8 陳杰;人肺腺癌多藥耐藥細(xì)胞差異表達(dá)基因的克隆與初步鑒定[D];第三軍醫(yī)大學(xué);2001年

9 彭依群;雌二醇誘導(dǎo)人成骨樣MG-63細(xì)胞差異表達(dá)基因的分離和鑒定[D];中南大學(xué);2003年

10 陳蓉芳;N-甲基-N'-硝基-N-甲基亞硝基胍致小鼠肢體異常發(fā)育差異表達(dá)基因的篩選和鑒定[D];第二軍醫(yī)大學(xué);2001年

相關(guān)碩士學(xué)位論文 前10條

1 孫夢夢;基于粒計(jì)算的疾病差異表達(dá)基因研究[D];江南大學(xué);2018年

2 方春曉;新疆漢族食管淲癌mRNA差異表達(dá)基因的篩選[D];石河子大學(xué);2018年

3 李佼旬;基因芯片篩選非綜合征型唇腭裂差異表達(dá)基因的初步研究[D];重慶醫(yī)科大學(xué);2018年

4 何聰;非酒精性脂肪肝病的血清miRNA差異表達(dá)譜的初步研究[D];江蘇大學(xué);2017年

5 王菁菁;食管鱗癌中差異表達(dá)的lncRNA的篩選及分析[D];江蘇大學(xué);2017年

6 任麗萍;根據(jù)功能相關(guān)性評價(jià)差異表達(dá)基因的可重復(fù)性[D];電子科技大學(xué);2011年

7 魏婷;基于轉(zhuǎn)錄組數(shù)據(jù)的造血干細(xì)胞差異表達(dá)基因研究[D];北京交通大學(xué);2015年

8 張遠(yuǎn)嬋;聯(lián)用激光顯微切割與基因芯片技術(shù)篩選肝細(xì)胞癌差異表達(dá)基因[D];廣州醫(yī)學(xué)院;2009年

9 徐勁松;應(yīng)用抑制消減雜交技術(shù)研究外周血嗜酸細(xì)胞支氣管哮喘相關(guān)基因的差異表達(dá)[D];第一軍醫(yī)大學(xué);2004年

10 張小蒙;雜交稻差異表達(dá)的基因分析及其與雜種優(yōu)勢的關(guān)系[D];揚(yáng)州大學(xué);2010年



本文編號:2605056

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/yixuelunwen/yiyuanguanlilunwen/2605056.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4c191***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com