天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

針對單細胞數(shù)據(jù)Dropout現(xiàn)象的聚類算法研究

發(fā)布時間:2023-11-05 11:06
  近年來,單細胞RNA測序技術得到了廣泛的應用。隨著技術的不斷發(fā)展,使人們能夠從中獲取到大量的單細胞基因表達數(shù)據(jù),為后期的研究以及生物信息學的探索奠定了良好的基礎。單細胞基因表達數(shù)據(jù)中蘊藏著大量的生物基因信息,而如何從中分析出有意義的生物結論,揭示細胞基因間的奧秘成為了目前研究的焦點,因此對單細胞RNA測序得到的數(shù)據(jù)進行后續(xù)分析有著重要的意義。目前,聚類分析是研究該數(shù)據(jù)的重要分析手段,但因數(shù)據(jù)存在的dropout現(xiàn)象,導致聚類算法無法直接應用于數(shù)據(jù)中,使得到的結果并不理想。故本文的研究目的是針對單細胞基因表達數(shù)據(jù)存在的dropout現(xiàn)象進行聚類算法研究。本文研究了當前主流的處理該數(shù)據(jù)的降維聚類算法,借鑒其思想并進行改進,提出了一種符合數(shù)據(jù)特點、高效準確的聚類算法。該算法的思想是將降維的思想與處理dropout問題相結合應用到聚類分析中,把降維作為聚類的預處理步驟,在降維的過程中用改進的距離度量、估算插補數(shù)據(jù)等方法解決dropout問題。在此基礎上,本文選擇符合數(shù)據(jù)分布的模型進行聚類,并對聚類初始化的算法進行改進,從而提高了算法的準確性以及縮減了算法運行時間。在實驗驗證部分,本文選取了兩套...

【文章頁數(shù)】:43 頁

【學位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 研究背景
    1.2 研究的目的及意義
    1.3 國內外研究現(xiàn)狀
    1.4 本文的主要工作
第2章 預備知識
    2.1 PCA降維算法
    2.2 聚類分析算法
    2.3 EM算法
    2.4 本章小結
第3章 算法流程
    3.1 處理流程概述
    3.2 數(shù)據(jù)預處理
    3.3 基于余弦相似度的降維算法
        3.3.1 改進降維算法的思想
        3.3.2 改進降維算法實現(xiàn)
    3.4 細化初始值的聚類算法
        3.4.1 改進聚類算法的思想
        3.4.2 改進聚類算法實現(xiàn)
    3.5 本章小結
第4章 實證分析
    4.1 數(shù)據(jù)來源
    4.2 可視化與結果分析
    4.3 算法優(yōu)劣評價
    4.4 本章小結
結論
參考文獻
致謝



本文編號:3860910

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3860910.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶0f8d2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com