基于二代測序的目標區(qū)段SNP識別數據流的建立與比較分析
發(fā)布時間:2017-07-07 05:05
本文關鍵詞:基于二代測序的目標區(qū)段SNP識別數據流的建立與比較分析
更多相關文章: 臨床診斷 Ion二代測序技術 BSFI 比對 SNP分型
【摘要】:隨著測序技術的不斷革新,高通量測序技術在個體化診療中的需求日益高漲。結合高通量測序,通過對基因組測序數據的分析,來明確病人DNA信息,并幫助醫(yī)生對疾病的診斷治療已經成為當前的一個醫(yī)療趨勢。目前,該領域存在的主要問題是現有的生物信息學分析流程仍然不能很好的滿足當前大數據的分析需求。作者所在實習單位開發(fā)了基于二代測序平臺的SNP鑒定技術,其所帶來的個體化數據解決方案亟待開發(fā)。本研究針對該測序方案建立了目標區(qū)段SNP識別數據流,主要包括測序數據的質控,測序數據接頭引物的去除,樣本的篩選與分類,barcode的切除,序列的比對,參考序列SNP位點處的突變鑒定,樣本基因型的判斷。在得到原始測序數據后,通過這套數據處理流程可以快速而準確的獲得樣本SNP分型信息。在本工作流程中,先使用Cutadapt軟件以Q20指標進行reads質量過濾與引物接頭剪切,能夠去約四分之一質量較差的數據;然后使用Fastx或BSFI軟件進行樣本分類,可歸集到約64%的reads數;待樣本分類完成之后,借助連在barcode上接頭序列使用Cutadapt將這些片段連同barcode一并切除;再通過自己編寫腳本從篩選好的數據中挑出不同項目的樣本數據,并將這些數據比對到項目對應的參考序列上,比對所選用軟件是BWA,在分類好的樣本序列中,超過90%的reads可以比對到參考基因上,隨后從比對結果中使用Samtools軟件鑒定SNP信息。在鑒定SNP信息之后,獲得了包含樣本比對結果的mpileup文件,再通過編寫腳本對mpileup文件中的數據進行簡化歸類并對分型結果進行判定,并將判定結果以更加簡潔的文本形式輸出。由于在樣本分類過程中使用Fastx所耗計算時間過多,因此在流程優(yōu)化時,重點編寫了全新的BSFI程序。在該程序中的barcode篩選中額外加入了允許一個堿基的缺失(Deletion),并采用了多線程來加快數據的篩選速度。與Fastx相比,在不損失準確度的情況下,BSFI的樣本分類速度顯著提升,大約縮短至原先的六分之一,使得整體SNP數據流能在一個工作日能完成。本研究開發(fā)的基于二代測序數據的SNP識別數據流,從數據獲取到數據產生僅需6小時,能夠滿足基于二代測序平臺的SNP鑒定技術所帶來的個體化數據需求。
【關鍵詞】:臨床診斷 Ion二代測序技術 BSFI 比對 SNP分型
【學位授予單位】:東華大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:R440;Q811.4
【目錄】:
- 摘要5-7
- ABSTRACT7-10
- 第一章 緒論10-21
- 1.1 研究背景10-14
- 1.2 部分二代測序數據分析軟件的簡介14-19
- 1.3 研究目的與意義19-21
- 第二章 數據結構與流程的初步實現21-46
- 2.1 數據信息的簡介21-33
- 2.2 處理流程的建立33-35
- 2.3 流程的初步實現35-46
- 第三章 整個流程的數據結果46-68
- 3.1 測序數據的質控結果46-51
- 3.2 樣本barcdoe的篩選結果51-52
- 3.3 Alignment(比對)及SNP calling的結果52-68
- 第四章 流程優(yōu)化68-85
- 4.1 樣本篩選分類優(yōu)化68-84
- 4.2 序列切除軟件的比較84-85
- 總結與展望85-87
- 參考文獻87-91
- 致謝91
【參考文獻】
中國期刊全文數據庫 前5條
1 周曉龍;葛星;時巧梅;徐麗芳;徐莉春;;候選基因SNP位點與非綜合征性唇腭裂的相關性[J];江蘇預防醫(yī)學;2016年01期
2 陳興健;徐百成;陳遲;朱一鳴;劉曉雯;楊小龍;王艷莉;邊盼盼;郭玉芬;;SNPscan法用于新疆主要少數民族非綜合征型聾患者GJB2基因突變篩查的研究[J];聽力學及言語疾病雜志;2014年06期
3 唐立群;肖層林;王偉平;;SNP分子標記的研究及其應用進展[J];中國農學通報;2012年12期
4 黃代新;桂程;易少華;楊慶恩;楊榮芝;梅q;;Typing of 24 mtDNA SNPs in a Chinese Population Using SNaPshot Minisequencing[J];Journal of Huazhong University of Science and Technology(Medical Sciences);2010年03期
5 張素華;李莉;李成濤;趙書民;;TaqMan探針技術用于X-SNP位點的分型[J];法醫(yī)學雜志;2010年01期
,本文編號:528900
本文鏈接:http://www.sikaile.net/yixuelunwen/swyx/528900.html