面向事務(wù)存儲系統(tǒng)的容錯技術(shù)研究
發(fā)布時間:2020-12-05 13:23
隨著多核處理器的發(fā)展,事務(wù)存儲作為一種有潛力的并發(fā)控制機制受到了越來越多的關(guān)注。另一方面,隨著大規(guī)模集成電路的發(fā)展進入深亞微米級甚至納米級,處理器更容易受電磁輻射、宇宙射線以及其它干擾源的影響,這使得處理器的可靠性問題變得日益突出。因此事務(wù)存儲機制下的容錯問題也將逐漸成為一個值得關(guān)注的問題。本文針對事務(wù)存儲系統(tǒng)下的容錯問題展開研究,以事務(wù)存儲系統(tǒng)中的錯誤傳播行為為理論基礎(chǔ),圍繞故障檢測、故障恢復(fù)和故障屏蔽等幾個關(guān)鍵問題提出了理論方法、技術(shù)方案和實現(xiàn)框架。本文的主要貢獻如下:1.以基于程序語句序列的語句間的錯誤傳播行為為始,層層遞進的分析了錯誤在事務(wù)存儲系統(tǒng)中的傳播行為。通過對事務(wù)自身的屬性和特點的分析,針對容錯位置和容錯對象集合這兩個容錯技術(shù)主要關(guān)心的信息,給出了事務(wù)存儲系統(tǒng)中兩類天然的容錯位置及對應(yīng)的容錯對象集合,并證明了其所具有的不同的容錯能力,從理論上揭示了事務(wù)存儲系統(tǒng)天然的容錯特性。2.提出了基于事務(wù)冗余的錯誤檢測方法——EDRT錯誤檢測方法。該方法為事務(wù)創(chuàng)建冗余副本,并同時執(zhí)行事務(wù)及其副本,通過在提交前比較兩事務(wù)的寫集合實現(xiàn)了低錯誤檢測開銷的基于冗余事務(wù)的錯誤檢測方法。此外,...
【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁數(shù)】:148 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景
1.1.1 事務(wù)存儲的興起
1.1.2 微處理器的可靠性問題
1.2 事務(wù)存儲系統(tǒng)
1.2.1 事務(wù)存儲系統(tǒng)的基本概念和分類
1.2.2 事務(wù)存儲系統(tǒng)的實現(xiàn)
1.3 可靠性及容錯研究基礎(chǔ)
1.3.1 系統(tǒng)可靠性的影響因素
1.3.2 容錯技術(shù)
1.4 相關(guān)工作
1.4.1 故障檢測技術(shù)
1.4.2 故障恢復(fù)技術(shù)
1.4.3 故障屏蔽技術(shù)
1.4.4 基于事務(wù)存儲的容錯技術(shù)
1.5 本文的研究內(nèi)容及主要創(chuàng)新點
1.5.1 本文的研究內(nèi)容
1.5.2 本文的創(chuàng)新點
1.6 論文結(jié)構(gòu)
第二章 錯誤在事務(wù)存儲系統(tǒng)中的傳播行為分析
2.1 程序語句間的錯誤傳播
2.1.1 語句間的錯誤傳播
2.1.2 任務(wù)段的錯誤隔離
2.2 事務(wù)間的錯誤傳播
2.2.1 事務(wù)間的錯誤傳播
2.2.2 事務(wù)存儲系統(tǒng)的錯誤隔離
2.3 小結(jié)
第三章 基于事務(wù)冗余的錯誤檢測
3.1 基于事務(wù)冗余的錯誤檢測方法
3.1.1 EDRT 的基本思想
3.1.2 開銷分析
3.1.3 錯誤檢測能力分析
3.2 容錯日志事務(wù)存儲系統(tǒng):FTLogTM
3.2.1 數(shù)據(jù)比較集
3.2.2 沖突檢測機制
3.3 容錯緩存事務(wù)存儲系統(tǒng):FTBufTM
3.3.1 數(shù)據(jù)比較集
3.3.2 沖突檢測機制
3.4 實驗與評測
3.4.1 實驗方法
3.4.2 實驗結(jié)果
3.5 小結(jié)
第四章 基于事務(wù)回退的故障恢復(fù)
4.1 基于FRTR 的容錯事務(wù)存儲系統(tǒng)
4.1.1 FRTR 的基本思想
4.1.2 一個例子
4.1.3 FRTR 的開銷分析
4.2 容錯事務(wù)存儲系統(tǒng)的隔離性
4.2.1 基于Eager 沖突檢測機制的容錯事務(wù)存儲系統(tǒng)的隔離性
4.2.2 基于Lazy 沖突檢測機制的容錯事務(wù)存儲系統(tǒng)的隔離性
4.2.3 FRTR 對故障恢復(fù)的充分性
4.3 實驗與評測
4.3.1 實驗方法
4.3.2 實驗結(jié)果
4.4 事務(wù)存儲系統(tǒng)中基于并行復(fù)算的故障恢復(fù)
4.4.1 基本思想
4.4.2 針對OpenTM 程序的并行復(fù)算
4.4.3 實驗與評測
4.5 小結(jié)
第五章 基于三模冗余的容錯方法
5.1 事務(wù)的三模冗余容錯方法:TriTM
5.1.1 TriTM 的基本思想
5.1.2 TriTM 的性能優(yōu)化
5.1.3 TriTM 的比較點設(shè)置
5.2 基于Closed 嵌套事務(wù)的TriTM 的實現(xiàn)
5.2.1 嵌套事務(wù)存儲系統(tǒng)
5.2.2 TriTM 的實現(xiàn)
5.3 實驗與評測
5.3.1 實驗方法
5.3.2 實驗結(jié)果
5.4 小結(jié)
第六章 結(jié)論與展望
6.1 工作總結(jié)
6.2 研究展望
致謝
參考文獻
作者在學(xué)期間取得的學(xué)術(shù)成果
作者在學(xué)期間參加的科研項目
本文編號:2899517
【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁數(shù)】:148 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景
1.1.1 事務(wù)存儲的興起
1.1.2 微處理器的可靠性問題
1.2 事務(wù)存儲系統(tǒng)
1.2.1 事務(wù)存儲系統(tǒng)的基本概念和分類
1.2.2 事務(wù)存儲系統(tǒng)的實現(xiàn)
1.3 可靠性及容錯研究基礎(chǔ)
1.3.1 系統(tǒng)可靠性的影響因素
1.3.2 容錯技術(shù)
1.4 相關(guān)工作
1.4.1 故障檢測技術(shù)
1.4.2 故障恢復(fù)技術(shù)
1.4.3 故障屏蔽技術(shù)
1.4.4 基于事務(wù)存儲的容錯技術(shù)
1.5 本文的研究內(nèi)容及主要創(chuàng)新點
1.5.1 本文的研究內(nèi)容
1.5.2 本文的創(chuàng)新點
1.6 論文結(jié)構(gòu)
第二章 錯誤在事務(wù)存儲系統(tǒng)中的傳播行為分析
2.1 程序語句間的錯誤傳播
2.1.1 語句間的錯誤傳播
2.1.2 任務(wù)段的錯誤隔離
2.2 事務(wù)間的錯誤傳播
2.2.1 事務(wù)間的錯誤傳播
2.2.2 事務(wù)存儲系統(tǒng)的錯誤隔離
2.3 小結(jié)
第三章 基于事務(wù)冗余的錯誤檢測
3.1 基于事務(wù)冗余的錯誤檢測方法
3.1.1 EDRT 的基本思想
3.1.2 開銷分析
3.1.3 錯誤檢測能力分析
3.2 容錯日志事務(wù)存儲系統(tǒng):FTLogTM
3.2.1 數(shù)據(jù)比較集
3.2.2 沖突檢測機制
3.3 容錯緩存事務(wù)存儲系統(tǒng):FTBufTM
3.3.1 數(shù)據(jù)比較集
3.3.2 沖突檢測機制
3.4 實驗與評測
3.4.1 實驗方法
3.4.2 實驗結(jié)果
3.5 小結(jié)
第四章 基于事務(wù)回退的故障恢復(fù)
4.1 基于FRTR 的容錯事務(wù)存儲系統(tǒng)
4.1.1 FRTR 的基本思想
4.1.2 一個例子
4.1.3 FRTR 的開銷分析
4.2 容錯事務(wù)存儲系統(tǒng)的隔離性
4.2.1 基于Eager 沖突檢測機制的容錯事務(wù)存儲系統(tǒng)的隔離性
4.2.2 基于Lazy 沖突檢測機制的容錯事務(wù)存儲系統(tǒng)的隔離性
4.2.3 FRTR 對故障恢復(fù)的充分性
4.3 實驗與評測
4.3.1 實驗方法
4.3.2 實驗結(jié)果
4.4 事務(wù)存儲系統(tǒng)中基于并行復(fù)算的故障恢復(fù)
4.4.1 基本思想
4.4.2 針對OpenTM 程序的并行復(fù)算
4.4.3 實驗與評測
4.5 小結(jié)
第五章 基于三模冗余的容錯方法
5.1 事務(wù)的三模冗余容錯方法:TriTM
5.1.1 TriTM 的基本思想
5.1.2 TriTM 的性能優(yōu)化
5.1.3 TriTM 的比較點設(shè)置
5.2 基于Closed 嵌套事務(wù)的TriTM 的實現(xiàn)
5.2.1 嵌套事務(wù)存儲系統(tǒng)
5.2.2 TriTM 的實現(xiàn)
5.3 實驗與評測
5.3.1 實驗方法
5.3.2 實驗結(jié)果
5.4 小結(jié)
第六章 結(jié)論與展望
6.1 工作總結(jié)
6.2 研究展望
致謝
參考文獻
作者在學(xué)期間取得的學(xué)術(shù)成果
作者在學(xué)期間參加的科研項目
本文編號:2899517
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/2899517.html
最近更新
教材專著