機群容錯系統(tǒng)的設(shè)計與實現(xiàn)
發(fā)布時間:2020-03-31 14:30
【摘要】: 在高可用計算機的研究當(dāng)中,如何保證系統(tǒng)的可用性和應(yīng)用可靠性一直是需要首先考慮的問題。機群以其高性價比和高擴展性成為構(gòu)造高性能計算機的一種主要方法,而節(jié)點間松散耦合的結(jié)構(gòu)也使得機群系統(tǒng)更易于保證系統(tǒng)的性能。但是隨著機群系統(tǒng)規(guī)模的增大,節(jié)點數(shù)目的增多,也帶來了許多的問題。因此本系統(tǒng)以提高機群系統(tǒng)的可用性為目的,設(shè)計并實現(xiàn)了基于Linux的機群容錯系統(tǒng)。系統(tǒng)由4個模塊組成:用戶模塊、中心模塊、進程模塊和心跳模塊。各個模塊之間相互協(xié)作實現(xiàn)系統(tǒng)功能。本文對各個模塊以及模塊之間的關(guān)系進行了介紹。系統(tǒng)采用分布式的松散耦合體系結(jié)構(gòu)來組織節(jié)點,使系統(tǒng)具有良好的可擴展性和更好的容錯性。盡可能地避免因故障導(dǎo)致的停機和服務(wù)的中斷。服務(wù)節(jié)點可以隨時的加入或離開監(jiān)控關(guān)系并且不會對服務(wù)造成影響。 本文設(shè)計為具有二級容錯功能,利用機群系統(tǒng)普遍應(yīng)用的心跳協(xié)議來實現(xiàn)節(jié)點間的檢測。為了避免任務(wù)調(diào)度因素對檢測的影響和完成對節(jié)點失效快速準(zhǔn)確的檢測,設(shè)計和實現(xiàn)了專用心跳檢測協(xié)議。使其作為網(wǎng)絡(luò)協(xié)議實體運行在操作系統(tǒng)核心態(tài),使得檢測器運行更加穩(wěn)定,從而大大提高了檢測速度。對于服務(wù)級別的檢測采用進程事件連接器來主動的檢測服務(wù)的行為變化。對于受監(jiān)控的服務(wù)只有系統(tǒng)撤銷對其的監(jiān)控才可以看作正常退出,否則就會對其進行容錯處理。對于容錯,本文選擇由分布式選舉算法選出的代理節(jié)點保證失效節(jié)點上的服務(wù)得到有效處理,采用簡單的服務(wù)遷移來保證服務(wù)的不間斷性,從而提高系統(tǒng)的可用性。
【圖文】:
系統(tǒng)硬件體系結(jié)構(gòu)
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2008
【分類號】:TP302.8
【圖文】:
系統(tǒng)硬件體系結(jié)構(gòu)
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2008
【分類號】:TP302.8
【相似文獻】
相關(guān)期刊論文 前10條
1 ;Wind River加強基于OpenSAF的高可用性系統(tǒng)開發(fā)[J];電子與電腦;2011年08期
2 ;Wind River加強基于OpenSAF的高可用性系統(tǒng)開發(fā)[J];工業(yè)控制計算機;2011年06期
3 ;APC希望成為中國的高可用性電源保護專家[J];電源世界;2002年03期
4 汪筱紅;;高可用集群技術(shù)的研究與應(yīng)用[J];電腦知識與技術(shù);2011年20期
5 楊海朝;;阻止你的MySQL集群罷工——MySQL高可用性方案探討[J];程序員;2010年11期
6 ;探求高可用性和高安全性的平衡之道[J];現(xiàn)代制造;2010年41期
7 范軼;康慕寧;張子龍;;基于高可用性集群系統(tǒng)的動態(tài)軟件更新[J];計算機應(yīng)用與軟件;2011年07期
8 李偉平;魏明欣;李東風(fēng);;一種簡單高可用的服務(wù)體系結(jié)構(gòu)[J];信息安全與通信保密;2011年09期
9 李正榮;;電視臺全臺網(wǎng)的高可用性研究[J];現(xiàn)代電視技術(shù);2011年07期
10 武丹;曾R挽,
本文編號:2609200
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/2609200.html
最近更新
教材專著