E級超級計算機故障預(yù)測的數(shù)據(jù)采集方法
本文關(guān)鍵詞:E級超級計算機故障預(yù)測的數(shù)據(jù)采集方法
更多相關(guān)文章: 超級計算機 故障預(yù)測 數(shù)據(jù)采集方法 數(shù)據(jù)匯集
【摘要】:面向未來E級超級計算機,提出用于故障預(yù)測的數(shù)據(jù)采集框架,能夠全面采集與計算結(jié)點故障相關(guān)的狀態(tài)數(shù)據(jù)。采用自適應(yīng)多層分組數(shù)據(jù)匯集方法,有效解決隨著系統(tǒng)規(guī)模增長數(shù)據(jù)匯集過程開銷過大的問題。在TH-1A超級計算機上的實現(xiàn)和測試表明,該數(shù)據(jù)采集框架具有開銷小、擴展性好的優(yōu)點,能夠滿足未來大規(guī)模系統(tǒng)故障預(yù)測數(shù)據(jù)采集的需求。
【作者單位】: 國防科技大學(xué)計算機學(xué)院;國家超級計算天津中心;中國人民解放軍95942部隊;
【關(guān)鍵詞】: 超級計算機 故障預(yù)測 數(shù)據(jù)采集方法 數(shù)據(jù)匯集
【基金】:國家自然科學(xué)基金資助項目(61272141,61120106005) 國家863計劃資助項目(2012AA01A301)
【分類號】:TP306.3
【正文快照】: 超級計算機的飛速發(fā)展面臨許多挑戰(zhàn),可靠性問題成為影響系統(tǒng)性能發(fā)展的重要挑戰(zhàn)之一。未來E級超級計算機由數(shù)十萬個部件組成,系統(tǒng)平均無故障時間(Mean Time Between Failure,MTBF)將從小時級到分鐘級[1]。消息傳遞接口(Message Passing Interface,MPI)是超級計算機應(yīng)用的主要
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王斌;齊長遠(yuǎn);李永平;;高分辨率電壓與電流快速數(shù)據(jù)采集方法[J];電子測量技術(shù);2002年01期
2 陳偉;Qiu Robin;;面向大型數(shù)據(jù)庫的審計數(shù)據(jù)采集方法[J];計算機應(yīng)用;2008年08期
3 王維瑞;范媛媛;孫伯川;;手持GPS設(shè)施農(nóng)業(yè)數(shù)據(jù)采集方法與實踐[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2011年12期
4 潘紅平;;數(shù)字城管部件普查數(shù)據(jù)采集方法探討[J];四川地質(zhì)學(xué)報;2013年S1期
5 蔣建偉;到館人數(shù)數(shù)據(jù)采集方法研究與實現(xiàn)[J];江蘇圖書館學(xué)報;1994年04期
6 陳明兵;劉知貴;;用于網(wǎng)絡(luò)流量異常檢測的數(shù)據(jù)采集方法的研究[J];電腦知識與技術(shù);2009年04期
7 王飛;司光亞;楊鏡宇;;基于任務(wù)的體系對抗仿真數(shù)據(jù)采集方法研究[J];系統(tǒng)仿真學(xué)報;2011年05期
8 孫朝斌;石明華;馬衛(wèi)民;郭海生;;紅外熱像儀船用數(shù)據(jù)采集方法應(yīng)用[J];艦船科學(xué)技術(shù);2011年09期
9 孫朝斌;石明華;馬衛(wèi)民;郭海生;;紅外熱像儀艙室設(shè)備數(shù)據(jù)采集方法應(yīng)用研究[J];測控技術(shù);2011年10期
10 蓋炳帥;王勁林;劉學(xué);;一種業(yè)務(wù)關(guān)聯(lián)的數(shù)據(jù)采集方法[J];西安電子科技大學(xué)學(xué)報;2013年02期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 趙海濱;洪延姬;崔村燕;辛朝軍;;重復(fù)加載脈沖推力測試數(shù)據(jù)采集方法[A];慶祝中國力學(xué)學(xué)會成立50周年暨中國力學(xué)學(xué)會學(xué)術(shù)大會’2007論文摘要集(下)[C];2007年
2 江寧川;李祥;趙U,
本文編號:873294
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/873294.html