天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 管理論文 > 組織管理論文 >

云服務(wù)基礎(chǔ)設(shè)施中故障診斷與識別策略管理研究

發(fā)布時間:2020-05-11 23:24
【摘要】:大型云服務(wù)基礎(chǔ)設(shè)施經(jīng)常出現(xiàn)故障,這成為了其管理成本的主要組成部分,并會導(dǎo)致托管服務(wù)違反服務(wù)級別協(xié)議(SLA)。近年來,各主要云服務(wù)提供商,包括IBM、亞馬遜和谷歌的云服務(wù)基礎(chǔ)設(shè)施數(shù)量出現(xiàn)了前所未有的增長。使云計算服務(wù)具有如此吸引力的一些獨特特性包括:無限可用的資源池、靈活的規(guī)模經(jīng)濟(jì)、多租戶和自組織特性,這些特性將云服務(wù)與傳統(tǒng)的分布式系統(tǒng)(例如,數(shù)據(jù)中心和網(wǎng)格)區(qū)別開來。盡管云計算提供了以上服務(wù)并具有優(yōu)勢,但也存在挑戰(zhàn)。復(fù)雜系統(tǒng)已經(jīng)成為一種流行的計算模式,它支持工作負(fù)載自動伸縮,以適應(yīng)需求的變化和云服務(wù)中資源的虛擬化。通過持續(xù)配置虛擬資源和物理工作負(fù)載的分配使工作實現(xiàn)彈性,但也增加了故障和異常發(fā)生的可能性,特別是在提供基礎(chǔ)設(shè)施服務(wù)(IaaS)的層面。在云服務(wù)基礎(chǔ)設(shè)施中,對故障診斷和識別相關(guān)問題的管理是至關(guān)重要的,這是本文研究的主要問題。本文論述了云服務(wù)基礎(chǔ)設(shè)施故障診斷和識別策略管理的四個具體主題:(1)由于在異構(gòu)環(huán)境中虛擬化技術(shù)的可擴(kuò)展性和復(fù)雜性增大,使故障診斷變得更加困難。但因其在云基礎(chǔ)設(shè)施的故障管理框架中的重要性,故障診斷和識別仍受到廣泛關(guān)注。大多數(shù)故障診斷和識別方法都是基于主動探測技術(shù),這些技術(shù)可用于快速準(zhǔn)確地檢測故障。然而,大多數(shù)方法都受到了通信開銷和故障診斷的影響,導(dǎo)致了云服務(wù)系統(tǒng)性能的降低,例如IaaS。(2)由于數(shù)據(jù)量大,監(jiān)測成為一項特殊的挑戰(zhàn)。大型復(fù)雜系統(tǒng)的監(jiān)測需要對故障檢測和異常進(jìn)行高精度、低延遲和近實時分析,還需要通過運行具有代表性的大型數(shù)據(jù)集處理應(yīng)用程序進(jìn)行優(yōu)化。(3)異常/故障的診斷和自我修復(fù)是云服務(wù)基礎(chǔ)設(shè)施的重要操作,需要自動化的故障檢測和實時自我修復(fù)。(4)在IaaS中,有四個有效的測量標(biāo)準(zhǔn)來確定故障排除的有效性:優(yōu)先級、故障概率、風(fēng)險和配置操作的持續(xù)時間。一些研究小組的目標(biāo)是通過將故障診斷擴(kuò)展到故障排除,來確定如何監(jiān)測集合、開發(fā)分類器并分析測量的屬性,而不是單個的測量閾值。本文針對云服務(wù)基礎(chǔ)設(shè)施中故障診斷和識別的策略管理進(jìn)行了研究。提出了有效的方法,并探討了潛在的動機(jī)和解決方案。通過全面的實證分析和新的定量方法進(jìn)行了詳盡的評價,并為今后的研究奠定了基礎(chǔ)。達(dá)成了四項獨立但相互關(guān)聯(lián)的成果:(1)首先,論文提出并開發(fā)了一種新的混合模型,名為加速故障診斷和識別(AFDI),根據(jù)故障級別和異常的嚴(yán)重程度,監(jiān)測VM和物理服務(wù)器托管的各種系統(tǒng)指標(biāo),并研究細(xì)粒度容錯算法;谶@些發(fā)現(xiàn),論文提出了一種新的方法來構(gòu)建一種模型,該模型可以優(yōu)化實時監(jiān)控的性能,并基于Hadoop MapReduce和Apache Spark平臺提高預(yù)測的準(zhǔn)確性。(2)接下來,論文提出了一種新的方法,通過對其定性指標(biāo)進(jìn)行分析和分類來診斷異常/故障。使用機(jī)器學(xué)習(xí)算法確定的異常/故障的分布來創(chuàng)建時間序列診斷方法,以在運行時檢測和分類異常/故障,從而估計每個自修復(fù)系統(tǒng)組件對系統(tǒng)功能的影響,并實現(xiàn)服務(wù)的高可用性。(3)論文提出了一種新的理論方法來構(gòu)建故障檢測與修復(fù)(故障排除)模型的步驟,將樸素貝葉斯分類(NBC)與多值決策圖(MDD)結(jié)合起來,對云異常檢測的故障排除進(jìn)行構(gòu)建和管理。實施這種方法的實際考量是提供一種決策理論的方法來對云服務(wù)基礎(chǔ)設(shè)施的故障診斷步驟進(jìn)行建模。(4)最后,論文為IaaS提出了一個基于Apache sparks的瓶頸故障排除性能框架,論文將其命名為CloudPT。CloudPT有許多優(yōu)點:它具有高效的檢測能力;它有一個統(tǒng)一的、全方位的循環(huán)反饋,與云生態(tài)系統(tǒng)的管理相協(xié)作;并且包括故障診斷性能測試。CloudPT的目標(biāo)是通過擴(kuò)展故障排除來監(jiān)測集合、深入分析并對測量的屬性進(jìn)行分類,而不是單個測量閾值。
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2018
【分類號】:TP393.07
,

本文編號:2659225

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/yunyingzuzhiguanlilunwen/2659225.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶095c2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com