一度宕機(jī)6小時 微軟Azure虛擬機(jī)做出回應(yīng)
來源:中關(guān)村在線
?
2021-10-14 17:21:50
據(jù)外媒報道,微軟的Azure虛擬機(jī)服務(wù)于2021年10月13日05:12 UTC至11:45UTC期間遭遇了長達(dá)6個小時的中端,其中使用Windows虛擬機(jī)的Azure客戶子集在執(zhí)行服務(wù)管理操作時面臨著各種問題,包括啟動、創(chuàng)建、更新、刪除虛擬機(jī)的眾多操作均告失敗,對Windows虛擬機(jī)有依賴性的服務(wù)也可能遇到類似的故障。
針對此事,微軟也公布了初步調(diào)查結(jié)果:
我們發(fā)現(xiàn)在服務(wù)管理操作過程中調(diào)用失敗,因為無法查詢到所需的工件版本數(shù)據(jù)。我們的調(diào)查集中在后端計算資源提供者(CRP),以確定調(diào)用失敗的原因,并確定無法從存儲庫中查詢到所需的VMGuestAgent。VM Guest Agent Extension發(fā)布架構(gòu)正在被遷移(作為傳統(tǒng)服務(wù)管理后臺系統(tǒng)遷移的一部分)到一個新的平臺,該平臺利用了最新的 Azure Resource Manager(ARM)功能。
緩解措施:我們通過將適當(dāng)?shù)臄U(kuò)展標(biāo)記為正確的預(yù)期級別(在這種情況下是公開的)來減輕影響。工程師們主動驗證了更新完成后,操作恢復(fù)到完全成功率。
接下來的步驟。我們將繼續(xù)調(diào)查,以確定完整的根本原因,并防止未來發(fā)生。完整的根本原因分析(RCA)將在 72 小時內(nèi)公布?!?/p>