亞馬遜云服務(wù)故障原因查明,美國東部服務(wù)器受影響,恢復(fù)時間未定
近年來,云服務(wù)已成為眾多企業(yè)和用戶賴以生存的關(guān)鍵設(shè)施。但頻繁的故障如同定時炸彈,給用戶帶來了諸多不便。亞馬遜云服務(wù)的這次故障事件就是一個典型例子,它不僅沒有明確告知恢復(fù)時間,也沒有解釋具體原因,這種行為引發(fā)了廣泛的爭議。
故障概況
美國東部地區(qū)的亞馬遜云服務(wù)器最近出現(xiàn)了故障。據(jù)網(wǎng)絡(luò)監(jiān)測公司透露,故障大約在美東時間上午10點左右發(fā)生。大約11點20分,已有超過2萬名用戶反饋遇到問題。這表明問題影響范圍很廣,且發(fā)生得非常突然。到了下午1點45分,故障報告數(shù)量減少了差不多一半,亞馬遜網(wǎng)站的故障率也大幅降低至三分之二。盡管如此,仍有部分服務(wù)受到較大影響,而且這些問題一直持續(xù)到周二晚上,仍未完全得到解決。
此次亞馬遜的配送系統(tǒng)出現(xiàn)了問題。同時,任天堂在12月8日凌晨遇到了網(wǎng)絡(luò)服務(wù)大規(guī)模中斷的情況。這種情況可能與他們即將使用亞馬遜的AWS云計算服務(wù)有關(guān)。從這個角度看,亞馬遜云服務(wù)的故障產(chǎn)生了連鎖效應(yīng)。
過往類似事件列舉
今年亞馬遜云服務(wù)并非頭一回遇到大規(guī)模故障。回想起10月4日,類似狀況已出現(xiàn)過,當(dāng)時美國不少社交平臺和亞馬遜服務(wù)都出現(xiàn)了問題。大約上午11點40分,臉書網(wǎng)站有一小時左右無法正常顯示,盡管照片墻還能訪問,但新內(nèi)容無法加載。直到下午5點45分左右,服務(wù)才慢慢恢復(fù)正常。而且,今年7月,亞馬遜的線上購物網(wǎng)站服務(wù)中斷了近兩小時,影響了超過3.8萬名用戶。由此可見,亞馬遜在服務(wù)穩(wěn)定性上確實存在問題。
損失狀況
相關(guān)報告顯示,有新聞報道指出,亞馬遜此次云服務(wù)故障可能導(dǎo)致的損失可能超1800萬美元,換算成人民幣大約是1.14億元。對企業(yè)來說,這樣的損失無疑是相當(dāng)嚴(yán)重的。它不僅會導(dǎo)致運營成本直接增加,還可能引起客戶流失等一系列問題。例如,那些重度依賴亞馬遜云服務(wù)的企業(yè),在服務(wù)中斷期間,自身業(yè)務(wù)也無法正常進(jìn)行,這可能會減少他們對亞馬遜云服務(wù)的信心,并促使他們開始尋找其他云服務(wù)提供商。
除此之外,這還涵蓋了非直接損失,比如名譽受損。若亞馬遜云服務(wù)無法確保為企業(yè)客戶持續(xù)提供穩(wěn)定服務(wù),那么在考慮云服務(wù)選擇時,部分潛在的新客戶可能會直接排除亞馬遜。
故障可能原因推測
10月4日,臉書遇到了系統(tǒng)問題,具體原因未明,但已承諾正在積極處理。互聯(lián)網(wǎng)基礎(chǔ)設(shè)施供應(yīng)商指出,目前沒有跡象表明這是網(wǎng)絡(luò)攻擊引起的,他們推測可能是臉書在維護(hù)時意外關(guān)閉了網(wǎng)絡(luò)。同時,有安全專家提出,問題可能是由于域名系統(tǒng)(DNS)頻繁故障。盡管如此,亞馬遜云服務(wù)也曾遇到類似問題。這可能是由于代碼在特定時段存在漏洞,或是維護(hù)時配置出現(xiàn)錯誤。當(dāng)然,也不能完全排除網(wǎng)絡(luò)安全威脅的可能性。
此外,亞馬遜云服務(wù)之前可能存在未被充分揭示的系統(tǒng)缺陷。當(dāng)服務(wù)器面臨重壓,或者遭遇異常數(shù)據(jù)流量沖擊時,服務(wù)器崩潰的風(fēng)險便會增加。
與其他網(wǎng)站的關(guān)聯(lián)影響
亞馬遜云服務(wù)出了問題,這是它自己的責(zé)任。不過,它連接的一些外部網(wǎng)站也因此遇到了困難。例如,任天堂的網(wǎng)絡(luò)服務(wù)中斷可能就是受到了亞馬遜云服務(wù)故障的影響。亞馬遜云服務(wù)在整體網(wǎng)絡(luò)中至關(guān)重要,一旦它出了問題,所有連接的設(shè)備都會受到影響。一些小型網(wǎng)站可能無法自己解決這種突發(fā)的云服務(wù)故障,只能被動等待問題解決。
應(yīng)對措施與未來展望
亞馬遜在接到停機(jī)通知后立刻著手解決故障,努力恢復(fù)服務(wù),這種做法是值得贊揚的。但未公開具體故障緣由和恢復(fù)時間,這樣的做法確實不夠周全。亞馬遜未來應(yīng)當(dāng)加大對云計算技術(shù)研究的資金支持,提升服務(wù)器的穩(wěn)定性和應(yīng)急處理能力。從客戶的角度來看,在選擇云服務(wù)提供商時,企業(yè)不應(yīng)只看重其規(guī)模和名聲,還應(yīng)考慮其歷史上故障發(fā)生的頻次以及處理故障的策略。
這起事件給云計算領(lǐng)域敲響了警鐘。它告訴我們,必須建立健全的故障預(yù)警和處理機(jī)制。這樣的標(biāo)準(zhǔn)流程不可或缺。
您是否遇到過因云服務(wù)問題而遭受損失的情況?歡迎在評論區(qū)留言點贊,講述您的經(jīng)歷。
作者:小藍(lán)
鏈接:http://www.huanchou.cn/content/6938.html
本站部分內(nèi)容和圖片來源網(wǎng)絡(luò),不代表本站觀點,如有侵權(quán),可聯(lián)系我方刪除。