北京時間 10 月 20 日 15 時 30 分,一場始于亞馬遜 AWS US-EAST-1 區(qū)域的服務故障,迅速演變?yōu)橄砣虻臄?shù)字服務危機 —— 核心 NoSQL 數(shù)據(jù)庫服務 DynamoDB 出現(xiàn)嚴重中斷,不僅導致 AWS 自身多項功能癱瘓,更讓依賴其架構的 Epic、任天堂等巨頭的在線服務陷入停擺,數(shù)百萬玩家與用戶被迫面對 “無法登錄”“功能報錯” 的困境。

作為 AWS 生態(tài)的 “數(shù)據(jù)中樞”,DynamoDB 的癱瘓直接擊中了全球大量互聯(lián)網(wǎng)服務的命脈。這款完全托管的無服務器數(shù)據(jù)庫,憑借高性能、低延遲的特性,被廣泛用于存儲用戶數(shù)據(jù)、游戲進度、服務配置等核心信息 —— 小到 APP 的用戶登錄狀態(tài),大到游戲的匹配系統(tǒng)數(shù)據(jù),都依賴其穩(wěn)定運行。而此次 US-EAST-1 區(qū)域的中斷,并非簡單的 “短暫卡頓”:根據(jù)用戶反饋,DynamoDB 不僅無法響應數(shù)據(jù)讀寫請求,連后臺監(jiān)控面板都無法正常加載,AWS 官方也在故障發(fā)生 1 小時后才發(fā)布 “服務降級” 公告,此前大量開發(fā)者因無法通過 AWS 支持中心創(chuàng)建案例,甚至無法及時反饋問題,進一步加劇了危機應對的滯后性。
故障的影響迅速從云服務層傳導至用戶端,游戲領域首當其沖。Epic Games 的在線生態(tài)幾乎全面受創(chuàng):《堡壘之夜》玩家登錄時普遍遭遇 “代碼:LS-0013” 報錯,無法進入匹配隊列;《彩虹六號圍攻》則出現(xiàn) “服務器連接超時” 問題,已登錄的玩家也會被強制踢出游戲;而面向青少年的創(chuàng)作平臺《Roblox》更直接顯示 “服務暫時不可用”,全球超千萬活躍用戶被迫下線。任天堂的在線服務同樣未能幸免,Switch 玩家發(fā)現(xiàn)無法登錄任天堂賬號,《馬里奧賽車 8 豪華版》《Splatoon 3》等聯(lián)機游戲的匹配功能完全失效,部分玩家甚至無法加載本地存檔 —— 這些問題的根源,正是任天堂北美地區(qū)的用戶數(shù)據(jù)、聯(lián)機匹配邏輯均依賴 US-EAST-1 區(qū)域的 DynamoDB 存儲與調(diào)用。
除了游戲領域,北美地區(qū)的互聯(lián)網(wǎng)服務也遭受 “連環(huán)打擊”。亞馬遜自家的 Prime Video 無法加載影片列表,用戶點擊播放后僅顯示 “加載失敗”;智能助手 Alexa 則出現(xiàn) “無法響應指令” 的情況,部分用戶反饋連基礎的 “設置鬧鐘”“查詢天氣” 功能都無法使用。更嚴重的是,AWS 支持體系自身也陷入癱瘓:用戶無法通過 AWS 支持中心提交故障工單,支持 API 同樣無法創(chuàng)建案例,這意味著企業(yè)客戶即便發(fā)現(xiàn)業(yè)務異常,也難以通過官方渠道獲取幫助,只能在社交平臺上自發(fā)交流故障應對經(jīng)驗,形成 “問題無法上報、故障無法溯源” 的惡性循環(huán)。
從技術層面來看,DynamoDB 的核心特性本應是 “高可用性”—— 其內(nèi)置的多區(qū)域復制、自動備份功能,理論上能抵御單一區(qū)域的故障。但此次中斷暴露了部分企業(yè) “過度依賴單一區(qū)域” 的隱患:許多廠商為降低成本,未啟用 DynamoDB 的跨區(qū)域災備功能,導致 US-EAST-1 區(qū)域一旦癱瘓,便無備用數(shù)據(jù)節(jié)點可切換。例如有獨立開發(fā)者透露,其團隊為節(jié)省每月數(shù)百美元的跨區(qū)域復制費用,僅在 US-EAST-1 部署了數(shù)據(jù)庫,此次故障直接導致旗下 APP 完全停服,損失難以估量。
截至北京時間 18 時 30 分,AWS 官方仍未公布故障的具體原因,僅表示 “正在全力修復 DynamoDB 服務”,部分區(qū)域的讀寫功能已逐步恢復,但游戲與視頻平臺的服務仍未完全穩(wěn)定。這場故障再次敲響警鐘:隨著全球數(shù)字服務對云廠商的依賴度不斷加深,單一區(qū)域的服務中斷,已足以引發(fā)跨行業(yè)、跨地區(qū)的連鎖反應,而企業(yè)在追求云服務便利性的同時,如何構建更穩(wěn)健的災備體系,將成為未來必須面對的課題。





























浙公網(wǎng)安備 33010502007447號