• Thông báo

Sự cố AWS khiến hàng loạt dịch vụ mất kết nối

leech

Member
Chuẩn mem
Sáng nay, một sự cố nghiêm trọng ở Amazon Web Services (AWS) đã khiến nhiều website, ứng dụng và game lớn trên internet tạm thời ngưng trệ. AWS xác định nguyên nhân liên quan đến phân giải DNS của API DynamoDB và bắt đầu khắc phục trong vài giờ.

b8fbe490-ad9a-11f0-8dfd-f6af2bebdd6d

Sáng sớm hôm nay, hàng loạt dịch vụ trực tuyến trên internet gặp tình trạng chậm hoặc không truy cập được sau khi Amazon Web Services (AWS) gặp sự cố ở vùng US-EAST-1 (miền Bắc Virginia).

Diễn biến và nguyên nhân​

AWS thông báo từ 3:11 AM ET rằng họ ghi nhận “tăng tỷ lệ lỗi và độ trễ” ở nhiều dịch vụ trong vùng US-EAST-1. Đến 5:01 AM, công ty xác định nguyên nhân là sự cố phân giải DNS liên quan đến API DynamoDB — dịch vụ cơ sở dữ liệu mà nhiều ứng dụng AWS dựa vào để lưu trữ và truy xuất dữ liệu.

Chuyên gia Mike Chapple từ Đại học Notre Dame mô tả: “Amazon vẫn giữ dữ liệu an toàn, nhưng nhiều ứng dụng không thể tìm thấy dữ liệu đó trong vài giờ, khiến chúng như bị mất trí nhớ tạm thời.”

AWS cho biết đến 6:35 AM họ đã khắc phục triệt để vấn đề DNS và “hầu hết các thao tác dịch vụ AWS giờ đã hoạt động bình thường”. Tuy nhiên, tác động dây chuyền đã gây rối loạn cho các dịch vụ khác, đặc biệt là EC2 — dịch vụ máy ảo nền tảng cho nhiều ứng dụng trực tuyến.

AWS tiếp tục cập nhật: lúc 8:48 AM họ đang “tiến triển trong việc khôi phục khả năng khởi tạo instance EC2 mới ở US-EAST-1” và khuyến nghị khách hàng không gắn chặt triển khai mới vào một Availability Zone cụ thể để EC2 có linh hoạt chọn vùng phù hợp.

Đến 9:42 AM, AWS báo rằng dù đã áp dụng nhiều biện pháp trên một số Availability Zone, họ vẫn “gặp tỷ lệ lỗi tăng cao khi khởi tạo instance EC2 mới” và phải tạm giới hạn tốc độ khởi tạo (rate limiting) để hỗ trợ phục hồi. Lúc 10:14 AM, công ty cho biết vẫn còn “lỗi API đáng kể và vấn đề kết nối” trên nhiều dịch vụ trong vùng US-EAST-1; ngay cả khi sự cố chính được giải quyết, lượng yêu cầu tồn đọng sẽ khiến việc phục hồi hoàn toàn mất thêm thời gian.

Dịch vụ bị ảnh hưởng​

Nhiều công ty lớn dùng US-EAST-1 cho hạ tầng của họ, nên buổi sáng hôm nay trông như “một nửa internet” bị ảnh hưởng. Người dùng báo cáo tình trạng chậm, lỗi kết nối và thông báo trên nhiều nền tảng; lượng báo cáo sự cố tăng mạnh trên DownDetector.
  • Ngân hàng và hãng hàng không
  • Dịch vụ giải trí như Disney+
  • Mạng xã hội và ứng dụng: Snapchat, Reddit, Pinterest
  • Ứng dụng gọi xe: Lyft
  • Game: Fortnite, Roblox
  • Truyền thông: The New York Times
  • Ứng dụng nghe nhạc: Apple Music
  • Trò chơi nhỏ như Wordle

Nhìn nhận và hậu quả​

AWS cung cấp nhiều tính năng tiện ích như tự động mở rộng tài nguyên theo nhu cầu và có trung tâm dữ liệu khắp thế giới, nên được nhiều công ty toàn cầu lựa chọn. Tính đến giữa năm 2025, thị phần hạ tầng đám mây toàn cầu của AWS ước khoảng 30%.

Sự cố hôm nay nhắc lại điểm yếu của việc phụ thuộc mạnh vào vài nhà cung cấp hạ tầng lớn: khi một vùng quan trọng gặp vấn đề, tác động có thể lan rộng và để lại hậu quả kéo dài cho nhiều dịch vụ và người dùng cuối.

Nguồn: https://www.engadget.com/big-tech/a...ites-and-games-offline-142935040.html?src=rss
 
Back
Top