Amazon vừa công bố báo cáo chi tiết về sự cố ngày 20/10, cho biết một lỗi trong phần mềm tự động hóa DynamoDB đã khởi nguồn cho hàng loạt vấn đề, khiến nhiều trang web, ứng dụng và dịch vụ bị gián đoạn.
Amazon đã công bố một báo cáo dài về sự cố khiến hàng loạt trang web, dịch vụ, ứng dụng và trò chơi bị ngưng hoạt động vào ngày 20 tháng 10. Mọi chuyện bắt đầu từ một lỗi trong phần mềm tự động hóa DynamoDB, nơi các khách hàng AWS lưu trữ dữ liệu của họ, và lỗi này sau đó kích hoạt thêm nhiều vấn đề ở các hệ thống khác phụ thuộc vào phần mềm đó.
Theo giải thích của Amazon, DynamoDB quản lý hàng trăm ngàn bản ghi DNS và lẽ ra có thể tự sửa bất kỳ vấn đề nào. Nhưng vào ngày 20/10, hệ thống quản lý DNS của DynamoDB gặp phải một lỗi dẫn đến một bản ghi DNS trống cho các trung tâm dữ liệu của Amazon ở Bắc Virginia. DynamoDB lẽ ra sẽ tự khắc phục vấn đề này nhưng đã không thể làm vậy, khiến Amazon phải can thiệp và sửa lỗi thủ công. Trong thời điểm sự cố diễn ra, tất cả hệ thống cần kết nối đến DynamoDB đều không thể kết nối và gặp lỗi DNS, bao gồm cả khách hàng sử dụng dịch vụ điện toán đám mây của hãng. Khi đó cảm giác như một nửa internet không hoạt động.
Những trang web và dịch vụ bị ảnh hưởng bao gồm chính Amazon, thiết bị Amazon Alexa, Bank of America, Snapchat, Canva, Reddit, Apple Music, Apple TV, Lyft, Duolingo, Fortnite, Disney+, Venmo, DoorDash, Hulu, PlayStation và cả Eight Sleep — công ty có các giường kết nối internet để điều chỉnh nhiệt độ và độ nghiêng. Một số dịch vụ phản hồi chậm, trong khi những dịch vụ khác hoàn toàn không truy cập được.
“Chúng tôi xin lỗi về ảnh hưởng mà sự cố này đã gây ra cho khách hàng. Mặc dù chúng tôi có lịch sử vận hành dịch vụ với mức độ sẵn sàng rất cao, nhưng chúng tôi hiểu dịch vụ của mình quan trọng với khách hàng, ứng dụng và người dùng cuối, cũng như đối với doanh nghiệp của họ. Chúng tôi biết sự kiện này đã ảnh hưởng đáng kể tới nhiều khách hàng. Chúng tôi sẽ làm mọi thứ có thể để rút kinh nghiệm từ sự kiện này và dùng nó để cải thiện tính sẵn sàng hơn nữa,” Amazon cho biết trong một tuyên bố.
© 2025 Yahoo. All rights reserved.
Nguồn: https://www.engadget.com/big-tech/amazon-says-automation-bug-caused-massive-aws-outage-133028856.html?src=rss