Amazon vừa công bố báo cáo chi tiết về sự cố ngày 20/10 khiến nhiều website, dịch vụ, ứng dụng và trò chơi ngừng hoạt động — nguyên nhân bắt nguồn từ lỗi trong phần mềm tự động hóa DynamoDB.
Amazon vừa công bố một báo cáo dài về sự cố đã làm nhiều website, dịch vụ, ứng dụng và trò chơi bị gián đoạn vào ngày 20/10. Mọi chuyện bắt đầu từ một lỗi trong phần mềm tự động hóa DynamoDB — nơi khách hàng AWS lưu trữ dữ liệu của họ — và lỗi này sau đó kéo theo hàng loạt vấn đề ở các hệ thống khác phụ thuộc vào phần mềm đó.
Theo Amazon, DynamoDB quản lý hàng trăm nghìn bản ghi DNS và được thiết kế để tự động khắc phục sự cố. Nhưng vào ngày 20/10, hệ thống quản lý DNS của DynamoDB gặp lỗi dẫn tới một bản ghi DNS trống cho các trung tâm dữ liệu của Amazon ở Bắc Virginia. DynamoDB lẽ ra phải tự sửa lỗi nhưng đã không làm được, buộc Amazon phải can thiệp sửa chữa thủ công. Trong thời gian lỗi xảy ra, tất cả hệ thống cần kết nối tới DynamoDB đều không thể truy cập và gặp lỗi DNS, bao gồm cả khách hàng sử dụng dịch vụ điện toán đám mây của Amazon. Khi đó, cảm giác như một nửa Internet không hoạt động.
Những website và dịch vụ bị ảnh hưởng bao gồm Amazon, các thiết bị Alexa của Amazon, Bank of America, Snapchat, Canva, Reddit, Apple Music, Apple TV, Lyft, Duolingo, Fortnite, Disney+, Venmo, DoorDash, Hulu, PlayStation và thậm chí cả Eight Sleep — công ty bán các chiếc giường kết nối Internet để điều chỉnh nhiệt độ và độ nghiêng. Một số dịch vụ phản hồi chậm, trong khi một số khác hoàn toàn không truy cập được.
“Chúng tôi xin lỗi về những ảnh hưởng sự kiện này đã gây ra cho khách hàng. Mặc dù chúng tôi có lịch sử vận hành với mức độ sẵn sàng cao, chúng tôi hiểu dịch vụ của mình quan trọng như thế nào đối với khách hàng, ứng dụng và người dùng cuối của họ, cũng như doanh nghiệp của họ. Chúng tôi biết sự kiện này đã ảnh hưởng đáng kể tới nhiều khách hàng. Chúng tôi sẽ làm mọi thứ có thể để rút kinh nghiệm từ sự việc và tiếp tục cải thiện độ sẵn sàng của dịch vụ,” Amazon cho biết trong một tuyên bố.
Bản quyền © 2025 Yahoo. Bảo lưu mọi quyền.
Nguồn: https://www.engadget.com/big-tech/amazon-says-automation-bug-caused-massive-aws-outage-133028856.html?src=rss