Amazon công bố báo cáo chi tiết về sự cố ngày 20/10, bắt nguồn từ lỗi phần mềm tự động hóa DynamoDB khiến nhiều trang web, dịch vụ và ứng dụng bị gián đoạn.
Amazon đã công bố một báo cáo khá dài về sự cố khiến nhiều website, dịch vụ, ứng dụng và trò chơi bị ngắt kết nối vào ngày 20/10. Mọi chuyện bắt đầu từ một lỗi trong phần mềm tự động hóa DynamoDB — nơi khách hàng của AWS lưu trữ dữ liệu — và lỗi này sau đó đã kích hoạt nhiều vấn đề khác trong các hệ thống phụ thuộc vào phần mềm đó.
Theo Amazon, DynamoDB quản lý hàng trăm nghìn bản ghi DNS và được thiết kế để tự động khắc phục các sự cố. Nhưng vào ngày 20/10, hệ thống quản lý DNS của DynamoDB gặp lỗi dẫn đến một bản ghi DNS trống cho các trung tâm dữ liệu của Amazon ở Bắc Virginia. DynamoDB lẽ ra sẽ tự sửa lỗi, nhưng nó đã không làm được, buộc Amazon phải can thiệp và sửa bằng tay. Trong khi sự cố diễn ra, tất cả hệ thống cần kết nối tới DynamoDB đều không thể kết nối và gặp lỗi DNS, bao gồm cả khách hàng dịch vụ điện toán đám mây của họ. Khi đó cảm giác như một nửa Internet không hoạt động.
Những trang web và dịch vụ bị ảnh hưởng bao gồm chính Amazon, các thiết bị Amazon Alexa, Bank of America, Snapchat, Canva, Reddit, Apple Music, Apple TV, Lyft, Duolingo, Fortnite, Disney+, Venmo, DoorDash, Hulu, PlayStation và cả Eight Sleep — chiếc giường kết nối Internet để điều chỉnh nhiệt độ và góc nghiêng. Một số dịch vụ phản hồi chậm, trong khi một số khác hoàn toàn không truy cập được.
“Chúng tôi xin lỗi về tác động mà sự cố này đã gây ra cho khách hàng. Mặc dù chúng tôi có lịch sử vận hành dịch vụ với mức độ khả dụng rất cao, chúng tôi hiểu tầm quan trọng của các dịch vụ đối với khách hàng, ứng dụng và người dùng cuối của họ, cũng như với hoạt động kinh doanh. Chúng tôi biết sự kiện này đã ảnh hưởng đáng kể tới nhiều khách hàng. Chúng tôi sẽ làm mọi thứ có thể để rút kinh nghiệm từ sự cố này và dùng nó để nâng cao độ khả dụng hơn nữa,” Amazon cho biết trong một tuyên bố.
© 2025 Yahoo. Bảo lưu mọi quyền.
Nguồn: https://www.engadget.com/big-tech/amazon-says-automation-bug-caused-massive-aws-outage-133028856.html?src=rss