Amazon: Lỗi tự động hóa gây sự cố lớn cho AWS

Amazon vừa công bố báo cáo chi tiết về sự cố ngày 20/10 khiến nhiều website, dịch vụ và ứng dụng ngưng hoạt động. Nguyên nhân bắt nguồn từ một lỗi trong hệ thống tự động hóa DynamoDB liên quan đến quản lý DNS.


Amazon vừa công bố một báo cáo khá dài về sự cố ngày 20/10 khiến hàng loạt website, dịch vụ, ứng dụng và trò chơi bị gián đoạn. Mọi việc bắt đầu từ một lỗi trong phần mềm tự động hóa DynamoDB — nơi khách hàng AWS lưu trữ dữ liệu — và lỗi này sau đó đã kích hoạt thêm nhiều vấn đề trong những hệ thống khác phụ thuộc vào phần mềm đó.

Theo Amazon, DynamoDB quản lý hàng trăm ngàn bản ghi DNS và được thiết kế để tự động sửa các sự cố. Nhưng vào ngày 20/10, hệ thống quản lý DNS của DynamoDB gặp lỗi khiến một bản ghi DNS của cụm trung tâm dữ liệu ở Bắc Virginia bị trống. DynamoDB đáng ra phải tự khắc phục, nhưng hệ thống đã không thực hiện được, buộc Amazon phải can thiệp sửa chữa thủ công. Trong thời gian xảy ra lỗi, tất cả hệ thống cần kết nối đến DynamoDB đều không thể truy cập và gặp sự cố DNS, bao gồm cả khách hàng dịch vụ đám mây của họ. Khi đó cảm giác như một nửa internet không hoạt động.

Những trang web và dịch vụ bị ảnh hưởng bao gồm Amazon, thiết bị Amazon Alexa, Bank of America, Snapchat, Canva, Reddit, Apple Music, Apple TV, Lyft, Duolingo, Fortnite, Disney+, Venmo, DoorDash, Hulu, PlayStation và cả Eight Sleep — công ty làm giường thông minh kết nối Internet để điều chỉnh nhiệt độ và góc nghiêng. Một số dịch vụ phản hồi chậm, trong khi một số khác hoàn toàn không truy cập được.

“Chúng tôi xin lỗi về những ảnh hưởng mà sự kiện này đã gây ra cho khách hàng. Mặc dù chúng tôi có thành tích vững chắc trong việc vận hành dịch vụ với mức độ khả dụng cao, nhưng chúng tôi hiểu dịch vụ của mình quan trọng như thế nào đối với khách hàng, ứng dụng, người dùng cuối và doanh nghiệp. Chúng tôi biết sự kiện này đã ảnh hưởng đáng kể tới nhiều khách hàng. Chúng tôi sẽ làm mọi thứ có thể để rút kinh nghiệm từ sự cố và tiếp tục nâng cao độ khả dụng,” Amazon cho biết trong thông cáo.

© 2025 Yahoo. Bảo lưu mọi quyền.

Nguồn: https://www.engadget.com/big-tech/amazon-says-automation-bug-caused-massive-aws-outage-133028856.html?src=rss

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *