Amazon: lỗi tự động hóa gây ra sự cố lớn cho AWS

Amazon vừa công bố báo cáo chi tiết về sự cố ngày 20/10 khiến nhiều website, dịch vụ, ứng dụng và trò chơi bị gián đoạn. Nguyên nhân bắt nguồn từ một lỗi trong phần mềm tự động hóa DynamoDB, dẫn đến hàng loạt hệ thống phụ thuộc gặp trục trặc.


Amazon vừa công bố một báo cáo khá dài về sự cố đã khiến hàng loạt website, dịch vụ, ứng dụng và trò chơi bị gián đoạn vào ngày 20/10. Mọi chuyện bắt đầu từ một lỗi trong phần mềm tự động hóa DynamoDB — nơi các khách hàng AWS lưu trữ dữ liệu — và lỗi này đã kéo theo các vấn đề khác trong hệ thống phụ thuộc vào phần mềm đó.

Theo Amazon, DynamoDB quản lý hàng trăm nghìn bản ghi DNS và được thiết kế để tự động khắc phục sự cố. Tuy nhiên vào ngày 20/10, hệ thống quản lý DNS của DynamoDB gặp lỗi, tạo ra một bản ghi DNS trống cho các trung tâm dữ liệu của Amazon ở North Virginia. DynamoDB lẽ ra sẽ tự sửa lỗi này, nhưng quá trình tự sửa đã thất bại, buộc Amazon phải can thiệp và sửa bằng tay.

Khi sự cố diễn ra, tất cả hệ thống cần kết nối tới DynamoDB không thể thực hiện được và gặp lỗi DNS, bao gồm cả khách hàng sử dụng dịch vụ đám mây của họ. Cảm giác lúc đó giống như một nửa Internet bị tê liệt.

Những website và dịch vụ bị ảnh hưởng gồm Amazon, thiết bị Amazon Alexa, Bank of America, Snapchat, Canva, Reddit, Apple Music, Apple TV, Lyft, Duolingo, Fortnite, Disney+, Venmo, DoorDash, Hulu, PlayStation và cả Eight Sleep — công ty sản xuất giường kết nối internet để điều chỉnh nhiệt độ và độ nghiêng. Một số dịch vụ phản hồi chậm, trong khi nhiều dịch vụ khác hoàn toàn không truy cập được.

Amazon đưa ra lời xin lỗi về tác động của sự kiện này tới khách hàng: “Chúng tôi xin lỗi vì những ảnh hưởng sự kiện này đã gây ra cho khách hàng. Mặc dù chúng tôi có lịch sử vận hành dịch vụ với mức độ sẵn sàng cao, chúng tôi hiểu tầm quan trọng của dịch vụ đối với khách hàng, ứng dụng và người dùng cuối của họ. Sự kiện này đã ảnh hưởng đáng kể tới nhiều khách hàng. Chúng tôi sẽ làm mọi thứ có thể để rút kinh nghiệm và cải thiện tính sẵn sàng trong tương lai.”

© 2025 Yahoo. Bảo lưu mọi quyền.

Nguồn: https://www.engadget.com/big-tech/amazon-says-automation-bug-caused-massive-aws-outage-133028856.html?src=rss

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *