Amazon vừa công bố báo cáo chi tiết về sự cố ngày 20/10, bắt nguồn từ lỗi phần mềm quản lý DNS của DynamoDB, khiến hàng loạt trang web, dịch vụ và ứng dụng lớn trên Internet bị gián đoạn.
Amazon vừa công bố một báo cáo dài về sự cố đã khiến hàng loạt trang web, dịch vụ, ứng dụng và trò chơi bị ngưng hoạt động vào ngày 20/10. Mọi chuyện bắt đầu từ một lỗi trong phần mềm tự động hóa DynamoDB — nơi khách hàng của AWS lưu trữ dữ liệu — và lỗi này sau đó đã gây ra thêm các vấn đề ở những hệ thống khác phụ thuộc vào phần mềm đó.
Theo Amazon, DynamoDB duy trì hàng trăm ngàn bản ghi DNS và lẽ ra phải có khả năng tự động khắc phục khi có sự cố. Tuy nhiên vào ngày 20/10, hệ thống quản lý DNS của DynamoDB gặp lỗi dẫn tới một bản ghi DNS trống cho các trung tâm dữ liệu của Amazon ở Bắc Virginia. DynamoDB đáng ra phải tự sửa được lỗi này, nhưng việc đó đã không xảy ra, buộc Amazon phải can thiệp sửa chữa thủ công.
Khi sự cố xảy ra, tất cả hệ thống cần kết nối tới DynamoDB không thể thực hiện được và gặp lỗi DNS, bao gồm cả khách hàng sử dụng dịch vụ điện toán đám mây của Amazon. Lúc đó cảm giác như một nửa Internet đang không hoạt động.
Những trang web và dịch vụ bị ảnh hưởng bao gồm chính Amazon, thiết bị Amazon Alexa, Bank of America, Snapchat, Canva, Reddit, Apple Music, Apple TV, Lyft, Duolingo, Fortnite, Disney+, Venmo, DoorDash, Hulu, PlayStation và thậm chí cả Eight Sleep — nơi những chiếc giường kết nối Internet để điều chỉnh nhiệt độ và độ nghiêng. Một số dịch vụ phản hồi chậm, trong khi một số khác hoàn toàn không truy cập được.
“Chúng tôi xin lỗi vì những ảnh hưởng sự kiện này gây ra cho khách hàng. Mặc dù chúng tôi có thành tích tốt trong việc vận hành các dịch vụ với mức độ khả dụng cao, chúng tôi hiểu tầm quan trọng của các dịch vụ đối với khách hàng, ứng dụng, người dùng cuối và doanh nghiệp của họ. Chúng tôi biết sự kiện này đã ảnh hưởng đáng kể tới nhiều khách hàng. Chúng tôi sẽ làm mọi thứ có thể để rút kinh nghiệm từ sự cố và sử dụng nó để nâng cao khả năng sẵn sàng của dịch vụ hơn nữa,” Amazon cho biết trong một tuyên bố.
© 2025 Yahoo. Bảo lưu mọi quyền.
Nguồn: https://www.engadget.com/big-tech/amazon-says-automation-bug-caused-massive-aws-outage-133028856.html?src=rss