Thế giới

Sự mong manh của hạ tầng internet nhìn từ sự cố Amazon

THƯ LÊ 22/10/2025 06:54

ĐNO - Sự cố dịch vụ điện toán đám mây Amazon (AWS) làm gián đoạn hàng trăm dịch vụ internet gióng hồi chuông cảnh báo: điều gì sẽ xảy ra khi thế giới số phụ thuộc gần như hoàn toàn vào một vài “đám mây” khổng lồ như AWS?

aws.jpg
Logo của Amazon Web Services được trưng bày tại một hội nghị. Ảnh: Noah Berger/AWS/Reuters

Hàng trăm dịch vụ toàn cầu tê liệt

Ngày 20/10 (giờ Mỹ), AWS, nền tảng vận hành phần lớn hạ tầng internet toàn cầu, bất ngờ gặp sự cố trong nhiều giờ.

Từ dịch vụ ngân hàng trực tuyến, mạng xã hội, các trang đặt vé máy bay cho đến ứng dụng mua sắm và gọi đồ ăn, đồng loạt ngừng hoạt động, tác động đến hàng triệu người trên khắp thế giới, theo CNN.

Sự cố một lần nữa nhắc nhở về tính mong manh của “xương sống” internet và mức độ phụ thuộc ngày càng lớn vào các dịch vụ đám mây.

Dù AWS và các đối thủ như Microsoft Azure hay Google Cloud được đánh giá có độ tin cậy cao, bản thân internet vẫn là một hệ thống chằng chịt, nơi mọi thành phần chỉ vững chắc nhờ mắt xích nhỏ nhất.

Theo Reuters, trục trặc trong hệ thống giám sát tình trạng của bộ cân bằng tải mạng tại một trung tâm dữ liệu ở Mỹ đã khiến Hệ thống tên miền (DNS) không thể định tuyến đúng các yêu cầu truy cập tới dịch vụ cơ sở dữ liệu của AWS.

Chuyên gia an ninh mạng Mike Chapple thuộc Đại học Notre Dame ví von rằng Amazon vẫn lưu giữ dữ liệu an toàn, nhưng các ứng dụng không thể tìm thấy chúng, giống như một phần lớn internet đột nhiên "mất trí nhớ tạm thời”.

aws (1)
Một trung tâm dữ liệu của AWS tại Mỹ. Ảnh: Reuters

Rủi ro từ việc “bỏ hết trứng vào một giỏ”

Dù các dịch vụ AWS đã được khôi phục hoàn toàn, nhưng sự cố lần này phơi bày nghịch lý đáng suy ngẫm: Internet vốn được thiết kế để phi tập trung và có khả năng chống chịu cao, nhưng ngày nay, phần lớn hạ tầng số lại tập trung vào một số ít khu vực đám mây của các “ông lớn” như Amazon, Microsoft và Google. Khi vùng đó gặp sự cố, tác động lập tức lan rộng toàn cầu.

Các sự cố quy mô lớn như vậy tuy hiếm, nhưng không phải chưa từng có tiền lệ. Lần gần nhất AWS gặp gián đoạn nghiêm trọng là vào năm 2021, ảnh hưởng đến hàng triệu người dùng.

Năm 2024, thế giới chứng kiến “thảm họa công nghệ” tồi tệ hơn nhiều khi lỗi phần mềm từ công ty bảo mật CrowdStrike khiến hàng loạt máy tính trên toàn cầu bị sập, dẫn đến các chuyến bay bị hủy, bệnh viện tê liệt và thiệt hại ước tính 5 tỷ USD.

Cùng năm 2024, mạng viễn thông AT&T nhiều lần “chết đứng”, có thời điểm kéo dài tới 11 giờ, khiến hàng vạn lao động tự do không thể làm việc.

Trước đây, những sự cố ngừng hoạt động quy mô lớn thường bắt nguồn từ lỗi cập nhật, xung đột phần mềm hay mã độc vô tình chèn vào hệ thống, hiếm khi tấn công mạng hay cắt cáp internet. Song, điều đáng lo không phải nguyên nhân, mà là tần suất lặp lại, cho thấy thế giới số vẫn thiếu các lớp dự phòng cần thiết.

Sự cố mới nhất của AWS vì thế không chỉ là vấn đề kỹ thuật, mà còn phản ánh thách thức của quá trình số hóa.

Khi các doanh nghiệp dồn dữ liệu, hạ tầng và hoạt động vận hành lên cùng một nền tảng, họ vô tình “đặt toàn bộ trứng vào một giỏ”.

Một lỗi nhỏ, từ cập nhật phần mềm sai, cấu hình lỗi, cho đến thay đổi không tương thích, đều có thể tạo ra hiệu ứng domino khiến cả hệ thống tê liệt.

Nguy cơ thế giới kỹ thuật số dường như đánh đổi tính bền vững để lấy sự tiện lợi và đã đến lúc phải nghiêm túc nghĩ lại về sự đa dạng hóa và dự phòng trong kiến trúc số.

Ra đời vào năm 2006 từ nhu cầu nội bộ của Amazon, AWS ban đầu chỉ nhằm tận dụng công suất máy chủ dư thừa ngoài mùa mua sắm cao điểm.

Trải qua hai thập kỷ, nền tảng này trở thành trụ cột của hạ tầng internet toàn cầu, cung cấp dịch vụ cho hàng triệu doanh nghiệp, từ startup nhỏ cho đến các tập đoàn Fortune 500.

THƯ LÊ