Hiện tượng “data poisoning” (nhiễm độc dữ liệu) đặt ra một mối đe dọa lớn đối với các hệ thống Trí tuệ Nhân tạo (AI). Vấn đề này, mặc dù không mới, đã nhận được sự chú ý đặc biệt do sự gia tăng của Big Data và sự phát triển của công nghệ AI. Data poisoning liên quan đến việc thao tác hoặc tiêm thông tin đã bị chỉnh sửa vào các bộ dữ liệu được sử dụng để huấn luyện các mô hình Học máy (ML). Những cuộc tấn công như vậy có thể giảm đáng kể độ tin cậy của những mô hình này hoặc thậm chí cho phép kẻ tấn công giới thiệu backdoors, cho phép họ điều khiển các mô hình theo ý muốn.
Các hệ thống AI và ML, đặc biệt là trong ngành năng lượng, dễ bị nhiễm độc dữ liệu. Ví dụ, kẻ tấn công có thể làm ảnh hưởng đến các chu kỳ đào tạo của xe tự hành, khiến chúng hiểu lầm biển báo giao thông. Mối nguy hiểm trở nên rõ ràng hơn khi xem xét khả năng nhiễm độc dữ liệu trong ứng dụng y tế, dẫn đến việc chuẩn đoán sai và làm căng thẳng hệ thống y tế.
Để giảm thiểu những rủi ro này, điều quan trọng là hiểu rõ bản chất của data poisoning và hậu quả của nó. Bằng cách kiểm tra các bộ dữ liệu sử dụng các mô hình ML đã được sử dụng trước đó và so sánh chúng với các mô hình sản xuất hiện tại, sự khác biệt có thể chỉ ra sự thay đổi dữ liệu tiềm năng. Các chính sách giới hạn lượng dữ liệu mà một người dùng có thể cung cấp cũng có thể hữu ích, vì kẻ tấn công thường tiêm một lượng lớn dữ liệu vào bộ dữ liệu. Việc tăng cường kiểm soát truy cập và củng cố chính sách xác định danh tính cho cả khách hàng và máy chủ, bao gồm dịch vụ điện toán đám mây, là rất quan trọng.
Trong năm 2021, Hyrum Anderson từ Microsoft đã trình diễn cách một người có thể trích xuất thông tin từ một mô hình ML mà không bị các hệ thống phòng thủ phát hiện. Bài thuyết trình này cung cấp cái nhìn quý giá về những rủi ro tiềm năng mà doanh nghiệp phải đối mặt và đề xuất hướng dẫn để tránh nguy hiểm.
Các kỹ thuật phòng thủ nên bao gồm việc giảm bề mặt tấn công với tường lửa, áp dụng nhanh chóng các bản vá bảo mật, giám sát lưu lượng mạng và có kế hoạch phản ứng sự cố mạnh mẽ. An ninh vật lý cũng quan trọng không kém, vì data poisoning có thể xảy ra bên trong khuôn viên công ty. Việc làm sạch dữ liệu bị nhiễm độc là một thách thức và có thể khiến các hoạt động đào tạo AI trở nên vô ích.
Source: Cybersecurity360
Để giảm thiểu các mối đe dọa tiềm năng, điều quan trọng là cần thực hiện các biện pháp bảo mật mạng bổ sung với sự giúp đỡ của một đối tác đáng tin cậy như INFRA www.infrascan.net hoặc bạn cũng có thể tự thử bằng cách sử dụng check.website.