zalo
Chat ngay

Các cuộc tấn công đối nghịch vào chính sách mạng nơ-ron

Tóm tắt

Các bộ phân loại học máy được biết là dễ bị tổn thương trước các đầu vào do kẻ thù tạo ra một cách ác ý để buộc phân loại sai. Các ví dụ đối nghịch như vậy đã được nghiên cứu rộng rãi trong bối cảnh các ứng dụng thị giác máy tính. Trong công trình này, chúng tôi chỉ ra các cuộc tấn công đối nghịch cũng có hiệu quả khi nhắm mục tiêu vào các chính sách mạng nơ-ron trong học tăng cường. Cụ thể, chúng tôi chỉ ra các kỹ thuật tạo ví dụ đối nghịch hiện có có thể được sử dụng để làm giảm đáng kể hiệu suất thời gian kiểm tra của các chính sách đã được đào tạo. Mô hình mối đe dọa của chúng tôi coi các đối thủ có khả năng đưa các nhiễu loạn nhỏ vào đầu vào thô của chính sách. Chúng tôi mô tả mức độ dễ bị tổn thương trên các tác vụ và thuật toán đào tạo, đối với một phân lớp các cuộc tấn công ví dụ đối nghịch trong các thiết lập hộp trắng và hộp đen. Bất kể tác vụ đã học hoặc thuật toán đào tạo, chúng tôi quan sát thấy hiệu suất giảm đáng kể, ngay cả với các nhiễu loạn đối nghịch nhỏ không ảnh hưởng đến nhận thức của con người. 

Xem thêm: Tài khoản ChatGPT 4 chính hãng giá rẻ với vô vàn ưu đãi hấp dẫn!

Hot Deal

Họ tên (*)

Số điện thoại (*)

Email (*)

Dịch vụ

Đăng ký để nhận bản tin mới nhất !