.png)
OpenAI cam kết thực thi các chính sách ngăn chặn lạm dụng và cải thiện tính minh bạch xung quanh nội dung do AI tạo ra. Điều này đặc biệt đúng đối với việc phát hiện và phá vỡ các hoạt động gây ảnh hưởng bí mật (IO), nhằm thao túng dư luận hoặc tác động đến kết quả chính trị mà không tiết lộ danh tính hoặc ý định thực sự của những người đứng sau chúng.
Trong ba tháng qua, chúng tôi đã phá vỡ năm IO bí mật tìm cách sử dụng mô hình của chúng tôi để hỗ trợ hoạt động lừa đảo trên internet. Tính đến tháng 5 năm 2024, các chiến dịch này dường như không làm tăng đáng kể mức độ tương tác hoặc phạm vi tiếp cận đối tượng của họ nhờ các dịch vụ của chúng tôi.
Xem thêm: mua tài khoản ChatGPT Plus chính hãng giá rẻ
Blog này mô tả các tác nhân đe dọa mà chúng tôi đã phá vỡ, xu hướng của kẻ tấn công mà chúng tôi đã xác định và các xu hướng phòng thủ quan trọng - bao gồm cách thiết kế các mô hình AI với sự an toàn trong nhiều trường hợp đã ngăn chặn các tác nhân đe dọa tạo ra nội dung mà chúng mong muốn và cách các công cụ AI đã giúp các cuộc điều tra của chúng tôi hiệu quả hơn. Cùng với blog này, chúng tôi đang xuất bản một phân tích xu hướng mô tả chi tiết hành vi của các tác nhân độc hại này.
Các tác nhân đe dọa hoạt động trên internet. Chúng tôi cũng vậy. Bằng cách hợp tác với ngành công nghiệp, xã hội dân sự và chính phủ, chúng tôi giải quyết vấn đề tạo, phân phối và tác động của nội dung IO. Các cuộc điều tra và gián đoạn của chúng tôi có thể thực hiện được một phần là do có rất nhiều báo cáo chi tiết về mối đe dọa trong những năm qua của các nền tảng phân phối và cộng đồng nguồn mở. OpenAI đang công bố những phát hiện này, giống như các công ty công nghệ khác, để thúc đẩy việc chia sẻ thông tin và các biện pháp thực hành tốt nhất trong cộng đồng các bên liên quan rộng lớn hơn.
Phá vỡ các hoạt động ảnh hưởng bí mật
Trong ba tháng qua, công việc của chúng tôi chống lại các tác nhân IO đã phá vỡ các hoạt động gây ảnh hưởng bí mật nhằm sử dụng các mô hình AI cho nhiều nhiệm vụ khác nhau, chẳng hạn như tạo các bình luận ngắn và bài viết dài hơn bằng nhiều ngôn ngữ, tạo tên và tiểu sử cho các tài khoản mạng xã hội, tiến hành nghiên cứu nguồn mở, gỡ lỗi mã đơn giản và dịch và đọc hiệu đính văn bản.
Cụ thể, chúng tôi đã phá vỡ:
+ Một hoạt động chưa từng được báo cáo trước đây từ Nga, mà chúng tôi gọi là Bad Grammar, hoạt động chủ yếu trên Telegram và nhắm mục tiêu vào Ukraine, Moldova, các quốc gia vùng Baltic và Hoa Kỳ. Những người đứng sau Bad Grammar đã sử dụng các mô hình của chúng tôi để gỡ lỗi mã để chạy bot Telegram và tạo các bình luận chính trị ngắn bằng tiếng Nga và tiếng Anh sau đó được đăng trên Telegram.
+ Một hoạt động có nguồn gốc từ Nga được gọi là Doppelganger. Những người hành động thay mặt cho Doppelganger đã sử dụng mô hình của chúng tôi để tạo các bình luận bằng tiếng Anh, tiếng Pháp, tiếng Đức, tiếng Ý và tiếng Ba Lan được đăng trên X và 9GAG; dịch và chỉnh sửa các bài viết bằng tiếng Anh và tiếng Pháp được đăng trên các trang web có liên kết đến hoạt động này; tạo tiêu đề; và chuyển đổi các bài báo thành bài đăng trên Facebook.
+ Một mạng lưới Trung Quốc được gọi là Spamouflage, sử dụng mô hình của chúng tôi để nghiên cứu hoạt động truyền thông xã hội công khai, tạo văn bản bằng các ngôn ngữ bao gồm tiếng Trung, tiếng Anh, tiếng Nhật và tiếng Hàn sau đó được đăng trên các nền tảng bao gồm X, Medium và Blogspot, và mã gỡ lỗi để quản lý cơ sở dữ liệu và trang web, bao gồm một tên miền chưa được báo cáo trước đó, revealscum[.]com.
+ Một hoạt động của Iran được gọi là Liên minh truyền thông ảo quốc tế (IUVM) , sử dụng các mô hình của chúng tôi để tạo và dịch các bài viết dài, tiêu đề và thẻ trang web sau đó được xuất bản trên một trang web có liên kết với tác nhân đe dọa người Iran này, iuvmpress[.]co;
+ Hoạt động của một công ty thương mại tại Israel có tên là STOIC, vì về mặt kỹ thuật, chúng tôi đã phá vỡ hoạt động chứ không phải công ty. Chúng tôi đặt biệt danh cho hoạt động này là Zero Zeno , theo tên người sáng lập trường phái triết học khắc kỷ. Những người đứng sau Zero Zeno đã sử dụng các mô hình của chúng tôi để tạo ra các bài viết và bình luận sau đó được đăng trên nhiều nền tảng, đặc biệt là Instagram, Facebook, X và các trang web liên quan đến hoạt động này.
Nội dung do các hoạt động này đăng tải tập trung vào nhiều vấn đề khác nhau, bao gồm cuộc xâm lược Ukraine của Nga, xung đột ở Gaza, cuộc bầu cử ở Ấn Độ, chính trị ở châu Âu và Hoa Kỳ, cũng như những lời chỉ trích đối với chính phủ Trung Quốc của những người bất đồng chính kiến Trung Quốc và chính phủ nước ngoài.
Cho đến nay, các hoạt động này dường như không được hưởng lợi từ việc tăng cường sự tham gia hoặc tiếp cận đối tượng một cách có ý nghĩa nhờ các dịch vụ của chúng tôi. Sử dụng thang đo đột phá của Brookings, đánh giá tác động của IO bí mật trên thang điểm từ 1 (thấp nhất) đến 6 (cao nhất), không có hoạt động nào trong năm hoạt động được đưa vào nghiên cứu điển hình của chúng tôi đạt điểm cao hơn 2 (hoạt động trên nhiều nền tảng, nhưng không đột phá vào cộng đồng đích thực).
Xu hướng tấn công
Dựa trên các cuộc điều tra về các hoạt động gây ảnh hưởng được nêu chi tiết trong báo cáo của chúng tôi và hoạt động của cộng đồng nguồn mở, chúng tôi đã xác định các xu hướng sau đây về cách các hoạt động gây ảnh hưởng bí mật gần đây đã sử dụng các mô hình trí tuệ nhân tạo như của chúng tôi.
+ Tạo nội dung : Tất cả các tác nhân đe dọa này đều sử dụng dịch vụ của chúng tôi để tạo văn bản (và đôi khi là hình ảnh) với khối lượng lớn hơn và ít lỗi ngôn ngữ hơn so với khả năng của con người.
+ Trộn lẫn cũ và mới : Tất cả các hoạt động này đều sử dụng AI ở một mức độ nào đó, nhưng không có hoạt động nào sử dụng AI một cách độc quyền. Thay vào đó, tài liệu do AI tạo ra chỉ là một trong nhiều loại nội dung mà họ đăng, bên cạnh các định dạng truyền thống hơn, chẳng hạn như văn bản viết tay hoặc meme sao chép từ khắp internet.
+ Giả mạo sự tương tác : Một số mạng lưới mà chúng tôi phá vỡ đã sử dụng dịch vụ của chúng tôi để giúp tạo ra sự tương tác trên phương tiện truyền thông xã hội - ví dụ, bằng cách tạo phản hồi cho bài đăng của riêng họ. Điều này khác với việc thu hút sự tương tác thực sự , mà không có mạng lưới nào chúng tôi mô tả ở đây có thể thực hiện ở mức độ có ý nghĩa.
+ Tăng năng suất : Nhiều tác nhân đe dọa mà chúng tôi xác định và ngăn chặn đã sử dụng dịch vụ của chúng tôi để cố gắng nâng cao năng suất, chẳng hạn như tóm tắt bài đăng trên mạng xã hội hoặc gỡ lỗi mã.
Xu hướng phòng thủ
Trong khi phần lớn cuộc tranh luận công khai cho đến nay tập trung vào tiềm năng hoặc việc sử dụng thực tế của AI bởi những kẻ tấn công, điều quan trọng là phải nhớ những lợi thế mà AI mang lại cho những người bảo vệ. Các cuộc điều tra của chúng tôi cũng được hưởng lợi từ việc chia sẻ trong ngành và nghiên cứu nguồn mở.
+ Thiết kế phòng thủ: Chúng tôi áp đặt ma sát lên các tác nhân đe dọa thông qua các hệ thống an toàn của mình, phản ánh cách tiếp cận của chúng tôi trong việc triển khai AI một cách có trách nhiệm . Ví dụ, chúng tôi đã nhiều lần quan sát thấy các trường hợp mà mô hình của chúng tôi từ chối tạo văn bản hoặc hình ảnh mà các tác nhân yêu cầu.
+ Điều tra được tăng cường bằng AI : Tương tự như cách tiếp cận của chúng tôi khi sử dụng tài khoản Chat GPT-4 để kiểm duyệt nội dung và phòng thủ mạng , chúng tôi đã xây dựng các công cụ hỗ trợ AI của riêng mình để phát hiện và phân tích hiệu quả hơn. Các cuộc điều tra được mô tả trong báo cáo đi kèm mất nhiều ngày, thay vì nhiều tuần hoặc nhiều tháng, nhờ vào công cụ của chúng tôi. Khi các mô hình của chúng tôi được cải thiện, chúng tôi sẽ tiếp tục tận dụng các khả năng của chúng để cải thiện các cuộc điều tra của mình.
+ Vấn đề phân phối : Giống như các hình thức nội dung truyền thống, tài liệu do AI tạo ra phải được phân phối nếu muốn tiếp cận được đối tượng. IO đã đăng trên nhiều nền tảng khác nhau, bao gồm X, Telegram, Facebook, Medium, Blogspot và các diễn đàn nhỏ hơn, nhưng không có nền tảng nào thu hút được lượng khán giả đáng kể.
+ Tầm quan trọng của việc chia sẻ trong ngành : Để tăng tác động của sự gián đoạn của chúng tôi đối với những tác nhân này, chúng tôi đã chia sẻ các chỉ số đe dọa chi tiết với các đồng nghiệp trong ngành. Các cuộc điều tra của riêng chúng tôi được hưởng lợi từ nhiều năm phân tích nguồn mở do cộng đồng nghiên cứu rộng lớn hơn thực hiện.
+ Yếu tố con người : AI có thể thay đổi bộ công cụ mà người vận hành sử dụng, nhưng không thay đổi bản thân người vận hành. Các cuộc điều tra của chúng tôi cho thấy những tác nhân này dễ mắc lỗi của con người như các thế hệ trước - ví dụ, đăng các thông báo từ chối từ các mô hình của chúng tôi trên phương tiện truyền thông xã hội và trang web của họ. Mặc dù điều quan trọng là phải nhận thức được các công cụ thay đổi mà các tác nhân đe dọa sử dụng, chúng ta không nên bỏ qua những hạn chế của con người có thể ảnh hưởng đến hoạt động và quá trình ra quyết định của họ.
Chúng tôi cam kết phát triển AI an toàn và có trách nhiệm, bao gồm việc thiết kế các mô hình của chúng tôi với sự an toàn trong tâm trí và chủ động can thiệp chống lại việc sử dụng có hại. Việc phát hiện và phá vỡ các hành vi lạm dụng đa nền tảng như các hoạt động gây ảnh hưởng bí mật có thể là một thách thức vì chúng tôi không phải lúc nào cũng biết cách phân phối nội dung do các sản phẩm của chúng tôi tạo ra. Nhưng chúng tôi cam kết tìm ra và giảm thiểu hành vi lạm dụng này ở quy mô lớn bằng cách khai thác sức mạnh của AI tạo ra.

Cách đổi Mật khẩu Chat GPT - Hướng dẫn đổi Pass Chat GPT 100% Thành công
Hướng dẫn Cách đăng nhập Chat GPT Nhanh nhất | Có hỗ trợ Miễn phí qua Teamview-Ultraview
Chat GPT Plus là gì? So sánh Chat GPT Plus với Chat GPT Miễn phí
Chat GPT bị giới hạn giải thích vì sao và cách khắc phục
Chat GPT là gì ? Cách đăng Ký Chat GPT Miễn Phí tại Việt Nam