Trong ba tháng qua, OpenAI đã phá vỡ năm hoạt động gây ảnh hưởng bí mật (IO) nhằm khai thác các mô hình của công ty cho các hoạt động lừa đảo Online. Tính đến tháng 5 năm 2024, các chiến dịch này chưa cho thấy mức độ tương tác hoặc phạm vi tiếp cận của khán giả tăng đáng kể nhờ các dịch vụ của OpenAI.
OpenAI tuyên bố cam kết của họ trong việc thiết kế các mô hình AI chú trọng đến sự an toàn thường cản trở nỗ lực tạo ra nội dung mong muốn của các tác nhân đe dọa. Ngoài ra, công ty cho biết các công cụ AI đã nâng cao hiệu quả điều tra của OpenAI.
Báo cáo chi tiết về mối đe dọa của các nền tảng phân phối và cộng đồng nguồn mở đã góp phần đáng kể vào việc chống lại IO. OpenAI đang chia sẻ những phát hiện này để thúc đẩy chia sẻ thông tin và thực tiễn tốt nhất giữa cộng đồng các bên liên quan rộng lớn hơn.
Phá vỡ IO bí mật
Trong ba tháng qua, OpenAI đã làm gián đoạn một số hoạt động IO bằng cách sử dụng mô hình của mình cho nhiều tác vụ khác nhau, chẳng hạn như tạo nhận xét ngắn, tạo hồ sơ mạng xã hội giả mạo, tiến hành nghiên cứu nguồn mở, gỡ lỗi mã đơn giản và dịch văn bản.
Các hoạt động cụ thể bị gián đoạn bao gồm:
- Ngữ pháp tệ: Một hoạt động chưa được báo cáo trước đây của Nga nhắm vào Ukraine, Moldova, các nước vùng Baltic và Mỹ. Nhóm này đã sử dụng các mô hình của OpenAI để gỡ lỗi mã chạy bot Telegram và tạo ra các bình luận chính trị bằng tiếng Nga và tiếng Anh, được đăng trên Telegram.
- Song trùng: Một hoạt động khác của Nga tạo ra các bình luận bằng nhiều ngôn ngữ trên các nền tảng như X và 9GAG, dịch và chỉnh sửa các bài báo, tạo tiêu đề và chuyển các bài báo thành bài đăng trên Facebook.
- Thư rác: Một mạng lưới của Trung Quốc sử dụng các mô hình của OpenAI để nghiên cứu hoạt động truyền thông xã hội công cộng, tạo văn bản bằng nhiều ngôn ngữ và gỡ lỗi mã để quản lý cơ sở dữ liệu và Site.
- Liên minh truyền thông ảo quốc tế (IUVM): Một hoạt động của Iran tạo và dịch các bài báo, tiêu đề và thẻ Site dài, được xuất bản trên một Site được liên kết.
- Zero Zeno: Một công ty thương mại ở Israel có hoạt động tạo ra các bài viết và bình luận được đăng trên nhiều nền tảng, bao gồm Instagram, Facebook, X và các Site liên kết.
Nội dung được đăng bởi các hoạt động này tập trung vào nhiều vấn đề khác nhau, bao gồm việc Nga xâm chiếm Ukraine, xung đột ở Gaza, bầu cử ở Ấn Độ, chính trị châu Âu và Mỹ cũng như những lời chỉ trích chính phủ Trung Quốc.
Bất chấp những nỗ lực này, không có hoạt động nào trong số này cho thấy mức độ tương tác của khán giả tăng lên đáng kể nhờ các mô hình của OpenAI. Sử dụng Thang đo đột phá của Brookings – đánh giá tác động của IO bí mật – không có hoạt động nào trong số năm hoạt động đạt điểm cao hơn điểm 2, cho thấy hoạt động trên nhiều nền tảng nhưng không có sự đột phá vào các cộng đồng xác thực.
Xu hướng tấn công
Các cuộc điều tra về các hoạt động gây ảnh hưởng này đã tiết lộ một số xu hướng:
- Tạo nội dung: Các tác nhân đe dọa đã sử dụng các dịch vụ của OpenAI để tạo ra khối lượng lớn văn bản với ít lỗi ngôn ngữ hơn những gì mà con người có thể tự mình thực hiện được.
- Trộn lẫn cũ và mới: AI được sử dụng cùng với các định dạng truyền thống, chẳng hạn như văn bản được viết thủ công hoặc các meme được sao chép.
- Giả vờ đính hôn: Một số mạng tạo ra câu trả lời cho các bài đăng của chính họ để tạo ra sự tương tác, mặc dù không có mạng nào thu hút được sự tương tác đích thực.
- Tăng năng suất: Các tác nhân đe dọa đã sử dụng AI để nâng cao năng suất, tóm tắt các bài đăng trên mạng xã hội và gỡ lỗi mã.
Xu hướng phòng thủ
Các cuộc điều tra của OpenAI được hưởng lợi từ việc chia sẻ trong ngành và nghiên cứu nguồn mở. Các biện pháp phòng thủ bao gồm:
- Thiết kế phòng thủ: Hệ thống an toàn của OpenAI gây ra xung đột với các tác nhân đe dọa, thường ngăn cản chúng tạo ra nội dung mong muốn.
- Điều tra tăng cường AI: Các công cụ được hỗ trợ bởi AI đã cải thiện hiệu quả phát hiện và phân tích, giảm thời gian điều tra từ Weekly, hàng tháng xuống còn vài ngày.
- Vấn đề phân phối: Nội dung IO, giống như nội dung truyền thống, phải được phân phối hiệu quả để tiếp cận khán giả. Bất chấp những nỗ lực của họ, không có hoạt động nào bị gián đoạn có được sự tham gia đáng kể.
- Tầm quan trọng của việc chia sẻ ngành: Việc chia sẻ các chỉ số về mối đe dọa với các đồng nghiệp trong ngành đã làm tăng tác động của sự gián đoạn của OpenAI. Công ty được hưởng lợi từ nhiều năm phân tích nguồn mở của cộng đồng nghiên cứu rộng lớn hơn.
- Yếu tố con người: Mặc dù sử dụng AI, nhưng các tác nhân đe dọa vẫn dễ mắc phải lỗi của con người, chẳng hạn như đăng thông báo từ chối từ các mô hình của OpenAI trên mạng xã hội và Site của họ.
OpenAI cho biết họ vẫn tập trung phát triển AI an toàn và có trách nhiệm. Điều này liên quan đến việc thiết kế các mô hình có lưu ý đến sự an toàn và chủ động can thiệp chống lại việc sử dụng có mục đích xấu.
Mặc dù thừa nhận rằng việc phát hiện và ngăn chặn các hành vi lạm dụng đa nền tảng như các hoạt động gây ảnh hưởng bí mật là một thách thức, OpenAI tuyên bố họ cam kết giảm thiểu các mối nguy hiểm.
(Ảnh của Chris Yang)
Xem thêm: EU ra mắt văn phòng thực thi Đạo luật AI và thúc đẩy đổi mới
Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Hãy xem AI & Big Data Expo diễn ra ở Amsterdam, California và London. Sự kiện toàn diện này được tổ chức cùng với các sự kiện hàng đầu khác bao gồm Hội nghị Tự động hóa Thông minh, BlockX, Tuần lễ Chuyển đổi số và Triển lãm An ninh Mạng & Cloud.
Khám phá các sự kiện và hội thảo Online về công nghệ doanh nghiệp sắp tới khác do TechForge cung cấp tại đây.