Thông tin trên được chính Nick Clegg - Chủ tịch phụ trách các vấn đề toàn cầu của Meta xác nhận với Reuters trong bài phỏng vấn tuần này. TheùngbàiđăngFacebookInstagramđểhuấnluyệcoffeo đó, dữ liệu phục vụ cho việc đào tạo AI "đa nhân cách" (mà hãng giới thiệu từ ngày 27.9 qua) được lấy từ chính các bài đăng (văn bản viết, hình ảnh) mà người dùng đăng công khai trên Facebook, Instagram. Các nội dung riêng tư hay giới hạn người xem là bạn bè, gia đình, đoạn chat không được sử dụng.
Clegg khẳng định Meta áp dụng các biện pháp kỹ thuật cần thiết để kiểm soát dữ liệu nào được khai thác bởi AI, nhưng từ chối đưa ra chi tiết về cách hoạt động của mô hình này. "Chúng tôi loại trừ các tập dữ liệu chứa nhiều thông tin cá nhân, đồng thời không sử dụng dữ liệu từ các trang web như LinkedIn để huấn luyện AI vì lo ngại vấn đề riêng tư", lãnh đạo Meta nhấn mạnh.
CEO Mark Zuckerberg của Meta miêu tả trợ lý Meta AI có thể "trò chuyện như con người" nhờ xây dựng trên mô hình ngôn ngữ lớn có tên Llama 2, kết hợp mô hình chuyển văn bản thành hình ảnh Emu. Trợ lý của hãng có khả năng tạo ra văn bản, âm thanh, hình ảnh, có quyền truy cập thông tin thời gian thực nhờ hợp tác với công cụ tìm kiếm Bing của Microsoft - một nền tảng cũng đang sử dụng ChatGPT thế hệ mới nhất.
Meta AI bao gồm 28 chatbot (chương trình trả lời tự động) dựa theo khuôn mẫu là những người nổi tiếng. Ngay trong ngày đầu thử nghiệm, công cụ này đã vấp phải nhiều tranh cãi khi có dấu hiệu độc hại, phản ứng quá mức cần thiết do mang... tính cách riêng. Trong đó, một số chatbot đưa ra thông tin có xu hướng phân biệt chủng tộc, xoáy quá sâu vào đời tư người dùng. Vấn đề nghiêm trọng hơn khi chính nhân viên Meta cũng tuyên bố không thử AI này do quan ngại về các nội dung bất thường được đưa ra bởi trí tuệ nhân tạo của hãng.
Việc Meta dùng dữ liệu người dùng đưa lên mạng xã hội để "nuôi" trí tuệ nhân tạo cũng dấy lên lo ngại về vấn đề bản quyền. Khi được hỏi Meta có tuân thủ các bước tránh sao chép nội dung bản quyền hay không, đại diện hãng chỉ nhắc đến điều khoản cấm người dùng tạo nội dung vi phạm quyền riêng tư và quyền sở hữu trí tuệ trên nền tảng này.