Meta đã giới thiệu Llama 3, thế hệ tiếp theo của mô hình ngôn ngữ lớn nguồn mở (LLM) tiên tiến nhất. Gã khổng lồ công nghệ tuyên bố Llama 3 thiết lập các tiêu chuẩn hiệu suất mới, vượt qua các mẫu dẫn đầu ngành trước đây như GPT-3.5 trong các tình huống thực tế.
Meta cho biết trong một bài đăng trên blog thông báo về việc phát hành: “Với Llama 3, chúng tôi bắt đầu xây dựng các mô hình mở tốt nhất ngang bằng với các mô hình độc quyền tốt nhất hiện nay”.
Các mẫu Llama 3 ban đầu được mở bán là phiên bản thông số 8 tỷ và 70 tỷ. Meta cho biết các nhóm của họ vẫn đang đào tạo hơn 400 tỷ mô hình tham số lớn hơn sẽ được phát hành trong những tháng tới, cùng với các tài liệu nghiên cứu trình bày chi tiết về công việc.
Llama 3 đã được thành lập hơn hai năm với nguồn lực đáng kể dành riêng cho việc tập hợp dữ liệu đào tạo chất lượng cao, mở rộng quy mô đào tạo phân tán, tối ưu hóa kiến trúc mô hình và các phương pháp tiếp cận đổi mới để tinh chỉnh hướng dẫn.
Mô hình tinh chỉnh hướng dẫn tham số 70 tỷ của Meta hoạt động tốt hơn GPT-3.5, Claude và các LLM khác có quy mô tương đương trong đánh giá của con người trong 12 tình huống sử dụng chính như Token hoá, lý luận và viết sáng tạo. Mô hình đào tạo trước 8 tỷ tham số của công ty cũng đặt ra các tiêu chuẩn mới cho các nhiệm vụ đánh giá LLM phổ biến:
Meta cho biết: “Chúng tôi tin rằng đây là những mô hình nguồn mở tốt nhất trong phân khúc của chúng”.
Gã khổng lồ công nghệ đang phát hành các mô hình thông qua cách tiếp cận “mở theo mặc định” để tiếp tục phát triển hệ sinh thái mở xung quanh việc phát triển AI. Llama 3 sẽ có sẵn trên tất cả các nhà cung cấp đám mây lớn, máy chủ mô hình, nhà sản xuất phần cứng và nền tảng AI.
Victor Botev, CTO và đồng sáng lập Iris.ai, cho biết: “Với sự thay đổi toàn cầu hướng tới quy định về AI, việc ra mắt mô hình Llama 3 của Meta là rất đáng chú ý. Bằng cách đảm bảo tính minh bạch thông qua nguồn mở, Meta phù hợp với sự chú trọng ngày càng tăng vào thực tiễn AI có trách nhiệm và phát triển đạo đức.
“Hơn nữa, điều này mang lại cơ hội cho giáo dục cộng đồng rộng rãi hơn vì các mô hình mở tạo điều kiện hiểu biết sâu sắc về sự phát triển và khả năng xem xét kỹ lưỡng các cách tiếp cận khác nhau, đồng thời tính minh bạch này sẽ hỗ trợ cho việc soạn thảo và thực thi quy định.”
Đi kèm với các mô hình mới nhất của Meta là bộ công cụ an toàn AI được cập nhật, bao gồm phiên bản thứ hai của Llama Guard để phân loại rủi ro và CyberSec Eval để đánh giá khả năng lạm dụng. Một thành phần mới có tên Code Shield cũng đã được giới thiệu để lọc các đề xuất mã không an toàn tại thời điểm suy luận.
“Tuy nhiên, điều quan trọng là phải duy trì quan điểm – một mô hình đơn giản là nguồn mở không tự động đồng nghĩa với AI có đạo đức,” Botev tiếp tục. “Việc giải quyết các thách thức của AI đòi hỏi một cách tiếp cận toàn diện để giải quyết các vấn đề như quyền riêng tư dữ liệu, sai lệch thuật toán và tác động xã hội – tất cả đều tập trung chính vào các quy định AI mới nổi trên toàn thế giới.
”Trong khi các sáng kiến mở như Llama 3 thúc đẩy sự giám sát và hợp tác, tác động thực sự của chúng xoay quanh cách tiếp cận toàn diện đối với việc tuân thủ quản trị AI và đưa đạo đức vào vòng đời của hệ thống AI. Những nỗ lực không ngừng của Meta với mô hình Llama là một bước đi đúng hướng, nhưng AI có đạo đức đòi hỏi sự cam kết bền vững từ tất cả các bên liên quan.”
Meta cho biết họ đã áp dụng “cách tiếp cận cấp hệ thống” để phát triển và triển khai AI có trách nhiệm với Llama 3. Mặc dù các mô hình đã trải qua thử nghiệm an toàn rộng rãi, công ty nhấn mạnh rằng các nhà phát triển nên triển khai tính năng lọc đầu vào/đầu ra của riêng họ phù hợp với yêu cầu của ứng dụng của họ .
Sản phẩm dành cho người dùng cuối của công ty tích hợp Llama 3 là Meta AI, được Meta tuyên bố hiện là trợ lý AI hàng đầu thế giới nhờ các mô hình mới. Người dùng có thể truy cập Meta AI thông qua Facebook, Instagram, WhatsApp, Messenger và web để tăng năng suất, học tập, sáng tạo và truy vấn chung.
Các phiên bản đa phương thức của Meta AI tích hợp khả năng thị giác đang được triển khai, với bản xem trước sớm dành cho kính thông minh Ray-Ban của Meta.
Bất chấp những thành tựu đáng kể của Llama 3, một số người trong lĩnh vực AI đã bày tỏ sự hoài nghi về động lực của Meta là một cách tiếp cận mở “vì lợi ích của xã hội”.
Tuy nhiên, chỉ một ngày sau khi Mistral AI thiết lập tiêu chuẩn mới cho các mô hình nguồn mở với Mixtral 8x22B, bản phát hành của Meta một lần nữa nâng cao tiêu chuẩn cho các LLM có sẵn công khai.
Xem thêm: SAS đặt mục tiêu làm cho AI có thể truy cập được bất kể kỹ năng nào bằng các mô hình AI được đóng gói
Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Hãy xem AI & Big Data Expo diễn ra ở Amsterdam, California và London. Sự kiện toàn diện này được tổ chức cùng với các sự kiện hàng đầu khác bao gồm BlockX, Tuần lễ Chuyển đổi số và An ninh mạng & Triển lãm đám mây.
Khám phá các sự kiện và hội thảo Online về công nghệ doanh nghiệp sắp tới khác do TechForge cung cấp tại đây.