IBM đã giới thiệu dòng mô hình AI phức tạp nhất của mình cho đến nay, được đặt tên là Granite 3.0, tại sự kiện thường niên của công ty TechXchange sự kiện.
Dòng sản phẩm Granite 3.0 bao gồm nhiều mẫu được thiết kế cho nhiều ứng dụng khác nhau:
- Mục đích/ngôn ngữ chung: các biến thể 8B và 2B ở cả cấu hình Hướng dẫn và Cơ sở
- An toàn: Các mẫu Guardian có kích thước 8B và 2B, được thiết kế để lắp đặt lan can
- Hỗn hợp các chuyên gia: Một loạt các mô hình được tối ưu hóa cho các kịch bản triển khai khác nhau
IBM tuyên bố rằng các mô hình ngôn ngữ 8B và 2B mới của họ có thể sánh ngang hoặc vượt qua hiệu suất của các dịch vụ có quy mô tương tự từ các nhà cung cấp hàng đầu trên nhiều tiêu chuẩn học thuật và công nghiệp. Các mô hình này được định vị là công cụ linh hoạt cho AI doanh nghiệp, xuất sắc trong các nhiệm vụ như Tạo thế hệ tăng cường truy xuất (RAG), phân loại, tóm tắt và trích xuất thực thể.
Điểm khác biệt chính của dòng Granite 3.0 là cam kết của IBM đối với AI nguồn mở. Các mô hình này được phát hành theo license Apache 2.0 cho phép, mang đến sự kết hợp độc đáo giữa hiệu suất, tính linh hoạt và quyền tự chủ cho cả khách hàng doanh nghiệp và cộng đồng AI rộng lớn hơn.
IBM tin rằng bằng cách kết hợp mô hình Granite nhỏ gọn với dữ liệu doanh nghiệp độc quyền, đặc biệt là sử dụng kỹ thuật căn chỉnh InstructLab mới của họ, doanh nghiệp có thể đạt được hiệu suất theo nhiệm vụ cụ thể cạnh tranh với các mô hình lớn hơn với chi phí thấp hơn. Những bằng chứng ban đầu về khái niệm cho thấy khả năng tiết kiệm chi phí ít hơn tới 23 lần so với các mô hình lớn.
Theo IBM, tính minh bạch và an toàn vẫn được đặt lên hàng đầu trong chiến lược AI của hãng. Công ty đã xuất bản một báo cáo kỹ thuật và hướng dẫn sử dụng có trách nhiệm đối với Granite 3.0, nêu chi tiết về các bộ dữ liệu được sử dụng, các bước xử lý dữ liệu và kết quả điểm chuẩn. Ngoài ra, IBM cung cấp khoản bồi thường IP cho tất cả các mô hình Granite trên nền tảng watsonx.ai của mình, mang lại cho doanh nghiệp sự tự tin cao hơn khi tích hợp các mô hình này với dữ liệu của riêng họ.
Mô hình Granite 3.0 8B Instruct đã cho thấy kết quả đặc biệt hứa hẹn, vượt trội so với các mô hình nguồn mở có quy mô tương tự từ Meta và Mistral về các điểm chuẩn học thuật tiêu chuẩn. Nó cũng dẫn đầu về tất cả các khía cạnh an toàn được đo lường theo tiêu chuẩn an toàn AttaQ của IBM.
IBM cũng đang giới thiệu các mô hình Granite Guardian 3.0, được thiết kế để triển khai các biện pháp bảo vệ an toàn bằng cách kiểm tra lời nhắc của người dùng và phản hồi LLM để phát hiện các rủi ro khác nhau. Các mô hình này cung cấp một tập hợp toàn diện các khả năng phát hiện rủi ro và tác hại, bao gồm các biện pháp kiểm tra riêng cho các vấn đề cụ thể của RAG như tính có căn cứ và mức độ phù hợp với bối cảnh.
Toàn bộ bộ mô hình Granite 3.0 có sẵn để tải xuống trên HuggingFace, với các tùy chọn sử dụng thương mại trên nền tảng watsonx của IBM. IBM cũng đã hợp tác với các đối tác trong hệ sinh thái để tích hợp các mô hình Granite vào nhiều sản phẩm khác nhau, mang lại nhiều lựa chọn hơn cho các doanh nghiệp trên toàn thế giới.
Khi IBM tiếp tục nâng cao danh mục AI của mình, công ty cho biết họ đang tập trung phát triển các công nghệ tác nhân AI tinh vi hơn có khả năng tự chủ cao hơn và giải quyết các vấn đề phức tạp. Điều này bao gồm các kế hoạch giới thiệu các tính năng tác nhân AI mới trong IBM watsonx Orchestrate và xây dựng các khả năng tác nhân trong danh mục của mình vào năm 2025.
Xem thêm: Chấm điểm mô hình AI: Endor Labs tiết lộ công cụ đánh giá
Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Kiểm tra Triển lãm AI & Dữ liệu lớn diễn ra ở Amsterdam, California và London. Sự kiện toàn diện này được tổ chức cùng với các sự kiện hàng đầu khác bao gồm Hội nghị tự động hóa thông minh, BlockX, Tuần lễ Chuyển đổi sốVà An ninh mạng & Triển lãm Cloud.
Khám phá các sự kiện và hội thảo Online về công nghệ doanh nghiệp sắp tới khác do TechForge cung cấp đây.