Thử nghiệm của Google Song Tử 1.5 Pro mô hình đã vượt qua OpenAI GPT-4o trong các tiêu chuẩn AI tạo ra.
Trong năm qua, GPT-4o của OpenAI và Anthropic Claude-3 đã thống trị bối cảnh. Tuy nhiên, phiên bản mới nhất của Gemini 1.5 Pro dường như đã dẫn đầu.
Một trong những chuẩn mực được công nhận rộng rãi nhất trong cộng đồng AI là LMSYS Chatbot Arena, đánh giá mô hình hóa các nhiệm vụ khác nhau và chỉ định điểm năng lực chung. Trên bảng xếp hạng này, GPT-4o đạt được số điểm là 1.286, trong khi Claude-3 đạt được số điểm đáng khen là 1.271. Phiên bản trước của Gemini 1.5 Pro đã đạt được số điểm là 1.261.
Phiên bản thử nghiệm của Gemini 1.5 Pro (được gọi là Gemini 1.5 Pro 0801) đã vượt qua các đối thủ cạnh tranh gần nhất với số điểm ấn tượng là 1.300. Sự cải thiện đáng kể này cho thấy mẫu máy mới nhất của Google có thể sở hữu khả năng tổng thể tốt hơn so với các đối thủ cạnh tranh.
Điều đáng chú ý là mặc dù các điểm chuẩn cung cấp thông tin chi tiết có giá trị về hiệu suất của mô hình AI, nhưng chúng không phải lúc nào cũng thể hiện chính xác toàn bộ khả năng hoặc hạn chế của mô hình AI đó trong các ứng dụng thực tế.
Mặc dù Gemini 1.5 Pro hiện đã có mặt trên thị trường, việc nó được dán nhãn là bản phát hành sớm hoặc đang trong giai đoạn thử nghiệm cho thấy Google vẫn có thể điều chỉnh hoặc thậm chí thu hồi mô hình này vì lý do an toàn hoặc liên kết.
Sự phát triển này đánh dấu một cột mốc quan trọng trong cuộc đua giành vị thế thống trị AI giữa các gã khổng lồ công nghệ. Khả năng vượt qua OpenAI và Anthropic về điểm chuẩn của Google cho thấy tốc độ đổi mới nhanh chóng trong lĩnh vực này và sự cạnh tranh gay gắt thúc đẩy những tiến bộ này.
Khi bối cảnh AI tiếp tục phát triển, sẽ rất thú vị khi xem OpenAI và Anthropic phản ứng thế nào với thách thức này từ Google. Liệu họ có thể giành lại vị trí dẫn đầu bảng xếp hạng hay Google đã thiết lập một tiêu chuẩn mới cho hiệu suất AI tạo ra?
(Ảnh chụp bởi Yuliya Strizhkina)
Xem thêm: Chiến lược AI của Meta: Xây dựng cho tương lai, không phải lợi nhuận trước mắt
Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ những người đi đầu trong ngành? Thủ tục thanh toán Triển lãm AI & Dữ liệu lớn diễn ra tại Amsterdam, California và London. Sự kiện toàn diện này được tổ chức cùng với các sự kiện hàng đầu khác bao gồm Hội nghị Tự động hóa thông minh, KhốiX, Tuần lễ chuyển đổi sốVà Triển lãm An ninh mạng và Điện toán Cloud.
Khám phá các sự kiện công nghệ doanh nghiệp sắp tới và hội thảo trên web do TechForge cung cấp đây.