Primate Labs đã chính thức ra mắt AI của Geekbenchmột công cụ đánh giá chuẩn được thiết kế dành riêng cho Machine Learning và khối lượng công việc tập trung vào AI.
Việc phát hành Geekbench AI 1.0 đánh dấu sự kết thúc của nhiều năm phát triển và hợp tác với khách hàng, đối tác và cộng đồng kỹ thuật AI. Chuẩn mực này, trước đây được gọi là Geekbench ML trong giai đoạn xem trước, đã được đổi tên để phù hợp với thuật ngữ của ngành và đảm bảo rõ ràng về mục đích của nó.
Geekbench AI hiện có sẵn cho Windows, macOS và Linux thông qua Site Primate Labs, cũng như trên Google Play Store và Apple App Store dành cho thiết bị di động.
Công cụ đánh giá chuẩn mới nhất của Primate Labs nhằm mục đích cung cấp một phương pháp chuẩn hóa để đo lường và so sánh các khả năng AI trên các nền tảng và kiến trúc khác nhau. Đánh giá chuẩn cung cấp một cách tiếp cận độc đáo bằng cách cung cấp ba điểm tổng thể, phản ánh tính phức tạp và tính không đồng nhất của khối lượng công việc AI.
“Đo lường hiệu suất, nói một cách đơn giản, thực sự rất khó”, Primate Labs giải thích. “Không phải vì khó chạy một bài kiểm tra tùy ý, mà vì khó xác định bài kiểm tra nào là quan trọng nhất đối với hiệu suất mà bạn muốn đo lường – đặc biệt là trên các nền tảng khác nhau và đặc biệt là khi mọi người đều làm mọi việc theo những cách khác nhau một cách tinh tế”.
Hệ thống ba điểm tính đến các mức độ chính xác khác nhau và tối ưu hóa phần cứng được tìm thấy trong các triển khai AI hiện đại. Phương pháp tiếp cận đa chiều này cho phép các nhà phát triển, nhà cung cấp phần cứng và những người đam mê có được cái nhìn sâu sắc hơn về hiệu suất AI của thiết bị trong các tình huống khác nhau.
Một bổ sung đáng chú ý cho Geekbench AI là việc đưa vào các phép đo độ chính xác cho mỗi bài kiểm tra. Tính năng này thừa nhận rằng hiệu suất AI không chỉ là về tốc độ mà còn về chất lượng kết quả. Bằng cách kết hợp các số liệu về tốc độ và độ chính xác, Geekbench AI cung cấp góc nhìn toàn diện hơn về khả năng của AI, giúp người dùng hiểu được sự đánh đổi giữa hiệu suất và độ chính xác.
Geekbench AI 1.0 giới thiệu hỗ trợ cho nhiều khuôn khổ AI, bao gồm OpenVINO trên Linux và Windows, và các đại biểu TensorFlow Lite dành riêng cho nhà cung cấp như Samsung ENN, ArmNN và Qualcomm QNN trên Android. Hỗ trợ khuôn khổ rộng này đảm bảo rằng chuẩn mực phản ánh các công cụ và phương pháp mới nhất được các nhà phát triển AI sử dụng.
Tiêu chuẩn này cũng sử dụng các tập dữ liệu mở rộng và đa dạng hơn, không chỉ nâng cao đánh giá độ chính xác mà còn thể hiện tốt hơn các use case AI trong thế giới thực. Tất cả khối lượng công việc trong Geekbench AI 1.0 chạy trong tối thiểu một giây, cho phép các thiết bị đạt mức hiệu suất tối đa trong quá trình thử nghiệm trong khi vẫn phản ánh bản chất bùng nổ của các ứng dụng trong thế giới thực.
Primate Labs đã công bố mô tả kỹ thuật chi tiết về khối lượng công việc và mô hình được sử dụng trong Geekbench AI 1.0, nhấn mạnh cam kết của họ về tính minh bạch và phương pháp thử nghiệm tiêu chuẩn công nghiệp. Điểm chuẩn được tích hợp với Trình duyệt Geekbenchtạo điều kiện dễ dàng cho việc so sánh đa nền tảng và chia sẻ kết quả.
Công ty dự kiến sẽ cập nhật thường xuyên Geekbench AI để theo kịp những thay đổi của thị trường và các tính năng AI mới nổi. Tuy nhiên, Primate Labs tin rằng Geekbench AI đã đạt đến mức độ tin cậy phù hợp để tích hợp vào quy trình làm việc chuyên nghiệp, với các công ty công nghệ lớn như Samsung và Nvidia đã sử dụng chuẩn này.
(Nguồn hình ảnh: Phòng thí nghiệm linh trưởng)
Xem thêm: xAI ra mắt Grok-2 để thách thức hệ thống phi tập trung hoá AI
Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ những người đi đầu trong ngành? Kiểm tra Triển lãm AI & Dữ liệu lớn diễn ra tại Amsterdam, California và London. Sự kiện toàn diện này được tổ chức cùng với các sự kiện hàng đầu khác bao gồm Hội nghị Tự động hóa thông minh, KhốiX, Tuần lễ chuyển đổi sốVà Triển lãm An ninh mạng và Điện toán Cloud.
Khám phá các sự kiện công nghệ doanh nghiệp sắp tới và hội thảo trên web do TechForge cung cấp đây.