Phản ứng của Alibaba đối với Deepseek là Qwen 2.5-Max, mô hình quy mô lớn hỗn hợp mới nhất của công ty (MOE).
Qwen 2,5-Max tự hào trước hơn 20 nghìn tỷ Token và tinh chỉnh thông qua các kỹ thuật tiên tiến như tinh chỉnh được giám sát (SFT) và học tập củng cố từ phản hồi của con người (RLHF).
Với API hiện có sẵn thông qua Cloud Alibaba Và mô hình có thể truy cập để khám phá qua Qwen Chat, gã khổng lồ công nghệ Trung Quốc đang mời các nhà phát triển và nhà nghiên cứu nhìn thấy những đột phá của nó.
Vượt trội hơn các đồng nghiệp
Khi so sánh hiệu suất của Qwen 2.5-Max với một số mô hình AI nổi bật nhất trên nhiều điểm chuẩn, kết quả rất hứa hẹn.
Các đánh giá bao gồm các số liệu phổ biến như MMLU-Pro cho việc giải quyết vấn đề cấp đại học, LiveCodebench cho chuyên môn Token hoá, LiveBench cho các khả năng tổng thể và đấu trường để đánh giá các mô hình chống lại sở thích của con người.
Theo Alibaba, Qwen Qwen 2.5-Max vượt trội so với DeepSeek V3 trong các điểm chuẩn như Arena-Hard, LiveCodeebench và GPQA-Diamond, đồng thời thể hiện kết quả cạnh tranh trong các đánh giá khác, bao gồm MMLU-Pro.
Mô hình hướng dẫn-được thiết kế cho các tác vụ hạ nguồn như trò chuyện và Token hoá-cạnh tranh trực tiếp với các mô hình hàng đầu như GPT-4O, Claude-3.5-Sonnet và DeepSeek V3. Trong số này, Qwen 2,5-Max đã quản lý để vượt trội so với các đối thủ trong một số lĩnh vực chính.
So sánh các mô hình cơ sở cũng mang lại kết quả đầy hứa hẹn. Trong khi các mô hình độc quyền như GPT-4O và Claude-3.5-sonnet vẫn nằm ngoài tầm với do các hạn chế truy cập, Qwen 2.5-Max được đánh giá đối với các tùy chọn công cộng hàng đầu như Deepseek V3, LLAMA-3.1-405B (mô hình dày đặc mở rộng nhất ) và QWEN2,5-72B. Một lần nữa, người mới của Alibaba đã thể hiện hiệu suất đặc biệt trên bảng.
Các mô hình cơ sở của chúng tôi đã thể hiện những lợi thế đáng kể trên hầu hết các điểm chuẩn, theo ông Al Albaba, và chúng tôi rất lạc quan rằng những tiến bộ trong các kỹ thuật sau đào tạo sẽ nâng phiên bản tiếp theo của Qwen 2.5-Max lên một tầm cao mới.
Làm cho Qwen 2.5-Max có thể truy cập được
Để làm cho mô hình dễ tiếp cận hơn với cộng đồng toàn cầu, Alibaba đã tích hợp Qwen 2.5-Max với nền tảng trò chuyện Qwen, nơi người dùng có thể tương tác trực tiếp với mô hình trong các khả năng khác nhau cho dù khám phá khả năng tìm kiếm của nó hay kiểm tra sự hiểu biết của nó về các truy vấn phức tạp.
Đối với các nhà phát triển, API QWEN 2.5-MAX hiện có sẵn thông qua Alibaba Cloud dưới tên mô hình là Qwen QWEN-MAX-2025-01-25. Người dùng quan tâm có thể bắt đầu bằng cách đăng ký tài khoản Alibaba Cloud, kích hoạt dịch vụ mô hình Studio và tạo khóa API.
API thậm chí còn tương thích với hệ sinh thái của Openai, làm cho việc tích hợp trở nên đơn giản cho các dự án và quy trình công việc hiện có. Khả năng tương thích này làm giảm rào cản cho những người háo hức kiểm tra các ứng dụng của họ với khả năng của mô hình.
Alibaba đã đưa ra một tuyên bố mạnh mẽ về ý định với Qwen 2.5-Max. Cam kết liên tục của công ty trong việc mở rộng các mô hình AI không chỉ là cải thiện điểm chuẩn hiệu suất mà còn về việc tăng cường tư duy cơ bản và khả năng lý luận của các hệ thống này.
Việc mở rộng quy mô của dữ liệu và kích thước mô hình không chỉ thể hiện những tiến bộ trong trí thông minh mô hình mà còn phản ánh cam kết không ngừng của chúng tôi đối với nghiên cứu tiên phong, theo ông Al Albaba.
Nhìn về phía trước, nhóm nghiên cứu nhằm mục đích vượt qua ranh giới của việc học củng cố để thúc đẩy các kỹ năng lý luận tiên tiến hơn nữa. Điều này, họ nói, có thể cho phép các mô hình của họ không chỉ phù hợp mà còn vượt qua trí thông minh của con người trong việc giải quyết các vấn đề phức tạp.
Ý nghĩa của ngành công nghiệp có thể là sâu sắc. Khi các phương pháp mở rộng được cải thiện và các mô hình Qwen phá vỡ nền tảng mới, chúng ta có thể sẽ thấy những gợn sóng tiếp theo trên các trường điều khiển AI trên toàn cầu mà chúng ta đã thấy trong những tuần gần đây.
(Ảnh bởi Maico Amorim)
Xem thêm: GOV TATGPT nhằm mục đích hiện đại hóa các cơ quan chính phủ Hoa Kỳ
Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Kiểm tra AI & Big Data Expo Diễn ra tại Amsterdam, California và London. Sự kiện toàn diện được cùng đặt với các sự kiện hàng đầu khác bao gồm cả Hội nghị tự động hóa thông minhThì BlockxThì Tuần Chuyển đổi sốVà An ninh mạng & Triển lãm Cloud.
Khám phá các sự kiện và hội thảo trên web về công nghệ doanh nghiệp sắp tới được cung cấp bởi TechForge đây.