Có một đối thủ mới trong lĩnh vực AI đang tạo nên làn sóng: QwQ-32B-Preview.
Cái gọi là mô hình AI “lý luận” này đang được so sánh với OpenAI o1 và đây là một trong số ít mô hình bạn có thể tải xuống theo license cho phép. Đối với các nhà phát triển và nhà nghiên cứu mong muốn thử nghiệm, đó là một phần thưởng đáng kể.
Được xây dựng bởi nhóm Qwen của Alibaba, QwQ-32B-Preview không hề nhẹ chút nào. Nó chứa 32,5 tỷ tham số—hãy coi đây là những khối xây dựng nên khả năng giải quyết vấn đề của nó—và có thể xử lý các lời nhắc lên tới 32.000 từ; dài hơn một số tiểu thuyết! Các thử nghiệm cho thấy nó vượt trội hơn OpenAI o1-preview và o1-mini trên các điểm chuẩn như AIME và MATH. Về ngữ cảnh, AIME sử dụng các mô hình AI khác để đánh giá hiệu suất, trong khi MATH là tập hợp các bài toán đố.
Nhưng mô hình này không chỉ có các bài toán hay câu đố logic. Điều làm nên sự khác biệt của nó là cách nó tiếp cận các nhiệm vụ. QwQ-32B-Preview lập kế hoạch trước, kiểm tra thực tế hoạt động của nó và tránh các lỗi AI phổ biến. Tất nhiên, điều đó không phải là hoàn hảo – Alibaba thừa nhận các vấn đề như chuyển đổi ngôn ngữ, thỉnh thoảng lặp lại và những khó khăn với lý luận “thông thường”. Mặc dù vậy, nó vẫn thể hiện một bước tiến tới các hệ thống AI thông minh hơn.
QwQ-32B-Preview có thể truy cập được: Bạn có thể chạy hoặc tải xuống qua Ôm mặt. Tuy nhiên, giống như các AI khác do Trung Quốc phát triển, nó hoạt động trong phạm vi quy định. Điều đó có nghĩa là nó cẩn thận tránh các chủ đề nhạy cảm về chính trị để tuân thủ các quy tắc của Trung Quốc, đảm bảo nó phù hợp với “các giá trị xã hội chủ nghĩa cốt lõi”.
Alibaba không đơn độc trong lĩnh vực này. Llama 3.1 của Meta là một tùy chọn nguồn mở khác, mặc dù nó có cách tiếp cận khác bằng cách tập trung vào AI tổng quát hơn là lý luận. Mặc dù cả hai mẫu đều có tính đổi mới nhưng QwQ-32B-Preview chuyên giải quyết vấn đề bằng phương pháp mà công ty mô tả là phương pháp tiếp cận giống con người, đưa nó vào danh mục lý luận.
Sự cạnh tranh về AI bên trong Trung Quốc đang ngày càng gay gắt. Các công ty như DeepSeek, Shanghai AI Lab và Kunlun Tech đã tham gia vào cuộc đua AI lý luận, phát hành các mô hình của họ với tốc độ nhanh chóng. Ví dụ: r1 của DeepSeek tuyên bố vượt trội hơn o1 của OpenAI trong một nửa số bài kiểm tra điểm chuẩn, đặc biệt là về toán và lập trình. InternThinker của Shanghai AI Lab áp dụng cách tiếp cận có cấu trúc để giải quyết vấn đề, kết hợp các bước như hiểu truy vấn, nhớ lại kiến thức, lập kế hoạch giải pháp và suy ngẫm về câu trả lời của mình.
Hoạt động gia tăng này cho thấy các công ty Trung Quốc đang nhanh chóng bắt kịp các gã khổng lồ công nghệ Mỹ như thế nào. Xu Liang, một doanh nhân AI đến từ Hàng Châu, tóm tắt lại: “OpenAI đã đưa ra hướng đi; với nghiên cứu, các công ty công nghệ Trung Quốc đang đạt được tiến bộ.” Việc phát hành QwQ-32B-Preview và các đối thủ cạnh tranh của nó cho thấy mức độ bao phủ của họ.
Nhưng điều này không chỉ dừng lại ở việc bắt kịp. Trí tuệ nhân tạo đánh dấu sự thay đổi trong cách thiết kế và sử dụng các mô hình. Không giống như các hệ thống AI cũ dựa vào sức mạnh vũ phu để tạo ra câu trả lời, các mô hình suy luận như QwQ-32B-Preview nhằm mục đích bắt chước cách giải quyết vấn đề của con người. Cách tiếp cận này không chỉ giúp chúng hoạt động hiệu quả hơn trong các nhiệm vụ phức tạp mà còn mở rộng các use case tiềm năng, như giải các phép toán nâng cao hoặc cung cấp lời khuyên tài chính chi tiết.
Cho dù đó là giải câu đố, suy luận thông qua các vấn đề phức tạp hay mở rộng những gì AI nguồn mở có thể đạt được, có một điều rõ ràng: sự phát triển của AI đang tăng tốc. Thắt dây an toàn—đây chỉ là sự khởi đầu.
(Ảnh chụp bởi Bapt)
Xem thêm: Alibaba Cloud đại tu sáng kiến đối tác AI
Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Kiểm tra Triển lãm AI & Dữ liệu lớn diễn ra ở Amsterdam, California và London. Sự kiện toàn diện này được tổ chức cùng với các sự kiện hàng đầu khác bao gồm Hội nghị tự động hóa thông minh, BlockX, Tuần lễ Chuyển đổi sốVà An ninh mạng & Triển lãm Cloud.
Khám phá các sự kiện và hội thảo Online về công nghệ doanh nghiệp sắp tới khác do TechForge cung cấp đây.