Ant Group đã bước vào đấu trường mô hình AI đánh dấu với Ling-1T, một mô hình ngôn ngữ nguồn mở mới mà gã khổng lồ fintech Trung Quốc trình bày như một bước đột phá trong việc cân bằng hiệu suất tính toán và khả năng suy luận tiên tiến.
Thông báo ngày 9 tháng 10 đánh dấu một cột mốc quan trọng cho nhà vận hành Alipay, khi họ đang nhanh chóng xây dựng hạ tầng trí tuệ nhân tạo của mình qua nhiều kiến trúc mô hình khác nhau.
Mô hình AI với hàng nghìn tỉ tham số này đã thể hiện hiệu suất cạnh tranh trong các bài toán suy luận toán học phức tạp, đạt độ chính xác 70.42% trên thước đo American Invitational Mathematics Examination (AIME) năm 2025, một tiêu chuẩn được sử dụng để đánh giá khả năng giải quyết vấn đề của các hệ thống AI.

Theo các thông số kỹ thuật của Ant Group, Ling-1T duy trì mức hiệu suất này trong khi tiêu thụ trung bình hơn 4,000 token đầu ra cho mỗi vấn đề, đặt nó cùng hạng với những gì công ty mô tả là “các mô hình AI hàng đầu” về chất lượng kết quả.
Chiến lược hai hướng trong phát triển AI
Sự ra mắt mô hình AI với hàng nghìn tỉ tham số trùng với việc Ant Group giới thiệu dInfer, một khung suy luận chuyên dụng được thiết kế cho các mô hình ngôn ngữ khuếch tán. Chiến lược phát hành song song này phản ánh niềm tin của công ty vào nhiều phương pháp tiếp cận công nghệ khác nhau thay vì một mô hình kiến trúc duy nhất.
Các mô hình ngôn ngữ khuếch tán đại diện cho một sự chuyển đổi từ các hệ thống tự hồi quy, vốn là nền tảng của các chatbot phổ biến như ChatGPT. Các mô hình này tạo ra kết quả đồng thời, khác với quá trình tạo văn bản tuần tự—một phương pháp đã phổ biến trong các công cụ tạo hình ảnh và video nhưng ít phổ biến hơn trong xử lý ngôn ngữ.
Các chỉ số hiệu suất của dInfer từ Ant Group cho thấy lợi ích hiệu quả đáng kể. Thử nghiệm trên mô hình phân tán LLaDA-MoE của công ty cho kết quả 1,011 token mỗi giây trên thước đo HumanEval cho Token hoá, so với 91 token mỗi giây từ khung Fast-dLLM của Nvidia và 294 token từ mô hình Qwen-2.5-3B của Alibaba chạy trên cơ sở hạ tầng vLLM.
Các nhà nghiên cứu tại Ant Group đã nhấn mạnh trong tài liệu kỹ thuật đi kèm rằng, “Chúng tôi tin rằng dInfer cung cấp cả một công cụ thực tiễn và một nền tảng tiêu chuẩn hóa để thúc đẩy nghiên cứu và phát triển trong lĩnh vực dLLMs đang phát triển nhanh chóng.”
Mở rộng hệ sinh thái vượt ra ngoài mô hình ngôn ngữ
Mô hình AI Ling-1T với hàng nghìn tỉ tham số nằm trong một họ rộng lớn hơn của các hệ thống AI mà Ant Group đã tập hợp trong những tháng gần đây.

Danh mục của công ty hiện bao gồm ba dòng chính: các mô hình Ling không suy luận cho các nhiệm vụ ngôn ngữ tiêu chuẩn, các mô hình suy luận Ring dành cho suy luận phức tạp (bao gồm Ring-1T-preview đã phát hành trước đó), và các mô hình đa phương tiện Ming có khả năng xử lý hình ảnh, văn bản, âm thanh và video.
Cách tiếp cận đa dạng này được mở rộng tới một mô hình thử nghiệm được gọi là LLaDA-MoE, sử dụng kiến trúc Mixture-of-Experts (MoE)—một kỹ thuật chỉ kích hoạt các phần liên quan của một mô hình lớn cho các nhiệm vụ cụ thể, cải thiện hiệu suất lý thuyết.
He Zhengyu, giám đốc công nghệ của Ant Group, đã phát biểu về định vị của công ty xung quanh các phát hành này. “Tại Ant Group, chúng tôi tin rằng Trí tuệ nhân tạo tổng quát (AGI) nên là một lợi ích chung—một cột mốc chung hướng tới tương lai thông minh của nhân loại,” He cho biết và nói thêm rằng việc phát hành nguồn mở cả mô hình AI với hàng nghìn tỉ tham số và Ring-1T-preview đều là những bước tiến tới “sự phát triển mở và hợp tác.”
Động lực cạnh tranh trong môi trường bị hạn chế
Thời điểm và bản chất của các phát hành từ Ant Group làm sáng tỏ các tính toán chiến lược trong lĩnh vực AI của Trung Quốc. Với việc tiếp cận công nghệ bán dẫn tiên tiến bị hạn chế bởi các hạn chế xuất khẩu, các công ty công nghệ Trung Quốc đã ngày càng nhấn mạnh vào đổi mới thuật toán và tối ưu hóa phần mềm như các yếu tố phân biệt cạnh tranh.
ByteDance, công ty mẹ của TikTok, cũng đã giới thiệu một mô hình ngôn ngữ khuếch tán có tên Seed Diffusion Preview vào tháng 7, tuyên bố cải thiện tốc độ năm lần so với các kiến trúc tự hồi quy tương tự. Những nỗ lực song song này cho thấy sự quan tâm rộng rãi của ngành công nghiệp vào các mô hình thay thế có thể mang lại lợi thế về hiệu suất.
Tuy nhiên, quỹ đạo ứng dụng thực tế cho các mô hình ngôn ngữ khuếch tán vẫn chưa được xác định. Các hệ thống tự hồi quy vẫn tiếp tục thống trị các ứng dụng thương mại do hiệu suất đã được chứng minh trong việc hiểu và tạo ngôn ngữ tự nhiên—các yêu cầu cốt lõi cho các ứng dụng hướng tới khách hàng.
Chiến lược nguồn mở như một vị thế thị trường
Bằng cách công khai mô hình AI với hàng nghìn tỉ tham số cùng với khung dInfer, Ant Group đang theo đuổi mô hình phát triển hợp tác đối lập với các tiếp cận khép kín của một số đối thủ cạnh tranh.
Chiến lược này có thể thúc đẩy đổi mới nhanh hơn đồng thời định vị công nghệ của Ant như một hạ tầng nền tảng cho cộng đồng AI rộng lớn hơn.
Công ty cũng đang phát triển AWorld, một khung nhằm hỗ trợ học tập liên tục trong các AI Agent tự động—các hệ thống được thiết kế để hoàn thành nhiệm vụ độc lập thay mặt người dùng.
Liệu những nỗ lực kết hợp này có thể đưa Ant Group trở thành một lực lượng quan trọng trong phát triển AI toàn cầu hay không phụ thuộc một phần vào việc xác thực thực tế các tuyên bố về hiệu suất và một phần vào tỉ lệ chấp nhận giữa các nhà phát triển đang tìm kiếm các lựa chọn thay thế cho các nền tảng đã được thiết lập.
Bản chất nguồn mở của mô hình AI với hàng nghìn tỉ tham số có thể tạo điều kiện cho quá trình xác thực này trong khi xây dựng một cộng đồng người dùng đầu tư vào sự thành công của công nghệ.
Hiện tại, các phát hành cho thấy các công ty công nghệ lớn của Trung Quốc coi bối cảnh AI hiện nay đủ linh hoạt để chấp nhận các đơn vị mới sẵn sàng đổi mới trên nhiều chiều đồng thời.
Nguồn : https://www.artificialintelligence-news.com/