Hãy tưởng tượng việc kết nối hàng nghìn chip AI mạnh mẽ trải khắp nhiều tủ máy chủ và làm cho chúng hoạt động cùng nhau như thể chúng là một máy tính khổng lồ duy nhất. Đây chính là điều mà Huawei đã chứng minh tại HUAWEI CONNECT 2025, nơi công ty giới thiệu một bước đột phá trong kiến trúc hạ tầng AI, có khả năng định hình lại cách mà thế giới xây dựng và mở rộng hệ thống trí tuệ nhân tạo.
Thay vì những phương pháp truyền thống, nơi các máy chủ hoạt động độc lập, công nghệ SuperPoD mới của Huawei tạo ra một “máy tính logic duy nhất” được hình thành từ hàng nghìn đơn vị xử lý độc lập, cho phép chúng “học hỏi, suy nghĩ, và lý luận như một.”
Các ứng dụng của công nghệ này không chỉ dừng lại ở thông số kỹ thuật ấn tượng, mà còn đại diện cho một sự thay đổi trong cách mà sức mạnh xử lý AI có thể được tổ chức, mở rộng và triển khai trong các ngành công nghiệp.
Nền tảng kỹ thuật: UnifiedBus 2.0
Tại trung tâm của phương pháp hạ tầng của Huawei là UnifiedBus (UB). Yang Chaobin, Giám đốc Hội đồng quản trị và CEO của Nhóm Kinh doanh ICT của Huawei, đã giải thích rằng “Huawei đã phát triển kiến trúc SuperPoD tiên tiến dựa trên giao thức kết nối UnifiedBus của chúng tôi. Kiến trúc này kết nối chặt chẽ các máy chủ vật lý để chúng có thể học, suy nghĩ và lý luận như một máy chủ logic duy nhất.”
Các thông số kỹ thuật mang đến cái nhìn tổng thể về tầm vóc của thành tựu này. Giao thức UnifiedBus giải quyết hai thách thức mà lịch sử đã hạn chế việc tính toán AI quy mô lớn: độ tin cậy của các kết nối dài và độ trễ băng thông. Các kết nối đồng truyền thống cung cấp băng thông cao nhưng chỉ trong khoảng cách ngắn, thường chỉ kết nối khoảng hai tủ máy.
Cáp quang hỗ trợ khoảng cách dài hơn nhưng gặp vấn đề về độ tin cậy càng trở nên nghiêm trọng khi khoảng cách và quy mô tăng lên. Eric Xu, Phó chủ tịch và Chủ tịch luân phiên của Huawei, cho biết rằng việc giải quyết các thách thức về kết nối cơ bản này là điều cần thiết cho chiến lược hạ tầng AI của công ty.
Xu đã giải thích các giải pháp đột phá theo mô hình OSI: “Chúng tôi đã xây dựng độ tin cậy ở mọi lớp của giao thức kết nối, từ lớp vật lý và lớp liên kết dữ liệu, cho đến lớp mạng và truyền tải. Có thể phát hiện lỗi và chuyển đổi bảo vệ ở mức 100-ns trên các đường quang, khiến bất kỳ sự ngắt quãng hay lỗi nào của các mô-đun quang đều không thể nhận thấy ở lớp ứng dụng.”
Kiến trúc SuperPoD: Quy mô và hiệu suất
Atlas 950 SuperPoD là phiên bản hàng đầu của kiến trúc này, bao gồm lên tới 8,192 chip Ascend 950DT trong một cấu hình mà Xu gọi là cung cấp “8 EFLOPS ở FP8 và 16 EFLOPS ở FP4. Băng thông kết nối của nó sẽ là 16 PB/s. Điều này có nghĩa là một Atlas 950 SuperPoD sẽ có băng thông kết nối hơn 10 lần cao hơn tổng băng thông internet cao nhất toàn cầu.”
Các thông số kỹ thuật này không chỉ là những cải tiến khiêm tốn. Atlas 950 SuperPoD chiếm 160 tủ máy trong 1,000m2, với 128 tủ máy tính và 32 tủ liên lạc được kết nối bằng các kết nối quang toàn bộ. Dung lượng bộ nhớ của hệ thống đạt 1,152 TB và duy trì độ trễ mà Huawei tuyên bố là 2.1 microgiây trong toàn bộ hệ thống.
Trong quy trình sản xuất sắp tới sẽ có Atlas 960 SuperPoD, hứa hẹn tích hợp 15,488 chip Ascend 960 trong 220 tủ máy trải rộng trên 2,200m2. Xu cho biết nó sẽ cung cấp “30 EFLOPS ở FP8 và 60 EFLOPS ở FP4, với 4,460 TB bộ nhớ và 34 PB/s băng thông kết nối.”
Đi xa hơn AI: Ứng dụng điện toán đa mục đích
Khái niệm SuperPoD không chỉ giới hạn ở các khối lượng công việc AI mà còn mở rộng ra điện toán đa mục đích thông qua TaiShan 950 SuperPoD. Được xây dựng trên các bộ xử lý Kunpeng 950, hệ thống này giải quyết các thách thức doanh nghiệp trong việc thay thế các mainframe và máy tính tầm trung cũ.
Xu cho rằng điều này đặc biệt quan trọng đối với lĩnh vực tài chính, nơi “TaiShan 950 SuperPoD, kết hợp với GaussDB phân tán, có thể phục vụ như một sự thay thế lý tưởng và loại bỏ hoàn toàn — một lần và mãi mãi — các mainframe, máy tính tầm trung, và các máy chủ cơ sở dữ liệu Exadata của Oracle.”
Chiến lược kiến trúc mở
Có lẽ điều quan trọng nhất đối với thị trường hạ tầng AI rộng lớn hơn, Huawei đã công bố phát hành các thông số kỹ thuật kỹ thuật UnifiedBus 2.0 như các tiêu chuẩn mở. Quyết định này phản ánh cả vị trí chiến lược và những hạn chế thực tế.
Xu đã thừa nhận rằng “trong một thời gian dài, lục địa Trung Quốc sẽ lùi lại trong quá trình sản xuất bán dẫn” và nhấn mạnh rằng “sức mạnh tính toán bền vững chỉ có thể đạt được với các quá trình sản xuất hiện có.”
Yang định hình cách tiếp cận mở này như một xây dựng hệ sinh thái: “Chúng tôi cam kết với phương pháp phần cứng mở và phần mềm mã nguồn mở của chúng tôi, nhằm giúp nhiều đối tác phát triển các giải pháp SuperPoD dựa trên các kịch bản ngành nghề của họ. Điều này sẽ thúc đẩy sự đổi mới của nhà phát triển và phát triển một hệ sinh thái phát triển mạnh mẽ.”
Công ty sẽ mã nguồn mở các thành phần phần cứng và phần mềm, với phần cứng bao gồm các mô-đun NPU, máy chủ lưỡi blade làm mát bằng không khí và bằng nước, thẻ AI, bo mạch CPU, và thẻ nối. Đối với phần mềm, Huawei cam kết sẽ mã nguồn mở hoàn toàn các công cụ biên dịch CANN, bộ công cụ ứng dụng Mind và các mô hình nền tảng openPangu trước ngày 31 tháng 12 năm 2025.
Triển khai thị trường và tác động đến hệ sinh thái
Việc triển khai trong thực tế cung cấp sự xác nhận cho những tuyên bố kỹ thuật này. Hơn 300 đơn vị Atlas 900 A3 SuperPoD đã được vận chuyển trong năm 2025, đã được triển khai cho hơn 20 khách hàng từ nhiều lĩnh vực khác nhau, bao gồm internet, tài chính, viễn thông, điện lực và sản xuất.
Tác động đối với sự phát triển của hệ thống hạ tầng AI của Trung Quốc là rất lớn. Bằng cách tạo ra một hệ sinh thái mở xung quanh công nghệ nội địa, Huawei đang giải quyết các thách thức trong việc xây dựng hạ tầng AI cạnh tranh trong bối cảnh hạn chế về quá trình sản xuất và khả năng cung cấp bán dẫn. Cách tiếp cận này cho phép sự tham gia rộng rãi của ngành trong việc phát triển các giải pháp hạ tầng AI mà không cần phải tiếp cận các quy trình sản xuất tiên tiến nhất.
Đối với thị trường hạ tầng AI toàn cầu, chiến lược kiến trúc mở của Huawei đưa ra một sự lựa chọn cho cách tiếp cận phần cứng và phần mềm tích hợp chặt chẽ, độc quyền mà các đối thủ phương Tây đang chiếm ưu thế. Liệu hệ sinh thái mà Huawei đề xuất có thể đạt được hiệu suất tương đương và duy trì tính khả thi thương mại vẫn cần được chứng minh ở quy mô lớn.
Cuối cùng, kiến trúc SuperPoD đại diện cho một bước tiến hơn cả về công nghệ AI. Huawei đang đề xuất một cách cơ bản về cách mà các tài nguyên tính toán khổng lồ được kết nối, quản lý và mở rộng. Sự phát hành mã nguồn mở của các thông số kỹ thuật và các thành phần của nó sẽ thử thách liệu phát triển hợp tác có thể thúc đẩy sự đổi mới trong hạ tầng AI trong một hệ sinh thái các đối tác. Điều này có khả năng định hình lại các động lực cạnh tranh trong thị trường hạ tầng AI toàn cầu.