Your Smart Business Idea
  • Login
  • Smart Business
    • Go To Market
    • Customer Success
    • Operation
    • Supply Chain
    • Human Resources
  • Smart Strategy
  • Smart Finance
  • Smart Green
  • Smart Technology
  • News
No Result
View All Result
  • Smart Business
    • Go To Market
    • Customer Success
    • Operation
    • Supply Chain
    • Human Resources
  • Smart Strategy
  • Smart Finance
  • Smart Green
  • Smart Technology
  • News
No Result
View All Result
Your Smart Business Idea
No Result
View All Result
Home Smart Technology

Các mô hình lý luận DeepSeek-R1 cạnh tranh với OpenAI về hiệu suất

Smart Business Vietnam by Smart Business Vietnam
21 Tháng 4, 2025
in Smart Technology
7
SHARES
131
VIEWS

tìm kiếm sâu đã tiết lộ các mẫu DeepSeek-R1 và DeepSeek-R1-Zero thế hệ đầu tiên được thiết kế để giải quyết các nhiệm vụ suy luận phức tạp.

DeepSeek-R1-Zero chỉ được đào tạo thông qua học tăng cường (RL) quy mô lớn mà không dựa vào tinh chỉnh có giám sát (SFT) như một bước sơ bộ. Theo DeepSeek, cách tiếp cận này đã dẫn đến sự xuất hiện tự nhiên của “nhiều hành vi lý luận mạnh mẽ và thú vị”, bao gồm việc tự xác minh, phản ánh và tạo ra chuỗi suy nghĩ rộng lớn (CoT).

“Đáng chú ý là [DeepSeek-R1-Zero] là nghiên cứu mở đầu tiên xác nhận rằng khả năng suy luận của LLM có thể được khuyến khích hoàn toàn thông qua RL mà không cần SFT,” các nhà nghiên cứu DeepSeek giải thích. Cột mốc quan trọng này không chỉ nhấn mạnh nền tảng đổi mới của mô hình mà còn mở đường cho những tiến bộ tập trung vào RL trong lý luận AI.

Tuy nhiên, khả năng của DeepSeek-R1-Zero có một số hạn chế nhất định. Những thách thức chính bao gồm “sự lặp lại vô tận, khả năng đọc kém và khả năng trộn ngôn ngữ” có thể gây ra những trở ngại đáng kể trong các ứng dụng trong thế giới thực. Để giải quyết những thiếu sót này, DeepSeek đã phát triển mẫu máy hàng đầu của mình: DeepSeek-R1.

Giới thiệu DeepSeek-R1

DeepSeek-R1 được xây dựng dựa trên phiên bản tiền nhiệm bằng cách kết hợp dữ liệu khởi động nguội trước khi đào tạo RL. Bước đào tạo trước bổ sung này giúp nâng cao khả năng suy luận của mô hình và giải quyết nhiều hạn chế được ghi nhận trong DeepSeek-R1-Zero.

Đáng chú ý, DeepSeek-R1 đạt được hiệu suất tương đương với hệ thống o1 được đánh giá cao của OpenAI trong các nhiệm vụ toán học, Token hoá và lý luận chung, củng cố vị trí của nó như một đối thủ cạnh tranh hàng đầu.

DeepSeek đã chọn nguồn mở cả DeepSeek-R1-Zero và DeepSeek-R1 cùng với sáu mẫu chưng cất nhỏ hơn. Trong số này, DeepSeek-R1-Distill-Qwen-32B đã cho thấy kết quả vượt trội—thậm chí còn vượt trội so với o1-mini của OpenAI trên nhiều điểm chuẩn.

  • MATH-500 (Pass@1): DeepSeek-R1 đạt 97,3%, làm lu mờ OpenAI (96,4%) và các đối thủ chính khác.
  • LiveCodeBench (Pass@1-COT): Phiên bản chưng cất DeepSeek-R1-Distill-Qwen-32B đạt 57,2%, hiệu suất vượt trội so với các mẫu nhỏ hơn.
  • AIME 2024 (Pass@1): DeepSeek-R1 đạt 79,8%, thiết lập tiêu chuẩn ấn tượng trong việc giải quyết vấn đề toán học.

Một đường dẫn mang lại lợi ích cho ngành công nghiệp rộng lớn hơn

DeepSeek đã chia sẻ những hiểu biết sâu sắc về quy trình nghiêm ngặt của mình để phát triển mô hình lý luận, tích hợp sự kết hợp giữa tinh chỉnh có giám sát và học tăng cường.

Theo công ty, quy trình này bao gồm hai giai đoạn SFT để thiết lập các khả năng lý luận cơ bản và phi lý luận, cũng như hai giai đoạn RL được thiết kế để khám phá các mẫu lý luận nâng cao và điều chỉnh các khả năng này cho phù hợp với sở thích của con người.

DeepSeek nhận xét: “Chúng tôi tin rằng hệ thống này sẽ mang lại lợi ích cho ngành bằng cách tạo ra các mô hình tốt hơn”, ám chỉ tiềm năng phương pháp của họ trong việc truyền cảm hứng cho những tiến bộ trong tương lai trên toàn lĩnh vực AI.

Một thành tựu nổi bật trong cách tiếp cận tập trung vào RL của họ là khả năng DeepSeek-R1-Zero thực hiện các mẫu lý luận phức tạp mà không cần có sự hướng dẫn trước của con người — lần đầu tiên đối với cộng đồng nghiên cứu AI nguồn mở.

Tầm quan trọng của quá trình chưng cất

Các nhà nghiên cứu của DeepSeek cũng nhấn mạnh tầm quan trọng của quá trình chắt lọc—quá trình chuyển khả năng suy luận từ mô hình lớn hơn sang mô hình nhỏ hơn, hiệu quả hơn, một chiến lược giúp tăng hiệu suất ngay cả đối với các cấu hình nhỏ hơn.

Các phiên bản được chắt lọc nhỏ hơn của DeepSeek-R1 – chẳng hạn như các phiên bản 1.5B, 7B và 14B – đã có thể giữ vững vị trí của riêng mình trong các ứng dụng thích hợp. Các mô hình được chắt lọc có thể đạt được kết quả tốt hơn thông qua đào tạo RL trên các mô hình có quy mô tương đương.

🔥 Phần thưởng: Các mô hình chưng cất mã nguồn mở!

🔬 Được chắt lọc từ DeepSeek-R1, 6 mẫu nhỏ có nguồn mở hoàn toàn
📏 Model 32B & 70B ngang bằng với OpenAI-o1-mini
🤝 Trao quyền cho cộng đồng nguồn mở

🌍 Vượt qua ranh giới của **AI mở**!

🐋 2/n pic.twitter.com/tfXLM2xtZZ

– DeepSeek (@deepseek_ai) Ngày 20 tháng 1 năm 2025

Đối với các nhà nghiên cứu, các mô hình chắt lọc này có sẵn với cấu hình từ 1,5 tỷ đến 70 tỷ tham số, hỗ trợ kiến ​​trúc Qwen2.5 và Llama3. Tính linh hoạt này cho phép sử dụng linh hoạt trong nhiều tác vụ khác nhau, từ viết mã đến hiểu ngôn ngữ tự nhiên.

DeepSeek đã áp dụng license MIT cho kho lưu trữ và trọng lượng của mình, mở rộng quyền cho mục đích sử dụng thương mại và sửa đổi tiếp theo. Cho phép các tác phẩm phái sinh, chẳng hạn như sử dụng DeepSeek-R1 để đào tạo các mô hình ngôn ngữ lớn (LLM) khác. Tuy nhiên, người dùng các mô hình chắt lọc cụ thể phải đảm bảo tuân thủ license của các mô hình cơ sở ban đầu, chẳng hạn như license Apache 2.0 và Llama3.

(Ảnh chụp bởi Prateek Katyal)

Xem thêm: Microsoft nâng cao khả năng khám phá vật liệu với MatterGen

Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Kiểm tra Triển lãm AI & Dữ liệu lớn diễn ra ở Amsterdam, California và London. Sự kiện toàn diện này được tổ chức cùng với các sự kiện hàng đầu khác bao gồm Hội nghị tự động hóa thông minh, BlockX, Tuần lễ Chuyển đổi sốVà An ninh mạng & Triển lãm Cloud.

Khám phá các sự kiện và hội thảo Online về công nghệ doanh nghiệp sắp tới khác do TechForge cung cấp đây.

thẻ: ai trí tuệ nhân tạo điểm chuẩn so sánh deepseek deepseek-r1 mô hình ngôn ngữ lớn llm mô hình lý luận mô hình lý luận học tăng cường kiểm tra



Nguồn: www.artificialintelligence-news.com

Có thể bạn chưa biết ?

Sainsbury’s đóng cửa hai nhà kho Argos khi ‘hiện đại hóa’ Logistics, 1.400 vai trò bị ảnh hưởng

Sự khác biệt giữa GenAI Chatbots và AI Agents

Lakehouse là gì ? Kiến trúc dữ liệu đột phá cho ngành Bán lẻ & Phân phối trong kỷ nguyên AI

Top 10 phần mềm PIM tốt nhất 2025 : So sánh, lựa chọn và chiến lược triển khai

Cuộc Cách Mạng AI Agent : Chiến Lược Lựa Chọn và Triển Khai AI Agent Cho Doanh Nghiệp Tương Lai

Thuế nhà thầu nước ngoài của Việt Nam: Hướng dẫn đầy đủ

Tags: AIAutomationBài kiểm trađiểm chuẩnhọc tăng cườnglý luậnmô hìnhmô hình lý luậnmô hình ngôn ngữ lớnso sánhtìm kiếm sâu sắctìm kiếm sâu-r1trí tuệ nhân tạoừm
Share3Tweet2Share
Previous Post

AI Agent ‑ chúng là gì và chúng sẽ thay đổi cách chúng ta làm việc như thế nào ?

Next Post

7 công cụ Token hoá AI miễn phí hàng đầu

Smart Business Vietnam

Smart Business Vietnam

I'm a strategic consultant and business development leader with over a decade of experience driving digital transformation across AI, data, ERP/CRM, and blockchain ecosystems.
As the founder of SmartBusiness.vn and SmartIndustry.vn, I’m passionate about democratizing tech knowledge and enabling Vietnamese enterprises to grow smarter, faster, and more sustainably. I thrive at the intersection of innovation, strategic thinking, and execution — and I’m always open to connecting with visionary teams and changemakers. Please connect & discuss with me if you have any innovation ideas !

Related Posts

Data Analytics

Big Data đang thúc đẩy ngành công nghiệp thực phẩm như thế nào

Tổng quan Không có gì ngạc nhiên khi ngành công nghiệp thực phẩm là một trong những phân khúc công...

1 Tháng 5, 2025
Smart Technology

Sainsbury’s đóng cửa hai nhà kho Argos khi ‘hiện đại hóa’ Logistics, 1.400 vai trò bị ảnh hưởng

Sainsbury's sẽ đóng cửa hai kho phân phối của Argos, đưa 1.400 người vào cuộc tư vấn. Các nhà kho...

21 Tháng 4, 2025
Smart Technology

Thương mại điện tử B2B2C – Những gì bạn cần biết

Thời đại nở rộ của bán hàng kỹ thuật số đã khai sinh ra các mô hình kinh doanh mới...

21 Tháng 4, 2025
Smart Technology

Thương mại trực tiếp (Live commerce) là gì? 6 xu hướng Live Commerce cần theo dõi trong năm 2023

Thương mại trực tiếp (Live commerce) , mua sắm trực tiếp , phát trực tiếp, trò chuyện trực tiếp... bạn đã nghe...

21 Tháng 4, 2025
Smart Technology

AI Chatbot vs. Rule-Based Chatbot: Lựa chọn nào thông minh hơn cho doanh nghiệp?

MỞ BÀI – Khi tự động hóa không còn là lựa chọn, mà là yêu cầu bắt buộc Một khảo...

17 Tháng 5, 2025
Smart Technology

Khám phá các Mô hình kinh doanh thương mại điện tử của năm 2023

Thương mại điện tử đã thay đổi các mô hình kinh doanh truyền thống theo nhiều cách khác nhau: giờ...

21 Tháng 4, 2025

Bài đọc nhiều

Giải mã chiến lược tăng trưởng: Phân tích sâu về tích hợp ngang và dọc

5 Tháng 5, 2025

ESG 360°: Toàn Cảnh Chiến Lược Cho Những Doanh Nghiệp Muốn Dẫn Đầu

10 Tháng 5, 2025

ESG , Tài chính bền vững và Công nghệ : Xu Hướng Tất Yếu hay Cơ Hội Bị Bỏ Lỡ ?

10 Tháng 5, 2025

Dự báo nhu cầu bằng AI & Machine Learning: Từ công cụ vận hành đến lợi thế chiến lược kinh doanh

13 Tháng 5, 2025

Chuyển đổi số ngành làm đẹp : Bài học từ hành trình bứt phá của Sephora

17 Tháng 5, 2025

Top 5 giải pháp ESG 2024–2025: Lựa chọn chiến lược cho doanh nghiệp hướng tới vận hành bền vững

17 Tháng 5, 2025

Truy xuất nguồn gốc & Nhãn điện tử – Chìa khóa minh bạch hóa chuỗi giá trị tại Việt Nam

12 Tháng 5, 2025

Quản Lý Quan Hệ Nhà Cung Cấp (SRM): Chìa Khóa Số Hóa Chuỗi Cung Ứng và Quy Trình Mua Hàng

30 Tháng 5, 2025

Từ Keep App đến cuộc chơi “wellness-as-a-platform”: Khi thể dục không chỉ là sức khỏe mà là hệ sinh thái dữ liệu và lối sống

30 Tháng 4, 2025

Công thức thành công bền vững của Coca-Cola: 10 yếu tố chiến lược xây dựng thương hiệu toàn cầu

3 Tháng 5, 2025

Insight

Giải mã chiến lược tăng trưởng: Phân tích sâu về tích hợp ngang và dọc

5 Tháng 5, 2025

Dự báo nhu cầu bằng AI & Machine Learning: Từ công cụ vận hành đến lợi thế chiến lược kinh doanh

13 Tháng 5, 2025

Chuyển đổi số ngành làm đẹp : Bài học từ hành trình bứt phá của Sephora

17 Tháng 5, 2025

Chuyển đổi số Route To Market (RTM) : Từ tích hợp hệ thống đến AI & Data

13 Tháng 5, 2025

Hệ sinh thái Carbon Accounting và Bài học chiến lược từ Persefoni

11 Tháng 5, 2025

AI Agents và cuộc chơi marketing mới: Khi thương hiệu của bạn phải được AI nhắc đến

29 Tháng 5, 2025

Xây dựng hệ thống quản lý tri thức doanh nghiệp hiệu quả: Hướng dẫn thực tế cho doanh nghiệp

23 Tháng 5, 2025

TOP 10 phần mềm đo lường & báo cáo carbon tốt nhất năm 2024-2025

16 Tháng 5, 2025

Bài mới nhất

MicrosaaS AI – Khi phần mềm nhỏ giải quyết bài toán lớn bằng trí tuệ nhân tạo

6 Tháng 6, 2025

Ứng dụng AI trong B2B Customer Portal – Giải pháp nâng cao chăm sóc khách hàng doanh nghiệp

6 Tháng 6, 2025

Thuốc giả: Vấn đề hệ thống & Vai trò của Blockchain trong minh bạch dược phẩm | SmartBusiness.vn

5 Tháng 6, 2025

Ant International triển khai AI-as-a-Service cho fintech, superapps

4 Tháng 6, 2025

Green AI: Đòn Bẩy Trung Tâm Dữ Liệu Bền Vững Tại Đông Nam Á

2 Tháng 6, 2025

AI Tạo Sinh và bán hàng B2B : Bạn Đã Sẵn Sàng Cho Sân Chơi Mới?

30 Tháng 5, 2025

Người tiêu dùng AI – Bạn đang ở nhóm nào trong kỷ nguyên trí tuệ nhân tạo?

30 Tháng 5, 2025

AI Agents và cuộc chơi marketing mới: Khi thương hiệu của bạn phải được AI nhắc đến

29 Tháng 5, 2025

About Us

SmartBusiness.vn – Nơi nội dung tạo ra giá trị thực và thúc đẩy đổi mới.
Chúng tôi kết nối chuyên gia, doanh nhân, và nhà sáng tạo để sản xuất những bài viết chuyên sâu, truyền cảm hứng, tập trung vào kinh doanh, công nghệ, và phát triển bền vững.
Tại đây, nội dung không chỉ để đọc, mà còn để hành động và tạo nên thay đổi.

Facebook LinkedIn

SmartBusiness.vn – Nơi nội dung tạo ra giá trị thực và thúc đẩy đổi mới.
Chúng tôi kết nối chuyên gia, doanh nhân, và nhà sáng tạo để sản xuất những bài viết chuyên sâu, truyền cảm hứng, tập trung vào kinh doanh, công nghệ, và phát triển bền vững.
Tại đây, nội dung không chỉ để đọc, mà còn để hành động và tạo nên thay đổi.

Top Read

Giải mã chiến lược tăng trưởng: Phân tích sâu về tích hợp ngang và dọc

5 Tháng 5, 2025

ESG 360°: Toàn Cảnh Chiến Lược Cho Những Doanh Nghiệp Muốn Dẫn Đầu

10 Tháng 5, 2025

Danh mục

  • AI
  • Blockchain & Web3
  • Business Automation
  • Business News
  • Customer Success
  • Data Analytics
  • Go To Market
  • Human Resources
  • Operation
  • Smart Finance
  • Smart Green
  • Smart Strategy
  • Smart Technology
  • Supply Chain

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Smart Business
    • Go To Market
    • Customer Success
    • Operation
    • Supply Chain
    • Human Resources
  • Smart Strategy
  • Smart Finance
  • Smart Green
  • Smart Technology
  • News
  • Login

SmartBusiness.vn – Nơi nội dung tạo ra giá trị thực và thúc đẩy đổi mới. Chúng tôi kết nối chuyên gia, doanh nhân, và nhà sáng tạo để sản xuất những bài viết chuyên sâu, truyền cảm hứng, tập trung vào kinh doanh, công nghệ, và phát triển bền vững. Tại đây, nội dung không chỉ để đọc, mà còn để hành động và tạo nên thay đổi.