Close Menu
    Facebook X (Twitter) Instagram
    Facebook X (Twitter) Instagram
    Your Smart Business Idea
    Subscribe
    • Smart Technology

      Thales: Cần thiết kế độ tin cậy trong AI cho các hệ thống quan trọng

      14 Tháng 10, 2025

      Cloudera Evolve London: 91% tổ chức cho rằng dữ liệu không phù hợp cho mục đích AI

      12 Tháng 10, 2025

      Cách AI đang tái thiết lập các quy tắc xây dựng đội ngũ kỹ sư của bạn

      10 Tháng 10, 2025

      Cơn bùng nổ băng thông rộng tại Brazil: Bài học cho các nước Đương đại Global South

      10 Tháng 10, 2025

      SAP: AI đang biến ứng dụng doanh nghiệp thành hàng hóa

      8 Tháng 10, 2025
    • Smart Business
      1. Go To Market
      2. Customer Success
      3. Operation
      4. Supply Chain
      5. Human Resources
      6. View All

      AI Product Manager Canvas: Nâng Tầm Quản Lý & Vận Hành Sản Phẩm AI Hiệu Quả cho doanh nghiệp

      21 Tháng 6, 2025

      Tối Ưu Trải Nghiệm Khách Hàng Với Conversational Marketing Và AI

      18 Tháng 6, 2025

      Giải Mã Video Storytelling bằng AI: Tối Ưu Hiệu Quả Marketing và Chăm Sóc Khách Hàng

      13 Tháng 6, 2025

      Tối Ưu Chuyển Đổi Với Customer Journey Analysis (CJA) : Khi Mỗi Điểm Chạm Trở Thành Cơ Hội Tăng Trưởng

      12 Tháng 6, 2025

      AI Product Canvas: Tấm Bản Đồ Chiến Lược Biến Ý Tưởng AI Thành Hiện Thực

      24 Tháng 6, 2025

      Ứng dụng AI trong B2B Customer Portal – Giải pháp nâng cao chăm sóc khách hàng doanh nghiệp

      6 Tháng 6, 2025

      Hướng dẫn về Giải pháp Field Service Management (FSM)

      20 Tháng 4, 2025

      Những phần mềm chuyển đổi số quan trọng cho doanh nghiệp ngành năng lượng tái tạo

      8 Tháng 4, 2025

      Ứng dụng OpenAI & n8n & RPA: Tự động hóa thông minh cho doanh nghiệp hiện đại

      29 Tháng 5, 2025

      Từ PIM, PDM đến Digital Product Passport: Chuẩn hóa dữ liệu sản phẩm

      26 Tháng 5, 2025

      Triển khai Hệ thống Quản lý Tri thức (KMS) trong Doanh nghiệp: Lộ trình và Ứng dụng với Hệ sinh thái Google

      24 Tháng 5, 2025

      Notion – Giải Pháp Workspace Tất Cả Trong Một Cho Doanh Nghiệp Thời Đại Số

      23 Tháng 5, 2025

      Vì sao Supply Chain Finance vẫn là ‘mảnh đất trống’ đầy tiềm năng cho SMEs tại Việt Nam?

      13 Tháng 5, 2025

      Trí tuệ nhân tạo (AI) có thể giúp các tổ chức trong báo cáo ESG như thế nào ?

      9 Tháng 5, 2025

      EcoVadis là gì ? Lợi ích, ứng dụng và chiến lược triển khai ESG thành công tại Việt Nam

      7 Tháng 5, 2025

      Watershed – Giải pháp Carbon Management Thế Hệ Mới Cho Doanh Nghiệp

      6 Tháng 5, 2025

      Chiến lược xây dựng Agentic AI cho doanh nghiệp: Từ công cụ hỗ trợ đến hệ sinh thái ra quyết định

      19 Tháng 5, 2025

      Khi AI càng xã hội hoá : Cá nhân, doanh nghiệp và xã hội sẽ đi về đâu ?

      7 Tháng 9, 2025

      AI Product Canvas: Tấm Bản Đồ Chiến Lược Biến Ý Tưởng AI Thành Hiện Thực

      24 Tháng 6, 2025

      AI Product Manager Canvas: Nâng Tầm Quản Lý & Vận Hành Sản Phẩm AI Hiệu Quả cho doanh nghiệp

      21 Tháng 6, 2025

      Tối Ưu Trải Nghiệm Khách Hàng Với Conversational Marketing Và AI

      18 Tháng 6, 2025
    • Smart Strategy
    • Smart Finance
    • Smart Green
    • News
    Your Smart Business Idea
    Trang chủ » Blog » Các mô hình lý luận DeepSeek-R1 cạnh tranh với OpenAI về hiệu suất
    Smart Technology

    Các mô hình lý luận DeepSeek-R1 cạnh tranh với OpenAI về hiệu suất

    Smart Business VietnamBy Smart Business Vietnam21 Tháng 1, 2025326 Mins Read
    Facebook Twitter Pinterest Copy Link LinkedIn Tumblr Email Telegram WhatsApp
    Follow Us
    Facebook LinkedIn
    Share
    Facebook Twitter LinkedIn Pinterest Email Copy Link

    tìm kiếm sâu đã tiết lộ các mẫu DeepSeek-R1 và DeepSeek-R1-Zero thế hệ đầu tiên được thiết kế để giải quyết các nhiệm vụ suy luận phức tạp.

    DeepSeek-R1-Zero chỉ được đào tạo thông qua học tăng cường (RL) quy mô lớn mà không dựa vào tinh chỉnh có giám sát (SFT) như một bước sơ bộ. Theo DeepSeek, cách tiếp cận này đã dẫn đến sự xuất hiện tự nhiên của “nhiều hành vi lý luận mạnh mẽ và thú vị”, bao gồm việc tự xác minh, phản ánh và tạo ra chuỗi suy nghĩ rộng lớn (CoT).

    “Đáng chú ý là [DeepSeek-R1-Zero] là nghiên cứu mở đầu tiên xác nhận rằng khả năng suy luận của LLM có thể được khuyến khích hoàn toàn thông qua RL mà không cần SFT,” các nhà nghiên cứu DeepSeek giải thích. Cột mốc quan trọng này không chỉ nhấn mạnh nền tảng đổi mới của mô hình mà còn mở đường cho những tiến bộ tập trung vào RL trong lý luận AI.

    Tuy nhiên, khả năng của DeepSeek-R1-Zero có một số hạn chế nhất định. Những thách thức chính bao gồm “sự lặp lại vô tận, khả năng đọc kém và khả năng trộn ngôn ngữ” có thể gây ra những trở ngại đáng kể trong các ứng dụng trong thế giới thực. Để giải quyết những thiếu sót này, DeepSeek đã phát triển mẫu máy hàng đầu của mình: DeepSeek-R1.

    Giới thiệu DeepSeek-R1

    DeepSeek-R1 được xây dựng dựa trên phiên bản tiền nhiệm bằng cách kết hợp dữ liệu khởi động nguội trước khi đào tạo RL. Bước đào tạo trước bổ sung này giúp nâng cao khả năng suy luận của mô hình và giải quyết nhiều hạn chế được ghi nhận trong DeepSeek-R1-Zero.

    Đáng chú ý, DeepSeek-R1 đạt được hiệu suất tương đương với hệ thống o1 được đánh giá cao của OpenAI trong các nhiệm vụ toán học, Token hoá và lý luận chung, củng cố vị trí của nó như một đối thủ cạnh tranh hàng đầu.

    DeepSeek đã chọn nguồn mở cả DeepSeek-R1-Zero và DeepSeek-R1 cùng với sáu mẫu chưng cất nhỏ hơn. Trong số này, DeepSeek-R1-Distill-Qwen-32B đã cho thấy kết quả vượt trội—thậm chí còn vượt trội so với o1-mini của OpenAI trên nhiều điểm chuẩn.

    • MATH-500 (Pass@1): DeepSeek-R1 đạt 97,3%, làm lu mờ OpenAI (96,4%) và các đối thủ chính khác.
    • LiveCodeBench (Pass@1-COT): Phiên bản chưng cất DeepSeek-R1-Distill-Qwen-32B đạt 57,2%, hiệu suất vượt trội so với các mẫu nhỏ hơn.
    • AIME 2024 (Pass@1): DeepSeek-R1 đạt 79,8%, thiết lập tiêu chuẩn ấn tượng trong việc giải quyết vấn đề toán học.

    Một đường dẫn mang lại lợi ích cho ngành công nghiệp rộng lớn hơn

    DeepSeek đã chia sẻ những hiểu biết sâu sắc về quy trình nghiêm ngặt của mình để phát triển mô hình lý luận, tích hợp sự kết hợp giữa tinh chỉnh có giám sát và học tăng cường.

    Theo công ty, quy trình này bao gồm hai giai đoạn SFT để thiết lập các khả năng lý luận cơ bản và phi lý luận, cũng như hai giai đoạn RL được thiết kế để khám phá các mẫu lý luận nâng cao và điều chỉnh các khả năng này cho phù hợp với sở thích của con người.

    DeepSeek nhận xét: “Chúng tôi tin rằng hệ thống này sẽ mang lại lợi ích cho ngành bằng cách tạo ra các mô hình tốt hơn”, ám chỉ tiềm năng phương pháp của họ trong việc truyền cảm hứng cho những tiến bộ trong tương lai trên toàn lĩnh vực AI.

    Một thành tựu nổi bật trong cách tiếp cận tập trung vào RL của họ là khả năng DeepSeek-R1-Zero thực hiện các mẫu lý luận phức tạp mà không cần có sự hướng dẫn trước của con người — lần đầu tiên đối với cộng đồng nghiên cứu AI nguồn mở.

    Tầm quan trọng của quá trình chưng cất

    Các nhà nghiên cứu của DeepSeek cũng nhấn mạnh tầm quan trọng của quá trình chắt lọc—quá trình chuyển khả năng suy luận từ mô hình lớn hơn sang mô hình nhỏ hơn, hiệu quả hơn, một chiến lược giúp tăng hiệu suất ngay cả đối với các cấu hình nhỏ hơn.

    Các phiên bản được chắt lọc nhỏ hơn của DeepSeek-R1 – chẳng hạn như các phiên bản 1.5B, 7B và 14B – đã có thể giữ vững vị trí của riêng mình trong các ứng dụng thích hợp. Các mô hình được chắt lọc có thể đạt được kết quả tốt hơn thông qua đào tạo RL trên các mô hình có quy mô tương đương.

    🔥 Phần thưởng: Các mô hình chưng cất mã nguồn mở!

    🔬 Được chắt lọc từ DeepSeek-R1, 6 mẫu nhỏ có nguồn mở hoàn toàn
    📏 Model 32B & 70B ngang bằng với OpenAI-o1-mini
    🤝 Trao quyền cho cộng đồng nguồn mở

    🌍 Vượt qua ranh giới của **AI mở**!

    🐋 2/n pic.twitter.com/tfXLM2xtZZ

    – DeepSeek (@deepseek_ai) Ngày 20 tháng 1 năm 2025

    Đối với các nhà nghiên cứu, các mô hình chắt lọc này có sẵn với cấu hình từ 1,5 tỷ đến 70 tỷ tham số, hỗ trợ kiến ​​trúc Qwen2.5 và Llama3. Tính linh hoạt này cho phép sử dụng linh hoạt trong nhiều tác vụ khác nhau, từ viết mã đến hiểu ngôn ngữ tự nhiên.

    DeepSeek đã áp dụng license MIT cho kho lưu trữ và trọng lượng của mình, mở rộng quyền cho mục đích sử dụng thương mại và sửa đổi tiếp theo. Cho phép các tác phẩm phái sinh, chẳng hạn như sử dụng DeepSeek-R1 để đào tạo các mô hình ngôn ngữ lớn (LLM) khác. Tuy nhiên, người dùng các mô hình chắt lọc cụ thể phải đảm bảo tuân thủ license của các mô hình cơ sở ban đầu, chẳng hạn như license Apache 2.0 và Llama3.

    (Ảnh chụp bởi Prateek Katyal)

    Xem thêm: Microsoft nâng cao khả năng khám phá vật liệu với MatterGen

    Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Kiểm tra Triển lãm AI & Dữ liệu lớn diễn ra ở Amsterdam, California và London. Sự kiện toàn diện này được tổ chức cùng với các sự kiện hàng đầu khác bao gồm Hội nghị tự động hóa thông minh, BlockX, Tuần lễ Chuyển đổi sốVà An ninh mạng & Triển lãm Cloud.

    Khám phá các sự kiện và hội thảo Online về công nghệ doanh nghiệp sắp tới khác do TechForge cung cấp đây.

    thẻ: ai trí tuệ nhân tạo điểm chuẩn so sánh deepseek deepseek-r1 mô hình ngôn ngữ lớn llm mô hình lý luận mô hình lý luận học tăng cường kiểm tra



    Nguồn: www.artificialintelligence-news.com

    AI Automation Bài kiểm tra điểm chuẩn học tăng cường lý luận mô hình mô hình lý luận mô hình ngôn ngữ lớn so sánh tìm kiếm sâu sắc tìm kiếm sâu-r1 trí tuệ nhân tạo ừm
    Follow on Google News Follow on Flipboard
    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email Copy Link
    Previous ArticleAI Agent ‑ chúng là gì và chúng sẽ thay đổi cách chúng ta làm việc như thế nào ?
    Next Article 7 công cụ Token hoá AI miễn phí hàng đầu
    Smart Business Vietnam
    • Website
    • Facebook
    • X (Twitter)
    • LinkedIn

    I'm a strategic consultant and business development leader with over a decade of experience driving digital transformation across AI, data, ERP/CRM, and blockchain ecosystems.
    As the founder of SmartBusiness.vn and SmartIndustry.vn, I’m passionate about democratizing tech knowledge and enabling Vietnamese enterprises to grow smarter, faster, and more sustainably. I thrive at the intersection of innovation, strategic thinking, and execution — and I’m always open to connecting with visionary teams and changemakers. Please connect & discuss with me if you have any innovation ideas !

    Related Posts

    Thales: Cần thiết kế độ tin cậy trong AI cho các hệ thống quan trọng

    14 Tháng 10, 2025

    Cloudera Evolve London: 91% tổ chức cho rằng dữ liệu không phù hợp cho mục đích AI

    12 Tháng 10, 2025

    Cách AI đang tái thiết lập các quy tắc xây dựng đội ngũ kỹ sư của bạn

    10 Tháng 10, 2025
    Add A Comment

    Comments are closed.

    Bài mới

    Thales: Cần thiết kế độ tin cậy trong AI cho các hệ thống quan trọng

    14 Tháng 10, 2025

    Giải thưởng chuyển đổi số Việt Nam (VDA) 2025 ghi nhận lượng hồ sơ kỷ lục

    13 Tháng 10, 2025

    Cloudera Evolve London: 91% tổ chức cho rằng dữ liệu không phù hợp cho mục đích AI

    12 Tháng 10, 2025

    Định hình ‘sân chơi’ tài sản mã hoá ở Việt Nam

    11 Tháng 10, 2025

    Cách AI đang tái thiết lập các quy tắc xây dựng đội ngũ kỹ sư của bạn

    10 Tháng 10, 2025

    Cơn bùng nổ băng thông rộng tại Brazil: Bài học cho các nước Đương đại Global South

    10 Tháng 10, 2025

    FPT và các doanh nghiệp Mỹ hợp tác phát triển giải pháp AI cho ngành bảo hiểm và quỹ đầu tư

    10 Tháng 10, 2025

    SAP: AI đang biến ứng dụng doanh nghiệp thành hàng hóa

    8 Tháng 10, 2025

    Type above and press Enter to search. Press Esc to cancel.