Trong vài năm qua, thế giới đã ngạc nhiên trước khả năng và khả năng được giải phóng bởi AI tổng quát (gen AI). Các mô hình nền tảng như mô hình ngôn ngữ lớn (LLM) có thể thực hiện những kỳ tích ấn tượng, trích xuất thông tin chi tiết và tạo nội dung trên nhiều phương tiện, chẳng hạn như văn bản, âm thanh, hình ảnh và video. Nhưng giai đoạn tiếp theo của GenAI có thể sẽ biến đổi nhiều hơn.
Chúng ta đang bắt đầu một sự phát triển từ các công cụ dựa trên tri thức, GenAI hỗ trợ — chẳng hạn như chatbot trả lời câu hỏi và tạo nội dung — sang “Agent ” hỗ trợ GenAI sử dụng các mô hình nền tảng để thực hiện quy trình làm việc phức tạp, nhiều bước trên thế giới kỹ thuật số. Nói tóm lại, công nghệ đang chuyển từ suy nghĩ sang hành động.
Nói chung, các hệ thống “Agent ” đề cập đến các hệ thống kỹ thuật số có thể tương tác độc lập trong một thế giới năng động. Mặc dù các phiên bản của các hệ thống phần mềm này đã tồn tại trong nhiều năm, nhưng khả năng ngôn ngữ tự nhiên của GenAI tiết lộ những khả năng mới, cho phép các hệ thống có thể lập kế hoạch hành động của họ, sử dụng các công cụ trực tuyến để hoàn thành các nhiệm vụ đó, cộng tác với các Agent và người khác và học cách cải thiện hiệu suất của họ.
Các AI Agent thế hệ cuối cùng có thể hoạt động như những đồng nghiệp ảo lành nghề, làm việc với con người một cách liền mạch và tự nhiên. Ví dụ, một trợ lý ảo có thể lập kế hoạch và đặt một hành trình du lịch được cá nhân hóa phức tạp, xử lý hậu cần trên nhiều nền tảng du lịch. Sử dụng ngôn ngữ hàng ngày, một kỹ sư có thể mô tả một tính năng phần mềm mới cho một Agent lập trình viên, sau đó sẽ viết mã, kiểm tra, lặp lại và triển khai công cụ mà nó đã giúp tạo ra.
Các hệ thống Agent theo truyền thống rất khó thực hiện, đòi hỏi phải tốn nhiều công sức, lập trình dựa trên quy tắc hoặc đào tạo các mô hình máy học cụ thể cao. Gen AI thay đổi điều đó. Khi các hệ thống Agent được xây dựng bằng cách sử dụng các mô hình nền tảng (đã được đào tạo trên các tập dữ liệu phi cấu trúc cực lớn và đa dạng) thay vì các quy tắc được xác định trước, chúng có khả năng thích ứng với các tình huống khác nhau giống như cách mà LLM có thể phản hồi một cách rõ ràng với các lời nhắc mà chúng chưa được đào tạo rõ ràng.
Hơn nữa, sử dụng ngôn ngữ tự nhiên thay vì mã lập trình, người dùng có thể điều khiển hệ thống Agent hỗ trợ GenAI để hoàn thành một quy trình làm việc phức tạp. Sau đó, một hệ thống đa Agent có thể diễn giải và tổ chức quy trình làm việc này thành các nhiệm vụ có thể hành động, giao công việc cho các Agent chuyên biệt, thực hiện các nhiệm vụ tinh chỉnh này bằng cách sử dụng hệ sinh thái công cụ kỹ thuật số và cộng tác với các Agent và con người khác để cải thiện chất lượng hành động của nó.
Trong bài viết này, chúng ta khám phá những cơ hội mà việc sử dụng các AI Agent thế hệ mang lại. Mặc dù công nghệ này vẫn đang trong giai đoạn sơ khai và cần phát triển kỹ thuật hơn nữa trước khi sẵn sàng triển khai kinh doanh, nhưng nó nhanh chóng thu hút sự chú ý. Chỉ trong năm qua, Google, Microsoft, OpenAI và các công ty khác đã đầu tư vào các thư viện phần mềm và khuôn khổ để hỗ trợ chức năng Agent . Các ứng dụng được hỗ trợ bởi LLM như Microsoft Copilot, Amazon Q và Project Astra sắp tới của Google đang chuyển từ dựa trên tri thức sang trở nên dựa trên hành động hơn. Các công ty và phòng thí nghiệm nghiên cứu như Adept, crewAI và Imbue cũng đang phát triển các mô hình dựa trên Agent và hệ thống đa Agent . Với tốc độ phát triển của thế hệ AI, các Agent có thể trở nên phổ biến như chatbot ngày nay.
Agent có thể mang lại giá trị gì cho doanh nghiệp?
Giá trị mà các Agent có thể mở khóa đến từ tiềm năng của họ trong việc tự động hóa một đuôi dài của các trường hợp sử dụng phức tạp được đặc trưng bởi đầu vào và đầu ra có nhiều thay đổi — các trường hợp sử dụng trước đây khó giải quyết theo cách hiệu quả về chi phí hoặc thời gian. Ví dụ, một cái gì đó đơn giản như một chuyến công tác có thể liên quan đến nhiều hành trình có thể bao gồm các hãng hàng không và chuyến bay khác nhau, chưa kể đến các chương trình phần thưởng khách sạn, đặt nhà hàng và các hoạt động ngoài giờ, tất cả đều phải được xử lý trên các nền tảng trực tuyến khác nhau. Mặc dù đã có những nỗ lực để tự động hóa các phần của quy trình này, nhưng phần lớn trong số đó vẫn phải được thực hiện thủ công. Điều này phần lớn là do sự thay đổi lớn về đầu vào và đầu ra tiềm năng làm cho quy trình quá phức tạp, tốn kém hoặc tốn nhiều thời gian để tự động hóa.
Các Agent hỗ trợ Gen AI có thể dễ dàng tự động hóa các trường hợp sử dụng phức tạp và mở theo ba cách quan trọng:
- Các Agent có thể quản lý đa dạng. Nhiều trường hợp và quy trình sử dụng kinh doanh được đặc trưng bởi quy trình làm việc tuyến tính, với sự khởi đầu rõ ràng và một loạt các bước dẫn đến một giải pháp hoặc kết quả cụ thể. Sự đơn giản tương đối này làm cho chúng dễ dàng được hệ thống hóa và tự động hóa trong các hệ thống dựa trên quy tắc. Nhưng các hệ thống dựa trên quy tắc thường thể hiện “sự giòn” – nghĩa là, chúng bị phá vỡ khi đối mặt với các tình huống không được các nhà thiết kế các quy tắc rõ ràng dự tính. Ví dụ, nhiều quy trình làm việc ít dự đoán hơn nhiều, được đánh dấu bằng những khúc quanh bất ngờ và một loạt các kết quả có thể xảy ra; Các quy trình làm việc này đòi hỏi xử lý đặc biệt và phán đoán sắc thái khiến tự động hóa dựa trên quy tắc trở nên khó khăn. Nhưng các hệ thống AI Agent thế hệ, vì chúng dựa trên các mô hình nền tảng, có khả năng xử lý nhiều tình huống ít có khả năng xảy ra hơn cho một trường hợp sử dụng nhất định, thích ứng trong thời gian thực để thực hiện các nhiệm vụ chuyên biệt cần thiết để hoàn thành quy trình.
- Hệ thống Agent có thể được định hướng bằng ngôn ngữ tự nhiên. Hiện tại, để tự động hóa một trường hợp sử dụng, trước tiên nó phải được chia thành một loạt các quy tắc và bước có thể được hệ thống hóa. Các bước này thường được chuyển thành mã máy tính và tích hợp vào hệ thống phần mềm – một quá trình thường tốn kém và tốn nhiều công sức, đòi hỏi chuyên môn kỹ thuật đáng kể. Bởi vì các hệ thống Agent sử dụng ngôn ngữ tự nhiên như một hình thức hướng dẫn, ngay cả quy trình làm việc phức tạp cũng có thể được mã hóa nhanh chóng và dễ dàng hơn. Hơn nữa, quá trình này có thể được thực hiện bởi các nhân viên không chuyên về kỹ thuật, thay vì các kỹ sư phần mềm. Điều này giúp tích hợp chuyên môn về chủ đề dễ dàng hơn, cấp quyền truy cập rộng rãi hơn vào các công cụ AI và GenAI, đồng thời dễ dàng cộng tác giữa các nhóm kỹ thuật và phi kỹ thuật.
- Nhân viên có thể làm việc với các công cụ và nền tảng phần mềm hiện có. Ngoài việc phân tích và tạo ra kiến thức, hệ thống Agent có thể sử dụng các công cụ và giao tiếp trên một hệ sinh thái kỹ thuật số rộng lớn hơn. Ví dụ: một Agent có thể được hướng dẫn làm việc với các ứng dụng phần mềm (chẳng hạn như các công cụ vẽ và biểu đồ), tìm kiếm thông tin trên web, thu thập và biên soạn phản hồi của con người và thậm chí tận dụng các mô hình nền tảng bổ sung. Việc sử dụng công cụ kỹ thuật số vừa là một đặc điểm xác định của các Agent (đó là một cách mà họ có thể hành động trên thế giới) nhưng cũng là một cách mà khả năng GenAI của họ có thể được phát huy một cách độc đáo. Các mô hình nền tảng có thể học cách giao tiếp với các công cụ, cho dù thông qua ngôn ngữ tự nhiên hay các giao diện khác. Nếu không có các mô hình nền tảng, những khả năng này sẽ đòi hỏi nỗ lực thủ công rộng rãi để tích hợp các hệ thống (ví dụ: sử dụng các công cụ trích xuất, chuyển đổi và tải) hoặc nỗ lực thủ công tẻ nhạt để đối chiếu đầu ra từ các hệ thống phần mềm khác nhau.
Cách hoạt động của các Agent hỗ trợ GenAI
Agent có thể hỗ trợ các trường hợp sử dụng phức tạp cao trong các ngành và chức năng kinh doanh, đặc biệt là đối với quy trình làm việc liên quan đến các nhiệm vụ tốn thời gian hoặc yêu cầu các loại phân tích định tính và định lượng chuyên biệt khác nhau. Các Agent thực hiện điều này bằng cách chia nhỏ quy trình làm việc phức tạp và thực hiện các tác vụ phụ trên các hướng dẫn và nguồn dữ liệu chuyên biệt để đạt được mục tiêu mong muốn. Quá trình này thường tuân theo bốn bước sau (Phụ lục 1):
- Người dùng cung cấp hướng dẫn: Người dùng tương tác với hệ thống AI bằng cách đưa ra lời nhắc bằng ngôn ngữ tự nhiên, giống như người dùng hướng dẫn một nhân viên đáng tin cậy. Hệ thống xác định trường hợp sử dụng dự kiến, yêu cầu người dùng làm rõ thêm khi được yêu cầu.
- Hệ thống tổng đài viên lập kế hoạch, phân bổ và thực hiện công việc: Hệ thống Agent xử lý lời nhắc thành một quy trình làm việc, chia nhỏ nó thành các nhiệm vụ và nhiệm vụ con mà một tổng đài viên phụ của người quản lý chỉ định cho các Agent phụ chuyên biệt khác. Các Agent phụ này, được trang bị kiến thức và công cụ cần thiết, dựa trên “kinh nghiệm” trước đó và chuyên môn được hệ thống hóa, phối hợp với nhau và sử dụng dữ liệu và hệ thống tổ chức để thực hiện các nhiệm vụ này.
- Hệ thống Agent cải thiện đầu ra lặp đi lặp lại: Trong suốt quá trình, nhân viên có thể yêu cầu đầu vào của người dùng bổ sung để đảm bảo tính chính xác và phù hợp. Quá trình này có thể kết thúc với Agent cung cấp kết quả cuối cùng cho người dùng, lặp lại bất kỳ phản hồi nào do người dùng chia sẻ.
- Agent thực hiện hành động: Agent thực hiện bất kỳ hành động cần thiết nào trên thế giới để hoàn thành đầy đủ nhiệm vụ do người dùng yêu cầu.
Ba trường hợp sử dụng tiềm năng
Những loại hệ thống này có ý nghĩa gì đối với doanh nghiệp? Ba trường hợp sử dụng giả định sau đây cung cấp một cái nhìn thoáng qua về những gì có thể xảy ra trong tương lai không xa.
Trường hợp sử dụng 1: Thẩm định khoản vay
Các tổ chức tài chính chuẩn bị các bản ghi nhớ rủi ro tín dụng để đánh giá rủi ro của việc mở rộng tín dụng hoặc khoản vay cho người vay. Quá trình này liên quan đến việc biên soạn, phân tích và xem xét các dạng thông tin khác nhau liên quan đến người vay, loại khoản vay và các yếu tố khác. Với sự đa dạng của các kịch bản và phân tích rủi ro tín dụng cần thiết, điều này có xu hướng là một nỗ lực tốn thời gian và hợp tác cao, đòi hỏi người quản lý quan hệ phải làm việc với người vay, các bên liên quan và nhà phân tích tín dụng để tiến hành các phân tích chuyên biệt, sau đó được đệ trình cho người quản lý tín dụng để xem xét và bổ sung chuyên môn.
Giải pháp dựa trên Agent tiềm năng: Một hệ thống Agent – bao gồm nhiều Agent , mỗi Agent đảm nhận một vai trò chuyên biệt, dựa trên nhiệm vụ – có khả năng được thiết kế để xử lý một loạt các kịch bản rủi ro tín dụng. Người dùng sẽ bắt đầu quá trình bằng cách sử dụng ngôn ngữ tự nhiên để cung cấp kế hoạch làm việc cấp cao về các nhiệm vụ với các quy tắc, tiêu chuẩn và điều kiện cụ thể. Sau đó, nhóm đặc vụ này sẽ chia nhỏ công việc thành các nhiệm vụ con có thể thực thi.
Ví dụ, một Agent có thể đóng vai trò là người quản lý quan hệ để xử lý thông tin liên lạc giữa người vay và các tổ chức tài chính. Một Agent thực hiện có thể biên soạn các tài liệu cần thiết và chuyển chúng cho một Agent phân tích tài chính, chẳng hạn như sẽ kiểm tra nợ từ báo cáo lưu chuyển tiền tệ và tính toán các tỷ lệ tài chính có liên quan, sau đó sẽ được xem xét bởi một Agent phê bình để xác định sự khác biệt và sai sót và cung cấp phản hồi. Quá trình phân tích, phân tích, tinh chỉnh và xem xét này sẽ được lặp lại cho đến khi hoàn thành bản ghi nhớ tín dụng cuối cùng (Phụ lục 2).
Không giống như các kiến trúc GenAI đơn giản hơn, các nhân viên có thể tạo ra nội dung chất lượng cao, giảm thời gian chu kỳ xem xét từ 20 đến 60%. Các Agent cũng có thể đi qua nhiều hệ thống và hiểu được dữ liệu được lấy từ nhiều nguồn. Cuối cùng, các Agent có thể hiển thị công việc của họ: các nhà phân tích tín dụng có thể nhanh chóng đi sâu vào bất kỳ văn bản hoặc số nào được tạo ra, truy cập toàn bộ chuỗi nhiệm vụ và sử dụng các nguồn dữ liệu để tạo ra thông tin chi tiết được tạo ra. Điều này tạo điều kiện thuận lợi cho việc xác minh nhanh chóng các đầu ra.
Trường hợp sử dụng 2: Tài liệu mã hoá và hiện đại hóa
Các ứng dụng và hệ thống phần mềm cũ tại các doanh nghiệp lớn thường gây ra rủi ro bảo mật và có thể làm chậm tốc độ đổi mới kinh doanh. Nhưng hiện đại hóa các hệ thống này có thể phức tạp, tốn kém và tốn nhiều thời gian, đòi hỏi các kỹ sư phải xem xét và hiểu hàng triệu dòng của cơ sở mã cũ hơn và tài liệu thủ công về logic nghiệp vụ, sau đó dịch logic này thành cơ sở mã cập nhật và tích hợp nó với các hệ thống khác.
Giải pháp dựa trên Agent tiềm năng: Các AI Agent có khả năng hợp lý hóa đáng kể quy trình này. Một Agent chuyên biệt có thể được triển khai như một chuyên gia phần mềm kế thừa, phân tích mã cũ và ghi lại và dịch các phân đoạn mã khác nhau. Đồng thời, một Agent đảm bảo chất lượng có thể phê bình tài liệu này và tạo ra các trường hợp thử nghiệm, giúp hệ thống AI tinh chỉnh đầu ra lặp đi lặp lại và đảm bảo tính chính xác và tuân thủ các tiêu chuẩn của tổ chức. Trong khi đó, bản chất lặp lại của quá trình này có thể tạo ra hiệu ứng bánh đà, trong đó các thành phần của khung Agent được sử dụng lại cho các di chuyển phần mềm khác trong toàn tổ chức, cải thiện đáng kể năng suất và giảm chi phí tổng thể trong phát triển phần mềm.
Trường hợp sử dụng 3: Tạo chiến dịch tiếp thị trực tuyến
Thiết kế, khởi chạy và chạy một chiến dịch tiếp thị trực tuyến có xu hướng liên quan đến một loạt các công cụ, ứng dụng và nền tảng phần mềm khác nhau. Và quy trình làm việc cho một chiến dịch tiếp thị trực tuyến rất phức tạp. Mục tiêu kinh doanh và xu hướng thị trường phải được chuyển thành ý tưởng chiến dịch sáng tạo. Tài liệu bằng văn bản và hình ảnh phải được tạo và tùy chỉnh cho các phân khúc và khu vực địa lý khác nhau. Các chiến dịch phải được thử nghiệm với các nhóm người dùng trên nhiều nền tảng khác nhau. Để hoàn thành những nhiệm vụ này, các nhóm tiếp thị thường sử dụng các dạng phần mềm khác nhau và phải chuyển đầu ra từ công cụ này sang công cụ khác, điều này thường tẻ nhạt và tốn thời gian.
Giải pháp dựa trên Agent tiềm năng: Các Agent có thể giúp kết nối hệ sinh thái tiếp thị kỹ thuật số này. Ví dụ: một nhà tiếp thị có thể mô tả người dùng được nhắm mục tiêu, ý tưởng ban đầu, kênh dự định và các thông số khác bằng ngôn ngữ tự nhiên. Sau đó, một hệ thống Agent – với sự hỗ trợ của các chuyên gia tiếp thị – sẽ giúp phát triển, thử nghiệm và lặp lại các ý tưởng chiến dịch khác nhau. Một Agent chiến lược tiếp thị kỹ thuật số có thể khai thác các cuộc khảo sát trực tuyến, phân tích từ các giải pháp quản lý quan hệ khách hàng và các nền tảng nghiên cứu thị trường khác nhằm thu thập thông tin chi tiết để xây dựng chiến lược bằng cách sử dụng các mô hình nền tảng đa phương thức. Các Agent tiếp thị nội dung, viết quảng cáo và thiết kế sau đó có thể xây dựng nội dung phù hợp, mà người đánh giá sẽ xem xét để liên kết thương hiệu. Các Agent này sẽ hợp tác để lặp lại và tinh chỉnh đầu ra và điều chỉnh theo cách tiếp cận tối ưu hóa tác động của chiến dịch đồng thời giảm thiểu rủi ro thương hiệu.
Các nhà lãnh đạo doanh nghiệp nên chuẩn bị như thế nào cho thời đại của các Agent ?
Mặc dù công nghệ Agent còn non trẻ, nhưng việc tăng cường đầu tư vào các công cụ này có thể dẫn đến việc các hệ thống Agent đạt được các cột mốc đáng chú ý và được triển khai trên quy mô lớn trong vài năm tới. Do đó, không còn quá sớm để các nhà lãnh đạo doanh nghiệp tìm hiểu thêm về các Agent và xem xét liệu một số quy trình cốt lõi hoặc yêu cầu kinh doanh của họ có thể được tăng tốc với các hệ thống và khả năng Agent hay không. Sự hiểu biết này có thể cung cấp thông tin cho việc lập kế hoạch hoặc kịch bản lộ trình trong tương lai và giúp các nhà lãnh đạo luôn sẵn sàng đổi mới. Khi những trường hợp sử dụng tiềm năng đó đã được xác định, các tổ chức có thể bắt đầu khám phá bối cảnh Agent đang phát triển, sử dụng API, bộ công cụ và thư viện (ví dụ: Microsoft Autogen, Hugging Face và LangChain) để bắt đầu hiểu những gì có liên quan.
Để chuẩn bị cho sự ra đời của các hệ thống Agent , các tổ chức nên xem xét ba yếu tố sau, đây sẽ là chìa khóa nếu các hệ thống đó muốn phát huy tiềm năng của chúng:
- Hệ thống hóa kiến thức liên quan: Việc triển khai các trường hợp sử dụng phức tạp có thể sẽ yêu cầu các tổ chức xác định và ghi lại các quy trình kinh doanh thành quy trình làm việc được hệ thống hóa sau đó được sử dụng để đào tạo các tổng đài viên. Tương tự như vậy, các tổ chức có thể xem xét cách họ có thể nắm bắt chuyên môn về chủ đề, sẽ được sử dụng để hướng dẫn các Agent bằng ngôn ngữ tự nhiên, do đó hợp lý hóa các quy trình phức tạp.
- Lập kế hoạch công nghệ chiến lược: Các tổ chức sẽ cần tổ chức dữ liệu và hệ thống CNTT của họ để đảm bảo rằng các hệ thống Agent có thể giao tiếp hiệu quả với cơ sở hạ tầng hiện có. Điều đó bao gồm nắm bắt các tương tác của người dùng để phản hồi liên tục và tạo ra sự linh hoạt để tích hợp các công nghệ trong tương lai mà không làm gián đoạn các hoạt động hiện có.
- Cơ chế điều khiển con người trong vòng lặp: Khi các AI Agent thế hệ bắt đầu tương tác với thế giới thực, các cơ chế kiểm soát là điều cần thiết để cân bằng quyền tự chủ và rủi ro (xem thanh bên, “Hiểu những rủi ro độc đáo do hệ thống Agent gây ra”). Con người phải xác nhận đầu ra về độ chính xác, tuân thủ và công bằng; làm việc với các chuyên gia về chủ đề để duy trì và mở rộng quy mô hệ thống Agent ; và tạo ra một bánh đà học tập để cải tiến liên tục. Các tổ chức nên bắt đầu xem xét trong những điều kiện nào và cách các cơ chế con người trong vòng lặp như vậy nên được triển khai.
Cuộc khảo sát “Tình trạng AI” gần đây nhất của McKinsey cho thấy hơn 72% công ty được khảo sát đang triển khai các giải pháp AI, với sự quan tâm ngày càng tăng đối với GenAI. Với hoạt động đó, sẽ không có gì ngạc nhiên khi thấy các công ty bắt đầu kết hợp các công nghệ tiên tiến như Agent vào quy trình lập kế hoạch và lộ trình AI trong tương lai của họ. Tự động hóa dựa trên Agent vẫn là một đề xuất thú vị, với tiềm năng cách mạng hóa toàn bộ ngành công nghiệp, mang lại tốc độ hành động mới cho công việc.
Điều đó nói rằng, công nghệ này vẫn đang trong giai đoạn đầu và cần phải phát triển nhiều trước khi khả năng đầy đủ của nó có thể được thực hiện. Sự phức tạp và tự chủ ngày càng tăng của các hệ thống này đặt ra một loạt thách thức và rủi ro. Và nếu việc triển khai các AI Agent giống như việc thêm nhân viên mới vào nhóm, giống như các thành viên trong nhóm con người của họ, các Agent sẽ yêu cầu kiểm tra, đào tạo và huấn luyện đáng kể trước khi họ có thể được tin tưởng để hoạt động độc lập. Nhưng ngay cả trong những ngày đầu tiên này, không khó để hình dung ra những cơ hội mở rộng mà thế hệ đồng nghiệp ảo mới này có thể mở ra.
Nguồn : Tại sao các AI Agent là biên giới tiếp theo của AI tổng quát | McKinsey