Các nhà nghiên cứu đã giới thiệu một cách tiếp cận mới gọi là chương trình nhúng ngôn ngữ tự nhiên (NLEP) để cải thiện khả năng suy luận số và ký hiệu của các mô hình ngôn ngữ lớn (LLM). Kỹ thuật này liên quan đến việc nhắc LLM tạo và thực thi các chương trình Python để giải quyết các truy vấn của người dùng, sau đó đưa ra các giải pháp bằng ngôn ngữ tự nhiên.
Mặc dù các LLM như ChatGPT đã thể hiện hiệu suất ấn tượng trong nhiều nhiệm vụ khác nhau, nhưng chúng thường gặp khó khăn với các vấn đề đòi hỏi lý luận bằng số hoặc ký hiệu.
NLEP tuân theo mẫu giải quyết vấn đề gồm bốn bước: gọi các gói cần thiết, nhập biểu diễn ngôn ngữ tự nhiên của kiến thức cần thiết, triển khai chức năng tính toán giải pháp và xuất kết quả dưới dạng ngôn ngữ tự nhiên với trực quan hóa dữ liệu tùy chọn.
Cách tiếp cận này mang lại một số lợi ích, bao gồm cải thiện độ chính xác, tính minh bạch và hiệu quả. Người dùng có thể điều tra các chương trình đã tạo và sửa lỗi trực tiếp, tránh phải chạy lại toàn bộ mô hình để khắc phục sự cố. Ngoài ra, một NLEP có thể được tái sử dụng cho nhiều tác vụ bằng cách thay thế một số biến nhất định.
Các nhà nghiên cứu phát hiện ra rằng NLEP cho phép GPT-4 đạt được độ chính xác trên 90% đối với các nhiệm vụ suy luận biểu tượng khác nhau, vượt trội hơn 30% so với các phương pháp nhắc nhở dành riêng cho nhiệm vụ
Ngoài những cải tiến về độ chính xác, NLEP có thể nâng cao quyền riêng tư của dữ liệu bằng cách chạy các chương trình cục bộ, loại bỏ nhu cầu gửi dữ liệu nhạy cảm của người dùng đến các công ty bên ngoài để xử lý. Kỹ thuật này cũng có thể nâng cao hiệu suất của các mô hình ngôn ngữ nhỏ hơn mà không cần đào tạo lại tốn kém.
Tuy nhiên, NLEP dựa vào khả năng tạo chương trình của mô hình và có thể không hoạt động tốt với các mô hình nhỏ hơn được đào tạo trên các tập dữ liệu hạn chế. Nghiên cứu trong tương lai sẽ khám phá các phương pháp làm cho LLM nhỏ hơn tạo ra NLEP hiệu quả hơn và điều tra tác động của các biến thể kịp thời đối với độ tin cậy của lý luận.
Nghiên cứu, được hỗ trợ một phần bởi Trung tâm Trí tuệ Nhận thức và Tương tác của Hồng Kông, sẽ được trình bày tại Hội nghị thường niên của Hiệp hội Ngôn ngữ học tính toán Bắc Mỹ vào cuối tháng này.
(Ảnh chụp bởi Alex Azabach)
Xem thêm: Apple được cho là đang nhận được quyền truy cập ChatGPT miễn phí
Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Hãy xem AI & Big Data Expo diễn ra ở Amsterdam, California và London. Sự kiện toàn diện này được tổ chức cùng với các sự kiện hàng đầu khác bao gồm Hội nghị Tự động hóa Thông minh, BlockX, Tuần lễ Chuyển đổi số và Triển lãm An ninh Mạng & Cloud.
Khám phá các sự kiện và hội thảo Online về công nghệ doanh nghiệp sắp tới khác do TechForge cung cấp tại đây.