Các nhà nghiên cứu của MIT đã phát triển một phương pháp đào tạo robot giúp giảm thời gian và chi phí đồng thời cải thiện khả năng thích ứng với các nhiệm vụ và môi trường mới.
Cách tiếp cận – được gọi là Máy biến áp tiền huấn luyện không đồng nhất (HPT) – kết hợp lượng lớn dữ liệu đa dạng từ nhiều nguồn vào một hệ thống thống nhất, tạo ra một ngôn ngữ chung mà các mô hình AI tổng hợp có thể xử lý một cách hiệu quả. Phương pháp này đánh dấu sự khởi đầu đáng kể so với đào tạo robot truyền thống, nơi các kỹ sư thường thu thập dữ liệu cụ thể cho từng robot và nhiệm vụ trong môi trường được kiểm soát.
Trưởng nhóm nghiên cứu Lirui Wang – một sinh viên tốt nghiệp ngành kỹ thuật điện và khoa học máy tính tại MIT – tin rằng trong khi nhiều người coi dữ liệu đào tạo không đầy đủ là một thách thức chính trong chế tạo robot, thì vấn đề lớn hơn nằm ở rất nhiều lĩnh vực, phương thức và phần cứng robot khác nhau. Công việc của họ thể hiện cách kết hợp và sử dụng hiệu quả tất cả các yếu tố đa dạng này.
Nhóm nghiên cứu đã phát triển một kiến trúc thống nhất nhiều loại dữ liệu khác nhau, bao gồm hình ảnh camera, hướng dẫn ngôn ngữ và bản đồ độ sâu. HPT sử dụng mô hình máy biến áp, tương tự như các mô hình ngôn ngữ nâng cao cấp nguồn, để xử lý đầu vào trực quan và cảm giác bản thể.
Trong các thử nghiệm thực tế, hệ thống đã cho thấy kết quả đáng chú ý – vượt trội hơn 20% so với các phương pháp đào tạo truyền thống trong cả tình huống mô phỏng và thực tế. Sự cải tiến này vẫn đúng ngay cả khi robot gặp phải các nhiệm vụ khác biệt đáng kể so với dữ liệu huấn luyện của chúng.
Các nhà nghiên cứu đã tập hợp một tập dữ liệu ấn tượng để huấn luyện trước, bao gồm 52 tập dữ liệu với hơn 200.000 quỹ đạo của robot thuộc bốn loại. Cách tiếp cận này cho phép robot học hỏi từ vô số kinh nghiệm, bao gồm cả sự trình diễn và mô phỏng của con người.
Một trong những cải tiến quan trọng của hệ thống nằm ở khả năng xử lý khả năng nhận thức quyền sở hữu (nhận thức của robot về vị trí và chuyển động của nó). Nhóm đã thiết kế kiến trúc đặt tầm quan trọng như nhau vào khả năng nhận thức quyền sở hữu và tầm nhìn, cho phép thực hiện các chuyển động khéo léo phức tạp hơn.
Nhìn về phía trước, nhóm đặt mục tiêu nâng cao khả năng của HPT để xử lý dữ liệu chưa được gắn nhãn, tương tự như các mô hình ngôn ngữ nâng cao. Tầm nhìn cuối cùng của họ liên quan đến việc tạo ra một bộ não robot phổ quát có thể được tải xuống và sử dụng cho bất kỳ robot nào mà không cần đào tạo thêm.
Mặc dù thừa nhận rằng họ đang ở giai đoạn đầu, nhóm nghiên cứu vẫn lạc quan rằng việc mở rộng quy mô có thể dẫn đến những phát triển đột phá trong chính sách robot, tương tự như những tiến bộ được thấy trong các mô hình ngôn ngữ lớn.
Bạn có thể tìm thấy bản sao bài báo của các nhà nghiên cứu đây (PDF)
(Ảnh chụp bởi Sở hữu nhiếp ảnh)
Xem thêm: Unlock robot AI: Các nhà nghiên cứu cảnh báo về các lỗi bảo mật
Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Kiểm tra Triển lãm AI & Dữ liệu lớn diễn ra ở Amsterdam, California và London. Sự kiện toàn diện này được tổ chức cùng với các sự kiện hàng đầu khác bao gồm Hội nghị tự động hóa thông minh, BlockX, Tuần lễ Chuyển đổi sốVà An ninh mạng & Triển lãm Cloud.
Khám phá các sự kiện và hội thảo Online về công nghệ doanh nghiệp sắp tới khác do TechForge cung cấp đây.