zalo
Chat ngay

Học tăng cường đa mục tiêu: Môi trường robot đầy thách thức và yêu cầu nghiên cứu

Tóm tắt

Mục đích của báo cáo kỹ thuật này có hai mặt. Trước hết, báo cáo giới thiệu một bộ các nhiệm vụ điều khiển liên tục đầy thử thách (tích hợp với OpenAI Gym) dựa trên phần cứng robot hiện có. Các nhiệm vụ bao gồm đẩy, trượt và nhặt & đặt bằng cánh tay robot Fetch cũng như thao tác vật thể trong tay bằng Shadow Dexterous Hand. Tất cả các nhiệm vụ đều có phần thưởng nhị phân thưa thớt và tuân theo khuôn khổ Học tăng cường đa mục tiêu (RL) trong đó tác nhân được cho biết phải làm gì bằng cách sử dụng đầu vào bổ sung. Phần thứ hai của bài báo trình bày một tập hợp các ý tưởng nghiên cứu cụ thể để cải thiện các thuật toán RL, hầu hết trong số đó liên quan đến RL đa mục tiêu và Phát lại trải nghiệm Hindsight.

Xem thêm: mua tài khoản ChatGPT 4 với nhiều ưu đãi đặc biệt!

Hot Deal

Họ tên (*)

Số điện thoại (*)

Email (*)

Dịch vụ

Đăng ký để nhận bản tin mới nhất !