zalo
Chat ngay

OpenAI Five Benchmark: Kết quả

Hôm qua, OpenAI Five  đã giành chiến thắng trong trận đấu ba trận hay nhất với một đội gồm những người chơi Dota đạt 99,95 phần trăm: Blitz, mũ, sương mù, Merlini và  MoonMeander—bốn người trong số họ đã chơi Dota chuyên nghiệp—trước khán giả trực tiếp và 100.000 người xem phát trực tiếp cùng lúc.

Đội người đã thắng ván thứ ba sau khi khán giả chọn đối thủ là anh hùng của Five. Chúng tôi cũng đã trình bày công trình sơ bộ của mình để xem xét quan điểm của Five về trò chơi, bao gồm cả khả năng chiến thắng, khiến những người quan sát ngạc nhiên trước các dự đoán. Những kết quả này cho thấy Five là một bước tiến tới các hệ thống AI tiên tiến có thể xử lý được sự phức tạp và không chắc chắn của thế  giới thực .

Tổng quan về ngày

Trò chơi khán giả

Ngày thi đấu bắt đầu với một nhóm tình nguyện viên từ khán giả đã dũng cảm chơi trận đấu công khai đầu tiên với OpenAI Five. Five đã giành chiến thắng trong vòng 14 phút đầu tiên (một trận đấu cân tài cân sức thường mất 45 phút).

Trò chơi 1 và 2

Chúng tôi đã tiết lộ một khả năng mới của OpenAI Five—khả năng  soạn thảo. Soạn thảo được coi là một công việc cực kỳ khó khăn một phần của Dota, vì các anh hùng tương tác với nhau theo những cách phức tạp.

Vào cuối tháng 6, chúng tôi đã thêm một đầu ra xác suất chiến thắng vào mạng nơ-ron của mình để tự vấn xem OpenAI Five đang dự đoán điều gì. Khi sau đó cân nhắc đến việc soạn thảo, chúng tôi nhận ra rằng chúng tôi có thể sử dụng điều này để đánh giá xác suất chiến thắng của bất kỳ bản thảo nào: chỉ cần xem dự đoán ở khung đầu tiên của trò chơi với đội hình đó. Trong một tuần triển khai, chúng tôi đã tạo ra một khung giả cho mỗi trong số 11 triệu trận đấu nhóm có thể xảy ra và viết một tìm kiếm cây để tìm bản thảo tối ưu của OpenAI Five.

Sau bản thảo ván 1, OpenAI Five dự đoán xác suất thắng là 95%, mặc dù trận đấu có vẻ ngang ngửa với người quan sát. Nó thắng ván đầu tiên trong 21 phút 37 giây. Sau bản thảo ván 2, OpenAI Five dự đoán xác suất thắng là 76,2% và thắng ván thứ hai trong 24 phút 53 giây.

Đào tạo

Chu kỳ phát triển thông thường của chúng tôi là đào tạo từng bản sửa đổi lớn của hệ thống từ đầu. Tuy nhiên, phiên bản OpenAI Five này chứa các tham số đã được đào tạo kể từ ngày 9 tháng 6 qua sáu bản sửa đổi hệ thống lớn. Mỗi bản sửa đổi được khởi tạo bằng các tham số từ bản trước đó.

Chúng tôi đã đầu tư rất nhiều vào công cụ "phẫu thuật" cho phép chúng tôi ánh xạ các tham số cũ vào một kiến ​​trúc mạng mới. Ví dụ, khi chúng tôi lần đầu tiên huấn luyện warding, chúng tôi đã chia sẻ một đầu hành động duy nhất để xác định nơi di chuyển và nơi đặt ward. Nhưng Five thường thả ward theo hướng mà nó đang cố gắng đi, và chúng tôi đưa ra giả thuyết rằng nó đang phân bổ khả năng của mình chủ yếu cho chuyển động. Công cụ của chúng tôi cho phép chúng tôi chia đầu thành hai bản sao được khởi tạo với cùng các tham số.

Chúng tôi ước tính rằng chúng tôi đã sử dụng lượng tính toán sau đây  để đào tạo các hệ thống Dota khác nhau của mình:

+ Mô hình 1v1: 8 petaflop/giây-ngày

+ Mô hình ngày 6 tháng 6: 11 petaflop/s-ngày 

+ Aug 5th model: 35 petaflop/s-days

Chúng tôi cũng đang phát hành  kiến ​​trúc mạng mới nhất của mình.

Nhìn vào mô hình

Chúng ta có thể có được một số hiểu biết sâu sắc về kế hoạch của mô hình thông qua đầu ra dự đoán vị trí của một anh hùng trong tương lai. Trong video sau, các hộp được tô sáng cho thấy vị trí dự đoán của Sven trong 6 giây:

Xem thêm: mua tài khoản ChatGPT Plus chính hãng giá rẻ 

Hot Deal

Họ tên (*)

Số điện thoại (*)

Email (*)

Dịch vụ

Đăng ký để nhận bản tin mới nhất !