zalo
Chat ngay

Học giả OpenAI 2020: Các dự án cuối cùng

Lớp học giả OpenAI thứ ba của chúng tôi đã trình bày các dự án cuối cùng của mình tại Ngày trình diễn trực tuyến, giới thiệu kết quả nghiên cứu của họ trong hơn năm tháng qua


Các dự án này nghiên cứu các vấn đề như phân tích cách GPT-2 biểu diễn ngữ pháp, đo lường khả năng diễn giải của các mô hình được đào tạo trên Coinrun và dự đoán các cơn động kinh bằng cách sử dụng bản ghi não. Thông tin thêm về lớp Học giả tiếp theo và cách nộp đơn sẽ được công bố vào mùa thu năm nay.

Chương  trình Học giả OpenAI cung cấp học bổng và sự cố vấn cho những cá nhân thuộc nhóm thiểu số để nghiên cứu về học sâu và mở nguồn một dự án.

Các học giả của chúng tôi đã chứng minh được các kỹ năng kỹ thuật cốt lõi trên nhiều lĩnh vực chuyên môn khác nhau và động lực tự thân—những năng lực quan trọng đối với một chương trình tự định hướng như thế này. Mỗi người trong số họ đều bước vào lĩnh vực học máy như những người mới đến, và chúng tôi hy vọng sự tiến bộ của họ cho thấy học máy dễ tiếp cận như thế nào.

Tìm kiếm Ngữ pháp ở Tất cả những Nơi phù hợp

Tôi bị cuốn hút bởi khả năng diễn giải của mạng nơ-ron. Hiểu được cách các mạng lưới có nhiều kiến ​​trúc khác nhau biểu diễn thông tin có thể giúp chúng ta xây dựng các mạng lưới đơn giản và hiệu quả hơn, cũng như dự đoán cách các mạng lưới chúng ta đã xây dựng sẽ hoạt động và thậm chí có thể cung cấp cho chúng ta cái nhìn sâu sắc về cách con người suy nghĩ. Theo hướng này, tôi đã phân tích cách GPT-2 biểu diễn ngữ pháp tiếng Anh và tìm thấy các mạng con nhỏ hơn có vẻ tương ứng với nhiều cấu trúc ngữ pháp khác nhau. Tôi sẽ trình bày phương pháp luận và kết quả của mình. Tôi bị cuốn hút bởi khả năng diễn giải của mạng nơ-ron. Hiểu được cách các mạng lưới có nhiều kiến ​​trúc khác nhau biểu diễn thông tin có thể giúp chúng ta xây dựng các mạng lưới đơn giản và hiệu quả hơn, cũng như dự đoán cách các mạng lưới chúng ta đã xây dựng sẽ hoạt động và thậm chí có thể cung cấp cho chúng ta cái nhìn sâu sắc về cách con người suy nghĩ. Theo hướng này, tôi đã phân tích cách GPT-2 biểu diễn ngữ pháp tiếng Anh và tìm thấy các mạng con nhỏ hơn có vẻ tương ứng với nhiều cấu trúc ngữ pháp khác nhau. Tôi sẽ trình bày phương pháp luận và kết quả của mình.
Chức vụ trước đây :  Cử nhân Toán ứng dụng, Thạc sĩ Triết học Tâm trí từ Ediburgh, Kỹ sư Phần mềm và Độ tin cậy của Trang web tại Facebook
Học tập thú vị :  “ Lời khuyên của tôi cho những ai mới bắt đầu nghiên cứu về học sâu là hãy dành thời gian để hiểu những hiểu biết sâu sắc từ các bài báo cơ bản và hãy nhớ rằng lĩnh vực này vẫn còn tương đối mới. Có rất nhiều chỗ cho các cá nhân có thể tạo ra tác động lớn. ”

Phân tích ngữ nghĩa tiếng Anh sang GraphQL

Dự án chương trình học giả của tôi là phân tích cú pháp ngữ nghĩa từ tiếng Anh sang GraphQL. Với một lời nhắc bằng tiếng Anh như "Chúng ta có bao nhiêu nhân viên?", hãy tìm một truy vấn GraphQL tương ứng để trả về thông tin. Dự án bao gồm việc tạo một tập dữ liệu, mô hình đào tạo và tạo một công cụ tương tác để xem kết quả.
Chức vụ trước đây :  CTO tại Droplii, Nhà sáng lập tại Lambdo
Bài học thú vị :  “ Tôi muốn có tiếng nói trong việc định hình AI—chương trình Scholars là cơ hội tuyệt vời để học hỏi và tham gia. ”

Phân công tín dụng dài hạn với vận chuyển phần thưởng tạm thời

Các thuật toán học tăng cường tiêu chuẩn gặp khó khăn với hiệu quả mẫu kém khi có phần thưởng thưa thớt với độ trễ thời gian dài giữa hành động và hiệu ứng. Để giải quyết vấn đề phân bổ tín dụng dài hạn, chúng tôi sử dụng "vận chuyển phần thưởng thời gian" (TRT) để tăng phần thưởng tức thời của các cặp trạng thái-hành động quan trọng bằng phần thưởng từ tương lai xa, sử dụng cơ chế chú ý để xác định ứng viên cho TRT. Một loạt các thí nghiệm gridworld cho thấy sự cải thiện rõ ràng trong quá trình học khi TRT được sử dụng kết hợp với thuật toán phê bình diễn viên lợi thế tiêu chuẩn.
Chức vụ trước đây :  Nhà khoa học dữ liệu tại Square và Driver
Học tập thú vị :  “ Tôi đánh giá cao chương trình này vì đã cho tôi sự tự do để học sâu hơn và phát huy khả năng sáng tạo của mình. ”
 

 

Định lượng khả năng diễn giải của các mô hình được đào tạo trên Coinrun

Mục đích của dự án này là tạo ra một thang đo khả năng diễn giải của mô hình A2C được đào tạo trên Coinrun của Procgen. Thang đo được tạo ra bằng cách kết hợp thuộc tính trên mô hình và mặt nạ của tài sản Coinrun. Thang đo được sử dụng để kiểm tra tính hợp lệ của giả thuyết đa dạng.
Chức vụ trước đây :  Kỹ sư CS tại Columbia, Nghiên cứu tại Creative Machines Lab, Kỹ sư phần mềm tại Autonomic
Bài học thú vị :  “ Chương trình này, và đặc biệt là người cố vấn của tôi, đã nuôi dưỡng sự tự tin trong tôi để dấn thân vào một lĩnh vực mà tôi không hiểu và phân tích các vấn đề cho đến khi tôi có thể giải quyết chúng. Tôi hy vọng sẽ sử dụng sự tự tin mà tôi đã học được từ chương trình này để tiếp tục phân tích các vấn đề trong và với AI. ”

Học tập xã hội trong học tập tăng cường đa tác nhân độc lập

Dự án của tôi đã khám phá sự chuyển giao chuyên môn xã hội giữa các tác nhân RL hoàn toàn độc lập được đào tạo trong môi trường chung. Câu hỏi thúc đẩy là liệu các tác nhân mới vào nghề có thể học cách bắt chước hành vi của chuyên gia để giải quyết các nhiệm vụ khám phá khó mà họ không thể thành thạo khi bị cô lập hay không. Tôi sẽ thảo luận về các quan sát của mình cũng như các môi trường mà tôi đã phát triển để thử nghiệm chuyển giao kỹ năng xã hội.
Chức vụ trước đây :  Toán và Vật lý tại MIT, Nhà khoa học nghiên cứu thuật toán tại Fitbit, Chuyên gia tư vấn thuật toán/ML độc lập, Kỹ sư ML tại Coinbase
Học tập thú vị :  “ Tôi tham gia chương trình Học giả để học hỏi từ những người tuyệt vời tại OpenAI và đắm mình vào nghiên cứu AI. Tôi rất biết ơn khi có cơ hội khám phá nghiên cứu tiên tiến với sự hỗ trợ của những nhà nghiên cứu tài năng như vậy (cảm ơn đặc biệt đến người cố vấn của tôi, Natasha Jaques!) ”

Hướng tới dự đoán cơn động kinh với mạng lưới sâu

Tôi đã làm việc trên một dự án để dự đoán các cơn động kinh bằng cách sử dụng các bản ghi não. Tôi đã đóng khung nó như một vấn đề phân loại hình ảnh dựa trên biểu diễn phổ của dữ liệu não. Mô hình thành công nhất của tôi cho đến nay là ResNet18. Trong cuộc sống sau khi tốt nghiệp Học giả, tôi dự định sẽ tiếp tục làm việc trên dự án này và tìm cách giải thích các mạng phân loại phổ.
Chức vụ trước đây :  Tiến sĩ Khoa học thần kinh tại UC Berkeley, Nghiên cứu hành vi tại Harvard và Brown
Học tập thú vị :  “ Tôi muốn học cách áp dụng học sâu để giải quyết các vấn đề khoa học và thực tế. Chương trình Học giả OpenAI là cơ hội kỳ diệu để bắt đầu bằng cách học hỏi từ những bộ óc giỏi nhất trong lĩnh vực này. ”

Các nhiễu loạn đối nghịch phổ quát và các mô hình ngôn ngữ

Các nhiễu loạn đối nghịch được hiểu rõ đối với hình ảnh nhưng ít hiểu rõ hơn đối với ngôn ngữ. Bài thuyết trình của tôi sẽ xem xét tài liệu về cách các ví dụ đối nghịch phổ quát có thể cung cấp thông tin cho việc hiểu các mô hình sinh, sao chép các kết quả tạo ra các kích hoạt đối nghịch phổ quát cho GPT-2 và để tấn công các mô hình NLI.
Chức vụ trước đây :  Toán và Khoa học máy tính tại Williams College, Nhà phân tích nghiên cứu tại Ngân hàng Dự trữ Liên bang New York, Học giả Herchel Smith tại Cambridge, Trưởng phòng sản phẩm tại The Whistle, Nhà nghiên cứu tại Lumi Labs
Học tập thú vị :  “ Chương trình này đã củng cố nền tảng kỹ thuật của tôi về học máy và giúp tôi hiểu cách các nhà nghiên cứu AI hiểu được ý nghĩa chính sách trong công việc của họ. ”

Sự đa dạng là cốt lõi để AI có tác động tích cực đến thế giới—cần phải đảm bảo các hệ thống AI tiên tiến trong tương lai được xây dựng để  mang lại lợi ích cho tất cả mọi người .

Nếu bạn háo hức bắt đầu hành trình khám phá ML của riêng mình, hãy xem qua một số  tài liệu giáo dục của chúng tôi . Thông tin chi tiết về lớp học giả tiếp theo và cách nộp đơn sẽ được công bố vào mùa thu năm nay. Hãy theo dõi nhé!

Xem thêm: mua tài khoản ChatGPT Plus chính hãng giá rẻ 

Hot Deal

Họ tên (*)

Số điện thoại (*)

Email (*)

Dịch vụ

Đăng ký để nhận bản tin mới nhất !