zalo
Chat ngay

Học giả OpenAI 2019: Các dự án cuối cùng

Lớp Học giả OpenAI thứ hai của chúng tôi đã kết thúc, với cả tám học giả đều tạo ra một dự án cuối khóa thú vị được giới thiệu tại Ngày trình diễn học giả tại OpenAI

Trong ba tháng qua, chúng tôi đã chứng kiến ​​các kỹ sư giàu kinh nghiệm làm việc trong lĩnh vực phần mềm, y học, vật lý, phát triển trẻ em và các lĩnh vực khác có thể trở thành những người thực hành máy học thông qua sự kết hợp giữa các nguồn tài nguyên giáo dục và sự cố vấn của chúng tôi.

Tinh chỉnh GPT-2 Nhỏ để Trả lời Câu hỏi

Chức vụ trước đây :  Eric Roberts Fellow về Khoa học máy tính tại Đại học Stanford
Học tập thú vị :  “ Chương trình OpenAI Scholars cho phép tôi xây dựng nền tảng vững chắc về học sâu và hiểu sâu sắc về Xử lý và Hiểu ngôn ngữ tự nhiên. Chương trình cũng cho phép tôi xác định rõ hơn sở thích nghiên cứu của mình về AI bằng cách cung cấp cho tôi các nguồn lực để thử nghiệm với nhiều lĩnh vực phụ khác nhau của học sâu. ”
Dự án cuối cùng :  Bất chấp những thành công gần đây của các mô hình ngôn ngữ mạnh mẽ, lý luận vẫn là một nhiệm vụ đầy thách thức trong Hiểu ngôn ngữ tự nhiên. Trả lời câu hỏi (QA) đòi hỏi sự kết hợp toàn diện giữa các kỹ năng xử lý ngôn ngữ và lý luận trong một nhiệm vụ duy nhất. Đánh giá thành công và thất bại của hệ thống trên các nhiệm vụ QA cung cấp những hiểu biết có giá trị về cơ chế lý luận của nó. Dự án này thử nghiệm với việc tinh chỉnh mô hình nhỏ GPT-2 cho QA để phân tích hiệu suất của nó về lý luận

Sử dụng động lực nội tại để giải quyết các nhiệm vụ của robot với phần thưởng ít ỏi

Chức vụ trước đây :  Nghiên cứu sinh Tiến sĩ chuyên ngành Sinh học tế bào và phân tử tại Đại học Chicago
Học tập thú vị :  “ Trước khi tham gia chương trình Học giả, tôi đã thực hiện một kế hoạch tự học về robot. Chương trình Học giả OpenAI đã cho tôi cơ hội nâng cao đáng kể khả năng tự học của mình với chương trình giảng dạy tập trung hoàn toàn vào Học tăng cường sâu. Sau khi dành 8 tuần đọc các bài báo và triển khai các thuật toán Deep RL cốt lõi, tôi đã có thể áp dụng những gì mình học được để giải quyết một loạt các vấn đề đầy thách thức về robot. ”
Dự án cuối cùng :  Nhiều vấn đề về rô-bốt được xây dựng theo cách mà phần thưởng bên ngoài cho tác nhân hoặc là thưa thớt hoặc là hoàn toàn không có. Những vấn đề này có thể cực kỳ khó giải quyết vì môi trường cung cấp phản hồi hạn chế để hướng dẫn tác nhân đạt được mục tiêu của mình. Các công trình trước đây đã chỉ ra rằng các tác nhân được đào tạo bằng cách sử dụng lỗi dự đoán làm phần thưởng nội tại có thể học trên nhiều lĩnh vực, bao gồm các trò chơi Atari và các nhiệm vụ điều khiển liên tục. Trong dự án này, tôi đã sử dụng sự khám phá thúc đẩy bởi sự tò mò để giải quyết các nhiệm vụ rô-bốt đầy thử thách với phần thưởng thưa thớt. Sau đó, tôi xây dựng phần thưởng nội tại là lỗi trong khả năng dự đoán trạng thái tiếp theo của tác nhân, dựa trên trạng thái hiện tại và hành động đã thực hiện. Kết quả của tôi chứng minh rằng phương pháp này có khả năng giải quyết một số nhiệm vụ thao tác rô-bốt khó trong mô phỏng.
 

CREATURE: Học tập của con người được hỗ trợ bởi máy học

Chức vụ trước đây :  Kỹ sư phần mềm tại Palo Alto Networks ; Giám đốc sáng lập Thiết kế và Nghiên cứu Học tập; Tổ chức phi lợi nhuận được thành lập tại Mexico; Trường Giáo dục Stanford
Học tập thú vị :  “ Chương trình Học giả OpenAI đã chứng minh rằng nếu có sự cố vấn, lòng tin và hỗ trợ tài chính phù hợp, việc học ML để thực hiện một dự án tự định hướng là điều có thể. Tôi đã học về các mô hình ngôn ngữ, thu thập và xử lý dữ liệu, điều chỉnh mô hình và cách tích hợp tất cả những điều đó vào một mô hình sẵn sàng sử dụng cho mục đích giáo dục. Tôi rất hào hứng được tiếp tục làm việc trên dự án của mình, đào sâu hơn vào mối quan hệ giữa trí thông minh của con người và AI, và chuyển những gì tôi đã học được trong chương trình này thành các hoạt động học tập mà những người khác có thể sử dụng. ”
Dự án cuối kỳ :  Học tập theo dự án là một cách học rất hiệu quả và thú vị, nhưng giáo viên thường gặp khó khăn trong việc tìm ra các dự án phù hợp cho học sinh của mình. Mặc dù có hàng nghìn dự án trực tuyến, nhưng hầu hết đều được dán nhãn kém và do đó giáo viên khó tìm thấy. Việc dán nhãn chính xác hàng nghìn dự án trực tuyến sẽ rất khó khăn và tốn kém tùy từng trường hợp. CREATURE là một mô hình chứng minh khái niệm dán nhãn các dự án trực tuyến với độ chính xác 75–90%.

Học tăng cường cho các ứng dụng y tế

Chức vụ trước đây :  Nghiên cứu sinh tiến sĩ tại Đại học Princeton
Học tập thú vị :  “ Tôi đã học về NN, CNN, RNN, LSTM và học tăng cường sâu. Tôi đã triển khai các kiến ​​trúc NN khác nhau và hầu hết các thuật toán RL bao gồm DQN, VPG, TRPO, PPO và DDPG. Trước chương trình này, tôi chuyên ngành Thống kê và không có kinh nghiệm về học sâu. Chương trình Học giả OpenAI đã cung cấp cho tôi hướng dẫn và tài nguyên để học các phưFơng pháp học sâu cốt lõi trong một khoảng thời gian ngắn. ”
Dự án cuối cùng :  Tôi đã phát triển một hệ thống máy tính học từ hồ sơ sức khỏe điện tử (EHR) trong lịch sử và đề xuất phương pháp điều trị tối ưu—liều lượng dịch truyền tĩnh mạch và thuốc làm co mạch—dựa trên các giá trị sinh tồn và xét nghiệm của bệnh nhân. Tôi đặc biệt xem xét lặp lại chính sách và Q-learning dạng bảng với không gian trạng thái và hành động rời rạc. Kết quả cho thấy các chính sách RL tối ưu đề xuất liều lượng dịch truyền tĩnh mạch thấp hơn và liều lượng thuốc làm co mạch cao hơn so với các phương pháp điều trị thực tế của bác sĩ. Đánh giá ngoài chính sách cho thấy chính sách tối ưu học được bằng Q-learning có phần thưởng cao hơn so với chính sách học được bằng lặp lại chính sách. Hệ thống có thể dễ dàng mở rộng để xử lý không gian trạng thái/hành động liên tục và kết hợp các thuật toán RL ngoài chính sách khác.

Phân tích tình cảm sử dụng học tăng cường

Chức vụ trước đây :  Nghiên cứu sinh Tiến sĩ Kinh tế tại UC Davis
Học tập thú vị :  “ Chương trình này cho tôi cơ hội học thực hành từ các mô hình ngôn ngữ hiện tại và hiểu sâu hơn về các phương pháp RL để triển khai trong dự án của mình. Sau ba tháng, tôi đã khám phá ra sở thích chính của mình trong lĩnh vực AI và chương trình Học giả cung cấp cho tôi các nguồn tài nguyên giá trị để học, thực hành và triển khai các ý tưởng thú vị trong lĩnh vực này. ”
Dự án cuối cùng :  Chúng tôi đề xuất các mô hình mới kết hợp các phương pháp học tăng cường (RL) và các phương pháp NLP có giám sát để dự đoán tình cảm của câu. Chúng tôi xây dựng nhiệm vụ phân tích tình cảm như một quy trình quyết định tuần tự với mục tiêu kết hợp các phương pháp RL để phân tích tình cảm. Đối với mô hình liên quan đến mạng chính sách và mạng phân loại, chúng tôi thấy rằng việc thêm một phương pháp RL có thể cải thiện hiệu suất từ ​​mô hình biến đổi và tạo ra kết quả tương đương trên mô hình BERT được đào tạo trước. Chúng tôi kết luận rằng đối với các vấn đề phân loại cụ thể trong mô hình ngôn ngữ, một định nghĩa hàm phần thưởng tốt là một thành phần quan trọng cho đào tạo RL.

Khám phá Gamma: Giảm giá của tương lai hay trọng lượng của quá khứ

Vai trò trước đây :  Nhóm nghiên cứu mùa hè REU-CAAR tại Cao đẳng Carleton
Học tập thú vị :  “ Chương trình Scholars cho phép tôi nhanh chóng có được một loạt các kỹ năng quan trọng. Trong hai tháng đầu tiên tự học, tôi đã tìm hiểu về lý thuyết học tăng cường và làm quen với cách triển khai các thuật toán học tăng cường sâu từ đầu. Tôi cũng đánh giá cao sự tự do và hỗ trợ mà tôi nhận được khi làm dự án cuối cùng của mình. Vào cuối chương trình, giờ đây tôi cảm thấy tự tin hơn và sẵn sàng bắt tay vào những thách thức mới phía trước. ”
Dự án cuối cùng :  Vai trò của hệ số chiết khấu thường bị bỏ qua trong học tăng cường sâu (DRL). Trong dự án này, tôi đã khám phá ra vai trò kép của hệ số chiết khấu trong mạng Q sâu: nó mã hóa sở thích liên thời gian và sự tự tin trong quá trình khởi động. Dựa trên giả thuyết này, tôi đã thiết kế một lược đồ cận thị đơn giản giúp cải thiện hiệu suất của Baselines trong nhiều môi trường Gridworld tùy chỉnh. Kết quả thử nghiệm chứng minh rằng lược đồ thay đổi theo thời gian có thể mạnh mẽ và hiệu quả trong các bối cảnh tổng quát hơn, vượt ra ngoài DQN và khuôn khổ hành động/trạng thái rời rạc.

Chắt lọc kiến ​​thức cho các mô hình ngôn ngữ biến đổi

Chức vụ trước đây :  Vật lý tại Đại học Cornell
Học tập thú vị :  “ Chương trình OpenAI Scholars đã cho tôi cơ hội tìm hiểu những tiến bộ mới nhất và tuyệt vời nhất trong Xử lý ngôn ngữ tự nhiên. Tôi cũng được cung cấp các nguồn lực để triển khai và khám phá một ý tưởng tính toán lớn mới, cho phép tôi nhanh chóng học các kỹ năng để thực hiện ý tưởng của mình. ”
Dự án cuối cùng :  Với sự ra đời của máy biến áp, mạng nơ-ron có khả năng tạo ra ngôn ngữ như con người, tóm tắt văn bản, trả lời câu hỏi và nhiều hơn thế nữa! Khi chúng trở nên mạnh mẽ hơn, chúng cũng trở nên lớn hơn về kích thước, khiến chúng ngày càng khó chạy trên các thiết bị di động. Để làm cho các công cụ này dễ tiếp cận hơn, dự án này đã khám phá quá trình chưng cất kiến ​​thức bằng các mô hình ngôn ngữ máy biến áp bằng cách sử dụng một máy biến áp lớn, được đào tạo tốt làm giáo viên cho một mạng lưới học sinh nhỏ hơn chưa được đào tạo.

Dự án

Các học giả của chúng tôi thể hiện các kỹ năng kỹ thuật cốt lõi trên nhiều lĩnh vực chuyên môn khác nhau và động lực tự thân—những năng lực quan trọng đối với một chương trình tự định hướng như thế này. Mỗi người trong số họ đều bước vào lĩnh vực học máy như những người mới đến, và chúng tôi hy vọng sự tiến bộ của họ cho thấy học máy dễ tiếp cận như thế nào. Để bắt đầu hành trình học tập của bạn, hãy xem một số  tài liệu giáo dục của chúng tôi . Thông tin thêm về lớp học giả tiếp theo và cách nộp đơn sẽ được công bố vào tháng 7. Hãy theo dõi!

Cảm ơn AWS đã cung cấp tín chỉ tính toán cho các học giả. Cảm ơn thêm đến các cố vấn cộng đồng tận tâm của chúng tôi đã dành thời gian tư vấn cho các học giả về các dự án của họ.

Xem thêm: mua tài khoản ChatGPT Plus chính hãng giá rẻ với nhiều ưu đãi đặc biệt!

Hot Deal

Họ tên (*)

Số điện thoại (*)

Email (*)

Dịch vụ

Đăng ký để nhận bản tin mới nhất !