zalo
Chat ngay

Quan hệ đối tác dữ liệu OpenAI

Hợp tác để tạo ra các tập dữ liệu nguồn mở và riêng tư phục vụ cho việc đào tạo AI

 

Chúng tôi đang giới thiệu Quan hệ đối tác dữ liệu OpenAI, nơi chúng tôi sẽ hợp tác với các tổ chức để tạo ra các tập dữ liệu công khai và riêng tư phục vụ cho mục đích đào tạo các mô hình AI.

Công nghệ AI hiện đại học các kỹ năng và khía cạnh của thế giới chúng ta—về con người, động lực, tương tác và cách chúng ta giao tiếp—bằng cách hiểu dữ liệu mà nó được đào tạo. Để cuối cùng tạo ra AGI an toàn và có lợi cho toàn thể nhân loại, chúng tôi muốn các mô hình AI hiểu sâu sắc mọi chủ đề, ngành công nghiệp, văn hóa và ngôn ngữ, đòi hỏi một tập dữ liệu đào tạo rộng nhất có thể. 

Bao gồm nội dung của bạn có thể giúp các mô hình AI hữu ích hơn cho bạn bằng cách tăng sự hiểu biết của chúng về miền của bạn. Chúng tôi đã làm việc với nhiều đối tác mong muốn đại diện cho dữ liệu từ quốc gia hoặc ngành của họ. Ví dụ, gần đây chúng tôi đã hợp tác với Chính phủ Iceland và Miðeind ehf (mở trong cửa sổ mới)để cải thiện khả năng nói tiếng Iceland của tài khoản Chat GPT-4 bằng cách tích hợp các tập dữ liệu được quản lý của họ. Chúng tôi cũng hợp tác với tổ chức phi lợi nhuận Free Law Project (mở trong cửa sổ mới), nhằm mục đích dân chủ hóa việc tiếp cận hiểu biết pháp lý bằng cách đưa bộ sưu tập lớn các tài liệu pháp lý của họ vào đào tạo AI. Chúng tôi biết rằng có thể có nhiều người khác cũng muốn đóng góp cho tương lai của nghiên cứu AI trong khi khám phá tiềm năng của dữ liệu độc đáo của họ.

Quan hệ đối tác dữ liệu nhằm mục đích cho phép nhiều tổ chức hơn có thể hỗ trợ định hướng tương lai của AI và hưởng lợi từ các mô hình hữu ích hơn với họ, bằng cách đưa vào nội dung mà họ quan tâm.

Các loại dữ liệu chúng tôi đang tìm kiếm

Chúng tôi quan tâm đến các tập dữ liệu quy mô lớn phản ánh xã hội loài người và hiện nay công chúng chưa dễ dàng truy cập trực tuyến. Chúng tôi có thể làm việc với bất kỳ phương thức nào, bao gồm văn bản, hình ảnh, âm thanh hoặc video. Chúng tôi đặc biệt tìm kiếm dữ liệu thể hiện ý định của con người (ví dụ: văn bản dài hoặc hội thoại thay vì các đoạn trích rời rạc), trên mọi ngôn ngữ, chủ đề và định dạng. 

Chúng tôi có thể làm việc với dữ liệu ở hầu hết mọi dạng và có thể sử dụng công nghệ AI nội bộ thế hệ tiếp theo của chúng tôi để giúp bạn số hóa và cấu trúc dữ liệu của mình. Ví dụ, chúng tôi có công nghệ nhận dạng ký tự quang học đẳng cấp thế giới(mở trong cửa sổ mới) Công nghệ (OCR) để số hóa các tệp như PDF và nhận dạng giọng nói tự động (mở trong cửa sổ mới) (ASR) để phiên âm lời nói. Nếu dữ liệu cần được làm sạch (ví dụ: có nhiều hiện vật tự động tạo hoặc lỗi phiên âm), chúng tôi có thể làm việc với nhóm của bạn để xử lý dữ liệu thành dạng hữu ích nhất. Chúng tôi không tìm kiếm các tập dữ liệu có thông tin nhạy cảm hoặc thông tin cá nhân hoặc thông tin thuộc về bên thứ ba; chúng tôi có thể làm việc với bạn để xóa thông tin này nếu bạn cần trợ giúp.

Cách thức hợp tác với chúng tôi

Hiện tại chúng tôi có hai cách hợp tác và có thể mở rộng trong tương lai:

+ Kho lưu trữ nguồn mở : Chúng tôi đang tìm kiếm các đối tác giúp chúng tôi tạo ra một tập dữ liệu nguồn mở để đào tạo các mô hình ngôn ngữ. Tập dữ liệu này sẽ được công khai để bất kỳ ai cũng có thể sử dụng trong đào tạo mô hình AI. Chúng tôi cũng sẽ khám phá việc sử dụng nó để tự đào tạo an toàn các mô hình nguồn mở bổ sung. Chúng tôi tin rằng nguồn mở đóng vai trò quan trọng trong hệ sinh thái.

+ Bộ dữ liệu riêng tư : Chúng tôi cũng đang chuẩn bị các bộ dữ liệu riêng tư để đào tạo các mô hình AI độc quyền, bao gồm các mô hình nền tảng và các mô hình tùy chỉnh và tinh chỉnh của chúng tôi. Nếu bạn có dữ liệu muốn giữ riêng tư, nhưng bạn muốn các mô hình AI của chúng tôi hiểu rõ hơn về miền của bạn (hoặc thậm chí bạn chỉ muốn đánh giá tiềm năng của dữ liệu của mình để làm như vậy), đây là cách hợp tác tối ưu. Chúng tôi sẽ xử lý dữ liệu của bạn với mức độ nhạy cảm và kiểm soát truy cập mà bạn thích. 

Nhìn chung, chúng tôi đang tìm kiếm những đối tác muốn giúp chúng tôi dạy AI hiểu thế giới của chúng ta để có thể giúp ích tối đa cho mọi người. Cùng nhau, chúng ta có thể hướng tới AGI mang lại lợi ích cho toàn thể nhân loại.

Xem thêm: mua tài khoản ChatGPT Plus chính hãng giá rẻ 

Hot Deal

Họ tên (*)

Số điện thoại (*)

Email (*)

Dịch vụ

Đăng ký để nhận bản tin mới nhất !