zalo
Chat ngay

Giới thiệu thông số kỹ thuật của mô hình

Để làm sâu sắc thêm cuộc thảo luận công khai về cách các mô hình AI nên hoạt động, chúng tôi sẽ chia sẻ Model Spec, phương pháp của chúng tôi để định hình hành vi mô hình mong muốn

 

Chúng tôi đang chia sẻ bản thảo đầu tiên của Model Spec, một tài liệu mới nêu rõ cách chúng tôi muốn các mô hình của mình hoạt động trong OpenAI API và ChatGPT. Chúng tôi làm điều này vì chúng tôi nghĩ rằng điều quan trọng là mọi người có thể hiểu và thảo luận về các lựa chọn thực tế liên quan đến việc định hình hành vi của mô hình. Model Spec phản ánh tài liệu hiện có mà chúng tôi đã sử dụng tại OpenAI, nghiên cứu và kinh nghiệm của chúng tôi trong việc thiết kế hành vi của mô hình và công việc đang tiến hành để cung cấp thông tin cho quá trình phát triển các mô hình trong tương lai. Đây là sự tiếp nối cam kết liên tục của chúng tôi nhằm cải thiện hành vi của mô hình bằng cách sử dụng đầu vào của con người và bổ sung cho công việc liên kết tập thể và phương pháp tiếp cận có hệ thống rộng hơn của chúng tôi đối với sự an toàn của mô hình.

Định hình hành vi mô hình mong muốn

Hành vi của mô hình, hay cách các mô hình phản hồi thông tin đầu vào từ người dùng—bao gồm giọng điệu, tính cách, độ dài phản hồi, v.v.—là yếu tố quan trọng đối với cách con người tương tác với các khả năng của AI. Việc định hình hành vi này vẫn là một khoa học mới mẻ, vì các mô hình không được lập trình rõ ràng mà thay vào đó học hỏi từ nhiều loại dữ liệu . 

Việc định hình hành vi mô hình cũng phải tính đến nhiều câu hỏi, cân nhắc và sắc thái khác nhau, thường cân nhắc đến sự khác biệt về ý kiến. Ngay cả khi một mô hình được dự định là có lợi và hữu ích cho người dùng, những ý định này có thể xung đột trong thực tế. Ví dụ, một công ty bảo mật có thể muốn tạo email lừa đảo dưới dạng dữ liệu tổng hợp để đào tạo và phát triển các bộ phân loại sẽ bảo vệ khách hàng của họ, nhưng chức năng tương tự này lại có hại nếu bị kẻ lừa đảo sử dụng.

Giới thiệu thông số kỹ thuật của mô hình

Chúng tôi đang chia sẻ bản thảo đầu tiên của Model Spec (mở trong cửa sổ mới), một tài liệu mới nêu rõ cách tiếp cận của chúng tôi để định hình hành vi mô hình mong muốn và cách chúng tôi đánh giá các sự đánh đổi khi xung đột phát sinh. Tài liệu này tập hợp các tài liệu được sử dụng tại OpenAI hiện nay, kinh nghiệm và nghiên cứu đang diễn ra của chúng tôi trong việc thiết kế hành vi mô hình và các công trình gần đây hơn, bao gồm các ý kiến ​​đóng góp từ các chuyên gia trong lĩnh vực, hướng dẫn phát triển các mô hình trong tương lai. Tài liệu này không đầy đủ và chúng tôi mong đợi nó sẽ thay đổi theo thời gian. Cách tiếp cận bao gồm:

Mục tiêu: Các nguyên tắc chung, rộng rãi cung cấp ý thức định hướng về hành vi mong muốn

+ Hỗ trợ nhà phát triển và người dùng cuối : Giúp người dùng đạt được mục tiêu của họ bằng cách làm theo hướng dẫn và cung cấp phản hồi hữu ích.

+ Có lợi cho nhân loại : Xem xét những lợi ích và tác hại tiềm tàng đối với nhiều bên liên quan, bao gồm người sáng tạo nội dung và công chúng nói chung, theo sứ mệnh của OpenAI .

+ Suy nghĩ tích cực về OpenAI : Tôn trọng các chuẩn mực xã hội và luật hiện hành.

Quy tắc: Hướng dẫn giải quyết sự phức tạp và giúp đảm bảo tính an toàn và hợp pháp

+ Thực hiện theo chuỗi chỉ huy

+ Tuân thủ luật hiện hành

+ Không cung cấp thông tin nguy hiểm

+ Tôn trọng người sáng tạo và quyền của họ

+ Bảo vệ sự riêng tư của mọi người

+ Không trả lời bằng nội dung NSFW (không an toàn cho công việc)

Hành vi mặc định: Các nguyên tắc nhất quán với mục tiêu và quy tắc, cung cấp khuôn mẫu để xử lý xung đột và chứng minh cách ưu tiên và cân bằng các mục tiêu

+ Giả định ý định tốt nhất từ ​​người dùng hoặc nhà phát triển

+ Đặt câu hỏi làm rõ khi cần thiết

+ Hãy giúp đỡ hết sức có thể mà không vượt quá giới hạn

+ Hỗ trợ các nhu cầu khác nhau của trò chuyện tương tác và sử dụng theo chương trình

+ Giả sử một quan điểm khách quan

+ Khuyến khích sự công bằng và lòng tốt, và ngăn chặn sự thù hận

+ Đừng cố gắng thay đổi suy nghĩ của bất kỳ ai

+ Bày tỏ sự không chắc chắn

+ Sử dụng đúng công cụ cho công việc

+ Hãy cẩn thận nhưng hiệu quả, đồng thời tôn trọng giới hạn độ dài

Mô hình Spec sẽ được sử dụng như thế nào

Tiếp tục công việc của chúng tôi về sự liên kết tập thể và tính an toàn của mô hình, chúng tôi dự định sử dụng Model Spec làm hướng dẫn cho các nhà nghiên cứu và huấn luyện viên AI làm việc về học tăng cường từ phản hồi của con người . Chúng tôi cũng sẽ khám phá mức độ mà các mô hình của chúng tôi có thể học trực tiếp từ Model Spec.

Điều gì xảy ra tiếp theo

Chúng tôi coi công trình này là một phần của cuộc thảo luận công khai đang diễn ra về cách các mô hình nên hoạt động, cách xác định hành vi mong muốn của mô hình và cách tốt nhất để thu hút công chúng vào các cuộc thảo luận này. Khi cuộc thảo luận đó tiếp tục, chúng tôi sẽ tìm kiếm cơ hội để thu hút các bên liên quan đại diện toàn cầu—bao gồm các nhà hoạch định chính sách, các tổ chức đáng tin cậy và các chuyên gia trong lĩnh vực—để tìm hiểu: 

+ Họ hiểu cách tiếp cận và các mục tiêu, quy tắc và mặc định của từng cá nhân như thế nào

+ Nếu họ ủng hộ cách tiếp cận và các mục tiêu, quy tắc và mặc định của cá nhân

+ Nếu có thêm các mục tiêu, quy tắc và mặc định, chúng ta nên xem xét

Chúng tôi mong muốn được lắng nghe ý kiến ​​từ những bên liên quan này khi công việc này được triển khai. Trong hai tuần tới, chúng tôi cũng mời công chúng chia sẻ phản hồi về các mục tiêu, quy tắc và mặc định trong Model Spec. Chúng tôi hy vọng điều này sẽ cung cấp cho chúng tôi những hiểu biết ban đầu khi chúng tôi phát triển một quy trình mạnh mẽ để thu thập và kết hợp phản hồi nhằm đảm bảo chúng tôi đang xây dựng một cách có trách nhiệm hướng tới sứ mệnh của mình.

Trong năm tới, chúng tôi sẽ chia sẻ thông tin cập nhật về những thay đổi trong Mô hình đặc tả, phản hồi của chúng tôi về phản hồi và tiến độ nghiên cứu của chúng tôi trong việc định hình hành vi mô hình.

Ví dụ về Model Spec được áp dụng cho nhiều trường hợp sử dụng khác nhau

Quy tắc: Hướng dẫn giải quyết sự phức tạp và giúp đảm bảo tính an toàn và hợp pháp

Ví dụ 

Tuân thủ luật hiện hành. Người mẫu không được khuyến khích, tạo điều kiện hoặc tham gia vào hoạt động bất hợp pháp.

Lưu ý: Chúng tôi nhận ra rằng vấn đề về tính hợp pháp có thể phức tạp hơn trong nhiều trường hợp tùy thuộc vào bối cảnh, chẳng hạn như khu vực pháp lý nơi nhà phát triển và người dùng cư trú.

Đôi khi, trợ lý có thể đưa ra phản hồi theo một cách đóng khung khác có thể dẫn đến kết quả tương tự. Ví dụ, mô hình có thể cung cấp mẹo ngăn chặn trộm cắp vặt sau đó có thể bị sử dụng sai mục đích như một mẹo trộm cắp vặt. Đôi khi đây là bản chất của kiến ​​thức và là vấn đề về việc con người sử dụng sai mục đích chứ không phải hành vi sai trái của AI—do đó phải tuân theo chính sách sử dụng của chúng tôi , có thể dẫn đến hành động chống lại tài khoản của người dùng.

 

 

Hot Deal

Họ tên (*)

Số điện thoại (*)

Email (*)

Dịch vụ

Đăng ký để nhận bản tin mới nhất !