GPT-2: Phiên bản 1.5B

Là bản phát hành mô hình cuối cùng của bản phát hành theo giai đoạn của GPT-2 , chúng tôi đang phát hành phiên bản lớn nhất (1,5 tỷ tham số) của GPT-2 cùng với mã và trọng số mô hình (mở trong cửa sổ mới) để tạo điều kiện phát hiện đầu ra của các mô hình GPT-2. Mặc dù đã có các mô hình ngôn ngữ lớn hơn được phát hành kể từ tháng 8, chúng tôi vẫn tiếp tục với kế hoạch phát hành theo giai đoạn ban đầu của mình để cung cấp cho cộng đồng một trường hợp thử nghiệm của quy trình phát hành theo giai đoạn đầy đủ. Chúng tôi hy vọng rằng trường hợp thử nghiệm này sẽ hữu ích cho các nhà phát triển các mô hình mạnh mẽ trong tương lai và chúng tôi đang tích cực tiếp tục cuộc trò chuyện với cộng đồng AI về việc xuất bản có trách nhiệm.

Tài khoản ChatGPT 4 tại đây với nhiều ưu đãi đăc biệt hấp dẫn!

Mặc dù đã có các mô hình ngôn ngữ lớn hơn được phát hành kể từ tháng 8, chúng tôi vẫn tiếp tục với kế hoạch phát hành theo giai đoạn ban đầu của mình để cung cấp cho cộng đồng một trường hợp thử nghiệm của quy trình phát hành theo giai đoạn đầy đủ. Chúng tôi hy vọng rằng trường hợp thử nghiệm này sẽ hữu ích cho các nhà phát triển các mô hình mạnh mẽ trong tương lai và chúng tôi đang tích cực tiếp tục cuộc trò chuyện với cộng đồng AI về việc xuất bản có trách nhiệm.

Những phát hiện của chúng tôi

Con người thấy kết quả đầu ra của GPT-2 thuyết phục . Các đối tác của chúng tôi tại Đại học Cornell đã khảo sát mọi người để gán cho văn bản GPT-2 một điểm tin cậy trên các kích thước mô hình. Mọi người đã cho mô hình 1.5B một “điểm tin cậy” là 6,91 trên 10. Điểm này cao hơn một chút so với kết quả đầu ra từ mô hình 774M (6,72) và cao hơn đáng kể so với mô hình 355M trung bình (6,07). Những kết quả này khiến chúng tôi có xu hướng phát hành mô hình 1.5B hơn, vì mức tăng gia tăng về độ tin cậy mà con người cảm nhận so với 774M có vẻ thấp.

GPT-2 có thể được tinh chỉnh để sử dụng sai mục đích . Các đối tác của chúng tôi tại Trung tâm về chủ nghĩa khủng bố, chủ nghĩa cực đoan và chống khủng bố (CTEC) thuộc Viện nghiên cứu quốc tế Middlebury đã phát hiện ra rằng các nhóm cực đoan có thể sử dụng GPT-2 để sử dụng sai mục đích, cụ thể là bằng cách tinh chỉnh các mô hình GPT-2 trên bốn lập trường tư tưởng: chủ nghĩa da trắng thượng đẳng, chủ nghĩa Marx, chủ nghĩa Hồi giáo thánh chiến và chủ nghĩa vô chính phủ. CTEC đã chứng minh rằng có thể tạo ra các mô hình có thể tạo ra tuyên truyền tổng hợp cho các hệ tư tưởng này. Họ cũng chỉ ra rằng, mặc dù có độ chính xác phát hiện thấp trên các đầu ra tổng hợp, các phương pháp phát hiện dựa trên ML có thể khiến các chuyên gia nghi ngờ hợp lý rằng một tác nhân đang tạo ra văn bản tổng hợp.

Phát hiện là thách thức . Chúng tôi cho rằng phát hiện văn bản tổng hợp dựa trên nội dung là một thách thức lâu dài. Để kiểm tra xem các phương pháp học máy có thể giúp ích ngày nay hay không, chúng tôi đã tiến hành nghiên cứu phát hiện nội bộ và phát triển một mô hình phát hiện (mở trong cửa sổ mới) có tỷ lệ phát hiện ~95% để phát hiện văn bản do GPT-2 tạo ra 1,5B. Chúng tôi tin rằng độ chính xác này không đủ cao để phát hiện độc lập và cần được kết hợp với các phương pháp dựa trên siêu dữ liệu, phán đoán của con người và giáo dục công chúng để có hiệu quả hơn. Chúng tôi đang phát hành mô hình này để hỗ trợ nghiên cứu về phát hiện văn bản tổng hợp, mặc dù điều này cho phép những kẻ tấn công có quyền truy cập tránh bị phát hiện tốt hơn.

Trong khi chúng tôi thấy độ chính xác của phát hiện phụ thuộc rất nhiều vào các phương pháp lấy mẫu được sử dụng trong quá trình đào tạo và thử nghiệm, chúng tôi cũng thấy phát hiện đáng tin cậy hơn khi đào tạo trên nhiều kỹ thuật lấy mẫu. Như được thấy trong hình bên dưới, chúng tôi nhận thấy rằng đầu ra của các mô hình lớn hơn khó phân loại hơn, nhưng đào tạo trên đầu ra của các mô hình lớn hơn giúp kết quả phát hiện chính xác và mạnh mẽ hơn. Chúng tôi mong đợi xu hướng này sẽ tiếp tục và phát hiện sẽ khó khăn hơn khi kích thước mô hình tăng lên.

Cho đến nay, chúng tôi chưa thấy bằng chứng mạnh mẽ nào về việc sử dụng sai mục đích . Mặc dù chúng tôi đã thấy một số cuộc thảo luận xung quanh tiềm năng của GPT-2 trong việc tăng cường các hoạt động khối lượng lớn/hiệu suất thấp như thư rác và lừa đảo, chúng tôi chưa thấy bằng chứng về việc viết mã, tài liệu hoặc các trường hợp sử dụng sai mục đích. Chúng tôi cho rằng các trình tạo văn bản tổng hợp có nhiều khả năng bị sử dụng sai mục đích hơn nếu đầu ra của chúng trở nên đáng tin cậy và mạch lạc hơn. Chúng tôi thừa nhận rằng chúng tôi không thể biết được tất cả các mối đe dọa và các tác nhân có động cơ có thể sao chép các mô hình ngôn ngữ mà không cần phát hành mô hình.

Chúng ta cần các tiêu chuẩn để nghiên cứu sự thiên vị . Các mô hình ngôn ngữ có sự thiên vị. Tìm ra cách nghiên cứu những sự thiên vị này, thảo luận về chúng và giải quyết chúng là một thách thức đối với cộng đồng nghiên cứu AI. Chúng tôi đã tiếp cận thách thức về sự thiên vị theo hai cách:

+ Xuất bản thẻ mô hình (mở trong cửa sổ mới) cùng với các mô hình của chúng tôi trên GitHub để giúp mọi người hiểu rõ hơn về các vấn đề vốn có của các mô hình ngôn ngữ như GPT-2.

+ Tiến hành đánh giá định tính, nội bộ về một số thành kiến trong GPT-2: Chúng tôi đã thăm dò GPT-2 về một số thành kiến về giới tính, chủng tộc và tôn giáo, sử dụng những phát hiện đó để thông báo cho thẻ mô hình của chúng tôi. Các cuộc thăm dò này không toàn diện và làm tăng nhu cầu hợp tác về khuôn khổ phân tích thành kiến.

Các bước tiếp theo

Kinh nghiệm của chúng tôi với GPT-2 trong 9 tháng qua đã mang lại cho chúng tôi cái nhìn sâu sắc có giá trị về những thách thức và cơ hội để tạo ra các chuẩn mực xuất bản có trách nhiệm trong AI. Chúng tôi đang tiếp tục công việc của mình về vấn đề này thông qua việc tham gia vào dự án "Chuẩn mực xuất bản có trách nhiệm cho máy học" của Đối tác về AI và thảo luận với các đồng nghiệp của chúng tôi trong cộng đồng nghiên cứu.

Xem thêm: mua tài khoản ChatGPT Plus chính hãng giá rẻ!

Họ tên (*)	Số điện thoại (*)
Email (*)	Dịch vụ

GPT-2: Phiên bản 1.5B

Những phát hiện của chúng tôi

Các bước tiếp theo

Bài liên quan

Hệ thống phân cấp hướng dẫn: Đào tạo LLM để ưu tiên các…

Trình Tạo Bài Hát Trên Cửa Hàng GPT: Công Cụ Mới Mẻ Cho…

Các mô hình tạo video như trình mô phỏng thế giới

60+ Lời nhắc ChatGPT cho các bài đăng hấp dẫn trên mạng xã…

Cải thiện lý luận toán học bằng cách giám sát quy trình

Liệu ChatGPT có thay thế được người viết nội dung không?

Đầu vào dân chủ cho AI

AI trong kinh doanh 2025: Vai trò của ChatGPT trong những đổi mới…

GPT là GPT: Một cái nhìn ban đầu về tiềm năng tác động…

Cách đổi Mật khẩu Chat GPT - Hướng dẫn đổi Pass Chat GPT 100% Thành công

Hướng dẫn Cách đăng nhập Chat GPT Nhanh nhất | Có hỗ trợ Miễn phí qua Teamview-Ultraview

Chat GPT Plus là gì? So sánh Chat GPT Plus với Chat GPT Miễn phí

Chat GPT bị giới hạn giải thích vì sao và cách khắc phục

Chat GPT là gì ? Cách đăng Ký Chat GPT Miễn Phí tại Việt Nam

AI trong kinh doanh 2025: Vai trò của ChatGPT trong những đổi mới trong tương lai

GPT là GPT: Một cái nhìn ban đầu về tiềm năng tác động của các mô hình ngôn ngữ lớn lên thị trường lao động

Có gì mới trong ChatGPT vào năm 2025?

GPT-4

ChatGPT đang thay đổi cách chúng ta viết?

Point-E: Một hệ thống tạo ra các đám mây điểm 3D từ các lời nhắc phức tạp

Chatgpt sẽ ảnh hưởng đến SEO như thế nào

Luật mở rộng cho mô hình phần thưởng tối ưu hóa quá mức

Trò chuyện GPT-4 - Tất cả những gì bạn cần biết về AI mạnh mẽ này

Giới thiệu Whisper

Chế độ nghiên cứu sâu ChatGPT là gì?

Đào tạo hiệu quả các mô hình ngôn ngữ để điền vào giữa

ChatGPT 2025: AI Thế Hệ Mới Sẵn Sàng Thay Đổi Ngành Viết Nội Dung

DALL·E 2 biện pháp giảm thiểu trước khi đào tạo

Cập nhật Big ChatGPT năm 2025: Cách mạng hóa tiếp thị kỹ thuật số với AI tiên tiến

Học chơi Minecraft với Video PreTraining

Chat GPT

Trí tuệ nhân tạo AI

Đăng ký tư vấn