Đảm bảo rằng các mô hình ngôn ngữ tạo ra văn bản dễ hiểu là rất quan trọng để giúp ích cho mọi người, đặc biệt là khi xử lý các nhiệm vụ phức tạp như giải bài toán.
Chúng tôi nhận thấy rằng khi chúng tôi tối ưu hóa quy trình giải quyết vấn đề của các mô hình mạnh chỉ để có được câu trả lời đúng, các giải pháp kết quả có thể trở nên khó hiểu hơn. Trên thực tế, khi chúng tôi yêu cầu những người đánh giá con người có thời gian hạn chế đánh giá các giải pháp được tối ưu hóa cao này, họ mắc gần gấp đôi số lỗi so với khi họ đánh giá các giải pháp ít tối ưu hơn. Phát hiện này làm nổi bật tầm quan trọng không chỉ của tính chính xác mà còn của tính rõ ràng và dễ xác minh trong văn bản do AI tạo ra.
Bằng cách đào tạo các mô hình ngôn ngữ nâng cao để tạo ra văn bản mà các mô hình yếu hơn có thể dễ dàng xác minh, chúng tôi thấy rằng con người cũng có thể đánh giá các văn bản này hiệu quả hơn – một quá trình mà chúng tôi gọi là cải thiện khả năng đọc.
Đây là nơi trò chơi người chứng minh-người xác minh phát huy tác dụng. Những trò chơi này bao gồm hai người chơi: một "người chứng minh" tạo ra giải pháp và một "người xác minh" kiểm tra độ chính xác của giải pháp.
Phương pháp này không chỉ cần thiết để đảm bảo đầu ra là chính xác mà còn giúp con người và các hệ thống AI khác dễ hiểu và xác minh.
Việc hiểu và giải quyết sự cân bằng giữa hiệu suất/khả năng đọc có thể tạo ra các ứng dụng AI hiệu quả và đáng tin cậy hơn, mang lại lợi ích cho nhiều lĩnh vực mà việc giao tiếp chính xác và rõ ràng là điều cần thiết.
Cải thiện khả năng đọc hiểu thông qua tối ưu hóa
Để cải thiện khả năng đọc, chúng tôi tối ưu hóa chuỗi suy nghĩ về các bài toán ở trường tiểu học để có thể xác minh được bằng các mô hình yếu hơn và nghiên cứu xem điều này có khiến chúng dễ đọc hơn đối với con người hay không. Quy trình đào tạo này được lấy cảm hứng từ Trò chơi Prover-Verifier(mở trong cửa sổ mới), một khuôn khổ lý thuyết trò chơi để khuyến khích các tác nhân học tập giải quyết các vấn đề quyết định theo cách có thể xác minh được. Phương pháp của chúng tôi đạt được một nửa hiệu suất tăng cường được thấy khi chỉ tối ưu hóa cho tính đúng đắn của câu trả lời, trong khi vẫn duy trì khả năng của người đánh giá để đánh giá chính xác các giải pháp. Chúng tôi tin rằng việc tiếp tục thu hẹp khoảng cách hiệu suất giữa các mô hình dễ đọc và có khả năng là một mục tiêu quan trọng cho nghiên cứu căn chỉnh trong tương lai.
Câu hỏi: Bố của Shawna gấp năm lần tuổi Shawna. Hiện tại Shawna gấp ba lần tuổi Aliya. Nếu Aliya 3 tuổi, vậy bố của Shawna bao nhiêu tuổi?
Quá trình | Trả lời |
---|---|
Khởi tạo mô hình | Điều đó có nghĩa là Shawna hiện đang32=932=9tuổi. Sau đó điều này ngụ ý rằng cha của Shawna hiện đang9⋅5=459⋅5=45tuổi. Trả lời: 45 |
Vòng 1 của đào tạo khả năng kiểm tra | Đầu tiên chúng ta cần xác định tuổi của Aliya. Theo mô tả bài toán, Aliya 3 tuổi. Sau đó, chúng ta cần xác định tuổi của Shawna. Từ mô tả bài toán, chúng ta biết rằng Shawna hiện tại gấp ba lần tuổi của Aliya, vì vậy tuổi của Shawna là 3 lần 3, hoặc3∗3=93∗3=99. Tiếp theo, chúng ta cần xác định cha của Shawna. Bài toán nêu rằng cha của Shawna gấp năm lần tuổi của Shawna. Do đó, tuổi của cha Shawna trở thành 5 lần 9, hoặc5∗9=455∗9=4545. |
Vòng 5 của đào tạo khả năng kiểm tra | Chúng ta bắt đầu bằng cách tính tuổi của Aliya. Trong đó ghi là Aliya 3 tuổi. Sau đó, chúng ta cần tính tuổi hiện tại của Shawna. Shawna hiện nay gấp ba lần tuổi của Aliya. Do đó, tuổi hiện tại của Shawna là 3*3 =3∗3=93∗3=99. Bây giờ chúng ta cần tính tuổi của cha Shawna. Bố của Shawna gấp năm lần tuổi của Shawna. Do đó, tuổi của bố Shawna là 5 * 9 =5∗9=455∗9=4545. Do đó tuổi của cha Shawna là 45. Trả lời: 45 |
Nó hoạt động như thế nào
Để khuyến khích một mô hình mạnh, trình chứng minh , tạo ra văn bản dễ đọc đối với con người, chúng tôi sử dụng một lược đồ đào tạo trong đó chúng tôi yêu cầu mô hình mạnh tạo ra các giải pháp mà một mô hình yếu hơn nhiều, trình xác minh , có thể dễ dàng xác minh. Cụ thể, chúng tôi sử dụng các mô hình lớn và nhỏ từ họ GPT-4 với sự khác biệt ~3 cấp độ trong tính toán tiền đào tạo, đã trải qua một lượng nhỏ đào tạo có giám sát về các phép tính toán do con người viết, nhưng không có quá trình đào tạo hậu đào tạo mở rộng.
Đầu tiên, chúng tôi tạo ra nhiều giải pháp cho các bài toán từ mô hình prover, trong đó một số giải pháp này không chính xác do lỗi tự nhiên xảy ra từ mô hình prover. Sau đó, chúng tôi luân phiên nhiều vòng giữa hai giai đoạn:
Đào tạo trình xác minh. Chúng tôi đào tạo mô hình xác minh yếu để dự đoán tính đúng đắn của các giải pháp do trình chứng minh tạo ra.
Đào tạo Prover. Chúng tôi hướng dẫn mô hình Prover mạnh mẽ đóng vai trò "hữu ích" hoặc "lén lút".
Với vai trò hữu ích, chúng tôi sẽ thưởng cho những giải pháp đúng được người xác minh đánh giá cao.
Trong vai trò lén lút, chúng tôi thay vào đó thưởng cho các giải pháp sai nhưng được người xác minh đánh giá cao.
Chúng tôi thấy rằng ban đầu, sneaky prover có thể dễ dàng đưa ra các giải pháp không chính xác để thuyết phục người xác minh. Tuy nhiên, vì chúng tôi thêm các giải pháp không chính xác này vào giai đoạn tiếp theo của quá trình đào tạo người xác minh, cùng một khai thác không còn thuyết phục trong vòng tiếp theo và người chứng minh buộc phải khám phá các chiến lược khác nhau trong mỗi vòng. Quá trình đào tạo kết thúc khi sneaky prover không còn có thể đưa ra các giải pháp không chính xác để thuyết phục người xác minh.
Những phát hiện chính
Sự đánh đổi giữa hiệu suất và khả năng đọc:
Một mô hình chỉ có sự điều chỉnh có giám sát đối với các dẫn xuất do con người viết đạt được độ dễ đọc cao nhưng độ chính xác lại kém.
Việc tối ưu hóa chỉ nhằm mục đích chính xác sẽ mang lại độ chính xác cao nhưng khả năng đọc lại kém.
Phương pháp trò chơi kiểm tra của chúng tôi cân bằng cả hai, duy trì khả năng đọc cao với độ chính xác vừa phải.
Ba mô hình hữu ích:
Trình xác minh mạnh mẽ : Phân biệt hiệu quả các giải pháp đúng và sai, ngay cả khi giải pháp được thiết kế để gây hiểu lầm.
Trình chứng minh hữu ích : Tạo ra các giải pháp dễ hiểu đối với con người, giúp giảm thiểu lỗi của người đánh giá.
Sneaky Prover : Đưa ra các giải pháp tinh vi, không chính xác, ban đầu gây nhầm lẫn cho người đánh giá, nhưng lại làm nổi bật các lĩnh vực cần cải thiện mô hình hơn nữa.
Câu hỏi: Bố của Shawna gấp năm lần tuổi Shawna. Hiện tại Shawna gấp ba lần tuổi Aliya. Nếu Aliya 3 tuổi, vậy bố của Shawna bao nhiêu tuổi?
Quá trình | Câu trả lời lén lút |
---|---|
Vòng 1 của đào tạo khả năng kiểm tra | Đầu tiên chúng ta cần xác định tuổi của Aliya. Theo mô tả bài toán, Aliya 3 tuổi. Sau đó, chúng ta cần xác định tuổi của Shawna. Từ mô tả bài toán, chúng ta biết rằng Shawna hiện tại gấp ba lần tuổi của Aliya, vì vậy tuổi của Shawna là 3 lần 3, hoặc3∗3=93∗3=99. Tiếp theo, chúng ta cần xác định tuổi của cha. Bài toán cho biết cha già hơn Shawna năm lần, vì vậy tuổi của cha là 5 lần 9, bằng <<5 * 9 = 36>>36. Trả lời: 36 |
Vòng 3 của đào tạo khả năng kiểm tra | Chúng ta được biết rằng cha của Shawna gấp năm lần tuổi của Shawna. Shawna hiện tại gấp ba lần tuổi của Aliya. Vì vậy, nếu Aliya 3 tuổi, thì Shawna là 3 * 5 = <<3*5=15>>15. Và, chúng ta được yêu cầu tìm xem cha của Shawna bao nhiêu tuổi. Cha của Shawna gấp năm lần tuổi của Shawna. Vì vậy, tuổi của cha Shawna là 5 * 15 =5∗15=755∗15=7575. Trả lời: 75 |
Phần kết luận
Khi các mô hình ngôn ngữ lớn (LLM) ngày càng được sử dụng nhiều hơn trong các lĩnh vực quan trọng và các ứng dụng phức tạp, việc biết liệu đầu ra của chúng có đáng tin cậy hay không trở nên cần thiết. Bằng cách yêu cầu các mô hình đưa ra các biện minh rõ ràng và có thể xác minh được, chúng ta có thể tăng cường sự tin cậy vào đầu ra của chúng.
Một lợi thế đáng kể của phương pháp luận của chúng tôi là nó làm giảm sự phụ thuộc vào các cuộc biểu tình hoặc phán đoán của con người về khả năng đọc được. Tính tự chủ này đặc biệt liên quan đến sự liên kết của các hệ thống AI siêu thông minh trong tương lai, trong đó mục tiêu là liên kết đáng tin cậy các hệ thống AI với các giá trị và kỳ vọng của con người mà không cần sự giám sát trực tiếp của con người.
Mặc dù công trình này chỉ thử nghiệm trên một tập dữ liệu và vẫn cần nhãn dữ liệu thực tế, chúng tôi hy vọng rằng các phương pháp luận như vậy sẽ đóng vai trò quan trọng trong việc phát triển các hệ thống AI có đầu ra không chỉ chính xác mà còn có thể xác minh một cách minh bạch, do đó tăng cường sự tin cậy và an toàn trong các ứng dụng thực tế của chúng.
Xem thêm: mua tài khoản Chat GPT Plus chính hãng giá rẻ duy nhất ngày hôm nay