AI và hiệu quả

Chúng tôi đang công bố một phân tích cho thấy rằng kể từ năm 2012, lượng tính toán cần thiết để đào tạo một mạng nơ-ron đạt cùng hiệu suất trên phân loại ImageNet đã giảm đi gấp đôi sau mỗi 16 tháng. So với năm 2012, hiện nay cần ít hơn 44 lần lượng tính toán để đào tạo một mạng nơ-ron đạt đến mức của AlexNet (ngược lại, Định luật Moore sẽ mang lại mức cải thiện chi phí gấp 11 lần trong giai đoạn này). Kết quả của chúng tôi cho thấy rằng đối với các tác vụ AI có mức đầu tư gần đây cao, tiến trình thuật toán đã mang lại nhiều lợi ích hơn so với hiệu quả phần cứng cổ điển.

Cải tiến thuật toán là yếu tố chính thúc đẩy sự tiến bộ của AI. Điều quan trọng là phải tìm kiếm các biện pháp làm sáng tỏ tiến trình thuật toán tổng thể, mặc dù điều này khó hơn việc đo lường các xu hướng như vậy trong tính toán. 

Tổng lượng tính toán tính bằng teraflops/giây-ngày được sử dụng để đào tạo hiệu suất ở mức AlexNet. Điểm tính toán thấp nhất tại bất kỳ thời điểm nào được hiển thị bằng màu xanh lam, tất cả các điểm được đo được hiển thị bằng màu xám.

Đo lường hiệu quả

Hiệu quả thuật toán có thể được định nghĩa là giảm lượng tính toán cần thiết để đào tạo một khả năng cụ thể. Hiệu quả là cách chính mà chúng ta đo lường tiến trình thuật toán trên các vấn đề khoa học máy tính cổ điển như sắp xếp. Hiệu quả tăng lên trên các vấn đề truyền thống như sắp xếp dễ đo lường hơn so với trong ML vì chúng có thước đo rõ ràng hơn về độ khó của nhiệm vụ. Tuy nhiên, chúng ta có thể áp dụng lăng kính hiệu quả vào máy học bằng cách giữ hiệu suất không đổi. Xu hướng hiệu quả có thể được so sánh trên các miền như giải trình tự DNA (nhân đôi sau 10 tháng), năng lượng mặt trời (nhân đôi sau 6 năm) và mật độ bóng bán dẫn (nhân đôi sau 2 năm).

Đối với phân tích của mình, chúng tôi chủ yếu tận dụng các triển khai lại mã nguồn mở để đo lường tiến trình về hiệu suất cấp độ AlexNet trong một khoảng thời gian dài. Chúng tôi đã thấy tốc độ cải thiện hiệu quả đào tạo tương tự đối với hiệu suất cấp độ ResNet-50 trên ImageNet (thời gian nhân đôi 17 tháng). Chúng tôi đã thấy tốc độ cải thiện nhanh hơn trong các khoảng thời gian ngắn hơn trong Translation, Go và Dota 2:

+ Trong bản dịch, Transformer đã vượt qua hiệu suất của seq2seq khi dịch từ tiếng Anh sang tiếng Pháp trên WMT'14 với khối lượng tính toán đào tạo ít hơn 61 lần sau 3 năm.

+ Chúng tôi ước tính AlphaZero cần ít hơn 8 lần khả năng tính toán để đạt được hiệu suất như AlphaGoZero sau 1 năm.

+ OpenAI Five Rerun yêu cầu ít hơn 5 lần tính toán đào tạo để vượt qua OpenAI Five (đã đánh bại nhà vô địch thế giới, OG (mở trong cửa sổ mới)) 3 tháng sau.

Có thể hữu ích khi nghĩ về tính toán năm 2012 không bằng tính toán năm 2019 theo cách tương tự như đô la cần được điều chỉnh theo lạm phát theo thời gian. Một lượng tính toán cố định có thể hoàn thành nhiều việc hơn vào năm 2019 so với năm 2012. Một cách để nghĩ về điều này là một số loại nghiên cứu AI tiến triển theo hai giai đoạn, tương tự như mô hình phát triển "tick tock" được thấy trong chất bán dẫn; các khả năng mới ("tick") thường đòi hỏi một lượng chi phí tính toán đáng kể để có được, sau đó các phiên bản tinh chỉnh của các khả năng đó ("tock") trở nên hiệu quả hơn nhiều khi triển khai do cải tiến quy trình.

Sự gia tăng hiệu quả thuật toán cho phép các nhà nghiên cứu thực hiện nhiều thí nghiệm quan tâm hơn trong một khoảng thời gian và tiền bạc nhất định. Ngoài việc là thước đo tiến độ chung, hiệu quả thuật toán còn tăng tốc nghiên cứu AI trong tương lai theo cách tương tự như có nhiều khả năng tính toán hơn.

Các biện pháp khác về tiến trình AI

Ngoài hiệu quả, nhiều biện pháp khác làm sáng tỏ tiến trình thuật toán tổng thể trong AI. Chi phí đào tạo tính bằng đô la có liên quan, nhưng ít tập trung hẹp hơn vào tiến trình thuật toán vì nó cũng bị ảnh hưởng bởi sự cải thiện trong phần cứng cơ bản, việc sử dụng phần cứng và cơ sở hạ tầng đám mây. Hiệu quả mẫu là chìa khóa khi chúng ta ở chế độ dữ liệu thấp, đây là trường hợp của nhiều tác vụ quan tâm. Khả năng đào tạo các mô hình nhanh hơn cũng tăng tốc nghiên cứu và có thể được coi là thước đo khả năng song song hóa của các khả năng học tập quan tâm. Chúng tôi cũng thấy sự gia tăng hiệu quả suy luận về thời gian GPU, các tham số và flops có ý nghĩa, nhưng chủ yếu là do tác động kinh tế của chúng chứ không phải tác động của chúng đến tiến trình nghiên cứu trong tương lai. Shufflenet đạt được hiệu suất ở cấp độ AlexNet với mức tăng hiệu quả suy luận 18 lần trong 5 năm (thời gian nhân đôi 15 tháng), điều này cho thấy hiệu quả đào tạo và hiệu quả suy luận có thể cải thiện ở tốc độ tương tự. Việc tạo ra các tập dữ liệu/môi trường/điểm chuẩn là một phương pháp mạnh mẽ giúp đo lường các khả năng AI cụ thể cần quan tâm.

Những hạn chế chính

+ Chúng tôi chỉ có một số ít điểm dữ liệu về hiệu quả thuật toán trên một vài nhiệm vụ. Không rõ mức độ mà các xu hướng hiệu quả mà chúng tôi đã quan sát được khái quát hóa cho các nhiệm vụ AI khác. Đo lường có hệ thống có thể làm rõ liệu có tồn tại một thuật toán tương đương với Định luật của Moore trong lĩnh vực AI hay không và nếu có, hãy làm rõ bản chất của nó. Chúng tôi coi đây là một câu hỏi mở rất thú vị. Chúng tôi nghi ngờ rằng chúng tôi có nhiều khả năng quan sát thấy tốc độ tiến triển hiệu quả tương tự trên các nhiệm vụ tương tự. Khi nói đến các nhiệm vụ tương tự, chúng tôi muốn nói đến các nhiệm vụ trong các tiểu lĩnh vực AI này, mà lĩnh vực này đồng ý rằng chúng tôi đã thấy tiến triển đáng kể và có mức đầu tư tương đương (thời gian tính toán và/hoặc thời gian nghiên cứu).

+ Mặc dù chúng tôi tin rằng AlexNet đại diện cho rất nhiều tiến bộ, nhưng phân tích này không cố gắng định lượng tiến bộ đó. Nói chung, lần đầu tiên một khả năng được tạo ra, các đột phá về thuật toán có thể đã giảm các nguồn lực cần thiết từ hoàn toàn không khả thi xuống chỉ còn cao. Chúng tôi cho rằng các khả năng mới thường đại diện cho một phần lớn hơn của tiến bộ khái niệm tổng thể so với các mức tăng hiệu quả được quan sát thấy theo loại được hiển thị ở đây.

+ Phân tích này tập trung vào chi phí chạy đào tạo cuối cùng cho một mô hình được tối ưu hóa thay vì tổng chi phí phát triển. Một số cải tiến thuật toán giúp đào tạo mô hình dễ dàng hơn bằng cách làm cho không gian của các siêu tham số sẽ đào tạo ổn định và có hiệu suất cuối cùng tốt lớn hơn nhiều. Mặt khác, tìm kiếm kiến ​​trúc làm tăng khoảng cách giữa chi phí chạy đào tạo cuối cùng và tổng chi phí đào tạo.

+ Chúng tôi không suy đoán về mức độ mà chúng tôi mong đợi xu hướng hiệu quả sẽ mở rộng theo thời gian, chúng tôi chỉ trình bày kết quả và thảo luận về những tác động nếu xu hướng này vẫn tiếp diễn.

Chính sách đo lường và AI

Chúng tôi tin rằng việc hoạch định chính sách liên quan đến AI sẽ được cải thiện bằng cách tập trung nhiều hơn vào việc đo lường và đánh giá các hệ thống AI, cả về mặt thuộc tính kỹ thuật và tác động xã hội. Chúng tôi nghĩ rằng các sáng kiến ​​đo lường như vậy có thể làm sáng tỏ những câu hỏi quan trọng trong chính sách; phân tích AI và Compute của chúng tôi  cho thấy các nhà hoạch định chính sách nên tăng tài trợ cho các nguồn lực tính toán cho học viện, để nghiên cứu học thuật có thể sao chép, tái tạo và mở rộng nghiên cứu trong ngành. Phân tích hiệu quả này cho thấy các nhà hoạch định chính sách có thể phát triển trực giác chính xác về chi phí triển khai các khả năng AI—và cách các chi phí này sẽ thay đổi theo thời gian—bằng cách đánh giá chặt chẽ hơn tốc độ cải thiện hiệu quả cho các hệ thống AI.

Theo dõi hiệu quả tiến về phía trước

Nếu tính toán quy mô lớn tiếp tục đóng vai trò quan trọng trong việc đạt được hiệu suất tổng thể ở mức hiện đại (SOTA) trong các lĩnh vực như ngôn ngữ và trò chơi thì điều quan trọng là phải nỗ lực đo lường tiến độ đáng kể đạt được với lượng tính toán nhỏ hơn (thường do các tổ chức học thuật thực hiện). Các mô hình đạt được hiệu quả đào tạo ở mức hiện đại về khả năng có ý nghĩa là những ứng cử viên đầy hứa hẹn để mở rộng quy mô và có khả năng đạt được hiệu suất cao nhất tổng thể. Ngoài ra, việc tìm ra những cải tiến về hiệu quả thuật toán là đơn giản vì chúng chỉ là một phần đặc biệt có ý nghĩa của các đường cong học tập mà tất cả các thử nghiệm tạo ra.

Chúng tôi cũng nghĩ rằng việc đo lường xu hướng dài hạn trong SOTA hiệu quả sẽ giúp vẽ nên bức tranh định lượng về tiến trình thuật toán tổng thể. Chúng tôi quan sát thấy rằng phần cứng và hiệu quả thuật toán tăng theo cấp số nhân và có thể ở quy mô tương tự trên các chân trời có ý nghĩa, điều này cho thấy một mô hình tốt về tiến trình AI nên tích hợp các biện pháp từ cả hai.

Kết quả của chúng tôi cho thấy rằng đối với các tác vụ AI có mức đầu tư cao (thời gian nghiên cứu và/hoặc tính toán), hiệu quả thuật toán có thể vượt xa mức tăng từ hiệu quả phần cứng (Định luật Moore). Định luật Moore được đưa ra vào năm 1965 khi mạch tích hợp chỉ có 64 bóng bán dẫn (6 lần nhân đôi) và ngây thơ suy rộng ra máy tính cá nhân và điện thoại thông minh dự đoán (iPhone 11 có 8,5 tỷ bóng bán dẫn). Nếu chúng ta quan sát thấy nhiều thập kỷ cải thiện theo cấp số nhân về hiệu quả thuật toán của AI, điều đó có thể dẫn đến điều gì? Chúng tôi không chắc chắn. Việc những kết quả này khiến chúng ta đặt ra câu hỏi này là một bản cập nhật khiêm tốn cho chúng ta hướng tới tương lai với các dịch vụ và công nghệ AI mạnh mẽ.

Vì tất cả những lý do này, chúng tôi sẽ bắt đầu theo dõi các SOTA hiệu quả một cách công khai. Chúng tôi sẽ bắt đầu với các chuẩn mực về hiệu quả về tầm nhìn và dịch thuật (ImageNet và WMT14), và chúng tôi sẽ cân nhắc thêm nhiều chuẩn mực hơn theo thời gian. Chúng tôi tin rằng có các SOTA hiệu quả trên các chuẩn mực này mà chúng tôi không biết và khuyến khích cộng đồng nghiên cứu gửi  chúng ở đây(mở trong cửa sổ mới) (chúng tôi sẽ ghi rõ nguồn tác giả và cộng tác viên gốc).

Các nhà lãnh đạo ngành, nhà hoạch định chính sách, nhà kinh tế và các nhà nghiên cứu tiềm năng đều đang cố gắng hiểu rõ hơn về tiến trình AI và quyết định mức độ chú ý mà họ nên đầu tư và hướng sự chú ý đó vào đâu. Các nỗ lực đo lường có thể giúp đưa ra các quyết định như vậy. Nếu bạn quan tâm đến loại công việc này,  hãy cân nhắc nộp đơn xin  làm việc tại nhóm Foresight hoặc Policy của OpenAI!

Xem thêm: mua tài khoản ChatGPT Plus chính hãng giá rẻ

Hot Deal

Họ tên (*)

Số điện thoại (*)

Email (*)

Dịch vụ

Đăng ký để nhận bản tin mới nhất !