zalo
Chat ngay

Khám phá những chi tiết nhỏ của hệ thống phụ trợ

Christian Gibson là kỹ sư của nhóm Siêu máy tính tại OpenAI

Điều gì đầu tiên khiến bạn hứng thú với kỹ thuật?

Tôi may mắn khi khám phá ra lập trình từ khi còn nhỏ và sử dụng điều đó như một cánh cổng để khám phá các chủ đề khác. Khi học trung học, một người bạn đã giới thiệu cho tôi hương vị đặc biệt của ngôn ngữ lập trình BASIC đi kèm với máy tính Texas Instruments (mã của tôi có thể dự đoán là không thể bảo trì được do hạn chế 27 biến một chữ cái cho mỗi chương trình và phụ thuộc nhiều vào các câu lệnh GOTO). Tuy nhiên, chúng tôi đã tạo ra một số chương trình đơn giản, như trò chơi phiêu lưu dựa trên văn bản, ứng dụng trò chuyện cho máy tính được liên kết và công cụ hỗ trợ công thức bậc hai thông thường.

Sau đó, tôi viết những chương trình phức tạp hơn: một trình trợ giúp trực quan để minh họa phương pháp của Newton và một máy tính quỹ đạo để ước tính vị trí của các hành tinh và mặt trăng của chúng, đã thu hút sự chú ý của câu lạc bộ Linux của trường tôi. Chẳng mấy chốc, tôi đã vật lộn với NDISwrapper để cố gắng làm cho bộ điều hợp WiFi dựa trên CardBus của máy tính xách tay của tôi hoạt động và làm cho các cửa sổ máy tính để bàn của tôi sáng lên với Compiz! Mô hình khám phá thông qua mã đó tiếp tục trong suốt thời trung học và sau đó, dẫn đến sự quan tâm đến kỹ thuật của tôi ngày hôm nay.

Điều gì khiến bạn đến với OpenAI?

Ở công việc trước, tôi đã chuyển từ vai trò backend sang vị trí full-stack, chỉ để thấy chán ghét công việc frontend và thiết kế UX. Tôi muốn chuyển về vai trò gần hơn với hệ thống backend và nhớ sự tương tác với môi trường Linux mà tôi đã thích trong học viện. OpenAI đã cung cấp sự thay đổi trong công việc mà tôi đang tìm kiếm và hơn thế nữa; bạn sẽ khó có thể tìm được sự phù hợp hơn với những gì tôi đang tìm kiếm ngoài việc làm việc trên các cụm siêu máy tính của OpenAI.

Bạn tập trung giải quyết những vấn đề nào tại OpenAI?

Quy trình làm việc AI khám phá vốn có tốc độ nhanh; các nhà nghiên cứu muốn có thể lấy bản in trước từ arXiv và thử nghiệm các phương pháp tiếp cận mới mà không bị cản trở bởi nền tảng mà họ đang tung ra mã của mình. Chúng cũng cực kỳ phức tạp, với các nhà nghiên cứu hành xử giống như các nhà toán học - dựa vào trực giác mà họ đã xây dựng trong suốt sự nghiệp của mình để thiết kế một giải pháp giải quyết bất kỳ vấn đề nào lọt vào mắt họ trong tuần này. Thực tế là các thời gian chạy này đang thực hiện trên một số siêu máy tính lớn nhất thế giới lại tạo thêm một lớp phức tạp nữa và nhóm của tôi sẽ tham gia xử lý lớp áp chót đó. Chúng tôi làm việc để ngăn chặn các nhu cầu nghiên cứu trước khi chúng cản trở tiến độ và nếu không, chúng tôi sẽ làm việc với các nhóm nghiên cứu để xác định các điểm nghẽn và triển khai các giải pháp thay thế nhanh nhất có thể.

Theo bạn, điều gì tạo nên sự khác biệt khi làm việc trên siêu máy tính tại OpenAI so với những nơi khác?

Quy mô tuyệt đối mà chúng tôi hoạt động, thành thật mà nói, là đáng kinh ngạc. Các nhà cung cấp phần cứng của bên thứ ba thường xuyên tâm sự rằng chúng tôi đang gặp phải những vấn đề mà họ chưa từng thấy trước đây. Thường thì điều này chỉ đơn giản là vì các cài đặt của chúng tôi có nhiều phần cứng hơn được nhét vào một siêu máy tính liền kề duy nhất so với các máy khách khác của họ, mặc dù đôi khi đó là hậu quả của kỳ vọng về hiệu suất của chúng tôi. Bản chất đồng bộ của hầu hết các phương pháp đào tạo mô hình dẫn đến một cấu hình mà toàn bộ cụm thực sự chạy ở tốc độ của nút chậm nhất.

Các mô hình nổi bật nhất của chúng tôi được đào tạo trên các siêu máy tính trị giá hàng tỷ đô la và kết quả là chúng tôi phải truy tìm các sự suy giảm hiệu suất mà hầu hết những người khác sẽ bỏ qua. Thật thú vị khi thấy một thay đổi như một dòng tác động đến hạt nhân chính, biết rằng nó sẽ tiết kiệm được ~6 ngày tính toán trên toàn bộ đội tàu của chúng tôi mỗi tuần hoặc thấy một mục dòng trên bản phát hành trình điều khiển mới, biết rằng đó là một trong những khám phá của chúng tôi dẫn đến bản sửa lỗi hiện đã được đưa lên thượng nguồn.

Một ngày bình thường của bạn tại OpenAI diễn ra như thế nào?

Ngày làm việc của tôi thường bao gồm một số công việc kết hợp giữa làm việc trên mã, điều tra các vấn đề và tham dự các cuộc họp. Các cuộc họp chiếm phần lớn thời gian vào thứ Ba của tôi (và thường chỉ vào thứ Ba, may mắn thay), và phần còn lại của tuần được chia thành gỡ lỗi và mã hóa. Các vấn đề được xác định thường trở thành công việc mã hóa, ví dụ, viết tài liệu thiết kế, đẩy bản sửa lỗi nhanh lên nhánh PR hoặc thêm logic kiểm tra tình trạng thụ động để loại bỏ phần cứng không phù hợp khỏi các cụm của chúng tôi.

Đào sâu vào các vấn đề đòi hỏi một chút công việc thám tử. Tác động của nghiên cứu thay đổi từ mơ hồ ("công việc của tôi có vẻ như đang chạy chậm hơn so với ngày hôm qua") đến cụ thể đáng sợ ("Tôi nghĩ nếu tôi đẩy hơn 30Gbps qua Ethernet NIC, tôi sẽ gây ra sự hoảng loạn hạt nhân?"). Đây có thể là một sự kết hợp quen thuộc: hiệu quả vào những ngày diễn ra như mong đợi và thú vị khi những gì mong đợi bị gián đoạn và bạn có cơ hội học được điều gì đó mới.

“OpenAI mang đến cơ hội đào sâu vào các khía cạnh của điện toán bị bỏ qua ở nơi khác.”

Điều gì tiếp thêm năng lượng cho bạn mỗi ngày?

Tôi hiếm khi đến làm việc mà không có việc gì đó quan trọng cần làm, và tôi thường biết nhóm, dự án và nhà nghiên cứu cụ thể nào được hưởng lợi từ việc hoàn thành đúng hạn một nhiệm vụ. OpenAI là công ty tuyển dụng lớn nhất mà tôi từng làm việc và việc đánh giá ngay lập tức tác động của công việc của tôi là rất quan trọng đối với động lực hàng ngày của tôi. Tôi cũng thích khám phá những chi tiết nhỏ nhặt của hệ thống. OpenAI không phải là công ty tuyển dụng đầu tiên tôi làm việc về hệ thống phụ trợ, nhưng đây là lần đầu tiên tôi làm việc trong không gian HPC.

Các công nghệ mà chúng tôi làm việc thường tồn tại hoàn toàn do các mối quan tâm về hiệu suất được thiết kế riêng cho không gian này. Tôi không cần phải lo lắng về cấu trúc vật lý của phần cứng của chúng tôi tại các công ty trước đây—ví dụ, đảm bảo rằng giao tiếp diễn ra trong cùng một miền NUMA hoặc GPU sử dụng thiết bị NVME hoặc InfiniBand đồng vị trí thông qua GPUDirect của Nvidia hoặc các quy trình hệ thống được ghim vào các CPU cụ thể để tránh xung đột hàng xóm ồn ào với thời gian chạy nghiên cứu. OpenAI cung cấp cơ hội để đào sâu vào các khía cạnh của điện toán bị bỏ qua ở nơi khác, điều này khiến tôi luôn hứng thú với nhiệm vụ trong tầm tay.

Bạn tìm cảm hứng ở đâu?

Không gì truyền cảm hứng bằng việc xem các nhóm nghiên cứu của chúng tôi tiến triển trong việc cải thiện các mô hình của họ. Nhiều nhóm thiết lập bot Slack hoặc sân chơi đơn giản nơi bạn có thể tương tác và thử nghiệm các mô hình vẫn đang được phát triển, cho phép bạn xem các mô hình cải thiện khi quá trình đào tạo tiếp tục!

Tôi cũng sử dụng Slackmoji phổ biến :meow_party: để gắn thẻ nội dung truyền cảm hứng hoặc thúc đẩy động lực từ nhiều kênh Slack khác nhau của chúng tôi. Kể từ khi tham gia vào giữa năm 2020, tôi đã có hơn 400 bài đăng được gắn thẻ :meow_party:, trung bình gần 4 bài mỗi tuần!

Xem thêm: mua tài khoản ChatGPT Plus chính hãng giá rẻ với nhiều ưu đãi đặc biệt

Hot Deal

Họ tên (*)

Số điện thoại (*)

Email (*)

Dịch vụ

Đăng ký để nhận bản tin mới nhất !