0965 636 913
Chat ngay

GPT-4o mini: nâng cao hiệu quả thông minh về mặt chi phí

Giới thiệu mô hình nhỏ tiết kiệm chi phí nhất của chúng tôi

OpenAI cam kết làm cho trí thông minh có thể tiếp cận rộng rãi nhất có thể. Hôm nay, chúng tôi công bố GPT-4o mini, mô hình nhỏ tiết kiệm chi phí nhất của chúng tôi. Chúng tôi hy vọng GPT-4o mini sẽ mở rộng đáng kể phạm vi ứng dụng được xây dựng bằng AI bằng cách làm cho trí thông minh trở nên hợp túi tiền hơn nhiều. GPT-4o mini đạt 82% trên MMLU và hiện vượt trội hơn GPT-4 về sở thích trò chuyện trong bảng xếp hạng LMSYS(mở trong cửa sổ mới). Giá của nó là 15 cent cho một triệu token đầu vào và 60 cent cho một triệu token đầu ra, rẻ hơn rất nhiều so với các mẫu frontier trước đây và rẻ hơn 60% so với GPT-3.5 Turbo.

GPT-4o mini cho phép thực hiện nhiều tác vụ với chi phí và độ trễ thấp, chẳng hạn như các ứng dụng nối tiếp hoặc song song hóa nhiều lệnh gọi mô hình (ví dụ: gọi nhiều API), truyền khối lượng lớn ngữ cảnh cho mô hình (ví dụ: toàn bộ cơ sở mã hoặc lịch sử hội thoại) hoặc tương tác với khách hàng thông qua phản hồi văn bản nhanh, thời gian thực (ví dụ: chatbot hỗ trợ khách hàng). 

Ngày nay, GPT-4o mini hỗ trợ văn bản và tầm nhìn trong API, với hỗ trợ cho đầu vào và đầu ra văn bản, hình ảnh, video và âm thanh trong tương lai. Mô hình có cửa sổ ngữ cảnh là 128K token, hỗ trợ tối đa 16K token đầu ra cho mỗi yêu cầu và có kiến ​​thức đến tháng 10 năm 2023. Nhờ bộ mã thông báo được cải tiến được chia sẻ với GPT-4o, việc xử lý văn bản không phải tiếng Anh hiện thậm chí còn hiệu quả hơn về mặt chi phí.

Một mô hình nhỏ với trí thông minh văn bản vượt trội và lý luận đa phương thức

GPT-4o mini vượt trội hơn GPT-3.5 Turbo và các mô hình nhỏ khác về điểm chuẩn học thuật trên cả trí thông minh văn bản và lý luận đa phương thức, và hỗ trợ cùng phạm vi ngôn ngữ như GPT-4o. Nó cũng chứng minh hiệu suất mạnh mẽ trong việc gọi hàm, có thể cho phép các nhà phát triển xây dựng các ứng dụng truy xuất dữ liệu hoặc thực hiện hành động với các hệ thống bên ngoài và cải thiện hiệu suất ngữ cảnh dài so với GPT-3.5 Turbo.

GPT-4o mini đã được đánh giá qua một số tiêu chuẩn quan trọng 2 .

Nhiệm vụ suy luận: GPT-4o mini tốt hơn các mô hình nhỏ khác trong các nhiệm vụ suy luận liên quan đến cả văn bản và thị giác, đạt 82,0% trên MMLU, một chuẩn mực về trí thông minh và lý luận văn bản, so với 77,9% của Gemini Flash và 73,8% của Claude Haiku.

Khả năng toán học và lập trình: GPT-4o mini vượt trội trong các tác vụ lập luận toán học và lập trình, vượt trội hơn các mô hình nhỏ trước đây trên thị trường. Trên MGSM, đo lường khả năng lập luận toán học, GPT-4o mini đạt 87,0%, so với 75,5% của Gemini Flash và 71,7% của Claude Haiku. GPT-4o mini đạt 87,2% trên HumanEval, công cụ đo hiệu suất lập trình, so với 71,5% của Gemini Flash và 75,9% của Claude Haiku.  

Suy luận đa phương thức: GPT-4o mini cũng cho thấy hiệu suất mạnh mẽ trên MMMU, một đánh giá suy luận đa phương thức, đạt 59,4% so với 56,1% của Gemini Flash và 50,2% của Claude Haiku.

Điểm đánh giá mô hình

Là một phần của quy trình phát triển mô hình, chúng tôi đã làm việc với một số đối tác đáng tin cậy để hiểu rõ hơn về các trường hợp sử dụng và hạn chế của GPT-4o mini. Chúng tôi đã hợp tác với các công ty như Ramp(mở trong cửa sổ mới) và Siêu nhân (mở trong cửa sổ mới) người nhận thấy GPT-4o mini hoạt động tốt hơn đáng kể so với GPT-3.5 Turbo đối với các tác vụ như trích xuất dữ liệu có cấu trúc từ tệp biên lai hoặc tạo phản hồi email chất lượng cao khi được cung cấp lịch sử luồng.

Các biện pháp an toàn tích hợp

Sự an toàn được xây dựng vào các mô hình của chúng tôi ngay từ đầu và được củng cố ở mọi bước trong quá trình phát triển của chúng tôi. Trong quá trình đào tạo trước, chúng tôi lọc ra (mở trong cửa sổ mới)thông tin mà chúng tôi không muốn mô hình của mình học hỏi hoặc đưa ra, chẳng hạn như lời nói thù địch, nội dung dành cho người lớn, các trang web chủ yếu tổng hợp thông tin cá nhân và thư rác. Trong quá trình đào tạo sau, chúng tôi căn chỉnh hành vi của mô hình theo chính sách của mình bằng các kỹ thuật như học tăng cường với phản hồi của con người (RLHF) để cải thiện độ chính xác và độ tin cậy của phản hồi của mô hình.

GPT-4o mini có cùng các biện pháp giảm thiểu an toàn được tích hợp sẵn như GPT-4o, mà chúng tôi đã đánh giá cẩn thận bằng cả đánh giá tự động và đánh giá của con người theo Khung chuẩn bị của chúng tôi và phù hợp với các cam kết tự nguyện của chúng tôi . Hơn 70 chuyên gia bên ngoài trong các lĩnh vực như tâm lý xã hội và thông tin sai lệch đã thử nghiệm GPT-4o để xác định các rủi ro tiềm ẩn, mà chúng tôi đã giải quyết và có kế hoạch chia sẻ thông tin chi tiết trong thẻ hệ thống GPT-4o sắp tới và bảng điểm Chuẩn bị. Những hiểu biết sâu sắc từ các đánh giá của chuyên gia này đã giúp cải thiện tính an toàn của cả GPT-4o và GPT-4o mini.

Dựa trên những bài học này, nhóm của chúng tôi cũng đã làm việc để cải thiện tính an toàn của GPT-4o mini bằng cách sử dụng các kỹ thuật mới được nghiên cứu của chúng tôi cung cấp. GPT-4o mini trong API là mô hình đầu tiên áp dụng hệ thống phân cấp hướng dẫn của chúng tôi (mở trong cửa sổ mới) phương pháp này giúp cải thiện khả năng chống bẻ khóa, tiêm mã độc và trích xuất mã độc của hệ thống của mô hình. Điều này làm cho phản hồi của mô hình đáng tin cậy hơn và giúp sử dụng an toàn hơn trong các ứng dụng ở quy mô lớn.

Chúng tôi sẽ tiếp tục theo dõi cách GPT-4o mini được sử dụng và cải thiện tính an toàn của mô hình khi xác định được những rủi ro mới.

Tính khả dụng và giá cả

GPT-4o mini hiện có sẵn dưới dạng mô hình văn bản và tầm nhìn trong API Trợ lý, API Hoàn thành trò chuyện và API Batch. Các nhà phát triển trả 15 xu cho mỗi 1 triệu mã thông báo đầu vào và 60 xu cho mỗi 1 triệu mã thông báo đầu ra (tương đương khoảng 2500 trang trong một cuốn sách tiêu chuẩn). Chúng tôi có kế hoạch triển khai tinh chỉnh cho GPT-4o mini trong những ngày tới.

Trong ChatGPT, người dùng Free, Plus và Team sẽ có thể truy cập GPT-4o mini bắt đầu từ hôm nay, thay cho GPT-3.5. Người dùng doanh nghiệp cũng sẽ có quyền truy cập bắt đầu từ tuần tới, phù hợp với sứ mệnh của chúng tôi là giúp mọi người đều có thể tiếp cận được lợi ích của AI.

Xem thêm: mua tài khoản Chat GPT Plus chính hãng giá rẻ

Tiếp theo là gì?

Trong vài năm qua, chúng ta đã chứng kiến ​​những tiến bộ đáng kể trong trí thông minh AI kết hợp với việc giảm đáng kể chi phí. Ví dụ, chi phí cho mỗi mã thông báo của GPT-4o mini đã giảm 99% kể từ text-davinci-003, một mô hình kém khả năng hơn được giới thiệu vào năm 2022. Chúng tôi cam kết tiếp tục quỹ đạo này để giảm chi phí trong khi tăng cường khả năng của mô hình.

Chúng tôi hình dung một tương lai mà các mô hình được tích hợp liền mạch trong mọi ứng dụng và trên mọi trang web. GPT-4o mini đang mở đường cho các nhà phát triển xây dựng và mở rộng quy mô các ứng dụng AI mạnh mẽ một cách hiệu quả và tiết kiệm hơn. Tương lai của AI đang trở nên dễ tiếp cận hơn, đáng tin cậy hơn và được nhúng vào các trải nghiệm kỹ thuật số hàng ngày của chúng ta, và chúng tôi rất vui mừng được tiếp tục dẫn đầu.

Họ tên (*)

Số điện thoại (*)

Email (*)

Dịch vụ

Đăng ký để nhận bản tin mới nhất !