Anthropic ra mắt chiến lược Advisor: Opus làm cố vấn kết hợp với Sonnet để thực thi, hiệu suất tăng và chi phí giảm 12%

ChainNewsAbmedia

Anthropic đã công bố vào ngày 9 tháng 4 việc chính thức đưa “Advisor strategy” vào Claude Platform. Giờ đây, nhà phát triển có thể để Opus đảm nhiệm vai trò cố vấn thông qua Messages API, kết hợp Sonnet hoặc Haiku làm người thực thi, đạt được mức hiệu suất trí tuệ gần tương đương Opus trong một lần gọi API, đồng thời giảm đáng kể chi phí. Tính năng này hiện đang được cung cấp dưới dạng bản thử nghiệm công khai.

Cơ chế hoạt động: Khi người thực thi gặp phải các vấn đề khó khăn, sẽ tự động tham vấn Opus

Khái niệm cốt lõi của Advisor strategy là tách rời suy luận và thực thi. Sau khi nhà phát triển thêm công cụ advisor vào lệnh gọi Messages API, khi agent Sonnet hoặc Haiku trong quá trình thực hiện nhiệm vụ gặp quyết định khó khăn, nó sẽ tự động hỏi Opus để lấy các gợi ý lập kế hoạch, rồi tiếp tục thực thi. Toàn bộ quá trình diễn ra trong một yêu cầu API duy nhất, không cần nhà phát triển sắp xếp thêm.

Cấu trúc này tương tự cách phân công giữa một cố vấn cấp cao và người thực thi trong một nhóm — Opus chịu trách nhiệm cho các phán đoán chiến lược cấp cao, còn Sonnet hoặc Haiku phụ trách thao tác thực tế; hai bên phối hợp trong cùng một luồng công việc.

Thực nghiệm: Hiệu năng tăng và chi phí thấp hơn

Theo dữ liệu đánh giá mà Anthropic công bố, trong bài kiểm tra chuẩn SWE-bench Multilingual, hiệu suất của Sonnet khi kết hợp với Opus advisor cao hơn 2,7 điểm phần trăm so với việc chỉ dùng riêng Sonnet, trong khi chi phí cho mỗi nhiệm vụ lại giảm 11,9%.

Nguyên nhân chi phí giảm là vì phần lớn nhiệm vụ vẫn được xử lý bởi Sonnet hoặc Haiku có chi phí thấp hơn; Opus chỉ được gọi tại các điểm quyết định then chốt, qua đó tránh việc sử dụng Opus trong suốt toàn bộ quá trình và phải trả phí cao.

Ý nghĩa đối với nhà phát triển

Advisor strategy mang đến cho các nhà phát triển xây dựng AI agent một lựa chọn cân bằng chi phí-hiệu năng mới. Trước đây, nhà phát triển phải chọn giữa “dùng Opus cho toàn bộ quá trình nhưng chi phí cao” hoặc “dùng Sonnet cho toàn bộ quá trình nhưng có thể sai khi gặp vấn đề phức tạp”. Giờ đây, có thể tận dụng ưu điểm của cả hai thông qua kiến trúc lai.

Cộng đồng phản ứng rất sôi nổi, và một số nhà phát triển ví nó như “đường dây sinh mệnh để gọi cầu cứu” trong chương trình dành cho triệu phú — người thực thi làm việc độc lập thường ngày, và chỉ khi gặp đúng bài toán khó mới tìm đến cao thủ để được trợ giúp.

Bài viết “Anthropic ra mắt Advisor strategy: Opus làm cố vấn kết hợp Sonnet thực thi, nâng hiệu năng và giảm chi phí 12%” xuất hiện sớm nhất trên Tin tức chuỗi ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Báo cáo thường niên của Google cho biết Gemini thực hiện chặn theo mili giây, chặn 99% quảng cáo lừa đảo

Bài viết thảo luận cách Google tăng cường an toàn quảng cáo thông qua hệ thống trí tuệ nhân tạo tạo sinh Gemini của mình; báo cáo cho thấy tốc độ của việc chặn các quảng cáo vi phạm đã được rút ngắn xuống còn mili giây, với tỷ lệ chặn đạt 99%. Năm ngoái, Google đã gỡ 8,3 tỷ lượt quảng cáo và tạm dừng 24,9 triệu tài khoản, cho thấy số lượng quảng cáo lừa đảo đã tăng mạnh. Các chuyên gia cho biết, đây là cuộc đối đầu giữa trí tuệ nhân tạo và trí tuệ nhân tạo; trong tương lai vẫn cần đối mặt với những thách thức do AI mang lại về các hành vi hợp pháp và bất hợp pháp.

ChainNewsAbmedia33phút trước

Đồng sáng lập Ethereum Lubin: AI sẽ là bước ngoặt then chốt cho crypto, nhưng độc quyền của các gã khổng lồ công nghệ tạo ra rủi ro mang tính hệ thống

Đồng sáng lập Ethereum Joseph Lubin nhấn mạnh tiềm năng mang tính đột phá của AI đối với lĩnh vực tiền mã hóa, đồng thời cảnh báo về các rủi ro của việc tập trung hóa giữa các gã khổng lồ công nghệ. Ông hình dung các giao dịch tự động do AI thúc đẩy trên blockchain và nhấn mạnh sự hội tụ giữa tài chính truyền thống với DeFi.

GateNews2giờ trước

Elon Musk Thúc Đẩy Các Khoản Chi Trả “Thu Nhập Cao Phổ Quát” như Giải Pháp Tối Ưu Cho Tình Trạng Thất Nghiệp Do AI

Elon Musk ủng hộ Thu nhập cao phổ quát (Universal High Income) để chống lại nạn thất nghiệp do AI gây ra, hình dung về một tương lai với hàng hóa dồi dào và lạm phát bằng không. Ngược lại, các chuyên gia như Sam Altman lại lo ngại về việc mất việc làm và đề xuất các biện pháp bảo vệ cho người lao động.

Coinpedia2giờ trước

据称DeepSeek启动首轮对外融资,目标估值超$10B,并计划筹集$300M+

DeepSeek,一家中国AI初创公司,正在洽谈其首轮对外融资,目标是在$300 百万的融资规模下,估值达到$10 十亿。尽管此前曾拒绝过投资邀约,但据称其融资讨论如今已展开。

GateNews3giờ trước

Quảng cáo ChatGPT mở rộng sang Úc và New Zealand: người dùng Free và Go dùng trước, các gói trả phí vẫn không có quảng cáo

OpenAI vào ngày 17 tháng 4 năm 2023 đã mở rộng quảng cáo ChatGPT tới Úc, New Zealand và Canada, dành cho người dùng Free và Go; người dùng trả phí không có quảng cáo. Động thái này đánh dấu con đường thứ hai của thương mại hóa AI, đồng thời cân nhắc rủi ro về kinh doanh và quy định; việc hiển thị quảng cáo có thể thúc đẩy chuyển đổi sang trả phí.

ChainNewsAbmedia5giờ trước

Hyundai Motor Group Tái Cơ Cấu Xung Quanh AI và Robot, Nhắm Tới 30.000 Robot Atlas vào năm 2030

Tập đoàn Hyundai Motor đang tái cơ cấu để tập trung vào AI và robot, đồng thời cắt giảm các hoạt động truyền thống. Tập đoàn dự kiến đầu tư 34,3 tỷ USD vào robot đến năm 2030 và hướng tới việc ra mắt mô hình robot-as-a-service, hợp tác với Google DeepMind và NVIDIA.

GateNews8giờ trước
Bình luận
0/400
Không có bình luận