OpenAI Phát hành Mô hình AI GPT-5.5 Với Khả năng Sử dụng Máy tính Bản địa

CryptoFrontier

OpenAI chính thức phát hành GPT-5.5 vào ngày 23 tháng 4 năm 2026, một mô hình AI mới được thiết kế để hiểu ý định của người dùng trong các ứng dụng thực tế thông qua khả năng sử dụng máy tính một cách bản địa. Mô hình này có các khả năng bản địa đa dụng cho phép nó điều hướng các ứng dụng máy tính để bàn, nhấp vào các nút và nhập văn bản cho các quy trình làm việc nhiều bước, theo thông báo của OpenAI.

GPT-5.5 kết hợp việc sử dụng máy tính bản địa với khả năng suy luận nâng cao, tự chủ điều hướng các công cụ phần mềm cần thiết cho các tác vụ chuyên nghiệp cấp cao. Cửa sổ ngữ cảnh khoảng ~1,1 triệu token của mô hình cho phép nó xử lý các tập dữ liệu tài chính khổng lồ mà trước đây cần phải chia thủ công thành từng phần. Nhóm tài chính của OpenAI đã sử dụng GPT-5.5 để rà soát 24.771 biểu mẫu thuế K-1 (71.637 trang) và hoàn thành nhiệm vụ nhanh hơn hai tuần so với năm trước.

Các mốc hiệu năng

GPT-5.5 đạt 88,5% trên các tác vụ mô hình hóa đầu tư ngân hàng nội bộ và 60% trên chuẩn FinancialAgent v1.1, vượt GPT-5.4 bốn điểm. Mô hình đạt 84,9% trên GDPval, bài kiểm tra khả năng của các tác nhân trong việc tạo ra công việc tri thức cụ thể trên 44 ngành nghề. Trên OSWorld-Verified, đo lường các thao tác máy tính thực tế tự chủ của mô hình, mô hình đạt 78,7%. GPT-5.5 đạt 98% trên Tau2-bench Telecom, bài kiểm tra các quy trình dịch vụ khách hàng cực kỳ khó khăn.

Một nhân viên của nhóm Go-to-Market xác nhận rằng việc tự động hóa các báo cáo kinh doanh hàng tuần sẽ tiết kiệm khoảng 5-10 giờ làm việc thủ công mỗi tuần.

Tạo mã và Tối ưu hóa Hệ thống

OpenAI báo cáo rằng GPT-5.5 đã được sử dụng để giúp viết mã cho hạ tầng phục vụ của chính họ. Mô hình đạt “System-Level Optimization” bằng cách phân tích các mẫu lưu lượng sản xuất để viết các heuristic cân bằng tải tùy chỉnh, giúp tăng tốc độ tạo token của chính nó lên 20%.

Trong một bài kiểm tra dành cho nhà phát triển, mô hình được yêu cầu “tái cấu trúc một trình soạn thảo markdown” và trả về một ngăn xếp 12-diff gần như hoàn chỉnh với chỉ cần sửa lỗi tối thiểu từ con người. OpenAI lưu ý rằng mô hình mới đạt đáp án đúng trong ít lượt hơn và sử dụng ít hơn 40% token cho các tác vụ Codex tương tự so với GPT-5.4.

Dan Shipper, người sáng lập và CEO của Every, mô tả GPT-5.5 là mô hình mã hóa đầu tiên có “tính rõ ràng khái niệm nghiêm túc”. Shipper đã thử nghiệm GPT-5.5 sau khi anh và kỹ sư giỏi nhất của mình mất nhiều ngày để gỡ lỗi một vấn đề phát sinh sau khi ra mắt trong một ứng dụng. Theo Shipper, GPT-5.5 đã đạt được điều mà GPT-5.4 không làm được: nó xem xét đoạn mã bị hỏng và tạo ra bản viết lại mà cuối cùng kỹ sư đã quyết định chọn. Mô hình có thể “ghi nhớ” và đối chiếu chéo toàn bộ thư viện thông tin mà không bị lạc vị trí, giảm các “ảo giác” vốn gây rắc rối ở những phiên bản trước.

Khả năng tự chủ và Tự hiệu chỉnh

OpenAI khẳng định GPT-5.5 được tối ưu cho “tự hiệu chỉnh” và tính tự chủ. Nó tốt hơn trong việc diễn giải các chỉ dẫn mơ hồ và sử dụng giao diện máy tính (clicking, typing, browsing) để hoàn thành mục tiêu mà không cần can thiệp của con người. Mô hình trở nên đặc biệt hữu ích khi cần một tác nhân để vận hành phần mềm, quản lý các quy trình làm việc nặng về terminal, hoặc suy luận xuyên suốt toàn bộ codebase (500K+ tokens) với độ chính xác truy xuất cao.

Tính năng suy nghĩ của GPT-5.5

Trong ChatGPT, OpenAI giới thiệu “GPT-5.5 Thinking”, mà công ty cho biết mở khóa khả năng hỗ trợ nhanh hơn cho các vấn đề khó hơn. Tính năng này cung cấp các câu trả lời thông minh hơn, súc tích hơn để giúp người dùng hoàn thành các tác vụ phức tạp hiệu quả hơn. Nó nổi bật trong công việc chuyên nghiệp như tổng hợp và phân tích thông tin, lập trình mã, và các tác vụ nặng về tài liệu như nghiên cứu, đặc biệt khi sử dụng các plugin.

Các nhà thử nghiệm Pro sớm của GPT-5.5 cho biết có một cải thiện rất lớn về cả chất lượng và độ khó của công việc mà ChatGPT có thể đảm nhận. Độ trễ thấp hơn khiến nó trở nên thực tế hơn cho các tác vụ đòi hỏi so với GPT-5.4 Pro. Các phản hồi của GPT-5.5 Pro được cấu trúc tốt, phù hợp, hữu ích và chính xác, với hiệu suất đặc biệt mạnh trong luật, khoa học dữ liệu, kinh doanh và giáo dục.

Định giá và Khả năng tiếp cận

Mặc dù có một phiên bản cơ bản, phiên bản có năng lực cao nhất (GPT-5.5 Pro) có giá $100/tháng cho người đăng ký cá nhân. Đối với doanh nghiệp, chi phí cho mỗi token đầu ra xấp xỉ gấp đôi so với GPT-5.4, ngay cả khi có hiệu quả token cao hơn 40%. Tổng chi phí cho các triển khai quy mô lớn theo hướng tác nhân có thể rất đáng kể. Có mối quan ngại ngày càng tăng rằng suy luận ở tầng cao nhất sẽ trở thành một “xa xỉ phẩm” chỉ có thể tiếp cận được với các công ty được cấp vốn tốt, từ đó có thể làm gia tăng khoảng cách về năng suất giữa các doanh nghiệp lớn và các startup nhỏ hơn.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
AprDaydreamvip
· 2giờ trước
Hy vọng chính thức cung cấp một cơ chế nhật ký hành động / phát lại có thể kiểm tra được, nếu không sẽ rất khó truy trách nhiệm khi xảy ra vấn đề, đặc biệt là các tài khoản tự động vận hành tài sản.
Xem bản gốcTrả lời0
PaperHandsProvip
· 2giờ trước
Trong các ứng dụng thực tế, "hiểu ý định" mới là điểm khó khăn, hy vọng đừng để xảy ra tình cảnh ngượng ngùng như bạn muốn đặt vé máy bay mà nó lại chỉnh sửa hồ sơ của bạn.
Xem bản gốcTrả lời0
Half-SectionedSucculentvip
· 2giờ trước
Có chút mong đợi, cũng có chút sợ: có thể nhấp chuột đồng nghĩa với việc có thể làm nhiều việc mà “con người nhấp” mới làm được, cần nâng cấp kiểm soát rủi ro và chống gian lận.
Xem bản gốcTrả lời0
ACalmnessWithAHintOfPomelovip
· 3giờ trước
Làn sóng này cũng ảnh hưởng đến Web3 đúng không, tự động hóa các thao tác trên chuỗi, quy trình ký, tương tác ví nếu có thể thực hiện một cách liền mạch, hình thái sản phẩm sẽ thay đổi.
Xem bản gốcTrả lời0
StarsInTheGlassDomevip
· 3giờ trước
API và giá cả đừng vội, trước tiên hãy xem nó có thể chống pop-up, chống đa cửa sổ, chống dao động mạng trong môi trường máy tính để bàn phức tạp hay không.
Xem bản gốcTrả lời0
GateUser-b665e41cvip
· 3giờ trước
Cảm thấy từ "biết nói biết viết" tiến hóa thành "biết làm và giao hàng", bước tiếp theo là cung cấp cho nó khả năng ghi nhớ và quản lý nhiệm vụ tốt hơn.
Xem bản gốcTrả lời0
LintCollectorvip
· 3giờ trước
Nếu thực sự có thể liên kết qua các ứng dụng: trình duyệt tra cứu tài liệu → Excel xử lý → PPT xuất bản → gửi email, thì đó là chu trình hoàn chỉnh của công việc văn phòng.
Xem bản gốcTrả lời0
DegenWithNotebookvip
· 3giờ trước
Cuối cùng đã lên giao diện gốc của máy tính để bàn rồi à? Giờ thật sự phải làm "thực tập sinh số" rồi.
Xem bản gốcTrả lời0