OpenAI phát hành GPT-5.2 khi sự chú ý chuyển hướng sang tự động hóa nơi làm việc


Khám phá các tin tức và sự kiện fintech hàng đầu!

Đăng ký nhận bản tin của FinTech Weekly

Được đọc bởi các giám đốc điều hành tại JP Morgan, Coinbase, Blackrock, Klarna và nhiều hơn nữa


OpenAI đã phát hành GPT-5.2, một mô hình mới mà công ty mô tả là nhanh hơn, đáng tin cậy hơn và có khả năng xử lý các công việc chuyên nghiệp đòi hỏi cao. Cập nhật này đánh dấu một bước tiến nữa trong giai đoạn tập trung nội bộ ngày càng gia tăng.

Đầu tháng này, nhân viên đã nhận được chỉ thị từ CEO Sam Altman yêu cầu họ tạm dừng các nỗ lực phụ và tập trung hoàn toàn vào việc cải thiện ChatGPT. Lệnh này đã tạo ra một tông chủ đạo cho giai đoạn mà OpenAI dường như muốn chứng minh rằng công nghệ của họ có thể hỗ trợ hoạt động hàng ngày trong doanh nghiệp thay vì chỉ đóng vai trò như một trợ lý dùng chung.

Một Mô Hình Được Thiết Kế Cho Các Quy Trình Hàng Ngày

OpenAI cho biết GPT-5.2 được thiết kế để hỗ trợ nhiều loại nhiệm vụ mà nhân viên thực hiện trong nhiều ngành công nghiệp khác nhau. Công ty giải thích rằng mô hình có thể xử lý các đầu vào dài hơn, diễn giải hình ảnh với độ chính xác ổn định hơn, tạo ra các tài liệu có cấu trúc và làm việc trong các quy trình đa bước đòi hỏi sự sắp xếp cẩn thận. Các giám đốc điều hành cho biết mục tiêu là mở rộng giá trị kinh tế mà người dùng có thể khai thác từ hệ thống này.

Các bình luận công khai của bộ phận ứng dụng của OpenAI mô tả mô hình mới này có khả năng vượt qua hoặc sánh bằng hiệu suất của con người trong phần lớn các nhiệm vụ chuyên nghiệp mô phỏng được nghiên cứu qua một tiêu chuẩn nội bộ mới. Công ty cho biết tiêu chuẩn này, gọi là GDPval, bao gồm các nhiệm vụ liên quan đến bốn mươi bốn nghề nghiệp và cung cấp cách so sánh kết quả của mô hình với kết quả của con người. Theo OpenAI, GPT-5.2 đã đạt hoặc vượt qua con người trong khoảng bảy mươi mốt phần trăm các so sánh này.

Các nhà nghiên cứu bên ngoài chưa xem xét tiêu chuẩn này, và các nhà phân tích ngành cho biết họ đang chờ đợi các đánh giá độc lập trước khi đánh giá các tuyên bố của công ty.

Thúc Đẩy Thị Trường Doanh Nghiệp

Trong năm qua, OpenAI đã dần chuyển hướng chú ý sang khách hàng doanh nghiệp và tổ chức. Công ty đã hoàn tất các thỏa thuận với chính phủ Hoa Kỳ và Disney, hướng tới chiến lược tập trung tích hợp các công cụ của mình vào các cấu trúc vận hành lâu dài. GPT-5.2 tiếp tục theo hướng này bằng cách giới thiệu bản thân như một hệ thống dành cho sử dụng bền vững trong văn phòng, phòng thu, nhóm nghiên cứu, bộ phận tuân thủ và các môi trường khác đòi hỏi kết quả đáng tin cậy.

Tự động hóa nơi làm việc đã trở thành một chủ đề trung tâm của nhiều nhà tuyển dụng lớn. Các khảo sát trong năm qua cho thấy các giám đốc điều hành kỳ vọng rộng rãi rằng các công cụ AI sẽ hỗ trợ tăng năng suất. Các báo cáo cũng chỉ ra rằng nhiều nhân viên lo ngại về an ninh công việc trong môi trường này. Một nghiên cứu của Just Capital cho thấy phần lớn các nhà lãnh đạo doanh nghiệp nhìn nhận AI tích cực, trong khi gần một nửa người Mỹ được khảo sát tin rằng công nghệ này có thể thay thế các vị trí công việc.

Áp lực đối với các công ty trong việc hiểu rõ những mối quan tâm này đã gia tăng khi các mô hình ngày càng trở nên khả năng hơn. GPT-5.2 xuất hiện trong giai đoạn các công ty đang cố gắng xác định ranh giới giữa hỗ trợ và thay thế, một cuộc tranh luận vẫn tiếp diễn trong các ngành công nghiệp, bao gồm fintech, chăm sóc sức khỏe, giải trí và hợp đồng chính phủ.

Những Tuyên Bố Về Hiệu Suất Và Thử Nghiệm

OpenAI nhấn mạnh một số cải tiến kỹ thuật trong buổi công bố. Các quan chức của công ty cho biết GPT-5.2 hoạt động tốt trong các bài kiểm tra đo lường khả năng lý luận và giải quyết vấn đề. Các bài kiểm tra này bao gồm GPQA Diamond và FrontierMath, đều nhằm mục đích xem xét cách các mô hình xử lý các câu hỏi nâng cao.

Công ty nói rằng GPT-5.2 cho kết quả ổn định hơn trong lập trình, phân tích dữ liệu và thiết kế thử nghiệm. Nó cũng nhấn mạnh các cải tiến trong khả năng duy trì liên tục của mô hình trong các tài liệu dài hơn, điều đã là một thách thức liên tục đối với các hệ thống trước đó. Ngoài ra, công ty cho biết GPT-5.2 được tạo ra để hỗ trợ tích hợp công cụ một cách đáng tin cậy hơn, mang lại cho các nhà phát triển và người dùng doanh nghiệp quyền kiểm soát lớn hơn đối với các chuỗi tự động.

OpenAI trình bày phản hồi từ các người thử nghiệm ban đầu cho biết mô hình hỗ trợ công việc đòi hỏi cao với ít gián đoạn hơn. Những tuyên bố này chưa được công bố bên ngoài thông báo của công ty, và các đánh giá độc lập có thể giúp xác định cách hệ thống hoạt động ở quy mô lớn.

Hệ Thống Ba Mô Hình Cho Các Nhu Cầu Khác Nhau

OpenAI phát hành GPT-5.2 dưới dạng ba phiên bản phản ánh các mức độ phức tạp khác nhau. Phiên bản “Nhanh” dành cho các yêu cầu nhanh chóng. Mô hình “Suy nghĩ” tập trung vào lý luận mở rộng và các nhiệm vụ có cấu trúc. Phiên bản “Chuyên nghiệp” được thiết kế cho công việc dài hạn thường do các nhóm nghiên cứu, đội pháp lý, nhà phân tích và các bộ phận kỹ thuật thực hiện.

Các nhà phát triển có thể truy cập ngay qua API. Công ty đặt giá là 1,75 đô la cho mỗi triệu token đầu vào và 14 đô la cho mỗi triệu token đầu ra. Các mức giá này phản ánh nỗ lực của công ty trong việc phân khúc sử dụng dựa trên yêu cầu của dự án thay vì dựa vào một mô hình duy nhất cho mọi yêu cầu.

Ra Mắt Trong Bối Cảnh Áp Lực Nội Bộ

Việc ra mắt GPT-5.2 diễn ra ngay sau một thông điệp nội bộ của Sam Altman kêu gọi nhân viên tạm dừng tất cả các dự án không thiết yếu và tập trung vào việc nâng cao ChatGPT. Bản ghi nhớ này báo hiệu rằng lãnh đạo của OpenAI muốn tập trung nỗ lực vào sản phẩm cốt lõi đã mang lại danh tiếng rộng rãi cho công ty.

Nhân viên được thông báo rằng những tháng tới sẽ đòi hỏi sự tập trung hoàn toàn vào độ tin cậy, tốc độ và tính hữu ích của hệ thống. Thời điểm của bản ghi nhớ tạo ra kỳ vọng rằng bản phát hành tiếp theo sẽ cố gắng giải quyết các mối quan tâm lặp đi lặp lại do người dùng và nhà phát triển đưa ra về tính nhất quán của kết quả, độ chính xác trong diễn giải và sự lệch mô hình. Việc định vị GPT-5.2 như một công cụ cho công việc chuyên nghiệp hàng ngày phù hợp với tông của thông điệp đó.

Một Mô Hình Ra Mắt Trong Môi Trường Làm Việc Thay Đổi

Nhân viên trong nhiều ngành công nghiệp đã và đang đánh giá cách sử dụng AI sinh tạo trong khi vẫn cảnh giác với những thách thức mà nó mang lại. Một số dựa vào các mô hình để soạn thảo sơ bộ hoặc phân tích sơ bộ. Những người khác dùng chúng để xem xét dữ liệu hoặc thử nghiệm ý tưởng trước khi chuyển sang chỉnh sửa thủ công. Nhiều tập đoàn đã ban hành các hướng dẫn nội bộ xác định cách nhân viên có thể sử dụng các hệ thống này cho các tài liệu nhạy cảm hoặc có quy định.

GPT-5.2 bước vào môi trường này với tuyên bố rằng mô hình có thể thực hiện phần lớn các nhiệm vụ với độ chính xác ổn định hơn. Các nhà quan sát ngành cho biết điều này có thể tạo thêm áp lực lên các công ty trong việc xem xét lại cách các nhóm của họ sử dụng AI. Nó cũng có thể làm gia tăng các cuộc tranh luận về đào tạo, giám sát, nghĩa vụ bản quyền và phân chia trách nhiệm khi kết quả tự động ảnh hưởng đến quyết định kinh doanh.

Các lãnh đạo công đoàn và người ủng hộ người lao động tiếp tục nâng cao mối lo ngại về cách tự động hóa có thể ảnh hưởng đến an ninh công việc. Họ lập luận rằng hiệu suất ổn định của các hệ thống AI có thể thúc đẩy một số công ty tái cấu trúc vai trò hoặc giới thiệu các chiến lược tuyển dụng mới. Các giám đốc điều hành thường phản hồi bằng cách nhấn mạnh vào cải thiện năng suất hơn là giảm nhân sự, mặc dù căng thẳng vẫn còn tồn tại.

Ảnh Hưởng Ngành Và Phản Ứng Sơ Bộ

Việc ra mắt GPT-5.2 có khả năng thu hút sự quan tâm từ các công ty phụ thuộc nhiều vào tài liệu lớn, phân tích dữ liệu hoặc công việc quy trình. Các tổ chức tài chính, công ty tư vấn, hãng truyền thông và các đơn vị chính phủ đã bắt đầu tích hợp các mô hình trước đó vào các công cụ nội bộ. GPT-5.2 có thể ảnh hưởng đến cách các hệ thống này phát triển, đặc biệt nếu các thử nghiệm độc lập xác nhận các tuyên bố về hiệu suất của công ty.

Các công ty fintech cũng đang theo dõi các diễn biến này vì nhiều sản phẩm của họ dựa vào phân tích tự động, giao tiếp khách hàng và hỗ trợ tuân thủ. Các cải tiến về khả năng hiểu ngữ cảnh dài và quy trình có cấu trúc có thể giúp họ tinh chỉnh hệ thống nội bộ hoặc phát triển dịch vụ mới cho khách hàng.

Các nhà nghiên cứu và chuyên gia chính sách cho biết việc thiếu đánh giá bên ngoài cho GDPval còn để ngỏ câu hỏi về tính đại diện của tiêu chuẩn này. Họ mong đợi các nghiên cứu của bên thứ ba sẽ xem xét xem các nhiệm vụ có phản ánh đúng điều kiện làm việc thực tế hay chỉ kiểm tra các chức năng hẹp mà các mô hình đã thực hiện tốt.

Nhìn Về Phía Trước

GPT-5.2 xuất hiện trong giai đoạn củng cố chiến lược nội bộ của OpenAI. Công ty đã thể hiện rõ mong muốn thiết lập các mô hình của mình như những phần cố định trong môi trường làm việc thay vì chỉ là công cụ hỗ trợ tạm thời. Hướng đi này trở nên rõ ràng hơn sau lời kêu gọi của Altman yêu cầu đội ngũ tập trung hoàn toàn vào ChatGPT và chậm lại các dự án khác.

Giai đoạn tiếp theo sẽ phụ thuộc vào phản ứng của các doanh nghiệp sau khi các thử nghiệm ban đầu chuyển sang sử dụng hàng ngày. Sự chấp thuận từ các khách hàng doanh nghiệp sẽ hỗ trợ kế hoạch của công ty. Sự hoài nghi tiếp tục từ các nhà nghiên cứu bên ngoài sẽ nhấn mạnh tầm quan trọng của các đánh giá độc lập.

Nhiều nhà tuyển dụng vẫn đang quyết định cách tích hợp các khả năng AI mới trong khi duy trì niềm tin của nhân viên. GPT-5.2 bổ sung thêm một chiều hướng vào cuộc thảo luận đó. Sự cân bằng giữa năng suất và an ninh sẽ định hướng nhiều quyết định tiếp theo, và cách các công ty phản ứng có thể quyết định mức độ tự động hóa có thể mở rộng trong văn phòng hiện đại.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim