OpenAI 推出 GPT-5.5:12M контекст, AA-индекс на первом месте, Terminal-Bench 82,7% переписывает эталон для агентов

OpenAI 於 4/23 正式發布 GPT-5.5,定位為面向代理式(agentic)工作與企業知識處理的主力模型,同步登上 ChatGPT 與 Codex。官方宣傳定調為「我們最聰明、最直覺易用的模型」,AA Intelligence Index 以 60 分登頂,領先 Claude Opus 4.7 與 Gemini 3.1 Pro Preview 各 3 分。

Ключевые данные в обзоре

Показатель GPT-5.5 в сравнении (GPT-5.4 или аналогичные конкуренты) AA Intelligence Index 60 Claude Opus 4.7:57;Gemini 3.1 Pro Preview:57 Terminal-Bench 2.0(командно-строчный рабочий процесс) 82.7% GPT-5.4:75.1% Expert-SWE(внутренняя оценка OpenAI программирования) 73.1% GPT-5.4:68.5% контекстное окно 12,00 тыс. токенов значительно увеличено, позволяет обрабатывать весь корпоративный репозиторий программ или несколько часов видео Цена (за миллион токенов) вход 5 долларов, выход 30 долларов, в 2 раза дороже, чем GPT-5.4;но использование токенов на вывод снижено примерно на 40%, чистая стоимость растет примерно на 20%

Позиционирование: разработано для «эpы агентов»

OpenAI описывает GPT-5.5 как базовую модель для агентных вычислений: она понимает сложные цели, использует инструменты, выполняет самопроверку результатов работы и может доводить многошаговые задачи до завершения без необходимости участия человека на каждом шаге. Согласно интервью TechCrunch, президент Greg Brockman охарактеризовал эту версию как «большой шаг к будущим вычислениям, но это только шаг», и подчеркнул, что «по сравнению с 5.4 это более быстрый и более острый рассуждающий, использующий меньше токенов».

Главный ученый Jakub Pachocki отметил: «В краткосрочной перспективе мы видим очень заметные улучшения»; руководитель исследований Mark Chen, в свою очередь, подчеркнул, что в этой версии на рабочие процессы «в научных и технических исследованиях» принесены значимые прорывы.

Объем поставки и многоуровневое разбиение версий

GPT-5.5:Plus, Pro, Business, Enterprise пользователи могут использовать в ChatGPT и Codex

GPT-5.5 Pro:более продвинутая версия рассуждений, доступная для Pro, Business, Enterprise пользователей в ChatGPT

Интеграция Codex:одновременно доступна для программных агентных инструментов OpenAI, усиливает редактирование нескольких файлов, командную строку и циклы тестирования

Одновременно повышаются нарративы по кибербезопасности и обороне

Член технической команды Mia Glaese, отвечая на вопросы в интервью TechCrunch, заявил, что возможности GPT-5.5 в сфере кибербезопасности окажут «существенное влияние» на то, как OpenAI «развертывает модели и направляет вложения в цифровую оборону». Этот тезис напрямую перекликается с недавними спорами вокруг Claude Mythos — оружейной модели кибербезопасности — со стороны Anthropic. Ранее Altman в программе《Core Memory》уже критиковал «стратегию маркетинга страха» Anthropic. На GPT-5.5 OpenAI делает еще больший акцент на нарративе «прикрытие и нападение — баланс, можно развертывать», намереваясь дистанцироваться от позиции Anthropic по ограничению доступа.

Изменения в ценовой стратегии

Цена GPT-5.5 за каждый миллион токенов удваивается до вход 5 долларов и выход 30 долларов — это первое поколение в линейке GPT-5, где существенно растет цена за единицу. Объяснение OpenAI заключается в следующем: за счет эффективности рассуждений можно сократить использование выходных токенов примерно на 40%, поэтому фактический счет для типичных задач оказывается примерно на 20% выше, чем у GPT-5.4, а не просто в 2 раза. Для предприятий, таким образом, решение смещается с вопроса «выгодна ли цена за единицу» к тому, «может ли GPT-5.5 в рамках того же prompt завершать более сложные задачи при меньшем общем количестве токенов».

Сигнал для отрасли

GPT-5.5 увеличивает разрыв между OpenAI в Terminal-Bench и внутренними оценками SWE: эти два бенчмарка проверяют выполнение командно-строчных агентных действий и реальные задачи программной инженерии — для позитивного противостояния Codex и Claude Code это более прямое поле битвы по баллам. С учетом того, что одновременно открывается контекстное окно на 12,00 тыс. токенов, OpenAI одновременно усиливает давление на двух направлениях: «полное обработка корпоративной базы знаний» и «агенты для долгих задач». Для Anthropic Claude Opus 4.7 отстает на 3 пункта: 57 баллов в AA-индексе, тогда как для пользователей Claude Code появляется еще одна причина наблюдать прогресс следующего поколения (Opus 4.8 или новый Claude).

Эта статья, где OpenAI продвигает GPT-5.5: 12M контекста, победа в AA-индексе, Terminal-Bench 82.7% — переписана как агентный бенчмарк, впервые появилась на 鏈新聞 ABMedia.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

OristaPay запускает платежную систему с AI-поддержкой в Telegram, обеспечивает мгновенные расчеты USDT в TON

Сообщение Gate News, 24 апреля — OristaPay, бренд, работающий под управлением RD Technologies, объявил о создании полного платежного пути, позволяющего AI-агентам выполнять транзакции в экосистеме Telegram во время Гонконгского Web3-фестиваля. Система позволяет пользователям инициировать транзакции с цифровыми активами через естественноязычные взаимодействия, не покидая интерфейс чата. Во время прямой демонстрации AI-агент, работающий на базе BytePlus, обработал запрос на обслуживание, интерпретировал намерение пользователя и инициировал платеж через канал OristaPay. Транзакция была завершена мгновенно с использованием USDT в сети блокчейна TON. Инфраструктура платформы построена на пяти ключевых финансовых возможностях: дебиторская задолженность, кредиторская задолженность, депозиты, денежные переводы и управление капиталом, что создает единую экосистему, соединяющую активы блокчейна с коммерческими сценариями использования. OristaPay предоставляет разработчикам стандартизированные интерфейсы для интеграции платежных функций в AI-приложения с минимальной сложностью. Платформа работает в рамках нормативно-правовой базы Гонконга, позиционируя себя как безопасное решение для компаний, переходящих к коммерции на базе Web3. Инициатива направлена на устранение ограничений традиционных платежных шлюзов за счет объединения больших языковых моделей, инфраструктуры блокчейна и социальных платформ в единую финансовую экосистему.

GateNews39м назад

Project Prometheus Джеффа Безоса привлекает $10B по $38B оценке

Сообщение Gate News, 24 апреля — Project Prometheus, AI-лаборатория, основанная основателем Amazon Джеффом Безосом и бывшим руководителем Google Виком Баджаджом, закрыла раунд финансирования на $10 миллиардов долларов при оценке в $38 миллиардов долларов. JPMorgan Chase и BlackRock являются

GateNews5ч назад

OpenAI представляет GPT-5.5, разработанную для задач агентов и сложных рабочих процессов

Сообщение Gate News, 24 апреля — OpenAI официально выпустила GPT-5.5, модель следующего поколения ИИ, предназначенную для решения сложных целей, интеграции инструментов, самопроверки и выполнения задач в несколько этапов. Модель особенно сильна в написании и отладке кода, онлайн-исследованиях, анализе данных, создании документов

GateNews5ч назад

ИИ-стартап Band привлекает посевной раунд $17M под руководством Sierra Ventures, Hetz Ventures, Team8

Новостное сообщение Gate, 24 апреля — Band, стартап, создающий платформу для коммуникации и совместной работы для ИИ-агентов, закрыл раунд посевного финансирования на $17 миллионов долларов под руководством Sierra Ventures, Hetz Ventures и Team8. Основанная в середине 2025 года генеральным директором Ариком Гумановским (Arick Goomanovsky) и техническим директором Владом Лузиным (Vlad Luzin), компания разрабатывает программное обеспечение для ре

GateNews6ч назад

Утечка в системе безопасности Vercel расширилась до сотен пользователей; разработчики ИИ находятся в группе повышенного риска

Сообщение Gate News, 23 апреля — Vercel сообщила 19 апреля, что ее инцидент в области безопасности, первоначально описанный как затрагивающий «ограниченное подмножество клиентов», расширился и теперь затрагивает гораздо более широкое сообщество разработчиков, особенно тех, кто создает рабочие процессы для ИИ-агентов. Атака может затронуть сотни пользователей

GateNews10ч назад

MagicBlock запускает Mirage — инструмент приватных платежей в командной строке для Solana

Сообщение Gate News, 23 апреля — MagicBlock выпустила Mirage, инструмент для приватных платежей в командной строке, предназначенный для сети Solana. Инструмент позволяет пользователям создавать кошельки, пополнять средства и отправлять приватные транзакции с помощью команд терминала, ботов или AI-агентов. Mirage построен на Private

GateNews15ч назад
комментарий
0/400
Нет комментариев