OpenAI 於 4/23 正式發布 GPT-5.5,定位為面向代理式(agentic)工作與企業知識處理的主力模型,同步登上 ChatGPT 與 Codex。官方宣傳定調為「我們最聰明、最直覺易用的模型」,AA Intelligence Index 以 60 分登頂,領先 Claude Opus 4.7 與 Gemini 3.1 Pro Preview 各 3 分。
Ключевые данные в обзоре
Показатель GPT-5.5 в сравнении (GPT-5.4 или аналогичные конкуренты) AA Intelligence Index 60 Claude Opus 4.7:57;Gemini 3.1 Pro Preview:57 Terminal-Bench 2.0(командно-строчный рабочий процесс) 82.7% GPT-5.4:75.1% Expert-SWE(внутренняя оценка OpenAI программирования) 73.1% GPT-5.4:68.5% контекстное окно 12,00 тыс. токенов значительно увеличено, позволяет обрабатывать весь корпоративный репозиторий программ или несколько часов видео Цена (за миллион токенов) вход 5 долларов, выход 30 долларов, в 2 раза дороже, чем GPT-5.4;но использование токенов на вывод снижено примерно на 40%, чистая стоимость растет примерно на 20%
Позиционирование: разработано для «эpы агентов»
OpenAI описывает GPT-5.5 как базовую модель для агентных вычислений: она понимает сложные цели, использует инструменты, выполняет самопроверку результатов работы и может доводить многошаговые задачи до завершения без необходимости участия человека на каждом шаге. Согласно интервью TechCrunch, президент Greg Brockman охарактеризовал эту версию как «большой шаг к будущим вычислениям, но это только шаг», и подчеркнул, что «по сравнению с 5.4 это более быстрый и более острый рассуждающий, использующий меньше токенов».
Главный ученый Jakub Pachocki отметил: «В краткосрочной перспективе мы видим очень заметные улучшения»; руководитель исследований Mark Chen, в свою очередь, подчеркнул, что в этой версии на рабочие процессы «в научных и технических исследованиях» принесены значимые прорывы.
Объем поставки и многоуровневое разбиение версий
GPT-5.5:Plus, Pro, Business, Enterprise пользователи могут использовать в ChatGPT и Codex
GPT-5.5 Pro:более продвинутая версия рассуждений, доступная для Pro, Business, Enterprise пользователей в ChatGPT
Интеграция Codex:одновременно доступна для программных агентных инструментов OpenAI, усиливает редактирование нескольких файлов, командную строку и циклы тестирования
Одновременно повышаются нарративы по кибербезопасности и обороне
Член технической команды Mia Glaese, отвечая на вопросы в интервью TechCrunch, заявил, что возможности GPT-5.5 в сфере кибербезопасности окажут «существенное влияние» на то, как OpenAI «развертывает модели и направляет вложения в цифровую оборону». Этот тезис напрямую перекликается с недавними спорами вокруг Claude Mythos — оружейной модели кибербезопасности — со стороны Anthropic. Ранее Altman в программе《Core Memory》уже критиковал «стратегию маркетинга страха» Anthropic. На GPT-5.5 OpenAI делает еще больший акцент на нарративе «прикрытие и нападение — баланс, можно развертывать», намереваясь дистанцироваться от позиции Anthropic по ограничению доступа.
Изменения в ценовой стратегии
Цена GPT-5.5 за каждый миллион токенов удваивается до вход 5 долларов и выход 30 долларов — это первое поколение в линейке GPT-5, где существенно растет цена за единицу. Объяснение OpenAI заключается в следующем: за счет эффективности рассуждений можно сократить использование выходных токенов примерно на 40%, поэтому фактический счет для типичных задач оказывается примерно на 20% выше, чем у GPT-5.4, а не просто в 2 раза. Для предприятий, таким образом, решение смещается с вопроса «выгодна ли цена за единицу» к тому, «может ли GPT-5.5 в рамках того же prompt завершать более сложные задачи при меньшем общем количестве токенов».
Сигнал для отрасли
GPT-5.5 увеличивает разрыв между OpenAI в Terminal-Bench и внутренними оценками SWE: эти два бенчмарка проверяют выполнение командно-строчных агентных действий и реальные задачи программной инженерии — для позитивного противостояния Codex и Claude Code это более прямое поле битвы по баллам. С учетом того, что одновременно открывается контекстное окно на 12,00 тыс. токенов, OpenAI одновременно усиливает давление на двух направлениях: «полное обработка корпоративной базы знаний» и «агенты для долгих задач». Для Anthropic Claude Opus 4.7 отстает на 3 пункта: 57 баллов в AA-индексе, тогда как для пользователей Claude Code появляется еще одна причина наблюдать прогресс следующего поколения (Opus 4.8 или новый Claude).
Эта статья, где OpenAI продвигает GPT-5.5: 12M контекста, победа в AA-индексе, Terminal-Bench 82.7% — переписана как агентный бенчмарк, впервые появилась на 鏈新聞 ABMedia.
Связанные статьи
OristaPay запускает платежную систему с AI-поддержкой в Telegram, обеспечивает мгновенные расчеты USDT в TON
Project Prometheus Джеффа Безоса привлекает $10B по $38B оценке
OpenAI представляет GPT-5.5, разработанную для задач агентов и сложных рабочих процессов
ИИ-стартап Band привлекает посевной раунд $17M под руководством Sierra Ventures, Hetz Ventures, Team8
Утечка в системе безопасности Vercel расширилась до сотен пользователей; разработчики ИИ находятся в группе повышенного риска
MagicBlock запускает Mirage — инструмент приватных платежей в командной строке для Solana