Anthropic готує Opus 4.7 та Full-Stack AI Studio — водночас маючи щось набагато страшніше

Коротко

  • Anthropic готує Claude Opus 4.7 та інструмент для дизайну на основі ШІ для вебсайтів і презентацій
  • Claude Mythos залишається справжньою передовою моделлю Anthropic, і компанія не планує її публічно випускати.
  • Індустрія все ще не може надійно вимірювати покращення ШІ, що ускладнює підтвердження заяв про здобутки Opus 4.7.

Anthropic готується випустити Claude Opus 4.7 разом із новим інструментом для дизайну на основі ШІ, який дозволяє користувачам створювати вебсайти, презентації та цільові сторінки за допомогою простих англійських підказок — новина, яка спричинила падіння акцій Adobe, Wix і Figma в понеділок, повідомляє The Information. Продукти можуть з’явитися вже цього тижня, повідомив The Information джерело, яке знайоме з планами. Інструмент для дизайну орієнтований як на розробників, так і на нетехнічних користувачів, ставлячи його на колізійний курс із стартапами, такими як Gamma і Stitch від Google. Anthropic не відповіли на запит Decrypt щодо коментаря.

Opus 4.7 навіть не є найпотужнішою моделлю Anthropic. Цю роль виконує Claude Mythos — модель, орієнтована на кібербезпеку, яку компанія тихо передає обраним фірмам безпеки, тримаючи її подалі від публіки.  Недавня оцінка Mythos Preview Інститутом безпеки ШІ Великої Британії показала, що вона може автономно виконувати складні кібератаки з рівнями, які не досягали жодні інші моделі. Вона стала першою ШІ, яка завершила “The Last Ones” — симуляцію атаки на корпоративну мережу з 32 кроків, що зазвичай займає людським червоним командам 20 годин. Mythos виконала її у трьох з десяти спроб, у середньому 22 з 32 кроків — порівняно з Opus 4.6, який виконував 16. Це важливо не лише для корпоративної безпеки. Вимірювання того, що ШІ насправді може зробити, стало галузевою головною болю. OpenAI нещодавно назвав провідний тест на кодування “забрудненим”, але моделі все ще порівнюють за цими ж тестами. Оцінка ARC-AGI-3 показала, що Gemini набрав 0,37%, а GPT-5.4 — 0,26%, тоді як люди — 100%. Виникає ситуація, коли бенчмарки є і спірними, і все ще використовуються як докази, що ускладнює контекстуалізацію заяв про здобутки Opus 4.7, поки Anthropic не опублікує детальну картку моделі.

Взаємовідносини між Opus і Mythos є ближчими, ніж багато хто уявляє. Anthropic створює свої передові моделі шляхом тонкого налаштування на базі лінійки Opus — тієї ж основи, що підтримує публічні продукти Claude, яка проходить стрес-тестування і зміцнення у Mythos. Opus 4.7 — це фундамент, на якому згодом закладається кібербезпекова майстерність. Крім того, зусилля Anthropic дедалі більше спрямовані на розробку/корпоративне застосування. Витік коду Claude, випуск системи навичок і протоколу MCP, фокус на агентному ШІ та увага до тестів на кодування роблять це ще більш очевидним. Хоча Anthropic офіційно не оголошували про це, витоки підсилюють ширший перехід від провайдера LLM до чогось, що нагадує модель “ШІ-студії” з повним стеком, де Claude не просто генерує текст, а створює і розгортає цілі продукти.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити