Гугл только что сделал очень стратегический ход на конференции Cloud Next в Лас-Вегасе. Он одновременно запустил два новых восьмого поколения процессоров TPU, что знаменует собой важный поворот в том, как компания видит рынок ИИ.



Впервые Google полностью отделил чипы для обучения и инференса. Есть TPU 8t, ориентированный на обучение моделей ИИ, и TPU 8i, оптимизированный для запуска этих моделей в производстве. Это явное тактическое изменение — признают, что эти две задачи имеют очень разные потребности.

Показатели производительности интересны. TPU 8t обеспечивает на 124% больше эффективности на ватт по сравнению с предыдущим поколением, в то время как TPU 8i показывает улучшение на 117%. По сравнению с Ironwood, выпущенным в ноябре, TPU 8t обеспечивает в 2,8 раза больше производительности за ту же цену, а 8i — на 80% более эффективен. Эти достижения не являются тривиальными.

Что особенно привлекает внимание в TPU 8t — это возможность масштабирования до 9600 единиц в одной системе. Google хорошо осознает, что в таких масштабных установках энергоэффективность стала критическим ограничением дата-центров. Поэтому энергоэффективность стала приоритетом номер один.

А TPU 8i использует иной подход. Каждый чип содержит 384 МБ SRAM — в три раза больше, чем Ironwood. Это полностью логично для инференса, где чип должен обрабатывать множество шагов рассуждения, не тратя время на постоянный поиск данных извне. Идеально подходит для запуска сложных агентов ИИ.

Оба процессора поступят на рынок в конце 2026 года. Сундар Пичаи, генеральный директор Alphabet, ясно дал понять, что архитектура была задумана для «одновременного запуска миллионов агентов в экономически оправданных масштабах». В этом и заключается суть — речь не только о создании лучших чипов, а о том, чтобы делать это без выхода за рамки бюджета.

Что касается программного обеспечения, Google выпустил платформу Gemini Enterprise Agent Platform с новыми функциями. Memory Bank и Memory Profile позволяют агентам запоминать прошлые взаимодействия с пользователями — решая реальную проблему, с которой сталкивались старые инструменты. Также есть Agent Simulation для более тщательного тестирования перед запуском.

Платформа Projects интегрирует данные из Workspace, OneDrive и корпоративных чатов, предоставляя агентам контекст. Кроме того, запущен Gemini Enterprise для обычных сотрудников, позиционируемый как «ИИ-ассистент для каждого», без необходимости писать код.

Всё это — двойная атака — аппаратная и программная — против Nvidia, OpenAI и Anthropic. Google хорошо понимает, что инженеры Кремниевой долины часто переключаются между Claude от Anthropic и Codex от OpenAI для разработки ИИ, редко рассматривая инструменты Google. Это явно раздражает руководство.

Принятие TPU ускоряется. Citadel Securities уже создала квантовое программное обеспечение на TPU Google. 17 национальных лабораторий Министерства энергетики США используют совместные инструменты на базе TPU. Meta подписала долгосрочный контракт на использование TPU Google, а Anthropic взяла на себя обязательство по вычислительным мощностям в масштабах гигаВатт.

Аналитики DA Davidson оценивают, что совокупная стоимость бизнеса TPU и DeepMind Google превышала 900 миллиардов долларов в сентябре прошлого года.

Интересно отметить, что Google не сравнил напрямую свой новый TPU с продуктами Nvidia. В то время как Nvidia готовится запустить новую линейку, включающую технологию Groq, приобретенную за 20 миллиардов долларов, специально ориентированную на инференс с ультранизкой задержкой. Дженсен Хуанг из Nvidia заявил, что более 20% нагрузок ИИ могут лучше управляться этим типом чипов.

Google тестирует внедрение TPU в дата-центры клиентов и продвигает совместимость с инструментами сторонних разработчиков. Но проблемы с поставками и разрыв между быстрыми итерациями моделей и многолетними циклами разработки чипов остаются реальными препятствиями для масштабирования.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить