Сьогоднішнім найважливішим заходом є конференція NVIDIA GTC, яка фактично є версією людської історії в епоху штучного інтелекту.

robot
Генерація анотацій у процесі

Найважливіша подія сьогодні — конференція NVIDIA GTC, фактично версія людської історії з штучним інтелектом.

Ще не вийшов на сцену, а вже витік інформації настільки багато, що вистачило б на книгу.

Вечірній огляд трьох головних моментів, поїхали, друзі, йдемо зі мною.

  1. Вартість обчислень для ШІ знизилася вдвічі

Попереднє покоління Blackwell вже було дуже потужним, так? Скоро буде оголошено про масове виробництво нового чипа Vera Rubin.

Чим же особливий Vera Rubin? Говорячи просто, двома словами: дешевий.

Для однакової моделі ШІ, кількість чипів скорочується до чверті, а вартість обчислень для виведення зменшується на 90%. Зменшення на дев’яносто відсотків, друзі. AWS, Microsoft, Google — три великі хмарні провайдери — одразу перші, хто підключаться.

  1. Вчора компанія витратила 20 мільярдів доларів на Groq, сьогодні здає роботу

Раніше на фінансовій зустрічі Хуанен Хуанг сказав, що Groq стане розширювальною архітектурою, інтегрованою у систему NVIDIA, так само, як раніше купівля Mellanox доповнила мережеві можливості.

LPU від Groq і GPU від NVIDIA розміщені в одному дата-центрі: GPU розуміє проблему, LPU відповідає швидким виведенням відповіді.

Спільна робота двох типів чипів зменшує затримки у сценаріях агентів.

Штучний агент виконує роботу за людину, один і той самий завдання може вимагати десятки раундів налаштування моделі, кожен з яких спалює обчислювальні ресурси для виведення, а користувачі чекають, і якщо затримка буде більшою — досвід руйнується.

Обчислення для виведення складається з двох кроків: спершу зрозуміти ваше питання, потім по одному слову видавати відповідь.

GPU добре справляється з першим кроком, але швидкість і стабільність другого — сильна сторона LPU від Groq.

Чи дорого це — 20 мільярдів?

Уявіть собі, що кожна компанія матиме сотні агентів, кожен день вони будуть запускати тисячі моделей.

  1. Вийшов NVIDIA-версія OpenClaw, називається NemoClaw

Це відкритий платформний комплекс, який дозволяє компаніям запускати AI-співробітників для автоматизації процесів, обробки даних, управління проектами. Кажуть, вже ведуть переговори з Salesforce та Adobe.

Цікаво те, що NemoClaw не вимагає використання чипів NVIDIA. Подумайте про цю логіку. Продаж чипів приносить лише прибуток з апаратного забезпечення, але встановлення правил дозволяє заробляти на всій ланцюжку. Хуанен Хуанг чітко розрахував цю стратегію.

  1. Хуанен Хуанг заявив, що представить «чипи, яких світ ще не бачив»

Майже напевно, це буде перша поява архітектури наступного покоління Feynman, яка вийде у 2028 році з масовим виробництвом на найсучаснішій технології TSMC 1.6 нм.

Ще є один маловідомий, але досить цікавий факт.

NVIDIA випустила ноутбукові процесори, дві моделі, орієнтовані на ігри. Тепер виробники відеокарт змагатимуться за ринок CPU.

Вечірній огляд — здається, Хуанен Хуанг стане великим лідером майбутнього.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити