Чи потрібні нульові докази для AI-інференсу? У більшості рішень обчислювальні витрати занадто великі. Але нещодавно я побачив цікавий протокол: бенчмарки показують, що на відеокарті H100 можна досягти понад 90% ефективності — що це означає? Можливий режим реального часу для інференсу, і ваші витрати на обчислення не зростуть до небес.
Ще важливіше — результати виходу можна перевірити. Це надзвичайно корисно для сценаріїв, де потрібно довести процес AI-обчислень, адже ніхто не хоче запускати чорний ящик і просто сподіватися, що все добре, чи не так?
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
11 лайків
Нагородити
11
6
Репост
Поділіться
Прокоментувати
0/400
SigmaValidator
· 11год тому
90% ефективності — це число звучить доволі вражаюче, але справжнє значення має лише те, що можна реально впровадити.
Переглянути оригіналвідповісти на0
TokenToaster
· 11год тому
Ого, 90% ефективності — ці дані справжні? Нарешті хтось вирішив цю величезну проблему вартості обчислювальних потужностей.
Якщо H100 може так працювати, то дійсно можна зітхнути з полегшенням щодо інференсу великих моделей. Раніше ті рішення були справді непомірно дорогими.
«Чорний ящик, чорний ящик» — найбільше дратує ця тема, а тепер нарешті можна перевірити результат, тож з’явилася впевненість.
Зачекай, а протокол уже з відкритим кодом? Треба спробувати.
Якщо це справді запрацює, це знову нова золота лихоманка.
Докази з нульовим розголошенням нарешті не залишилися лише на папері — чи справді їх можна застосувати в продакшені?
Але обіцяють багато, а реально працює мало що, треба подивитися на справжні кейси.
Цього разу нарешті не треба «вбивати себе» заради верифікованості, ефективність і безпека разом — це справді рідкість.
Переглянути оригіналвідповісти на0
LowCapGemHunter
· 11год тому
90% ефективності — це звучить непогано, але чи реально вона буде стабільною на практиці? Боюся, це знову лише теоретичні дані.
Якщо справді можна перевірити обчислювальний процес, тоді дійсно варто задуматися, інакше ці AI-чорні скриньки — тільки нерви псують.
Якщо на H100 дійсно можна досягти такої ефективності, це справжня економія — більше не потрібно турбуватися про витрати на інференс.
Такі верифіковані рішення точно стануть популярними в майбутньому: питання довіри вирішене, навіщо тоді довіряти чорній скриньці?
Цікаво, треба подивитися, чи є реальні проекти, які це використовують — на папері параметри завжди легко прикрасити.
Переглянути оригіналвідповісти на0
BlockchainFoodie
· 11год тому
Чесно кажучи, це фактично та сама перевірка "від ферми до столу", про яку ми мріяли, але для обчислень AI... 90% ефективності на H100? Це як нарешті змусити кухню мішленівського рівня працювати на відновлюваній енергії без втрати ідеальної скоринки 🔥 більше ніяких молитов до чорної скриньки, лише чистий доказ чесних обчислень
Переглянути оригіналвідповісти на0
HashRateHermit
· 11год тому
90% ефективності? Якби це справді вдалося реалізувати, це було б справжнім проривом, нарешті хтось приборкав цього «ненажерливого до обчислювальної потужності звіра» ZK.
Переглянути оригіналвідповісти на0
MEVHunter
· 11год тому
90% ефективності? Оце я і хотів почути. Раніше всі ці ZKP-рішення дійсно були чорними дірами для обчислювальної потужності, а тепер нарешті хтось застосував логіку gas fee до перевірки доведення.
Чи потрібні нульові докази для AI-інференсу? У більшості рішень обчислювальні витрати занадто великі. Але нещодавно я побачив цікавий протокол: бенчмарки показують, що на відеокарті H100 можна досягти понад 90% ефективності — що це означає? Можливий режим реального часу для інференсу, і ваші витрати на обчислення не зростуть до небес.
Ще важливіше — результати виходу можна перевірити. Це надзвичайно корисно для сценаріїв, де потрібно довести процес AI-обчислень, адже ніхто не хоче запускати чорний ящик і просто сподіватися, що все добре, чи не так?