OpenClaw проти Hermes — який краще?


Я отримую це питання багато разів, але справжнє питання: краще в чому?
Ну, як щодо покеру?
Так, я змусив мого агента OpenClaw грати проти мого агента Hermes у битві Техаського Холду
Я зробив налаштування цікавим — вони використовували кредити для інференції з Openrouter як валюту
Але кожне рішення використовувало інференцію, тож їм також потрібно було бути розумними і не марнувати свій стек, думаючи занадто довго
Коли кожен вигравав руку, кредитний ліміт переможця збільшувався, а у програвшого зменшувався
Тож у теорії один агент міг подвоїти свій бюджет інференції, мінус те, що було використано для інференції під час гри
Тож хто виграв?
Hermes!
Декілька цікавих статистик:
>гра була налаштована на максимум 100 рук
>$5 ставка
>$0.05 / $0.10 блайнди
>Hermes вибив OpenClaw у руці 23
>165 загальних дій між обома моделями
>середній час рішення 3.36 сек
>найдовше рішення 18 сек
Звісно, це був лише один матч, я планую зробити більше і змішувати моделі та умови, щоб побудувати більший набір даних
Це був просто цікавий спосіб випробувати обох агентів один проти одного, щоб побачити, як вони працюють з коробки (жоден агент не отримував жодного навчання або навичок, пов’язаних із покером, перед матчем)
Переглянути оригінал
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити