На початку грудня минулого року фонд OpenAGI зробив гучний крок — випустив базову модель під назвою Lux. Ця штука справді цікава, адже позиціонується як перше відкрите рішення, спеціально створене для того, щоб навчити ШІ «натискати мишкою та друкувати на клавіатурі, як людина».
Простіше кажучи, якщо раніше навіть найрозумніший ШІ міг працювати лише через API-інтерфейси, то тепер Lux здатен безпосередньо керувати програмним інтерфейсом. Вони протестували модель на 300 повсякденних сценаріях, і результати вражають: на галузевому бенчмарку Online-Mind2Web Lux показав результат 83,6%.
Для порівняння, це справді високий показник — у одного великого пошуковика Gemini CUA набрав 69%, у відомого чат-бота Operator — 61,3%, а навіть у компанії, що спеціалізується на AI-асистентах, Claude Sonnet, результат був нижчий.
Відкритий код дійсно дає свої плоди, принаймні тепер більше розробників можуть спробувати себе у напрямку «автоматичне керування комп’ютером за допомогою ШІ».
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
8 лайків
Нагородити
8
6
Репост
Поділіться
Прокоментувати
0/400
LiquidatedTwice
· 15год тому
Чорт, ці дані Lux справжні чи ні, 83,6% просто розчавлює Claude? Це якось занадто дивно.
Переглянути оригіналвідповісти на0
PuzzledScholar
· 15год тому
83,6% — це число трохи лякає, здається, що ШІ справді починає "сам працювати".
---
Відкрите програмне забезпечення — це справжня знахідка для користувачів, раніше все це було заблоковано великими корпораціями.
---
Зачекай, Lux може напряму керувати інтерфейсом? То чим я тепер займатимусь?
---
Claude Sonnet програв, це вже справді незручно.
---
Чи можна довіряти результатам, отриманим із тестування у 300 сценаріях? Мені щось здається, що тут є перебільшення.
---
Як і слід було очікувати, варто звертати увагу на відкриті рішення, комерційні ШІ стають дедалі абсурднішими.
---
Клікати мишкою й натискати клавіші звучить просто, але реалізувати це на такому рівні — це справді круто.
---
Якщо ця штука стане зрілою, багато рутинної роботи просто зникне, правда ж?
Переглянути оригіналвідповісти на0
SmartContractRebel
· 15год тому
83,6% це число справді вражає, напряму розбиває всі ті закриті рішення від великих корпорацій.
Відкрита версія навіть змогла перевершити Claude, про що це говорить? Можливо, у великих компаній просто не було мотивації працювати ефективніше, ха-ха.
Мене насправді цікавить, чи достатньо реалістичні ці 300 сценаріїв завдань... Відчуття таке, що час покаже.
До речі, якщо такі AI-інструменти для автоматизації роботи на комп’ютері стануть масовими, нам, "робочим бджілкам", мабуть, доведеться шукати нову роботу.
Назва Lux дуже вдала, звучить справді "світло", натякає, що open-source врятує світ, чи не так?
Цього разу фонд справді не перебільшував — дані говорять самі за себе, набагато переконливіші, ніж PPT з офіційних презентацій.
Здається, AI-бенчмарки 2024 року вже майже перетворилися на жарт — Lux з’явився і одразу змінив рейтинг.
Переглянути оригіналвідповісти на0
CommunityWorker
· 16год тому
83.6% напряму придушує інших, невже опенсорс справді такий потужний? Чомусь у мене відчуття, що це трохи перебільшено.
Переглянути оригіналвідповісти на0
SandwichVictim
· 16год тому
83,6% — ці дані дійсно вражають, просто тиснуть Gemini і Claude, чи не час відкритим моделям взяти реванш?
---
Це справді перемога open-source спільноти, нарешті хтось це реалізував.
---
Зачекайте, можна прямо керувати інтерфейсом — хіба це не фінальна еволюція RPA? Якщо це масово впровадять, стає трохи моторошно.
---
Навіть крутіше за Claude Sonnet? Мені здається, це трохи перебільшення.
---
Слава open-source, час вже зламати монополію великих корпорацій!
---
Просто клацати мишкою, натискати клавіші... Якщо це справді запрацює, багатьом робочим місцям доведеться добряче похвилюватися.
Переглянути оригіналвідповісти на0
alpha_leaker
· 16год тому
83,6% напряму перегнав Gemini та Claude, ця відкрита розробка просто шалена, нарешті хтось зробив AI, який керує комп’ютером
На початку грудня минулого року фонд OpenAGI зробив гучний крок — випустив базову модель під назвою Lux. Ця штука справді цікава, адже позиціонується як перше відкрите рішення, спеціально створене для того, щоб навчити ШІ «натискати мишкою та друкувати на клавіатурі, як людина».
Простіше кажучи, якщо раніше навіть найрозумніший ШІ міг працювати лише через API-інтерфейси, то тепер Lux здатен безпосередньо керувати програмним інтерфейсом. Вони протестували модель на 300 повсякденних сценаріях, і результати вражають: на галузевому бенчмарку Online-Mind2Web Lux показав результат 83,6%.
Для порівняння, це справді високий показник — у одного великого пошуковика Gemini CUA набрав 69%, у відомого чат-бота Operator — 61,3%, а навіть у компанії, що спеціалізується на AI-асистентах, Claude Sonnet, результат був нижчий.
Відкритий код дійсно дає свої плоди, принаймні тепер більше розробників можуть спробувати себе у напрямку «автоматичне керування комп’ютером за допомогою ШІ».