No início de dezembro do ano passado, a Fundação OpenAGI fez um grande movimento — lançou um modelo base chamado Lux. Esta solução é bastante interessante, sendo anunciada como a primeira abordagem open source especificamente criada para ensinar a IA a “clicar com o rato e digitar no teclado como um humano”.
Em termos simples, antes, por mais inteligente que fosse, a IA precisava sempre de uma API para funcionar; agora, o Lux consegue operar diretamente na interface dos softwares. Eles testaram o modelo em 300 cenários de tarefas do dia a dia, com resultados impressionantes: alcançou 83,6% no Online-Mind2Web, um dos benchmarks mais utilizados no setor.
A comparação mostra o verdadeiro valor — o Gemini CUA de um certo gigante dos motores de busca ficou nos 69%, o Operator de uma conhecida empresa de chatbots atingiu 61,3%, e até um fabricante famoso pelo seu assistente de IA, o Claude Sonnet, não conseguiu superar esta pontuação.
O caminho do open source tem realmente valor, pelo menos por permitir que mais developers tenham acesso ao patamar do “controlo automático do computador por IA”.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
8 Curtidas
Recompensa
8
6
Repostar
Compartilhar
Comentário
0/400
LiquidatedTwice
· 15h atrás
Fogo, estes dados do Lux são reais? 83,6% a esmagar diretamente o Claude? Isto é um bocado absurdo.
Ver originalResponder0
PuzzledScholar
· 15h atrás
83,6% este número é um bocado assustador, parece que a IA começou mesmo a "trabalhar sozinha".
---
O open source é mesmo uma bênção para os utilizadores, antes estas coisas estavam todas fechadas nas grandes empresas.
---
Espera aí, o Lux consegue operar diretamente na interface? Então e eu, faço o quê à vida?
---
O Claude Sonnet foi arrasado, isto agora ficou embaraçoso.
---
Será que dá para confiar nos resultados de 300 cenários de teste? Tenho sempre a sensação que há batota.
---
No fim de contas, o melhor é mesmo apostar nas soluções open source, as IAs comerciais são cada vez mais absurdas.
---
Clicar com o rato e escrever no teclado parece simples, mas conseguir pôr isto a funcionar assim é mesmo impressionante.
---
Se isto ficar maduro, muito trabalho repetitivo vai desaparecer diretamente, não?
Ver originalResponder0
SmartContractRebel
· 15h atrás
83,6% este número é realmente ridículo, dá uma tareia direta àquelas soluções proprietárias das grandes empresas.
Uma versão open-source conseguir superar o Claude, o que é que isto mostra? Mostra que as grandes empresas andam provavelmente a fazer corpo mole, haha.
O que me deixa realmente curioso é se 300 cenários de tarefas são suficientemente realistas... Acho que só o tempo dirá.
Por falar nisso, se este tipo de IA que opera computadores automaticamente se tornar comum, nós, que andamos aqui a “carregar tijolos”, vamos todos ficar desempregados?
Lux é um nome bem escolhido, soa mesmo a “luz”, a sugerir que o open-source vai salvar o mundo, não é?
Desta vez a fundação não exagerou, os dados estão aí, muito mais credíveis do que os PPTs das apresentações oficiais.
Parece que os benchmarks de IA de 2024 estão a tornar-se uma anedota, este Lux apareceu e mudou logo o ranking.
Ver originalResponder0
CommunityWorker
· 16h atrás
83,6% elimina diretamente os outros, o open source é realmente assim tão forte? Porque é que me parece um pouco exagerado.
Ver originalResponder0
SandwichVictim
· 16h atrás
83,6% este dado é mesmo impressionante, supera diretamente o Gemini e o Claude, será que os modelos open source estão finalmente a dar a volta?
---
Isto é mesmo uma vitória da comunidade open source, finalmente alguém conseguiu fazer isto.
---
Espera aí, conseguir operar diretamente a interface não é a evolução final do RPA? Se isto se generalizar, parece-me um bocado assustador.
---
Ainda mais forte que o Claude Sonnet? Parece-me um bocado exagerado, não?
---
Viva o open source, está na altura de abalar o monopólio das grandes empresas.
---
Clicar diretamente com o rato, teclar no teclado... se isto for mesmo usado, muitos postos de trabalho vão tremer.
Ver originalResponder0
alpha_leaker
· 16h atrás
83,6% supera diretamente o Gemini e o Claude, este open source é brutal, finalmente alguém conseguiu fazer com que a IA controlasse o computador.
No início de dezembro do ano passado, a Fundação OpenAGI fez um grande movimento — lançou um modelo base chamado Lux. Esta solução é bastante interessante, sendo anunciada como a primeira abordagem open source especificamente criada para ensinar a IA a “clicar com o rato e digitar no teclado como um humano”.
Em termos simples, antes, por mais inteligente que fosse, a IA precisava sempre de uma API para funcionar; agora, o Lux consegue operar diretamente na interface dos softwares. Eles testaram o modelo em 300 cenários de tarefas do dia a dia, com resultados impressionantes: alcançou 83,6% no Online-Mind2Web, um dos benchmarks mais utilizados no setor.
A comparação mostra o verdadeiro valor — o Gemini CUA de um certo gigante dos motores de busca ficou nos 69%, o Operator de uma conhecida empresa de chatbots atingiu 61,3%, e até um fabricante famoso pelo seu assistente de IA, o Claude Sonnet, não conseguiu superar esta pontuação.
O caminho do open source tem realmente valor, pelo menos por permitir que mais developers tenham acesso ao patamar do “controlo automático do computador por IA”.