Microsoft Fara-7B desempenho supera o GPT-4o, como um modelo de 7 bilhões de parâmetros consegue realizar cálculos em segundos localmente

robot
Geração de resumo em curso

A mais recente inovação da Microsoft, Fara-7B, não é apenas mais um modelo de IA; ela desafia a concepção tradicional de que “quanto maior o modelo, mais inteligente”. Este “agente de uso de computador” com apenas 70 bilhões de parâmetros supera em várias métricas o GPT-4o da OpenAI, além de poder ser executado diretamente no seu computador pessoal, sem depender de nuvem.

Dados de desempenho falam por si: por que modelos menores vencem

Nos testes de referência WebVoyager, o Fara-7B alcançou uma taxa de conclusão de 73,5%, superando diretamente o GPT-4o com 65,1%. Ainda mais impressionante é o indicador de eficiência — realizar a mesma operação leva apenas 16 passos, enquanto o UI-TARS-1.5-7B do mesmo nível necessita de 41 passos, uma redução de 60% nos passos redundantes.

Isso não é por acaso, mas resultado da adoção pela Microsoft de uma técnica de treinamento chamada destilação de conhecimento. Ao integrar 145 mil exemplos de navegação gerados pelo sistema multi-agente Magentic-One, a Microsoft conseguiu comprimir as capacidades de um grande modelo em um modelo compacto e eficiente. A base é o Qwen2.5-VL-7B, equipado com uma janela de contexto de 128.000 tokens, elevando a compreensão visual a um novo patamar.

Ver na tela, clicar com o mouse: raciocínio pixel a pixel redefine automação

A arma secreta do Fara-7B é a lógica de “operações de tela”. Enquanto os métodos tradicionais dependem de códigos estruturados de navegador, o Fara-7B realiza raciocínio totalmente baseado em dados pixel a pixel — lê capturas de tela, prevê cliques do mouse, entrada de texto, rolagem de páginas, etc. Mesmo em sites com códigos confusos, ele funciona normalmente.

Yash Lara, gerente de produto do Microsoft Research, chama isso de “soberania do pixel”, permitindo que setores altamente regulados como saúde e finanças possam implantar com segurança localmente. Isso significa que informações sensíveis das empresas não precisam mais ser enviadas à nuvem, reduzindo drasticamente a latência e garantindo maior privacidade de dados.

Mecanismo de segurança: linha de defesa de pausa automática para operações críticas

Vale destacar o mecanismo de “pontos de confirmação críticos” embutido no Fara-7B. Quando encontra operações envolvendo dados pessoais ou ações irreversíveis (como envio de e-mails ou transferências de dinheiro), o modelo pausa automaticamente e solicita confirmação manual. Com a interface de interação Magentic-UI, forma-se uma verdadeira linha de defesa colaborativa entre homem e máquina.

Código aberto, mas ainda não de nível de produção

Em 24 de novembro, a Microsoft lançou oficialmente o Fara-7B sob licença MIT, disponível no Hugging Face e na plataforma Foundry da Microsoft, suportando aplicações comerciais. No entanto, a Microsoft admite que o modelo ainda não atende aos padrões de implantação em ambientes de produção, sendo mais adequado para desenvolvedores em fases de prototipagem e validação de funcionalidades.

Este lançamento reflete uma mudança importante: a Microsoft deixou claro que, no futuro, não buscará modelos cada vez maiores por si só, mas focará em criar soluções “pequenas, inteligentes e seguras”. Além disso, planeja incorporar aprendizado por reforço em ambientes sandbox para treinar o modelo de forma autônoma, elevando ainda mais seu potencial de autoaprendizado.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar

Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)