Karpathy: A perceção das capacidades da IA apresenta uma falha grave; a versão gratuita e o Agent de ponta são «produtos completamente diferentes»

O antigo diretor-geral de IA da Tesla e membro fundador da OpenAI, Andrej Karpathy, publicou um longo texto no X no dia 9 de abril, afirmando que a perceção do público sobre as capacidades da IA está a dividir-se gravemente. Segundo ele, as pessoas que usam o ChatGPT na versão gratuita e os técnicos que usam diariamente ferramentas de agentes de ponta como Codex e Claude Code estão, na prática, a discutir “produtos completamente diferentes”, mas ambos os lados acreditam que estão a ver a totalidade do que é a IA.

Dois mundos, duas perceções de IA

Karpathy divide os utilizadores atuais de IA em dois grupos.

O primeiro grupo experimentou a versão gratuita do ChatGPT em algum momento do ano passado e formou com isso a sua perceção global da IA. O que veem são vários erros do modelo — alucinações, resultados de pesquisa absurdos e até falhas em problemas simples, como “devo conduzir ou ir a pé para lavar o carro” no modo de voz. Karpathy reconhece que estes problemas de facto existem, mas sublinha que a versão gratuita e modelos desatualizados não conseguem representar com fidelidade as capacidades reais dos modelos de agentes de ponta até 2026.

O segundo grupo cumpre simultaneamente duas condições: usa, com pagamento, os mais recentes modelos de agentes de ponta (como OpenAI Codex ou Claude Code) e recorre a eles de forma profissional em áreas técnicas como desenvolvimento de software, matemática e investigação. Karpathy chama a este grupo um estado de “psicose de IA” altamente intenso, porque os progressos recentes destes modelos nas áreas técnicas “só podem ser descritos como surpreendentes” — é possível ver, literalmente, como resolvem em uma hora problemas de arquitetura de programação que antes exigiam dias ou até semanas.

Porque o progresso se concentra nas áreas técnicas

Karpathy explica porque é que a melhoria nas capacidades de IA é especialmente marcante em áreas técnicas como desenvolvimento de programação, mas menos evidente em usos gerais como pesquisa, escrita e recomendações.

Existem duas razões: primeiro, as áreas técnicas fornecem funções de recompensa verificáveis (por exemplo, se os testes unitários passam), o que permite que o treino por aprendizagem por reforço funcione de forma eficaz; em contrapartida, é difícil determinar de forma clara a qualidade de um texto. Segundo, as áreas técnicas têm mais valor comercial em cenários B2B, por isso as empresas de IA investem a maior parte dos recursos das suas equipas nessas direções.

Estes dois grupos não se conseguem entender

Karpathy conclui que estes dois grupos estão a “falar entre si”. O modo de voz da versão gratuita da OpenAI falha em problemas do dia a dia, enquanto o Codex da versão paga mais avançada da OpenAI consegue, em uma hora, reestruturar toda a base de código ou detetar vulnerabilidades do sistema — e ambas as coisas são verdade ao mesmo tempo.

Nas suas respostas subsequentes, ele acrescentou que alguém lhe apresentou uma perspetiva: o incidente do OpenClaw atraiu tanta atenção social precisamente porque fez com que muitos não especialistas em tecnologia tivessem contacto pela primeira vez com os modelos de agentes mais recentes, e essas pessoas até então só sabiam que IA era sinónimo de ChatGPT na versão web.

Este artigo de Karpathy: a perceção das capacidades de IA apresenta uma rutura grave, a versão gratuita e os agentes de ponta são “produtos completamente diferentes” apareceu pela primeira vez em Cadeia de Notícias ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Realidade dos Agentes de IA do Vale do Silício: desperdício massivo de tokens, integração dos sistemas “extremamente caótica”, previsão de Huang Renxun sobre o “próximo ChatGPT” a aguardar validação

Numa recente conferência do Vale do Silício, vários CEOs de novas empresas de IA apresentaram as suas perspectivas sobre os problemas de utilização atuais dos agentes de IA, considerando que enfrentam dois grandes desafios: o desperdício de tokens e a desordem do sistema. Especialistas apontam que as empresas precisam de avaliar com mais cuidado quando usar modelos de linguagem de grande escala, para evitar desperdício de recursos desnecessário. Além disso, a colaboração entre vários agentes de IA pode causar problemas de transmissão de mensagens e de consistência do estado, indicando que ainda é necessário melhorar a normalização atual. Embora o comentário de Huang Renxun sobre a perspetiva dos indicadores de salário em tokens tenha sido mencionado, o feedback mostra que isto não equivale a produtividade; o valor real reside na conceção eficaz de tarefas.

ChainNewsAbmedia3h atrás

A IA devora 80% do capital de risco global; no 1.º trimestre de 2026, leva 240 mil milhões de dólares: como é que os intervenientes no setor cripto podem dar resposta à redistribuição de fundos

De acordo com a informação, no primeiro trimestre de 2026, o montante total global de capital de risco foi quase de 300 mil milhões de dólares, com as empresas relacionadas com IA a deterem cerca de 242 mil milhões de dólares, ou 80% do capital de risco. Isto mostra que a IA se tornou o principal foco do capital de risco. À medida que os fundos se concentram na IA, outras áreas como a crypto têm sofrido pressão, pelo que os intervenientes precisam de ajustar as suas estratégias, integrando a IA de forma mais profunda nos seus negócios, e antecipando uma tendência de consolidação de infraestruturas.

ChainNewsAbmedia8h atrás

Robô humanoide de honra vence a Meia-Maratona Yizhuang de Pequim 2026 em 50 minutos e 26 segundos

O Meia-Maratona Yizhuang de Pequim 2026 contou com robôs humanoides a competir numa distância de 21,0975 km. A equipa autónoma Qitian Dasheng venceu em 50:26, enquanto a equipa de controlo remoto Jueying Chitu terminou em primeiro no tempo líquido, mas ficou com uma classificação inferior devido a penalizações.

GateNews9h atrás

Polícia de Hong Kong alerta para burla em criptomoedas de “trading quantitativo de IA”; mulher perde 7,7 milhões de HKD

A polícia de Hong Kong revelou um caso de fraude em criptomoedas em que uma mulher perdeu 7,7 milhões de HKD para burlões que se faziam passar por especialistas em investimento via Telegram, prometendo retornos elevados através de negociação por IA. A polícia alertou o público para os riscos associados aos investimentos em criptomoedas.

GateNews9h atrás

Cofundador da Ethereum Lubin: A IA será o ponto de viragem crítico para as criptomoedas, mas o monopólio das gigantes da tecnologia coloca um risco sistémico

O cofundador da Ethereum, Joseph Lubin, destacou o potencial transformador da IA para o sector das criptomoedas, ao mesmo tempo que alertou para os riscos da centralização entre grandes empresas de tecnologia. Ele imagina transacções autónomas impulsionadas por IA na blockchain e sublinha a convergência das finanças tradicionais com a DeFi.

GateNews04-18 14:01

Luffa faz parceria com plataforma de activos digitais para integrar trading cripto com IA

Luffa, um ecossistema social Web3, fez parceria com uma plataforma de negociação de activos digitais para integrar funcionalidades de trading orientadas por IA, melhorando a comunicação segura e o trading numa interface unificada, mantendo a descentralização e a mitigação de riscos.

GateNews04-18 06:31
Comentar
0/400
Nenhum comentário