A batalha dos frameworks de agentes de IA: quem é o melhor entre Eliza, Rig e Daydreams

Autores: Shlok Khemani, Oliver Jaros Fonte: Decentralised.co Tradução: Shanooba, Golden Finance

O artigo de hoje é uma explicação do quadro de agentes e uma avaliação do seu nível de desenvolvimento. Também é um pedido de propostas destinado aos fundadores que trabalham na interseção entre moedas da Internet (criptografia) e agentes.

No último ano, a Decentralised.co mergulhou profundamente na interseção entre criptografia e inteligência artificial. Nós até mesmo construímos um produto usado por mais de 70.000 pessoas para rastrear agentes de inteligência artificial e infraestrutura de agentes. Embora o frenesi em torno desse campo tenha diminuído nas últimas semanas, o impacto da inteligência artificial na tecnologia e na sociedade é algo que nunca vimos desde a internet. Se a criptomoeda se tornar o caminho financeiro do futuro, como previmos, sua interação com a inteligência artificial será um tema recorrente, em vez de uma ocorrência única.

Uma das categorias de projetos mais interessantes que surgiram dessa onda é a estrutura de agentes de inteligência artificial nativos de criptografia. Eles são uma experiência fascinante que traz os princípios fundamentais da blockchain - transferência de valor sem permissão, transparência e incentivos consistentes - para o desenvolvimento de inteligência artificial. Sua natureza de código aberto nos oferece uma rara oportunidade de explorar seu funcionamento interno, não apenas para analisar suas promessas, mas também para analisar sua forma real de operar.

Neste artigo, primeiro analisamos o significado real dos frameworks de agente e sua importância. Em seguida, abordamos uma questão óbvia: por que precisamos de frameworks nativos criptografados quando opções maduras como LangChain existem? Para isso, analisamos os principais frameworks nativos criptografados, bem como suas vantagens e limitações em diferentes casos de uso. Por fim, se estiver a construir um agente de inteligência artificial, ajudaremos a decidir qual framework pode atender às suas necessidades, ou se deve usar um framework para a construção.

Vamos aprofundar esta questão.

Abstrato

"O progresso da civilização reside na expansão do número de operações importantes que podemos executar sem hesitação." - Alfred North Whitehead

Pense em como os nossos antepassados viviam. Cada família tinha que cultivar os seus alimentos, fazer as suas roupas, construir as suas próprias habitações. Passavam inúmeras horas em tarefas básicas de sobrevivência, mal tendo tempo para mais alguma coisa. Mesmo há dois séculos, quase 90% das pessoas trabalhavam na agricultura. Hoje em dia, compramos alimentos nos supermercados, habitamos em casas construídas por especialistas, vestimos roupas produzidas em fábricas distantes. Tarefas que outrora consumiam o esforço de várias gerações tornaram-se simples transações. Atualmente, apenas 27% da população mundial trabalha na agricultura (nos países desenvolvidos, esse número desce para menos de 5%).

Quando começamos a dominar uma nova tecnologia, surgem padrões familiares. Começamos por compreender os princípios básicos - o que é eficaz, o que não é eficaz e quais os padrões que surgem repetidamente. Uma vez que esses padrões se tornam claros, embalhamo-los em abstrações mais fáceis, rápidas e confiáveis. Estas abstrações libertam tempo e recursos para lidar com desafios mais diversos e significativos. É assim também na construção de software.

Tomando o desenvolvimento da Web como exemplo. No início, os desenvolvedores precisavam escrever tudo do zero - lidar com solicitações HTTP, gerenciar o estado e criar interfaces do usuário - tarefas complexas e demoradas. Posteriormente, surgiram estruturas como o React, que simplificaram enormemente esses desafios, fornecendo abstrações úteis. O desenvolvimento móvel também seguiu um caminho semelhante. Inicialmente, os desenvolvedores precisavam de conhecimentos específicos e profundos da plataforma, até o surgimento de ferramentas como o React Native e o Flutter, que lhes permitiram escrever código uma vez e implantá-lo em qualquer lugar.

No campo da aprendizagem automática, também surgiram padrões de abstração semelhantes. No início dos anos 2000, os investigadores descobriram o potencial das GPUs nas cargas de trabalho de aprendizagem automática. Inicialmente, os programadores tiveram de lidar com elementos gráficos e linguagens como o GLSL, semelhantes ao OpenGL - ferramentas que não foram projetadas para computação genérica. Em 2006, a NVIDIA lançou o CUDA, tornando a programação de GPUs mais acessível e levando o treino de aprendizagem automática a um público mais amplo, o que mudou tudo.

Com o aumento do desenvolvimento de ML, surgiram estruturas específicas para abstrair a complexidade da programação da GPU. TensorFlow e PyTorch permitem que os desenvolvedores se concentrem na arquitetura do modelo, em vez de ficarem presos no código ou nos detalhes de implementação da GPU. Isso acelera a iteração da arquitetura do modelo e o rápido progresso da AI/ML que temos visto nos últimos anos.

Agora vemos uma evolução semelhante nos agentes de inteligência artificial - um programa de software capaz de tomar decisões e agir para atingir objetivos, como um assistente ou funcionário humano. Ele usa grandes modelos de linguagem como seu 'cérebro' e pode recorrer a várias ferramentas, como pesquisar na web, fazer chamadas de API ou acessar bancos de dados para concluir tarefas.

Para construir um agente do zero, os desenvolvedores precisam escrever códigos complexos para lidar com todos os aspectos: como o agente pensa, como decide quais ferramentas usar e quando usar, como interagir com essas ferramentas, como lembrar o contexto de interações anteriores e como dividir uma grande tarefa em etapas gerenciáveis. Cada padrão precisa ser tratado separadamente, o que leva a trabalho repetitivo e resultados inconsistentes.

É aqui que os frameworks de agentes de inteligência artificial entram em ação. Assim como o React simplifica o desenvolvimento web lidando com as partes complicadas de atualização de UI e gerenciamento de estado, esses frameworks abordam os desafios comuns na construção de agentes de inteligência artificial. Eles oferecem componentes prontos para padrões eficazes que descobrimos, como como construir o processo de tomada de decisão do agente, integrar diferentes ferramentas e manter o contexto em várias interações.

Usando estruturas, os desenvolvedores podem se concentrar nos aspetos que tornam seus agentes únicos — seus recursos específicos e casos de uso — em vez de reconstruir esses componentes básicos. Eles podem criar agentes de IA complexos em dias ou semanas, em vez de meses, tornando mais fácil experimentar diferentes abordagens e aprender com as melhores práticas encontradas por outros desenvolvedores e pela comunidade.

Para entender melhor a importância da estrutura, considere um desenvolvedor que esteja construindo um agente para ajudar médicos a rever relatórios médicos. Sem uma estrutura, eles teriam que escrever todo o código do zero: lidar com anexos de e-mail, extrair texto de PDFs, inserir o texto corretamente no LLM, gerenciar o histórico de conversas para rastrear o que foi discutido e garantir que o agente responda apropriadamente. Isso representa uma grande quantidade de código complexo para tarefas que não são exclusivas do seu caso de uso.

Usando um quadro de agente, muitos desses blocos de construção podem ser usados diretamente. O quadro trata da leitura de e-mails e PDFs, fornece padrões para dicas de conhecimento médico, gerencia fluxos de conversa e até ajuda a rastrear detalhes importantes em várias interações. Os desenvolvedores podem se concentrar em aspectos distintos de seus agentes, como ajustar dicas de análise médica ou adicionar verificações de segurança específicas para diagnósticos, em vez de reinventar padrões comuns. O que originalmente poderia levar meses para construir do zero agora pode ser prototipado em questão de dias.

LangChain tornou-se a navalha suíça do desenvolvimento de inteligência artificial, fornecendo um conjunto flexível de ferramentas para a construção de aplicativos baseados em LLM. Embora não seja estritamente um framework de agente, ele fornece os blocos de construção básicos para a maioria dos frameworks de agente, desde cadeias usadas para classificar chamadas LLM até sistemas de memória usados para manter o contexto. Seu amplo ecossistema de integração e documentação abrangente o tornam o ponto de partida preferido para desenvolvedores que desejam construir aplicativos práticos de inteligência artificial.

Em seguida, há estruturas multiagente como o CrewAI e o AutoGen, que permitem aos desenvolvedores construir sistemas nos quais vários agentes de IA colaboram, cada um com seu papel e habilidades únicas. Essas estruturas não apenas executam tarefas sequencialmente, mas enfatizam a colaboração dos agentes por meio de diálogo para resolver problemas em conjunto.

Por exemplo, ao distribuir um relatório de pesquisa, um agente pode resumir a sua estrutura, outro agente pode recolher informações relevantes, e um terceiro agente pode rever e aprimorar o rascunho final. É como montar uma equipa virtual, onde os agentes de inteligência artificial podem discutir, debater e colaborar para melhorar soluções. Este tipo de trabalho colaborativo para atingir objetivos de alto nível em sistemas multi-agentes é frequentemente referido como um 'cluster' de agentes de inteligência artificial.

Embora o AutoGPT não seja um framework tradicional, ele introduziu o conceito de agentes de inteligência artificial autônomos. Ele demonstra como a inteligência artificial pode receber um objetivo de alto nível, decompor em subtarefas e completar de forma independente com muito pouca entrada humana. Apesar de suas limitações, o AutoGPT desencadeou uma onda de inovação em agentes autônomos e influenciou o design de estruturas mais estruturadas subsequentes.

Mas por que é que é criptografado?

Todo esse pano de fundo nos leva, finalmente, ao surgimento do framework de inteligência artificial nativa de criptografia. Neste ponto, você pode estar se perguntando, por que o Web3 precisa de seu próprio framework, quando já temos frameworks relativamente maduros como Langchain e CrewAI no Web2? Certamente, os desenvolvedores podem usar esses frameworks existentes para construir qualquer agente que desejarem? Dada a tendência da indústria de impor o Web3 a todas as narrativas, essa dúvida é compreensível.

Acreditamos que a existência de estruturas de agentes específicas da Web3 tem três razões suficientes.

Agentes financeiros em execução na cadeia

Acreditamos que no futuro a maioria das transações financeiras ocorrerá na pista de blockchain. Isso acelera a demanda por um tipo de agente de inteligência artificial que pode analisar dados on-chain, executar transações de blockchain e gerenciar ativos digitais em vários protocolos e redes. Desde robôs de negociação automatizados que podem detectar oportunidades de arbitragem até gestores de carteira de investimento que executam estratégias de rendimento, esses agentes dependem da profunda integração das funcionalidades de blockchain em seus fluxos de trabalho principais.

Os frameworks Web2 tradicionais não fornecem componentes nativos para essas tarefas. Você tem que juntar bibliotecas de terceiros para interagir com contratos inteligentes, analisar eventos brutos na cadeia e gerenciar chaves privadas - introduzindo complexidade e possíveis vulnerabilidades. Em contraste, os frameworks Web3 especializados podem lidar com essas funcionalidades prontas para uso, permitindo que os desenvolvedores se concentrem na lógica e estratégia de seus contratos, em vez de lutar com os detalhes de baixo nível da cadeia de blocos.

Coordenação e incentivo nativos

Blockchain não se limita apenas a moedas digitais. Eles fornecem um sistema de registro global e de minimização de confiança, e ferramentas financeiras embutidas podem melhorar a coordenação entre múltiplos agentes. Os desenvolvedores podem usar primitivas on-chain (como apostas, custódia e piscinas de incentivo) para coordenar os interesses de vários agentes de IA, em vez de depender da reputação off-chain ou de bancos de dados isolados.

Imagine um grupo de agentes colaborando em uma tarefa complexa (por exemplo, rotular dados para treinar um novo modelo). O desempenho de cada agente pode ser acompanhado on-chain, e as recompensas são distribuídas automaticamente com base nas contribuições. A transparência e imutabilidade do sistema baseado em cadeias de blocos permite uma remuneração justa, um acompanhamento mais forte da reputação e regimes de incentivos que evoluem em tempo real.

A estrutura nativa de criptografia pode incorporar explicitamente essas funcionalidades, permitindo que os desenvolvedores projetem uma estrutura de incentivo com contratos inteligentes sem ter que redesenhar a roda sempre que precisarem delegar confiança ou pagar a outro delegado.

Novas oportunidades no mercado inicial

Embora estruturas como LangChain já tenham ideias compartilhadas e efeitos de rede, o campo de agentes de inteligência artificial ainda está em estágios iniciais. Atualmente, não está claro como esses sistemas acabarão parecendo e não há uma maneira de garantir o mercado.

A economia cripto abre novas possibilidades para a construção, gestão e monetização baseadas em incentivos, possibilidades estas que não podem ser totalmente mapeadas para a economia tradicional SaaS ou Web2. Nesta fase inicial, experimentos podem desbloquear novas estratégias de monetização para o próprio framework, em vez de apenas para os agentes construídos sobre o framework.

Concorrentes

ElizaOS está associado ao projeto popular AI16Z, é um framework baseado em Typescript para criar, implantar e gerenciar agentes de IA. Foi projetado como um sistema operacional de agentes de IA amigável ao Web3, permitindo aos desenvolvedores construir agentes com personalidades únicas, ferramentas flexíveis para interações com blockchain e fácil escalabilidade através de sistemas multiagente. Rig é um framework de agente de IA de código aberto desenvolvido pela Playgrounds Analytics Inc., construído com a linguagem de programação Rust, para criar agentes de IA modulares e escaláveis. Está associado ao projeto AI Rig Complex (ARC).
Daydreams é uma estrutura de proxy generativa que foi originalmente criada para criar proxies autônomos para jogos on-chain, mas desde então se expandiu para executar tarefas on-chain.
Pippin é uma estrutura de agência de IA desenvolvida por Yohei Nakajima, o fundador da BabyAGI, para ajudar os desenvolvedores a criar assistentes digitais modulares e autônomos. Yohei primeiro construiu um agente autônomo e depois o estendeu para uma estrutura de uso geral.
ZerePy é um framework Python de código aberto, projetado para implantar agentes autônomos em várias plataformas e blockchains, com foco em integração de IA criativa e mídias sociais. Assim como o Pippin, o Zerepy inicialmente era um agente autônomo independente chamado Zerebro, que depois se expandiu para um framework.

padrão

Para avaliar a força de cada estrutura, colocamo-nos no lugar dos desenvolvedores interessados em construir um agente de IA. O que lhes interessa? Achamos útil dividir a avaliação em três categorias principais: núcleo, funcionalidade e experiência do desenvolvedor.

Você pode considerar o núcleo do framework como a base para a construção de todos os outros agentes. Se o núcleo for fraco, lento ou não estiver em constante desenvolvimento, os agentes criados com esse framework serão limitados da mesma forma. O núcleo pode ser avaliado com base nos seguintes critérios:

**Núcleo de Raciocínio: **o cérebro de qualquer estrutura de agente; como resolve problemas. Um framework poderoso suporta tudo, desde fluxos de entrada e saída básicos até padrões complexos, como cadeias de pensamento. Sem uma capacidade de raciocínio robusta, o agente não pode decompor eficazmente tarefas complexas ou avaliar várias opções, simplificando-as em apenas um conversor de bate-papo elegante.
Mecanismo de memória: Os agentes precisam de memória de curto prazo para conversas contínuas e armazenamento de longo prazo para conhecimento persistente. Boas estruturas não se lembram apenas – elas entendem as relações entre diferentes informações e podem priorizar quais informações valem a pena manter e o que vale a pena esquecer.
Incorporação e suporte RAG: Os agentes modernos devem usar conhecimento externo, como documentação e dados de mercado. Estruturas poderosas facilitam a incorporação dessas informações e a recuperação contextual por meio do RAG, baseando as respostas em conhecimentos específicos, em vez de depender apenas do treinamento básico do modelo.
Configuração personalizada: A capacidade de moldar a forma como os agentes de suporte se comunicam (tom, etiqueta e personalidade) é crucial para o envolvimento do utilizador. Uma estrutura sólida pode configurar facilmente essas características, reconhecendo que a personalidade dos agentes de suporte pode ter um impacto significativo na confiança do utilizador.
Coordenação multiagente: O poderoso framework fornece padrões embutidos para a colaboração entre agentes, seja por meio de diálogos estruturados, delegação de tarefas ou sistemas de memória compartilhada. Isso pode criar equipes profissionais, onde cada agente contribui com suas habilidades únicas para resolver problemas em conjunto.

Para além das funcionalidades principais, a utilidade real do framework depende em grande parte das suas funcionalidades e integração. As ferramentas expandem significativamente as funcionalidades reais do agente. Um agente com apenas acesso ao LLM pode participar numa conversa, mas se lhe for concedido acesso a um navegador Web, pode obter informações em tempo real. Conecte-o à sua API de calendário e ele pode agendar reuniões. Cada nova ferramenta aumenta exponencialmente as funcionalidades do agente. Do ponto de vista dos programadores, quanto mais ferramentas, maior a opção e o alcance experimental.

Avaliamos a funcionalidade de estruturas criptonativas em três dimensões:

Suporte e recursos do modelo de IA: A estrutura poderosa oferece integração nativa com uma variedade de modelos de linguagem - desde a série GPT da OpenAI até soluções alternativas de código aberto como Llama e Mistral. No entanto, isso não se limita apenas ao LLM. O suporte para outras funcionalidades de IA, como conversão de texto em fala, uso do navegador, geração de imagens e inferência de modelos locais, pode expandir significativamente as capacidades do agente. O suporte robusto do modelo está se tornando um requisito essencial para muitas estruturas desse tipo.
Suporte à infraestrutura Web3: Construir um proxy criptográfico requer uma integração profunda com a infraestrutura blockchain. Isso significa suportar os componentes Web3 necessários, como carteiras para assinatura de transações, RPC para comunicação de cadeia e indexadores para acesso a dados. Um framework robusto deve integrar-se com as ferramentas e serviços fundamentais de todo o ecossistema, desde mercados de NFT e protocolos DeFi até soluções de identidade e camadas de disponibilidade de dados.
Cobertura da cadeia: o suporte à infraestrutura Web3 determina o que os agentes podem fazer, enquanto a cobertura da cadeia determina onde eles podem fazê-lo. O ecossistema cripto está evoluindo para um gigante descentralizado e multicadeia, destacando a importância de uma ampla cobertura da cadeia.

Por último, mesmo o framework mais poderoso só será tão bom quanto a experiência dos desenvolvedores. Um framework pode ter funcionalidades de primeira linha, mas se os desenvolvedores tiverem dificuldade em utilizá-lo eficazmente, nunca será amplamente adotado.

A linguagem utilizada no framework afeta diretamente quem pode usá-lo para construir. O Python domina tanto no campo da inteligência artificial quanto na ciência de dados, tornando-se naturalmente a escolha para frameworks de inteligência artificial. Frameworks escritos em linguagens de nicho podem ter vantagens únicas, mas podem se isolar do ecossistema de desenvolvedores mais amplo. A prevalência do JavaScript no desenvolvimento web o torna outro concorrente forte, especialmente para frameworks voltados para integração web.
Documentos claros e abrangentes são a linha de vida dos desenvolvedores ao adotar novos frameworks. Isso não é apenas uma referência de API, embora isso também seja crucial. Documentação poderosa inclui uma visão geral de conceitos que explicam os princípios centrais, tutoriais passo a passo, exemplos de código bem comentados, tutoriais educativos, guias de solução de problemas e padrões de design estabelecidos.

Resultados

A tabela abaixo resume o desempenho de cada estrutura nos parâmetros que acabamos de definir (classificação 1-5).

Embora discutir as razões por trás de cada ponto de dados esteja além do escopo deste artigo, aqui estão algumas impressões marcantes deixadas por cada estrutura.

Eliza é, de longe, a estrutura mais madura desta lista. Dado que a estrutura Eliza se tornou um ponto de Schelling para o ecossistema cripto alcançar a IA na recente onda de proxies, uma característica que se destaca é o grande número de recursos e integrações que suporta.

Devido à sua notoriedade, cada blockchain e ferramenta de desenvolvimento estão ansiosos para se integrar ao framework (atualmente possui quase 100 integrações!). Ao mesmo tempo, Eliza também atrai mais atividades de desenvolvedores do que a maioria dos frameworks. Eliza pelo menos se beneficia a curto prazo de alguns efeitos de rede muito claros. O framework é escrito em TypeScript, que é uma linguagem madura utilizada tanto por iniciantes quanto por desenvolvedores experientes, o que impulsiona ainda mais o seu desenvolvimento.

Eliza também se destaca por seu rico conteúdo educacional e tutoriais para desenvolvedores usarem a estrutura.

Já vimos uma série de agentes que utilizam o quadro Eliza, incluindo Spore, Eliza (agente) e Pillzumi. Espera-se que a nova versão do quadro Eliza seja lançada nas próximas semanas.

O método do Rig é fundamentalmente diferente do método do Eliza. Ele se destaca por ter um núcleo poderoso, leve e de alto desempenho. Suporta vários modos de raciocínio, incluindo cadeias de prompts (aplicação sequencial de prompts), orquestração (coordenação de múltiplos agentes), lógica condicional e paralelismo (execução de operações em paralelo).

No entanto, o Rig em si não tem uma integração tão rica. Em vez disso, adota uma abordagem diferente, que a equipe chama de "aperto de mão Arc". Aqui, a equipe Arc colabora com diferentes equipes de alta qualidade do Web2 e Web3 para expandir as funcionalidades do Rig. Algumas dessas colaborações incluem a colaboração com a Soulgraph no desenvolvimento de personalizações de agente, bem como a colaboração com Listen e Solana Agent Kit no desenvolvimento de funcionalidades de blockchain.

No entanto, o Rig tem duas desvantagens. Em primeiro lugar, é escrito em Rust, que tem um desempenho excelente, mas é menos familiar para os desenvolvedores. Em segundo lugar, vimos apenas um número limitado de proxies com suporte para o Rig em aplicações reais (com a exceção do AskJimmy), o que torna difícil avaliar a adoção real pelos desenvolvedores.

Antes do Daydreams começar, o fundador lordOfAFew era o principal contribuidor do framework Eliza. Isso o expôs ao crescimento do framework e, mais importante, a algumas deficiências. A diferença do Daydreams para outros frameworks é que ele se concentra em raciocínio encadeado para ajudar os agentes a alcançar objetivos de longo prazo. Isso significa que, ao ser dado um objetivo de alto nível e complexo, o agente realizará raciocínio em várias etapas, propõe várias ações, aceita ou descarta com base em se elas ajudarão a alcançar o objetivo e continua o processo para progredir. Isso permite que os agentes criados com o Daydreams sejam verdadeiramente autônomos.

A formação dos fundadores influenciou este método de construção de projetos de jogos. Os jogos, especialmente os baseados em blockchain, são o ambiente ideal para treinar e testar as capacidades dos agentes. Não é surpreendente que alguns dos primeiros casos de uso do Daydreams Agent tenham sido em jogos como Pistols, Istarai e PonziLand.

Este framework também possui uma implementação poderosa de colaboração e fluxo de trabalho de orquestração multi-agente.

Semelhante a Daydreams, Pippin também é um retardatário para jogos de quadro. Detalhamos seu lançamento neste post. No centro da visão de Yohei está que os agentes sejam uma "presença digital" que possa operar de forma inteligente e autónoma com acesso às ferramentas certas. Esta visão é incorporada no núcleo simples, mas elegante, de Pippin. Com apenas algumas linhas de código, você pode criar um agente complexo que pode ser executado de forma autônoma ou até mesmo escrever código para si mesmo.

A desvantagem deste framework é que lhe faltam até funcionalidades básicas como suporte para incorporação de vetores e fluxo de trabalho RAG. Também incentiva os desenvolvedores a utilizarem a biblioteca de terceiros Composio para a maioria das integrações. Comparado com outros frameworks discutidos até agora, ele está longe de ser maduro.

Alguns dos proxies construídos com Pippin incluem Ditto e Telemafia.

Zerepy tem uma implementação central relativamente simples. Ele seleciona eficazmente uma tarefa de um conjunto de tarefas configuradas e a executa quando necessário. No entanto, carece de padrões de raciocínio complexos, como orientação por objetivos ou planejamento em cadeia de pensamento.

Embora suporte chamadas de inferência para vários LLMs, carece de qualquer implementação embutida ou RAG. Também carece de qualquer primitiva para memória ou coordenação de múltiplos agentes.

Esta falta de funcionalidades centrais e integração reflete-se na adoção do Zerepy. Ainda não vimos nenhum agente real usando este quadro online.

Construa com frameworks

Se tudo isso soa muito técnico e teórico, não te culpamos. Uma pergunta mais simples seria "Posso usar essas estruturas para construir que tipo de agente sem ter que escrever um monte de código?".

Para avaliar esses frameworks na prática, identificamos cinco tipos comuns de agentes que os desenvolvedores frequentemente desejam construir. Eles representam diferentes níveis de complexidade e testam vários aspectos das funcionalidades de cada framework.

Agente de Chat de Documentos: Testar a funcionalidade central RAG, incluindo o tratamento de documentos, manutenção de contexto, precisão de citações e gestão de memória. Este teste revela a capacidade de navegação do framework entre compreensão real de documentos e correspondência de padrões simples.
Chatbots: Avalie sistemas de memória e consistência comportamental. A estrutura deve manter traços de personalidade consistentes, lembrar informações-chave da conversa e permitir a configuração de personalidade que essencialmente transforma um chatbot sem estado em uma entidade digital persistente.
Robô de negociação on-chain: Realizando testes de integração externa processando dados de mercado em tempo real, executando transações cross-chain, analisando sentimentos sociais e implementando estratégias de negociação. Isso revela como o framework lida com infraestruturas complexas de blockchain e conexões de API.
NPCs de jogos: Embora o mundo só tenha começado a se concentrar em agentes no último ano, os agentes desempenharam um papel crucial como um personagem não-jogador em (NPC) jogo por décadas. Os proxies de jogos estão fazendo a transição de proxies baseados em regras para proxies inteligentes alimentados por LLM e continuam sendo o principal caso de uso para frameworks. Aqui, testamos a capacidade do agente de entender o ambiente, cenários de raciocínio autônomo e alcançar objetivos de longo prazo.
Assistente de Voz: Avaliar o processamento em tempo real e a experiência do usuário através do processamento de voz, tempo de resposta rápido e integração com plataformas de mensagens. Isso testa se o framework pode suportar aplicativos verdadeiramente interativos, em vez de apenas o simples modo de solicitação-resposta.

Damos uma pontuação de 5 pontos para cada estrutura para cada tipo de agente. Aqui está o desempenho deles:

Indicadores de código aberto

! O8m4ShXL3jqjBDkDuKi9liuV2S1kBT3x5oqoX8dd.png

Ao avaliar esses frameworks, a maioria das análises dá muita importância às métricas do GitHub, como stars e fork. Aqui, vamos dar uma rápida visão geral do que essas métricas são e em que medida elas indicam a qualidade do framework.

As estrelas funcionam como o sinal mais óbvio de popularidade. Eles são essencialmente marcadores que os desenvolvedores dão a projetos que eles acham interessantes ou querem acompanhar. Embora um número de estrelas alto indique uma ampla gama de cognição e interesse, pode ser enganoso. Por vezes, os projetos acumulam estrelas através do marketing e não do valor técnico. Pense nas estrelas como uma prova social, não como uma medida de qualidade.

O número de forks indica quantos desenvolvedores criaram cópias do repositório de código para construir em cima dele. Mais forks geralmente indicam que os desenvolvedores estão ativamente usando e expandindo o projeto. Ou seja, muitos forks acabam sendo abandonados, portanto, o número original de forks precisa de contexto.

O número de contribuintes revela quantos desenvolvedores diferentes realmente enviaram código para o projeto. Isso geralmente é mais significativo do que estrelas ou forks. Um número saudável de contribuintes regulares indica que o projeto tem uma comunidade ativa mantendo e melhorando-o.

Vamos mais longe e criamos nosso próprio indicador - a pontuação do contribuidor. Avaliamos o histórico público de cada desenvolvedor, incluindo suas contribuições passadas para outros projetos, a frequência de atividade e a popularidade de suas contas, atribuindo a cada contribuidor uma pontuação. Em seguida, calculamos a média de todos os contribuidores de um projeto e ponderamos de acordo com o número de contribuições que fizeram.

O que significam esses números para o nosso framework?

Na maioria dos casos, o número de estrelas é insignificante. Não são um indicador significativo de adoção. A exceção aqui é Eliza, que em um ponto se tornou o repositório de tendência número um de todos os projetos no GitHub, que coincide com o ponto de Schelling onde se tornou toda a IA cripto. Além disso, desenvolvedores bem conhecidos como 0xCygaar contribuíram para o projeto. Isso também se reflete no número de colaboradores – 10 vezes mais do que outros projetos – e Eliza atrai contribuidores.

Além disso, os Devaneios são interessantes para nós simplesmente porque atraem desenvolvedores de alta qualidade. Como um recém-chegado lançado após o pico de hype, ele não se beneficiou do efeito de rede da Eliza.

Qual é o próximo passo?

Se és um desenvolvedor, esperamos ter, pelo menos, fornecido um ponto de partida para a escolha do quadro que desejas construir (se necessário). Ainda assim, terás de testar arduamente se o raciocínio central e a integração de cada quadro são adequados para o teu caso de uso. Isso é inevitável.

Do ponto de vista de um observador, é importante lembrar que todos esses frameworks de agentes de inteligência artificial têm menos de três meses. (Sim, parece mais longo.) Durante este tempo, eles passaram de extremamente hyped para o que é chamado de "castelo no ar". Esta é a natureza da tecnologia. Apesar dessa volatilidade, acreditamos que este campo é um novo e interessante experimento duradouro no campo da criptografia.

O que importa a seguir é como essas estruturas amadurecem em termos de tecnologia e monetização.

Em termos de tecnologia, o principal benefício que um framework pode proporcionar é permitir que os agentes interajam perfeitamente na cadeia. Esta é a principal razão pela qual os desenvolvedores optam por frameworks criptográficos nativos em vez de frameworks genéricos. Além disso, a tecnologia de construção de agentes e de agentes é um problema de ponta global, com novos desenvolvimentos diários. Os frameworks também precisam evoluir constantemente e se adaptar a esses avanços.

Como a estrutura torna a monetização mais interessante. Nestes estágios iniciais, criar uma plataforma de lançamento inspirada em Virtuals é um fruto facilmente alcançável do projeto. Mas acreditamos que há muito espaço para experimentação aqui. Estamos caminhando em direção a um futuro com milhões de agentes, especializados em todos os tipos de áreas de nicho imagináveis. Ferramentas que os ajudem a coordenar eficazmente podem capturar um valor enorme das taxas de transação. Como um portal para construtores, a estrutura é certamente a mais adequada para capturar esse valor.

Ao mesmo tempo, a monetização de frameworks também é disfarçada como uma questão de monetizar projetos de código aberto e recompensar contribuidores, que historicamente fizeram um trabalho gratuito e ingrato. Se uma equipe puder decifrar código sobre como criar uma economia de código aberto sustentável, mantendo seu ethos básico, as implicações irão muito além da estrutura de proxy.

Estes são os temas que esperamos explorar nos próximos meses.

ELIZA-5.47%

Ver original

O conteúdo é apenas para referência, não uma solicitação ou oferta. Nenhum aconselhamento fiscal, de investimento ou jurídico é fornecido. Consulte a isenção de responsabilidade para obter mais informações sobre riscos.

Recompensa
curtir
Comentário
Compartilhar

Comentário

0/400

Sem comentários

Tema
#BTC#
192k Postagens
#ETH#
120k Postagens
#PI#
96k Postagens
4#GateioInto11#
76k Postagens
5#ContentStar#
64k Postagens
6#BOME#
59k Postagens
7#GT#
56k Postagens
8#DOGE#
53k Postagens
9#MAGA#
52k Postagens
10#SLERF#
51k Postagens

Marcar

sitemap