Desconstruindo Estruturas de IA: De Agentes Inteligentes à Exploração de Descentralização

intermediário1/16/2025, 6:03:33 AM
Este artigo aprofunda as tendências de desenvolvimento e lógica de investimento no campo do Agente de IA, com foco especial na análise detalhada de projetos baseados em estruturas. Ele apresenta os conceitos básicos e funcionalidades das estruturas de IA e demonstra seu desempenho e potencial em diferentes cenários de aplicação por meio de estudos de caso específicos, como Eliza, G.A.M.E, Rig e ZerePy. Além disso, a partir de perspectivas técnicas, de mercado e de investimento, o artigo compara as semelhanças entre os Agentes de IA e o ecossistema BTC, explorando o significado de trazer Agentes de IA para a blockchain e as inovações potenciais que isso pode trazer no futuro.

Introdução

Em artigos anteriores, discutimos frequentemente nossas opiniões sobre o estado atual dos Memes de IA e o desenvolvimento futuro dos Agentes de IA. No entanto, o rápido desenvolvimento narrativo e a evolução da trilha de Agentes de IA ainda têm sido um tanto avassaladores. Nos breves dois meses desde o lançamento do “Truth Terminal” e o início do Agent Summer, a narrativa da integração de IA e Crypto evoluiu quase semanalmente. Recentemente, a atenção do mercado começou a se voltar para projetos “framework”, que são principalmente impulsionados por narrativas tecnológicas. Este subcampo de nicho já produziu vários projetos unicorn com um limite de mercado de mais de um bilhão de dólares nas últimas semanas. Esses projetos também levaram a um novo paradigma para emissão de ativos, onde os projetos emitem tokens com base em seus repositórios de código do GitHub, e os Agentes construídos nessas estruturas também podem emitir tokens. No cerne desta estrutura, temos frameworks, com Agentes como a camada acima. Isso se assemelha a uma plataforma de emissão de ativos, mas na verdade é um modelo infraestrutural único que está surgindo na era da IA. Como devemos encarar essa nova tendência? Este artigo começará com uma introdução aos frameworks e oferecerá uma interpretação do que os frameworks de IA significam para Crypto, combinando essas percepções com nossas próprias reflexões.

I. O que é um Framework?

Por definição, um framework de IA é uma ferramenta ou plataforma de desenvolvimento subjacente que integra um conjunto de módulos, bibliotecas e ferramentas pré-construídas para simplificar o processo de construção de modelos de IA complexos. Esses frameworks geralmente também incluem funções para lidar com dados, treinar modelos e fazer previsões. Em termos simples, você pode pensar em um framework como um sistema operacional para a era da IA, semelhante a sistemas operacionais de desktop como Windows ou Linux, ou sistemas operacionais móveis como iOS e Android. Cada framework tem suas próprias vantagens e desvantagens, permitindo que os desenvolvedores escolham com base em suas necessidades específicas.

Embora o termo “estrutura de IA” ainda seja um conceito relativamente novo no campo da criptografia, seu desenvolvimento remonta a quase 14 anos, começando com Theano em 2010. Na comunidade tradicional de IA, tanto a academia quanto a indústria já desenvolveram estruturas muito maduras para escolher, como o TensorFlow do Google, o PyTorch da Meta, o PaddlePaddle da Baidu e o MagicAnimate da ByteDance, cada um com suas vantagens em diferentes cenários.

Os projetos de framework de IA atualmente emergentes em Crypto são baseados na demanda por um grande número de Agentes decorrentes do boom de IA, e estes se ramificaram em outras trilhas em Crypto, formando eventualmente diferentes frameworks de IA para subcampos específicos. Vamos explorar alguns dos frameworks mainstream atuais na indústria para ilustrar melhor esse ponto.

1.1 Eliza

Primeiro, vamos considerar Eliza, um framework criado pela ai16z. É um framework de simulação multi-agente projetado para criar, implantar e gerenciar agentes de IA autônomos. Desenvolvido usando TypeScript como linguagem de programação, sua vantagem está na melhor compatibilidade e integração API mais fácil. De acordo com a documentação oficial, Eliza é principalmente projetado para mídias sociais, oferecendo suporte para integrações multiplataforma. O framework fornece integração completa com o Discord, suportando canais de voz, contas automatizadas para X/Twitter, integração do Telegram e acesso direto à API. Em termos de processamento de conteúdo de mídia, ele suporta leitura e análise de documentos PDF, extração e resumo de links, transcrição de áudio, tratamento de conteúdo de vídeo, análise de imagens e resumos de conversas.

Os casos de uso suportados pela Eliza atualmente incluem as seguintes quatro categorias:

  1. Aplicações do assistente de IA: agentes de suporte ao cliente, administradores de comunidade, assistentes pessoais.
  2. Funções nas Redes Sociais: Criadores de conteúdo automatizados, bots interativos, representantes de marcas.
  3. Trabalhadores do conhecimento: assistentes de pesquisa, analistas de conteúdo, processadores de documentos.
  4. Funções Interativas: Personagens de jogo de interpretação, tutores educacionais, bots de entretenimento.

Os modelos atualmente suportados pela Eliza são:

  1. Modelos de inferência local de código aberto: como Llama3, Qwen1.5, BERT.
  2. Inferência em nuvem via API OpenAI.
  3. Configuração padrão como Nous Hermes Llama 3.1B.
  4. Integração com Claude para consultas complexas.

1.2 G.A.M.E

G.A.M.E (Generative Autonomous Multimodal Entities Framework) é um framework de IA multimodal para geração e gerenciamento automático, lançado pela Virtual. É projetado principalmente para o projeto inteligente de NPC em jogos. Um aspecto único deste framework é que ele permite que até mesmo usuários com pouco ou nenhum código participem do design do Agente, simplesmente modificando parâmetros por meio de sua interface de teste.

Em termos de arquitetura do projeto, G.A.M.E é construído com um design modular, onde múltiplos subsistemas trabalham juntos em colaboração. A arquitetura detalhada é a seguinte:

  1. Agent Prompting Interface: A interface para os desenvolvedores interagirem com a estrutura de IA. Por meio dessa interface, os desenvolvedores podem iniciar uma sessão e especificar IDs de sessão, IDs de agente, IDs de usuário e outros parâmetros.
  2. Subsistema de Percepção: Responsável por receber informações de entrada, sintetizá-las e enviá-las para o mecanismo de planejamento estratégico. Também lida com as respostas do módulo de processamento de diálogo.
  3. Motor de Planejamento Estratégico: O núcleo de todo o framework, dividido em um planejador de alto nível e uma política de baixo nível. O planejador de alto nível é responsável por formular metas e planos de longo prazo, enquanto a política de baixo nível traduz esses planos em ações específicas.
  4. Contexto Mundial: Contém informações ambientais, estado mundial e dados do estado do jogo, ajudando os agentes a entender seu contexto atual.
  5. Módulo de Processamento de Diálogo: Lida com mensagens e respostas, gerando diálogo ou reações como saída.
  6. Operador de Carteira On-Chain: Provavelmente relacionado a aplicações de tecnologia blockchain, embora as funções específicas não estejam claras.
  7. Módulo de Aprendizagem: Aprende com o feedback e atualiza a base de conhecimento do agente.
  8. Memória de trabalho: Armazena ações recentes, resultados e planos atuais, entre outras informações de curto prazo.
  9. Processador de Memória de Longo Prazo: Extrai e classifica informações importantes sobre o agente e sua memória de trabalho com base em fatores como importância, recentidade e relevância.
  10. Repositório do Agente: Armazena os objetivos, reflexões, experiências e características do agente.
  11. Planejador de Ação: Gera planos de ação específicos com base em estratégias de baixo nível.
  12. Executor do Plano: Executa os planos de ação gerados pelo planejador de ação.

Fluxo de trabalho: os desenvolvedores iniciam um agente via a Interface de Solicitação de Agente, onde o Subsistema de Percepção recebe a entrada e a envia para o Motor de Planejamento Estratégico. O motor, com a ajuda do sistema de memória, contexto mundial e repositório de Agentes, formula e executa um plano de ação. O Módulo de Aprendizado monitora as ações do Agente e ajusta seu comportamento de acordo.

Cenários de Aplicação: A partir da arquitetura técnica geral, este framework concentra-se na tomada de decisões, feedback, percepção e personalidade dos Agentes em ambientes virtuais. Além dos jogos, este framework também é aplicável ao Metaverso. A lista abaixo do Virtual mostra que muitos projetos já adotaram este framework para construção.

1.3 Sonda

Rig é uma ferramenta de código aberto escrita em Rust, projetada especificamente para simplificar o desenvolvimento de aplicativos de modelo de linguagem grande (LLM). Ele fornece uma interface unificada que permite aos desenvolvedores interagir facilmente com vários provedores de serviços LLM (como OpenAI e Anthropic) e vários bancos de dados de vetores (como MongoDB e Neo4j).

Recursos principais:

  • Interface Unificada: Independentemente do provedor LLM ou armazenamento de vetor utilizado, Rig oferece um método de acesso consistente, reduzindo significativamente a complexidade do trabalho de integração.
  • Arquitetura Modular: O framework utiliza um design modular, que inclui componentes-chave como 'Camada de Abstração do Provedor', 'Interface de Armazenamento de Vetores' e 'Sistema de Agente Inteligente', garantindo flexibilidade e escalabilidade do sistema.
  • Segurança de Tipo: Aproveitando as características do Rust, Rig alcança operações de incorporação seguras por tipo, garantindo qualidade de código e segurança em tempo de execução.
  • Alto Desempenho: O sistema suporta programação assíncrona, otimizando as capacidades de processamento de concorrência. Recursos de registro e monitoramento embutidos auxiliam na manutenção e solução de problemas.

Fluxo de trabalho: Quando um usuário entra no sistema Rig, o pedido primeiro passa pela “Camada de Abstração do Provedor”, que padroniza as diferenças entre vários provedores e garante o tratamento consistente de erros. Na camada central, agentes inteligentes podem chamar diferentes ferramentas ou consultar o armazenamento de vetor para recuperar as informações necessárias. Finalmente, mecanismos avançados como a Geração com Recuperação Aprimorada (RAG) combinam a recuperação de documentos e a compreensão contextual para gerar respostas precisas e significativas antes de devolvê-las ao usuário.

Casos de uso: Rig é adequado para a construção de sistemas que requerem respostas rápidas e precisas a perguntas, criação de ferramentas eficientes de busca de documentos, desenvolvimento de chatbots ou assistentes virtuais com consciência de contexto e até mesmo suporte à criação de conteúdo através da geração automática de texto ou outras formas de conteúdo com base em padrões de dados existentes.

1.4 ZerePy

ZerePy é um framework de código aberto baseado em Python projetado para simplificar a implantação e o gerenciamento de agentes de IA na plataforma X (anteriormente Twitter). Ele evoluiu do projeto Zerebro e herdou suas funcionalidades principais, mas foi projetado de maneira mais modular e escalável. O objetivo é permitir que os desenvolvedores criem facilmente agentes de IA personalizados e implementem várias tarefas de automação e criação de conteúdo no X.

O ZerePy fornece uma interface de linha de comando (CLI), tornando conveniente para os usuários gerenciar e controlar os agentes de IA que implantam. Sua arquitetura central é modular, permitindo que os desenvolvedores integrem flexivelmente diferentes módulos funcionais, como:

  • Integração LLM: O ZerePy suporta grandes modelos de linguagem (LLMs) da OpenAI e da Anthropic, permitindo que os desenvolvedores selecionem o modelo mais adequado para sua aplicação. Isso permite que os agentes gerem conteúdo textual de alta qualidade.
  • Integração da Plataforma X: A estrutura integra diretamente com a API da X, permitindo que os agentes realizem tarefas como postar, responder, curtir e retuitar.
  • Sistema de conexão modular: Este sistema permite que os desenvolvedores adicionem facilmente suporte para outras plataformas ou serviços sociais, estendendo a funcionalidade do framework.
  • Sistema de Memória (Planos Futuros): Embora não esteja totalmente implementado na versão atual, o objetivo de design do ZerePy inclui a integração de um sistema de memória que permitiria aos agentes lembrar interações anteriores e informações contextuais para gerar conteúdo mais coerente e personalizado.

Embora tanto ZerePy quanto o projeto Eliza da a16z visem construir e gerenciar agentes de IA, eles diferem em arquitetura e foco. Eliza está mais voltado para simulações de múltiplos agentes e pesquisa mais ampla em IA, enquanto ZerePy se concentra em simplificar a implantação de agentes de IA em plataformas sociais específicas (X), tornando-o mais orientado para aplicativos.

II. Uma réplica do ecossistema BTC

Em termos de trajetória de desenvolvimento, os agentes de IA compartilham muitas semelhanças com o ecossistema BTC de finais de 2023 a inícios de 2024. A trajetória de desenvolvimento do ecossistema BTC pode ser resumida de forma simples como: competição multi-protocolo BRC20-Atomical/Rune e outros — BTC L2 — BTCFi centrado em Babilônia. Enquanto os agentes de IA têm se desenvolvido de forma mais rápida com base em pilhas de tecnologia tradicional de IA maduras, sua trajetória geral de desenvolvimento espelha o ecossistema BTC em vários aspectos. Eu resumiria da seguinte forma: GOAT/ACT — Agentes do tipo social — Competição de estrutura analítica de agentes de IA. Do ponto de vista das tendências, projetos de infraestrutura focados em descentralização e segurança em torno de agentes provavelmente seguirão essa onda de estrutura, tornando-se o próximo tema dominante.

Então, será que essa trilha, assim como o ecossistema BTC, levará à homogeneização e à bolhação? Eu não acredito nisso. Primeiro, a narrativa dos agentes de IA não se trata de recriar a história das cadeias de contratos inteligentes. Segundo, se esses projetos de estrutura de IA existentes são tecnicamente fortes, ainda estão presos na fase de PPT ou apenas Ctrl+C e Ctrl+V, pelo menos eles fornecem uma nova abordagem de desenvolvimento de infraestrutura. Muitos artigos têm comparado estruturas de IA a plataformas de emissão de ativos e agentes a ativos. No entanto, em comparação com Memecoin Launchpads e protocolos de Inscrição, eu pessoalmente acredito que estruturas de IA se assemelham a futuras cadeias públicas, enquanto agentes se assemelham a futuros DApps.

No espaço Crypto de hoje, temos milhares de cadeias públicas e dezenas de milhares de DApps. No campo das cadeias de propósito geral, temos BTC, Ethereum e várias cadeias heterogêneas, enquanto as formas de cadeias de aplicativos são mais diversas, como cadeias de jogos, cadeias de armazenamento e cadeias Dex. As cadeias públicas e os frameworks de IA são bastante semelhantes em natureza, e os DApps podem corresponder bem aos agentes.

Na era da criptografia na IA, é altamente provável que o espaço evolua nessa direção, com debates futuros mudando de EVM versus cadeias heterogêneas para debates de estrutura. A questão atual é mais sobre descentralização, ou como "encadeá-la". Acredito que futuros projetos de infraestrutura de IA se desenvolverão em torno dessa fundação. Outro ponto importante é: qual a importância de fazer isso no blockchain?

III. O Significado de On-Chain

Independentemente de qual blockchain se combine, ela enfrenta ultimamente uma questão crítica: ela é significativa? No artigo do ano passado, critiquei o GameFi por suas prioridades equivocadas, onde o desenvolvimento de infraestrutura estava excessivamente avançado, e nos artigos anteriores sobre IA, expressei ceticismo sobre a praticidade atual de combinar IA com Cripto. Afinal, a força impulsionadora da narrativa para projetos tradicionais tem enfraquecido cada vez mais. Os poucos projetos tradicionais que se saíram bem no ano passado em termos de preço do token foram geralmente aqueles que podiam igualar ou superar a força do preço.

O que a IA pode fazer pelo Crypto? Anteriormente, eu pensei em casos de uso como agentes de IA realizando tarefas em nome dos usuários, Metaverse e agentes como funcionários - ideias relativamente mundanas, mas com certas demandas. No entanto, essas demandas não exigem estar completamente na cadeia e, do ponto de vista da lógica de negócios, elas não podem formar um loop fechado. O navegador de agentes mencionado no último artigo, que implementa intenções, pode gerar demandas para marcação de dados e potência de computação de inferência, mas esses dois elementos ainda não estão totalmente integrados e, em termos de potência de computação, a computação centralizada ainda tem vantagem.

Ao revisitar o sucesso do DeFi, a razão pela qual o DeFi conseguiu conquistar uma parte das finanças tradicionais é porque ele oferece maior acessibilidade, melhor eficiência, custos mais baixos e segurança sem confiança. Se considerarmos esse quadro, acho que pode haver várias razões pelas quais a 'cadeização' dos agentes pode fazer sentido:

  1. Redução de custos: A descentralização do agente pode reduzir os custos de uso, permitindo assim uma maior acessibilidade e mais opções para os usuários? Isso poderia eventualmente permitir que usuários comuns participem do que tradicionalmente tem sido o domínio exclusivo dos gigantes da tecnologia Web2 em aluguel de IA.
  2. Segurança: De acordo com a definição mais simples, um agente é uma IA que pode interagir com o mundo virtual ou real. Se um agente pode intervir no mundo real ou até mesmo na minha carteira virtual, então soluções de segurança baseadas em blockchain poderiam se tornar uma necessidade.
  3. Jogo Financeiro Específico da Blockchain: Os agentes podem criar um conjunto único de mecanismos financeiros na blockchain? Por exemplo, no AMM (Automated Market Maker), os provedores de liquidez (LPs) permitem que os usuários comuns participem da criação de mercado automatizada. Da mesma forma, se os agentes precisarem de potência de computação ou rotulagem de dados, os usuários poderiam investir nesses protocolos na forma de USDT, com base em sua confiança no sistema. Ou, agentes em diferentes cenários de aplicação poderiam formar novas estruturas financeiras.
  4. Interoperabilidade DeFi: Embora DeFi atualmente careça de interoperabilidade perfeita, os agentes podem ser capazes de abordar esse problema, possibilitando processos de raciocínio transparentes e rastreáveis, preenchendo as lacunas.

IV. Criatividade?

Projetos de estrutura no futuro também fornecerão oportunidades empreendedoras semelhantes à Loja GPT. Embora lançar um agente via uma estrutura ainda seja complexo para usuários comuns, acredito que simplificar o processo de construção do agente e fornecer combinações de funções mais complexas dará a essas estruturas uma vantagem competitiva no futuro. Isso poderia levar à criação de uma economia criativa Web3 muito mais interessante do que a Loja GPT.

Atualmente, a GPT Store ainda está mais orientada para usos práticos tradicionais, com a maioria dos aplicativos populares sendo criados por empresas tradicionais do Web2. Além disso, a renda gerada é amplamente monopolizada pelos criadores. De acordo com a explicação oficial da OpenAI, a estratégia é simplesmente fornecer apoio financeiro a desenvolvedores excepcionais nos Estados Unidos, oferecendo subsídios até um certo valor.

Do ponto de vista da demanda, o Web3 ainda tem muitas lacunas a preencher e, do ponto de vista do sistema econômico, pode tornar as políticas injustas dos gigantes Web2 mais equitativas. Além disso, podemos naturalmente introduzir economias comunitárias para melhorar ainda mais os agentes. A economia criativa em torno dos agentes apresentará às pessoas comuns uma oportunidade de participar. No futuro, os memes de IA serão muito mais inteligentes e interessantes do que os agentes emitidos pela GOAT ou Clanker.

Sobre YBB

YBB é um fundo web3 dedicado a identificar projetos definidores da Web3 com uma visão de criar um habitat online melhor para todos os residentes da internet. Fundada por um grupo de crentes em blockchain que têm participado ativamente nesta indústria desde 2013, a YBB está sempre disposta a ajudar projetos em estágio inicial a evoluir de 0 a 1. Valorizamos a inovação, paixão auto-motivada e produtos orientados para o usuário, reconhecendo o potencial de criptomoedas e aplicações blockchain.

Website | Twi: @YBBCapital

Aviso Legal:

  1. Este artigo foi reproduzido de [YBB Capital]. Todos os direitos autorais pertencem ao autor original [Pesquisador de Capital da YBB Zeke]. Se houver objeções a esta reimpressão, entre em contato com o Gate Aprendaequipe e eles lidarão com isso prontamente.
  2. Isenção de Responsabilidade: As opiniões expressas neste artigo são exclusivamente do autor e não constituem conselho de investimento.
  3. A equipe de aprendizado da gate traduziu o artigo para outros idiomas. Copiar, distribuir ou plagiar os artigos traduzidos é proibido, a menos que mencionado.

Desconstruindo Estruturas de IA: De Agentes Inteligentes à Exploração de Descentralização

intermediário1/16/2025, 6:03:33 AM
Este artigo aprofunda as tendências de desenvolvimento e lógica de investimento no campo do Agente de IA, com foco especial na análise detalhada de projetos baseados em estruturas. Ele apresenta os conceitos básicos e funcionalidades das estruturas de IA e demonstra seu desempenho e potencial em diferentes cenários de aplicação por meio de estudos de caso específicos, como Eliza, G.A.M.E, Rig e ZerePy. Além disso, a partir de perspectivas técnicas, de mercado e de investimento, o artigo compara as semelhanças entre os Agentes de IA e o ecossistema BTC, explorando o significado de trazer Agentes de IA para a blockchain e as inovações potenciais que isso pode trazer no futuro.

Introdução

Em artigos anteriores, discutimos frequentemente nossas opiniões sobre o estado atual dos Memes de IA e o desenvolvimento futuro dos Agentes de IA. No entanto, o rápido desenvolvimento narrativo e a evolução da trilha de Agentes de IA ainda têm sido um tanto avassaladores. Nos breves dois meses desde o lançamento do “Truth Terminal” e o início do Agent Summer, a narrativa da integração de IA e Crypto evoluiu quase semanalmente. Recentemente, a atenção do mercado começou a se voltar para projetos “framework”, que são principalmente impulsionados por narrativas tecnológicas. Este subcampo de nicho já produziu vários projetos unicorn com um limite de mercado de mais de um bilhão de dólares nas últimas semanas. Esses projetos também levaram a um novo paradigma para emissão de ativos, onde os projetos emitem tokens com base em seus repositórios de código do GitHub, e os Agentes construídos nessas estruturas também podem emitir tokens. No cerne desta estrutura, temos frameworks, com Agentes como a camada acima. Isso se assemelha a uma plataforma de emissão de ativos, mas na verdade é um modelo infraestrutural único que está surgindo na era da IA. Como devemos encarar essa nova tendência? Este artigo começará com uma introdução aos frameworks e oferecerá uma interpretação do que os frameworks de IA significam para Crypto, combinando essas percepções com nossas próprias reflexões.

I. O que é um Framework?

Por definição, um framework de IA é uma ferramenta ou plataforma de desenvolvimento subjacente que integra um conjunto de módulos, bibliotecas e ferramentas pré-construídas para simplificar o processo de construção de modelos de IA complexos. Esses frameworks geralmente também incluem funções para lidar com dados, treinar modelos e fazer previsões. Em termos simples, você pode pensar em um framework como um sistema operacional para a era da IA, semelhante a sistemas operacionais de desktop como Windows ou Linux, ou sistemas operacionais móveis como iOS e Android. Cada framework tem suas próprias vantagens e desvantagens, permitindo que os desenvolvedores escolham com base em suas necessidades específicas.

Embora o termo “estrutura de IA” ainda seja um conceito relativamente novo no campo da criptografia, seu desenvolvimento remonta a quase 14 anos, começando com Theano em 2010. Na comunidade tradicional de IA, tanto a academia quanto a indústria já desenvolveram estruturas muito maduras para escolher, como o TensorFlow do Google, o PyTorch da Meta, o PaddlePaddle da Baidu e o MagicAnimate da ByteDance, cada um com suas vantagens em diferentes cenários.

Os projetos de framework de IA atualmente emergentes em Crypto são baseados na demanda por um grande número de Agentes decorrentes do boom de IA, e estes se ramificaram em outras trilhas em Crypto, formando eventualmente diferentes frameworks de IA para subcampos específicos. Vamos explorar alguns dos frameworks mainstream atuais na indústria para ilustrar melhor esse ponto.

1.1 Eliza

Primeiro, vamos considerar Eliza, um framework criado pela ai16z. É um framework de simulação multi-agente projetado para criar, implantar e gerenciar agentes de IA autônomos. Desenvolvido usando TypeScript como linguagem de programação, sua vantagem está na melhor compatibilidade e integração API mais fácil. De acordo com a documentação oficial, Eliza é principalmente projetado para mídias sociais, oferecendo suporte para integrações multiplataforma. O framework fornece integração completa com o Discord, suportando canais de voz, contas automatizadas para X/Twitter, integração do Telegram e acesso direto à API. Em termos de processamento de conteúdo de mídia, ele suporta leitura e análise de documentos PDF, extração e resumo de links, transcrição de áudio, tratamento de conteúdo de vídeo, análise de imagens e resumos de conversas.

Os casos de uso suportados pela Eliza atualmente incluem as seguintes quatro categorias:

  1. Aplicações do assistente de IA: agentes de suporte ao cliente, administradores de comunidade, assistentes pessoais.
  2. Funções nas Redes Sociais: Criadores de conteúdo automatizados, bots interativos, representantes de marcas.
  3. Trabalhadores do conhecimento: assistentes de pesquisa, analistas de conteúdo, processadores de documentos.
  4. Funções Interativas: Personagens de jogo de interpretação, tutores educacionais, bots de entretenimento.

Os modelos atualmente suportados pela Eliza são:

  1. Modelos de inferência local de código aberto: como Llama3, Qwen1.5, BERT.
  2. Inferência em nuvem via API OpenAI.
  3. Configuração padrão como Nous Hermes Llama 3.1B.
  4. Integração com Claude para consultas complexas.

1.2 G.A.M.E

G.A.M.E (Generative Autonomous Multimodal Entities Framework) é um framework de IA multimodal para geração e gerenciamento automático, lançado pela Virtual. É projetado principalmente para o projeto inteligente de NPC em jogos. Um aspecto único deste framework é que ele permite que até mesmo usuários com pouco ou nenhum código participem do design do Agente, simplesmente modificando parâmetros por meio de sua interface de teste.

Em termos de arquitetura do projeto, G.A.M.E é construído com um design modular, onde múltiplos subsistemas trabalham juntos em colaboração. A arquitetura detalhada é a seguinte:

  1. Agent Prompting Interface: A interface para os desenvolvedores interagirem com a estrutura de IA. Por meio dessa interface, os desenvolvedores podem iniciar uma sessão e especificar IDs de sessão, IDs de agente, IDs de usuário e outros parâmetros.
  2. Subsistema de Percepção: Responsável por receber informações de entrada, sintetizá-las e enviá-las para o mecanismo de planejamento estratégico. Também lida com as respostas do módulo de processamento de diálogo.
  3. Motor de Planejamento Estratégico: O núcleo de todo o framework, dividido em um planejador de alto nível e uma política de baixo nível. O planejador de alto nível é responsável por formular metas e planos de longo prazo, enquanto a política de baixo nível traduz esses planos em ações específicas.
  4. Contexto Mundial: Contém informações ambientais, estado mundial e dados do estado do jogo, ajudando os agentes a entender seu contexto atual.
  5. Módulo de Processamento de Diálogo: Lida com mensagens e respostas, gerando diálogo ou reações como saída.
  6. Operador de Carteira On-Chain: Provavelmente relacionado a aplicações de tecnologia blockchain, embora as funções específicas não estejam claras.
  7. Módulo de Aprendizagem: Aprende com o feedback e atualiza a base de conhecimento do agente.
  8. Memória de trabalho: Armazena ações recentes, resultados e planos atuais, entre outras informações de curto prazo.
  9. Processador de Memória de Longo Prazo: Extrai e classifica informações importantes sobre o agente e sua memória de trabalho com base em fatores como importância, recentidade e relevância.
  10. Repositório do Agente: Armazena os objetivos, reflexões, experiências e características do agente.
  11. Planejador de Ação: Gera planos de ação específicos com base em estratégias de baixo nível.
  12. Executor do Plano: Executa os planos de ação gerados pelo planejador de ação.

Fluxo de trabalho: os desenvolvedores iniciam um agente via a Interface de Solicitação de Agente, onde o Subsistema de Percepção recebe a entrada e a envia para o Motor de Planejamento Estratégico. O motor, com a ajuda do sistema de memória, contexto mundial e repositório de Agentes, formula e executa um plano de ação. O Módulo de Aprendizado monitora as ações do Agente e ajusta seu comportamento de acordo.

Cenários de Aplicação: A partir da arquitetura técnica geral, este framework concentra-se na tomada de decisões, feedback, percepção e personalidade dos Agentes em ambientes virtuais. Além dos jogos, este framework também é aplicável ao Metaverso. A lista abaixo do Virtual mostra que muitos projetos já adotaram este framework para construção.

1.3 Sonda

Rig é uma ferramenta de código aberto escrita em Rust, projetada especificamente para simplificar o desenvolvimento de aplicativos de modelo de linguagem grande (LLM). Ele fornece uma interface unificada que permite aos desenvolvedores interagir facilmente com vários provedores de serviços LLM (como OpenAI e Anthropic) e vários bancos de dados de vetores (como MongoDB e Neo4j).

Recursos principais:

  • Interface Unificada: Independentemente do provedor LLM ou armazenamento de vetor utilizado, Rig oferece um método de acesso consistente, reduzindo significativamente a complexidade do trabalho de integração.
  • Arquitetura Modular: O framework utiliza um design modular, que inclui componentes-chave como 'Camada de Abstração do Provedor', 'Interface de Armazenamento de Vetores' e 'Sistema de Agente Inteligente', garantindo flexibilidade e escalabilidade do sistema.
  • Segurança de Tipo: Aproveitando as características do Rust, Rig alcança operações de incorporação seguras por tipo, garantindo qualidade de código e segurança em tempo de execução.
  • Alto Desempenho: O sistema suporta programação assíncrona, otimizando as capacidades de processamento de concorrência. Recursos de registro e monitoramento embutidos auxiliam na manutenção e solução de problemas.

Fluxo de trabalho: Quando um usuário entra no sistema Rig, o pedido primeiro passa pela “Camada de Abstração do Provedor”, que padroniza as diferenças entre vários provedores e garante o tratamento consistente de erros. Na camada central, agentes inteligentes podem chamar diferentes ferramentas ou consultar o armazenamento de vetor para recuperar as informações necessárias. Finalmente, mecanismos avançados como a Geração com Recuperação Aprimorada (RAG) combinam a recuperação de documentos e a compreensão contextual para gerar respostas precisas e significativas antes de devolvê-las ao usuário.

Casos de uso: Rig é adequado para a construção de sistemas que requerem respostas rápidas e precisas a perguntas, criação de ferramentas eficientes de busca de documentos, desenvolvimento de chatbots ou assistentes virtuais com consciência de contexto e até mesmo suporte à criação de conteúdo através da geração automática de texto ou outras formas de conteúdo com base em padrões de dados existentes.

1.4 ZerePy

ZerePy é um framework de código aberto baseado em Python projetado para simplificar a implantação e o gerenciamento de agentes de IA na plataforma X (anteriormente Twitter). Ele evoluiu do projeto Zerebro e herdou suas funcionalidades principais, mas foi projetado de maneira mais modular e escalável. O objetivo é permitir que os desenvolvedores criem facilmente agentes de IA personalizados e implementem várias tarefas de automação e criação de conteúdo no X.

O ZerePy fornece uma interface de linha de comando (CLI), tornando conveniente para os usuários gerenciar e controlar os agentes de IA que implantam. Sua arquitetura central é modular, permitindo que os desenvolvedores integrem flexivelmente diferentes módulos funcionais, como:

  • Integração LLM: O ZerePy suporta grandes modelos de linguagem (LLMs) da OpenAI e da Anthropic, permitindo que os desenvolvedores selecionem o modelo mais adequado para sua aplicação. Isso permite que os agentes gerem conteúdo textual de alta qualidade.
  • Integração da Plataforma X: A estrutura integra diretamente com a API da X, permitindo que os agentes realizem tarefas como postar, responder, curtir e retuitar.
  • Sistema de conexão modular: Este sistema permite que os desenvolvedores adicionem facilmente suporte para outras plataformas ou serviços sociais, estendendo a funcionalidade do framework.
  • Sistema de Memória (Planos Futuros): Embora não esteja totalmente implementado na versão atual, o objetivo de design do ZerePy inclui a integração de um sistema de memória que permitiria aos agentes lembrar interações anteriores e informações contextuais para gerar conteúdo mais coerente e personalizado.

Embora tanto ZerePy quanto o projeto Eliza da a16z visem construir e gerenciar agentes de IA, eles diferem em arquitetura e foco. Eliza está mais voltado para simulações de múltiplos agentes e pesquisa mais ampla em IA, enquanto ZerePy se concentra em simplificar a implantação de agentes de IA em plataformas sociais específicas (X), tornando-o mais orientado para aplicativos.

II. Uma réplica do ecossistema BTC

Em termos de trajetória de desenvolvimento, os agentes de IA compartilham muitas semelhanças com o ecossistema BTC de finais de 2023 a inícios de 2024. A trajetória de desenvolvimento do ecossistema BTC pode ser resumida de forma simples como: competição multi-protocolo BRC20-Atomical/Rune e outros — BTC L2 — BTCFi centrado em Babilônia. Enquanto os agentes de IA têm se desenvolvido de forma mais rápida com base em pilhas de tecnologia tradicional de IA maduras, sua trajetória geral de desenvolvimento espelha o ecossistema BTC em vários aspectos. Eu resumiria da seguinte forma: GOAT/ACT — Agentes do tipo social — Competição de estrutura analítica de agentes de IA. Do ponto de vista das tendências, projetos de infraestrutura focados em descentralização e segurança em torno de agentes provavelmente seguirão essa onda de estrutura, tornando-se o próximo tema dominante.

Então, será que essa trilha, assim como o ecossistema BTC, levará à homogeneização e à bolhação? Eu não acredito nisso. Primeiro, a narrativa dos agentes de IA não se trata de recriar a história das cadeias de contratos inteligentes. Segundo, se esses projetos de estrutura de IA existentes são tecnicamente fortes, ainda estão presos na fase de PPT ou apenas Ctrl+C e Ctrl+V, pelo menos eles fornecem uma nova abordagem de desenvolvimento de infraestrutura. Muitos artigos têm comparado estruturas de IA a plataformas de emissão de ativos e agentes a ativos. No entanto, em comparação com Memecoin Launchpads e protocolos de Inscrição, eu pessoalmente acredito que estruturas de IA se assemelham a futuras cadeias públicas, enquanto agentes se assemelham a futuros DApps.

No espaço Crypto de hoje, temos milhares de cadeias públicas e dezenas de milhares de DApps. No campo das cadeias de propósito geral, temos BTC, Ethereum e várias cadeias heterogêneas, enquanto as formas de cadeias de aplicativos são mais diversas, como cadeias de jogos, cadeias de armazenamento e cadeias Dex. As cadeias públicas e os frameworks de IA são bastante semelhantes em natureza, e os DApps podem corresponder bem aos agentes.

Na era da criptografia na IA, é altamente provável que o espaço evolua nessa direção, com debates futuros mudando de EVM versus cadeias heterogêneas para debates de estrutura. A questão atual é mais sobre descentralização, ou como "encadeá-la". Acredito que futuros projetos de infraestrutura de IA se desenvolverão em torno dessa fundação. Outro ponto importante é: qual a importância de fazer isso no blockchain?

III. O Significado de On-Chain

Independentemente de qual blockchain se combine, ela enfrenta ultimamente uma questão crítica: ela é significativa? No artigo do ano passado, critiquei o GameFi por suas prioridades equivocadas, onde o desenvolvimento de infraestrutura estava excessivamente avançado, e nos artigos anteriores sobre IA, expressei ceticismo sobre a praticidade atual de combinar IA com Cripto. Afinal, a força impulsionadora da narrativa para projetos tradicionais tem enfraquecido cada vez mais. Os poucos projetos tradicionais que se saíram bem no ano passado em termos de preço do token foram geralmente aqueles que podiam igualar ou superar a força do preço.

O que a IA pode fazer pelo Crypto? Anteriormente, eu pensei em casos de uso como agentes de IA realizando tarefas em nome dos usuários, Metaverse e agentes como funcionários - ideias relativamente mundanas, mas com certas demandas. No entanto, essas demandas não exigem estar completamente na cadeia e, do ponto de vista da lógica de negócios, elas não podem formar um loop fechado. O navegador de agentes mencionado no último artigo, que implementa intenções, pode gerar demandas para marcação de dados e potência de computação de inferência, mas esses dois elementos ainda não estão totalmente integrados e, em termos de potência de computação, a computação centralizada ainda tem vantagem.

Ao revisitar o sucesso do DeFi, a razão pela qual o DeFi conseguiu conquistar uma parte das finanças tradicionais é porque ele oferece maior acessibilidade, melhor eficiência, custos mais baixos e segurança sem confiança. Se considerarmos esse quadro, acho que pode haver várias razões pelas quais a 'cadeização' dos agentes pode fazer sentido:

  1. Redução de custos: A descentralização do agente pode reduzir os custos de uso, permitindo assim uma maior acessibilidade e mais opções para os usuários? Isso poderia eventualmente permitir que usuários comuns participem do que tradicionalmente tem sido o domínio exclusivo dos gigantes da tecnologia Web2 em aluguel de IA.
  2. Segurança: De acordo com a definição mais simples, um agente é uma IA que pode interagir com o mundo virtual ou real. Se um agente pode intervir no mundo real ou até mesmo na minha carteira virtual, então soluções de segurança baseadas em blockchain poderiam se tornar uma necessidade.
  3. Jogo Financeiro Específico da Blockchain: Os agentes podem criar um conjunto único de mecanismos financeiros na blockchain? Por exemplo, no AMM (Automated Market Maker), os provedores de liquidez (LPs) permitem que os usuários comuns participem da criação de mercado automatizada. Da mesma forma, se os agentes precisarem de potência de computação ou rotulagem de dados, os usuários poderiam investir nesses protocolos na forma de USDT, com base em sua confiança no sistema. Ou, agentes em diferentes cenários de aplicação poderiam formar novas estruturas financeiras.
  4. Interoperabilidade DeFi: Embora DeFi atualmente careça de interoperabilidade perfeita, os agentes podem ser capazes de abordar esse problema, possibilitando processos de raciocínio transparentes e rastreáveis, preenchendo as lacunas.

IV. Criatividade?

Projetos de estrutura no futuro também fornecerão oportunidades empreendedoras semelhantes à Loja GPT. Embora lançar um agente via uma estrutura ainda seja complexo para usuários comuns, acredito que simplificar o processo de construção do agente e fornecer combinações de funções mais complexas dará a essas estruturas uma vantagem competitiva no futuro. Isso poderia levar à criação de uma economia criativa Web3 muito mais interessante do que a Loja GPT.

Atualmente, a GPT Store ainda está mais orientada para usos práticos tradicionais, com a maioria dos aplicativos populares sendo criados por empresas tradicionais do Web2. Além disso, a renda gerada é amplamente monopolizada pelos criadores. De acordo com a explicação oficial da OpenAI, a estratégia é simplesmente fornecer apoio financeiro a desenvolvedores excepcionais nos Estados Unidos, oferecendo subsídios até um certo valor.

Do ponto de vista da demanda, o Web3 ainda tem muitas lacunas a preencher e, do ponto de vista do sistema econômico, pode tornar as políticas injustas dos gigantes Web2 mais equitativas. Além disso, podemos naturalmente introduzir economias comunitárias para melhorar ainda mais os agentes. A economia criativa em torno dos agentes apresentará às pessoas comuns uma oportunidade de participar. No futuro, os memes de IA serão muito mais inteligentes e interessantes do que os agentes emitidos pela GOAT ou Clanker.

Sobre YBB

YBB é um fundo web3 dedicado a identificar projetos definidores da Web3 com uma visão de criar um habitat online melhor para todos os residentes da internet. Fundada por um grupo de crentes em blockchain que têm participado ativamente nesta indústria desde 2013, a YBB está sempre disposta a ajudar projetos em estágio inicial a evoluir de 0 a 1. Valorizamos a inovação, paixão auto-motivada e produtos orientados para o usuário, reconhecendo o potencial de criptomoedas e aplicações blockchain.

Website | Twi: @YBBCapital

Aviso Legal:

  1. Este artigo foi reproduzido de [YBB Capital]. Todos os direitos autorais pertencem ao autor original [Pesquisador de Capital da YBB Zeke]. Se houver objeções a esta reimpressão, entre em contato com o Gate Aprendaequipe e eles lidarão com isso prontamente.
  2. Isenção de Responsabilidade: As opiniões expressas neste artigo são exclusivamente do autor e não constituem conselho de investimento.
  3. A equipe de aprendizado da gate traduziu o artigo para outros idiomas. Copiar, distribuir ou plagiar os artigos traduzidos é proibido, a menos que mencionado.
Comece agora
Inscreva-se e ganhe um cupom de
$100
!