Os meus dados não são meus: O surgimento das camadas de dados

Intermediário2/10/2025, 4:24:36 AM
As discussões em torno da propriedade de dados e privacidade têm se intensificado. Protocolos de dados da Web3 como Vana, Ocean Protocol e Masa estão surgindo, impulsionando a soberania de dados descentralizados e permitindo que os usuários controlem e monetizem seus dados, especialmente no treinamento de IA e na aquisição de dados em tempo real. Esses protocolos oferecem novas soluções para negociação de dados e proteção de privacidade, atendendo à crescente demanda por dados de alta qualidade.

Os dados são o ouro digital nesta era em que a atenção está online. O tempo médio de tela global em 2024 é de 6 horas e 40 minutos por dia, um aumento em relação aos anos anteriores. Nos Estados Unidos, a média é ainda maior, com 7 horas e 3 minutos diários.

Com este nível de envolvimento, o volume de dados gerados é impressionante - 328,77 milhões de terabytes são criados todos os dias em 2024. Isso equivale aproximadamente a 0,4 zettabytes (ZB) por dia ao considerar todos os dados recém-gerados, capturados, copiados ou consumidos.

No entanto, apesar das enormes quantidades de dados que são produzidos e consumidos diariamente, os utilizadores possuem muito pouco deles:

  • Redes Sociais: Os dados em plataformas como Twitter, Instagram e outras são controlados pelas empresas, apesar de serem gerados pelos usuários.
  • Internet das Coisas (IoT): Os dados de dispositivos inteligentes geralmente pertencem ao fabricante do dispositivo ou ao provedor de serviços, a menos que acordos específicos indiquem o contrário.
  • Dados de saúde: Embora os indivíduos tenham direitos sobre seus prontuários médicos, grande parte dos dados de aplicativos de saúde ou dispositivos vestíveis é controlada pelas empresas que fornecem esses serviços.

Crypto e Dados Sociais

Em criptografia, vimos o surgimento de @_kaitoai, que indexa dados sociais no Twitter e os traduz em dados de sentimento acionáveis para projetos, KOLs e líderes de pensamento. As palavras 'yap' e 'mindshare' foram popularizadas pela equipe Kaito por causa de sua expertise em growth hacking (com seus populares painéis mindshare & yapper) e habilidade em atrair interesse orgânico no Crypto Twitter.

"Yap" tem como objetivo incentivar a criação de conteúdo de qualidade no Twitter, mas muitas perguntas permanecem sem resposta:

  • Como os yaps estão sendo pontuados “exatamente”?
  • Recebe mais yap por mencionar Kaito?
  • O Kaito realmente recompensa conteúdo de qualidade, ou favorece opiniões controversas polêmicas?

Além dos dados sociais, as discussões sobre propriedade de dados, privacidade e transparência estão esquentando. Com o avanço rápido da IA, surgem novas perguntas: Quem é proprietário dos dados usados para treinar os modelos de IA? Quem se beneficia dos resultados gerados pela IA?

Estas perguntas prepararam o terreno para o surgimento das camadas de dados da Web3 - uma mudança em direção a ecossistemas de dados descentralizados e de propriedade do usuário.

A Emergência das Camadas de Dados

Na Web3, existe um ecossistema em crescimento de camadas de dados, protocolos e infraestrutura focados em permitir a soberania dos dados pessoais - a ideia de dar às pessoas mais controle sobre seus dados, com opções de monetizá-los.

1. Vana

@vana's missão principal é dar aos usuários controle sobre seus dados, especialmente no contexto da IA, onde os dados são inestimáveis para treinar modelos.

Vana apresenta DataDAOs, entidades orientadas pela comunidade onde os utilizadores agrupam os seus dados para benefício coletivo. Cada DataDAO concentra-se num conjunto de dados específico:

  • r/datadao: Concentra-se nos dados do utilizador do Reddit, permitindo aos utilizadores controlar e monetizar as suas contribuições.
  • Volara: Lidar com dados do Twitter, permitindo que os usuários se beneficiem de sua atividade nas redes sociais.
  • DNA DAO: Com o objetivo de gerir dados genéticos com privacidade e propriedade em mente.

Vana tokeniza os dados num ativo negociável chamado "DLP". Cada DLP agrega dados para um domínio específico, e os utilizadores podem apostar tokens nestes pools para receber recompensas, sendo que os pools mais populares são recompensados com base no apoio da comunidade e na qualidade dos dados.

O que faz com que Vana se destaque é a facilidade de contribuir com dados. Os utilizadores simplesmente:

  1. Escolha um DataDAO
  2. Agrupe os seus dados diretamente através da integração da API ou carregue-os manualmente
  3. Ganhe tokens DataDAO e$VANAcomo recompensas

2. Ocean Protocol

@oceanprotocolé um mercado de dados descentralizado que permite aos fornecedores de dados compartilhar, vender ou licenciar seus dados, enquanto os consumidores os acessam para AI e pesquisa.

O Ocean Protocol utiliza "datatokens" (tokens ERC-20) para representar direitos de acesso a conjuntos de dados, permitindo que os provedores de dados monetizem seus dados mantendo o controle sobre as condições de acesso.

Tipos de dados negociados no Ocean:

  • Dados Públicos: Conjuntos de dados abertos como informações meteorológicas, dados demográficos públicos ou dados históricos de ações - valiosos para treinamento e pesquisa de IA.
  • Dados Privados: Registos médicos, transações financeiras, dados de sensores IoT ou dados de utilizador personalizados - requerem controlos de privacidade rigorosos.

Compute-to-Data é mais uma característica chave do Ocean, permitindo que os cálculos sejam feitos nos dados sem os mover, garantindo privacidade e segurança para conjuntos de dados sensíveis.

3. Masa

@getmasafi está focada em criar uma camada aberta para dados de treinamento de IA, fornecendo dados em tempo real, de alta qualidade e baixo custo para agentes e desenvolvedores de IA.

Masa lançou duas sub-redes na rede Bittensor:

  • Subnet 42 (SN42): Agrega e processa milhões de registros de dados diariamente, servindo como base para o desenvolvimento de agentes de IA e aplicações.
  • Subnet 59 (SN59) - "AI Agent Arena": Um ambiente competitivo onde agentes de IA, alimentados por dados em tempo real de SN42, competem por$TAOemissões com base em métricas de desempenho como participação de mercado, envolvimento do usuário e autoaperfeiçoamento.

Masa associou-se com @virtuals_iocapacitando agentes virtuais com capacidades de dados em tempo real. Também lançou $TAOCAT, mostrando as suas habilidades (atualmente na Binance Alpha).

4. Open Ledger

@OpenledgerHQ está construindo uma blockchain especialmente projetada para dados, especialmente para aplicativos de IA e ML, garantindo gerenciamento de dados seguro, descentralizado e verificável.

Principais destaques:

  • Datanets: Redes especializadas de obtenção de dados dentro da OpenLedger que selecionam e enriquecem dados do mundo real para aplicações de IA.
  • SLMs: modelos de IA feitos sob medida para indústrias ou aplicações específicas. A ideia é fornecer modelos que não só sejam mais precisos para casos de uso específicos, mas também estejam em conformidade com a privacidade e sejam menos propensos a preconceitos encontrados em modelos de propósito geral
  • Verificação de Dados: Garante a precisão e confiabilidade dos dados usados para treinar modelos de linguagem especializados (SLMs) que são precisos e confiáveis para casos de uso específicos.

A procura de dados para o treino de IA

A demanda por dados de alta qualidade para alimentar IA e agentes autônomos está aumentando. Além do treinamento inicial, os agentes de IA requerem dados em tempo real para aprendizado contínuo e adaptação.

Principais desafios e oportunidades:

  • Qualidade de Dados em vez de Quantidade: Os modelos de IA requerem dados de alta qualidade, diversificados e relevantes para evitar tendências ou desempenho ruim.
  • Soberania de Dados e Privacidade: Como visto com Vana, há um impulso para a monetização de dados de propriedade do usuário, o que poderia remodelar a forma como os dados de treinamento de IA são obtidos.
  • Dados Sintéticos: Com preocupações com a privacidade, os dados sintéticos estão ganhando tração como uma forma de treinar modelos de IA enquanto mitigam questões éticas.
  • Mercado de Dados: O surgimento de mercados de dados (centralizados e descentralizados) está criando uma economia em que os dados são um ativo comercializável.
  • IA para Gestão de Dados: A IA é agora utilizada para gerir, limpar e melhorar conjuntos de dados, melhorando a qualidade dos dados para o treino de IA.

À medida que os agentes de IA se tornam mais autônomos, sua capacidade de acessar e processar dados em tempo real e de alta qualidade determinará sua eficácia. Essa demanda crescente levou ao surgimento de mercados de dados específicos para agentes de IA, onde tanto humanos quanto agentes de IA podem acessar dados de agentes de IA de alta qualidade.

Mercado para Dados de Agentes Web3

  • @cookiedotfunagrega dados de sentimento social do agente de IA e relacionados com tokens, transformando-os em informações acionáveis para agentes humanos e de IA.
  • A API Cookie DataSwarm permite que os agentes de IA acessem dados atuais e de alta qualidade para insights relacionados à negociação - um dos casos de uso mais procurados na cripto.
  • Cookie possui 200K MAU e 20K DAU, tornando-se um dos maiores mercados de dados de agentes de IA, com $COOKIEno centro.

Outros jogadores-chave:

  • @GoatIndexAIconcentra-se em insights do ecossistema Solana.
  • @Decentralisedcoespecializa-se em painéis de dados de nicho como repositórios do GitHub e análises específicas do projeto.

Conclusão da Parte 1

Este é apenas o começo. A Parte 2 irá aprofundar-se em:

  • Os desafios e oportunidades em constante evolução na economia de dados
  • O papel dos dados sintéticos na formação de IA
  • Preocupações com a privacidade de dados e como elas estão sendo abordadas
  • O futuro da formação de IA descentralizada

Quem controla os dados irá moldar o futuro, e os projetos construídos dentro deste setor irão definir como os dados são possuídos, partilhados e monetizados na era da IA. À medida que a procura por dados de alta qualidade continua a crescer, a corrida para criar uma economia de dados mais transparente e controlada pelo usuário apenas está começando.

Fique atento para a Parte 2!

Nota pessoal: Obrigado por ler! Se estiveres no Crypto AI e quiseres conectar, sente-te à vontade para me enviar uma mensagem direta.

Se quiser apresentar um projeto, por favor utilize o formulário no meu perfil - ele tem prioridade sobre as mensagens diretas.

Aviso Legal Completo: Este documento destina-se apenas a fins informativos e de entretenimento. As opiniões expressas neste documento não são e não devem ser interpretadas como conselhos ou recomendações de investimento. Os destinatários deste documento devem realizar a sua própria diligência, tendo em conta as suas circunstâncias financeiras específicas, objetivos de investimento e tolerância ao risco (que não são considerados neste documento) antes de investir. Este documento não é uma oferta, nem a solicitação de uma oferta, para comprar ou vender quaisquer dos ativos mencionados aqui.

Aviso legal:

  1. Este artigo é reproduzido a partir deX. Os direitos de autor pertencem ao autor original [@Defi0xJeff]. Se houver alguma objeção à reprodução, por favor entre em contato com ogate Aprender Equipe, e a equipa irá processá-la de acordo com os procedimentos relevantes.
  2. Aviso de Responsabilidade: As opiniões expressas neste artigo são exclusivamente do autor e não constituem aconselhamento de investimento.
  3. A equipe de Aprendizado da Gate traduziu o artigo para outros idiomas. Copiar, distribuir ou plagiar os artigos traduzidos é proibido, a menos que seja mencionado.

Os meus dados não são meus: O surgimento das camadas de dados

Intermediário2/10/2025, 4:24:36 AM
As discussões em torno da propriedade de dados e privacidade têm se intensificado. Protocolos de dados da Web3 como Vana, Ocean Protocol e Masa estão surgindo, impulsionando a soberania de dados descentralizados e permitindo que os usuários controlem e monetizem seus dados, especialmente no treinamento de IA e na aquisição de dados em tempo real. Esses protocolos oferecem novas soluções para negociação de dados e proteção de privacidade, atendendo à crescente demanda por dados de alta qualidade.

Os dados são o ouro digital nesta era em que a atenção está online. O tempo médio de tela global em 2024 é de 6 horas e 40 minutos por dia, um aumento em relação aos anos anteriores. Nos Estados Unidos, a média é ainda maior, com 7 horas e 3 minutos diários.

Com este nível de envolvimento, o volume de dados gerados é impressionante - 328,77 milhões de terabytes são criados todos os dias em 2024. Isso equivale aproximadamente a 0,4 zettabytes (ZB) por dia ao considerar todos os dados recém-gerados, capturados, copiados ou consumidos.

No entanto, apesar das enormes quantidades de dados que são produzidos e consumidos diariamente, os utilizadores possuem muito pouco deles:

  • Redes Sociais: Os dados em plataformas como Twitter, Instagram e outras são controlados pelas empresas, apesar de serem gerados pelos usuários.
  • Internet das Coisas (IoT): Os dados de dispositivos inteligentes geralmente pertencem ao fabricante do dispositivo ou ao provedor de serviços, a menos que acordos específicos indiquem o contrário.
  • Dados de saúde: Embora os indivíduos tenham direitos sobre seus prontuários médicos, grande parte dos dados de aplicativos de saúde ou dispositivos vestíveis é controlada pelas empresas que fornecem esses serviços.

Crypto e Dados Sociais

Em criptografia, vimos o surgimento de @_kaitoai, que indexa dados sociais no Twitter e os traduz em dados de sentimento acionáveis para projetos, KOLs e líderes de pensamento. As palavras 'yap' e 'mindshare' foram popularizadas pela equipe Kaito por causa de sua expertise em growth hacking (com seus populares painéis mindshare & yapper) e habilidade em atrair interesse orgânico no Crypto Twitter.

"Yap" tem como objetivo incentivar a criação de conteúdo de qualidade no Twitter, mas muitas perguntas permanecem sem resposta:

  • Como os yaps estão sendo pontuados “exatamente”?
  • Recebe mais yap por mencionar Kaito?
  • O Kaito realmente recompensa conteúdo de qualidade, ou favorece opiniões controversas polêmicas?

Além dos dados sociais, as discussões sobre propriedade de dados, privacidade e transparência estão esquentando. Com o avanço rápido da IA, surgem novas perguntas: Quem é proprietário dos dados usados para treinar os modelos de IA? Quem se beneficia dos resultados gerados pela IA?

Estas perguntas prepararam o terreno para o surgimento das camadas de dados da Web3 - uma mudança em direção a ecossistemas de dados descentralizados e de propriedade do usuário.

A Emergência das Camadas de Dados

Na Web3, existe um ecossistema em crescimento de camadas de dados, protocolos e infraestrutura focados em permitir a soberania dos dados pessoais - a ideia de dar às pessoas mais controle sobre seus dados, com opções de monetizá-los.

1. Vana

@vana's missão principal é dar aos usuários controle sobre seus dados, especialmente no contexto da IA, onde os dados são inestimáveis para treinar modelos.

Vana apresenta DataDAOs, entidades orientadas pela comunidade onde os utilizadores agrupam os seus dados para benefício coletivo. Cada DataDAO concentra-se num conjunto de dados específico:

  • r/datadao: Concentra-se nos dados do utilizador do Reddit, permitindo aos utilizadores controlar e monetizar as suas contribuições.
  • Volara: Lidar com dados do Twitter, permitindo que os usuários se beneficiem de sua atividade nas redes sociais.
  • DNA DAO: Com o objetivo de gerir dados genéticos com privacidade e propriedade em mente.

Vana tokeniza os dados num ativo negociável chamado "DLP". Cada DLP agrega dados para um domínio específico, e os utilizadores podem apostar tokens nestes pools para receber recompensas, sendo que os pools mais populares são recompensados com base no apoio da comunidade e na qualidade dos dados.

O que faz com que Vana se destaque é a facilidade de contribuir com dados. Os utilizadores simplesmente:

  1. Escolha um DataDAO
  2. Agrupe os seus dados diretamente através da integração da API ou carregue-os manualmente
  3. Ganhe tokens DataDAO e$VANAcomo recompensas

2. Ocean Protocol

@oceanprotocolé um mercado de dados descentralizado que permite aos fornecedores de dados compartilhar, vender ou licenciar seus dados, enquanto os consumidores os acessam para AI e pesquisa.

O Ocean Protocol utiliza "datatokens" (tokens ERC-20) para representar direitos de acesso a conjuntos de dados, permitindo que os provedores de dados monetizem seus dados mantendo o controle sobre as condições de acesso.

Tipos de dados negociados no Ocean:

  • Dados Públicos: Conjuntos de dados abertos como informações meteorológicas, dados demográficos públicos ou dados históricos de ações - valiosos para treinamento e pesquisa de IA.
  • Dados Privados: Registos médicos, transações financeiras, dados de sensores IoT ou dados de utilizador personalizados - requerem controlos de privacidade rigorosos.

Compute-to-Data é mais uma característica chave do Ocean, permitindo que os cálculos sejam feitos nos dados sem os mover, garantindo privacidade e segurança para conjuntos de dados sensíveis.

3. Masa

@getmasafi está focada em criar uma camada aberta para dados de treinamento de IA, fornecendo dados em tempo real, de alta qualidade e baixo custo para agentes e desenvolvedores de IA.

Masa lançou duas sub-redes na rede Bittensor:

  • Subnet 42 (SN42): Agrega e processa milhões de registros de dados diariamente, servindo como base para o desenvolvimento de agentes de IA e aplicações.
  • Subnet 59 (SN59) - "AI Agent Arena": Um ambiente competitivo onde agentes de IA, alimentados por dados em tempo real de SN42, competem por$TAOemissões com base em métricas de desempenho como participação de mercado, envolvimento do usuário e autoaperfeiçoamento.

Masa associou-se com @virtuals_iocapacitando agentes virtuais com capacidades de dados em tempo real. Também lançou $TAOCAT, mostrando as suas habilidades (atualmente na Binance Alpha).

4. Open Ledger

@OpenledgerHQ está construindo uma blockchain especialmente projetada para dados, especialmente para aplicativos de IA e ML, garantindo gerenciamento de dados seguro, descentralizado e verificável.

Principais destaques:

  • Datanets: Redes especializadas de obtenção de dados dentro da OpenLedger que selecionam e enriquecem dados do mundo real para aplicações de IA.
  • SLMs: modelos de IA feitos sob medida para indústrias ou aplicações específicas. A ideia é fornecer modelos que não só sejam mais precisos para casos de uso específicos, mas também estejam em conformidade com a privacidade e sejam menos propensos a preconceitos encontrados em modelos de propósito geral
  • Verificação de Dados: Garante a precisão e confiabilidade dos dados usados para treinar modelos de linguagem especializados (SLMs) que são precisos e confiáveis para casos de uso específicos.

A procura de dados para o treino de IA

A demanda por dados de alta qualidade para alimentar IA e agentes autônomos está aumentando. Além do treinamento inicial, os agentes de IA requerem dados em tempo real para aprendizado contínuo e adaptação.

Principais desafios e oportunidades:

  • Qualidade de Dados em vez de Quantidade: Os modelos de IA requerem dados de alta qualidade, diversificados e relevantes para evitar tendências ou desempenho ruim.
  • Soberania de Dados e Privacidade: Como visto com Vana, há um impulso para a monetização de dados de propriedade do usuário, o que poderia remodelar a forma como os dados de treinamento de IA são obtidos.
  • Dados Sintéticos: Com preocupações com a privacidade, os dados sintéticos estão ganhando tração como uma forma de treinar modelos de IA enquanto mitigam questões éticas.
  • Mercado de Dados: O surgimento de mercados de dados (centralizados e descentralizados) está criando uma economia em que os dados são um ativo comercializável.
  • IA para Gestão de Dados: A IA é agora utilizada para gerir, limpar e melhorar conjuntos de dados, melhorando a qualidade dos dados para o treino de IA.

À medida que os agentes de IA se tornam mais autônomos, sua capacidade de acessar e processar dados em tempo real e de alta qualidade determinará sua eficácia. Essa demanda crescente levou ao surgimento de mercados de dados específicos para agentes de IA, onde tanto humanos quanto agentes de IA podem acessar dados de agentes de IA de alta qualidade.

Mercado para Dados de Agentes Web3

  • @cookiedotfunagrega dados de sentimento social do agente de IA e relacionados com tokens, transformando-os em informações acionáveis para agentes humanos e de IA.
  • A API Cookie DataSwarm permite que os agentes de IA acessem dados atuais e de alta qualidade para insights relacionados à negociação - um dos casos de uso mais procurados na cripto.
  • Cookie possui 200K MAU e 20K DAU, tornando-se um dos maiores mercados de dados de agentes de IA, com $COOKIEno centro.

Outros jogadores-chave:

  • @GoatIndexAIconcentra-se em insights do ecossistema Solana.
  • @Decentralisedcoespecializa-se em painéis de dados de nicho como repositórios do GitHub e análises específicas do projeto.

Conclusão da Parte 1

Este é apenas o começo. A Parte 2 irá aprofundar-se em:

  • Os desafios e oportunidades em constante evolução na economia de dados
  • O papel dos dados sintéticos na formação de IA
  • Preocupações com a privacidade de dados e como elas estão sendo abordadas
  • O futuro da formação de IA descentralizada

Quem controla os dados irá moldar o futuro, e os projetos construídos dentro deste setor irão definir como os dados são possuídos, partilhados e monetizados na era da IA. À medida que a procura por dados de alta qualidade continua a crescer, a corrida para criar uma economia de dados mais transparente e controlada pelo usuário apenas está começando.

Fique atento para a Parte 2!

Nota pessoal: Obrigado por ler! Se estiveres no Crypto AI e quiseres conectar, sente-te à vontade para me enviar uma mensagem direta.

Se quiser apresentar um projeto, por favor utilize o formulário no meu perfil - ele tem prioridade sobre as mensagens diretas.

Aviso Legal Completo: Este documento destina-se apenas a fins informativos e de entretenimento. As opiniões expressas neste documento não são e não devem ser interpretadas como conselhos ou recomendações de investimento. Os destinatários deste documento devem realizar a sua própria diligência, tendo em conta as suas circunstâncias financeiras específicas, objetivos de investimento e tolerância ao risco (que não são considerados neste documento) antes de investir. Este documento não é uma oferta, nem a solicitação de uma oferta, para comprar ou vender quaisquer dos ativos mencionados aqui.

Aviso legal:

  1. Este artigo é reproduzido a partir deX. Os direitos de autor pertencem ao autor original [@Defi0xJeff]. Se houver alguma objeção à reprodução, por favor entre em contato com ogate Aprender Equipe, e a equipa irá processá-la de acordo com os procedimentos relevantes.
  2. Aviso de Responsabilidade: As opiniões expressas neste artigo são exclusivamente do autor e não constituem aconselhamento de investimento.
  3. A equipe de Aprendizado da Gate traduziu o artigo para outros idiomas. Copiar, distribuir ou plagiar os artigos traduzidos é proibido, a menos que seja mencionado.
今すぐ始める
登録して、
$100
のボーナスを獲得しよう!