Relva - Uma Revolução de Dados

Intermediário12/9/2024, 8:36:14 AM
A Grass fornece modelos de IA e aplicativos acesso à Internet inteira como um conjunto de dados, que é coletado por meio de uma rede de nós ao redor do mundo que estão contribuindo com sua largura de banda ociosa da Internet. Eles têm uma forte tração inicial com mais de 2,5 milhões de usuários.

Sumário Executivo

A IA generativa é a inovação mais importante na memória recente e está se tornando ainda mais importante à medida que o tempo passa. A IA generativa é basicamente um produto de três elementos:

Algoritmos + Dados + Computação = Inteligência

Isso significa que Dados e Computação provavelmente se tornarão dois dos ativos mais importantes do mundo, e o acesso a eles será incrivelmente importante.

Os modelos de IA generativa são ávidos por dados. Os dados em que os modelos de IA generativa mais significativos operam são o valor da Internet de dados, que é uma aproximação da soma de todo o conhecimento humano.

A criptomoeda é tudo sobre dar acesso a novos recursos digitais em todo o mundo e transformar em ativos coisas que não eram ativos antes através de tokens. A Grass faz isso para os Dados.

Grass dá acesso a modelos de IA e aplicativos a toda a Internet como um conjunto de dados em tempo real, que é coletado por meio de uma rede de nós ao redor do mundo que estão contribuindo com sua largura de banda ociosa da Internet. Eles têm uma forte adesão inicial com mais de 2,5 milhões de usuários.[1]

O potencial de mercado de longo prazo para Grass é enorme e está relacionado com o tamanho do mercado de IA e seu crescimento futuro. No passado, a coleta de conjuntos de dados dessa escala era relegada apenas aos maiores gigantes da tecnologia. Grass traz novas economias para os dados, reduzindo os custos. Isso democratiza o acesso aos dados para não apenas atender às grandes empresas de elite, mas também a longa cauda da indústria de IA.

O Problema

O treinamento e ajuste fino do modelo de IA requerem enormes quantidades de dados. Historicamente, grande parte desses dados foi coletada por meio de criadores de modelos de IA raspando dados de sites. Esse processo de raspagem apresenta vários desafios:

  • A raspagem da web é cara. Apenas algumas grandes organizações são capazes de fazer a raspagem da web inteira periodicamente. Isso impede que desenvolvedores de IA menores acessem os dados.
  • Bloqueio de IP. Houve um jogo de gato e rato entre esses serviços de raspagem e os criadores de conteúdo. É bastante simples bloquear um endereço IP para parar a raspagem, tornando difícil alcançar os objetivos de raspagem e reunir os dados necessários para treino e ajuste fino de IA.
  • Recursos desperdiçados. Raspar a web é uma tarefa que pode beneficiar muitos clientes. O hardware, largura de banda e poder de computação necessários para isso é ineficiente se feito por um único cliente.
  • Atualidade dos dados. É difícil e dispendioso pesquisar toda a Internet. Isso torna impraticável para a maioria dos usuários fazer pesquisas frequentes, o que torna os dados menos atualizados, afetando a qualidade dos modelos de IA.

Solução de Grass

Grass tem como objetivo resolver esses problemas, criando uma rede federada de web scrapers. Cada indivíduo que participa na rede Grass contribui com uma parte da sua largura de banda de Internet não utilizada para fornecer uma pequena quantidade de scraping a partir do seu endereço IP. Grass reúne depois os dados de cada um destes nós para formar um conjunto de dados combinado que é útil para o treino e ajuste fino de IA. É um uso elegante e adequado de redes distribuídas alimentadas por criptomoeda.

Existem outros casos de uso para a Internet não utilizada, tais como:

  • Recolha de dados locais / geográficos, como anúncios
  • Realizar pesquisa acadêmica
  • Verificação de preços locais

Hoje, a Grass recolhe dados usando hardware existente (laptops, desktops, etc.). No futuro, a Grass planeia oferecer um dispositivo de recolha de dados, que é um dispositivo de hardware personalizado dedicado exclusivamente à recolha de dados, criando eficiências devido ao dispositivo ser otimizado para essa tarefa específica.

Benefícios da Relva

Existem várias vantagens em usar uma rede distribuída para coleta de dados:

  • Acesso democratizado aos dados da web que se torna mais barato em grande escala. Em vez de um único cliente reunir dados para suas próprias necessidades, o Grass reúne dados em nome de muitos clientes. Esses dados podem ser revendidos várias vezes, criando economias de escala nos dados, reduzindo os custos econômicos da raspagem e tornando o mercado mais eficiente. Em grande escala, o Grass pode hipoteticamente tornar-se a solução de coleta de dados mais econômica para os clientes, criando um efeito de rede econômica em torno de seu protocolo. Isso significa que a coleta de dados está agora disponível para qualquer pessoa, não apenas para um par de grandes empresas que têm os recursos para raspar a web.
  • O bloqueio de IP torna-se inviável. Ao distribuir a raspagem, torna-se muito mais difícil detectar e parar a raspagem, uma vez que cada nó realiza apenas uma quantidade relativamente pequena de captura de dados e é difícil distinguir do tráfego típico da Internet. Isso resulta em conjuntos de dados mais completos para treinamento.
  • A largura de banda da Internet é usada de forma mais eficiente. Como o Grass é efetivamente uma colaboração no consumo de largura de banda não utilizada da Internet, é mais eficiente do que a provisão de nova largura de banda apenas para raspagem.
  • Os dados são mais precisos e recentes. Torna-se mais rentável raspar com mais frequência do que um cliente típico poderia fazer por si próprio. Isso resulta em dados menos obsoletos. Isso é importante, uma vez que os modelos de IA resultantes estão mais atualizados.

O Desafio: Criadores de Conteúdo Que Monetizam Seus Dados

Uma das coisas complicadas de navegar ao raspar dados são os criadores de conteúdo. Isso inclui sites como o NY Times e o Reddit, que começaram a monetizar seus dados licenciando-os para terceiros treinarem modelos de IA. Eles naturalmente protegem os dados de seus sites, já que esses dados representam fluxos de receita altamente lucrativos para eles. De fato, o Reddit proibiu o uso de sua API de desenvolvedor para aprendizado de máquina a fim de proteger seu modelo de negócio de licenciar seus dados para criadores de modelos de IA (ver termos de serviço).aqui).

O que o futuro reserva para os criadores de conteúdo? Bem, considere que, para o conteúdo gerado pelo usuário (UGC), como o Reddit, há um argumento de que os usuários são donos de seus próprios dados (em vez da plataforma), uma vez que o conteúdo foi criado pelos usuários e deve ser de propriedade desses usuários. Este argumento ainda não foi totalmente explorado do ponto de vista legal. Será interessante ficar de olho nisso no futuro. No entanto, se os usuários realmente forem donos de seus dados contribuídos, o Grass poderia representar um caminho hipotético para ajudar esses usuários a monetizar seus próprios dados contribuídos. Por exemplo, o Grass poderia recompensar os próprios contribuidores do Reddit por se voluntariarem para contribuir com seus dados que eles criaram no Reddit.

Para criadores de conteúdo pagos, como o NY Times, o conteúdo é criado por escritores pagos e, como tal, não há argumento para dados de propriedade do usuário. Assim, a Grass poderia simplesmente excluir esses sites de serem raspados. Alternativamente, a Grass pode escalar ao ponto de se tornar viável para a própria Grass se tornar cliente desses sites e pagar taxas de licenciamento. A maneira como isso poderia funcionar hipoteticamente é que os clientes da Grass poderiam pagar pelos dados e, em seguida, a Grass poderia compartilhar a receita de volta para os criadores de conteúdo, permitindo assim a criação de modelos de IA em um orçamento flexível. Alternativamente, a Grass poderia alcançar uma escala tal que poderia negociar um acordo de licenciamento em massa em nome de todos os seus clientes.

Lançamento do Grass

A Grass teve um lançamento extremamente impressionante no início deste ano:

  • A grama teve o airdrop mais amplamente distribuído na história da Solana.[2]
  • Mais de 2 milhões de carteiras reivindicadoo airdrop, causando a rede da Solana a ceder sob pressão.
  • Há mais de 2,5 milhões de usuários totais da Grass em todo o mundo.[3]
  • A Grass tem a capacidade e os dados para treinar o modelo ChatGPT 3.5 da OpenAI.
  • Como demonstração da sua plataforma, a Grass disponibilizou um conjunto de dados composto por 600 milhões de publicações e comentários de 2024 no Reddit (ver aquipara o anúncio eaquipara o conjunto de dados).

No momento da escrita, o token Grass tinha ação de preço positivapós-lançamento (+115%), o que é incomum, já que a maioria dos tokens cai nos dias/semanas seguintes à listagem. Isso provavelmente reflete sua abordagem inteligente em relação à distribuição de airdrops, bem como a crença no futuro e no potencial do Grass. No geral, este é um ótimo começo para a rede e acreditamos que isso abre o caminho para muitos anos prósperos.

Desempenho do Token Grass desde o lançamento em 28 de outubro de 2024

Origem: TradingView.

Comece a contribuirUtilize sua largura de banda de internet não utilizada conectando sua carteira Solana e ganhe o token Grass.

Quer usar os conjuntos de dados da Grass para o seu negócio, pesquisa ou projeto? Entre em contato com a equipe em descubra@grassfoundation.io.

Notas de rodapé

[1] Source: https://www.getgrass.io/.
[2] Source: https://www.google.com/url?q=https://www.theblock.co/post/323805/grass-becomes-most-distributed-solana-airdrop-as-nearly-1-5-million-addresses-claim-tokens&sa=D&source=docs&ust=1732646335082707&usg=AOvVaw0oVvhJL661rmE1ABmJqOyP.
[3] Fonte: https://www.getgrass.io/.

Aviso Legal:

  1. Este artigo é reproduzido de [Hack VC], Todos os direitos autorais pertencem ao autor original [Ed Roman]. Se houver objeções a esta reimpressão, por favor contacte o Gate Learnequipa, e eles vão tratar disso prontamente.
  2. Aviso de Responsabilidade: As opiniões expressas neste artigo são exclusivamente do autor e não constituem qualquer conselho de investimento.
  3. As traduções do artigo para outras línguas são feitas pela equipe Learn da gate. A menos que seja mencionado, copiar, distribuir ou plagiar os artigos traduzidos é proibido.

Relva - Uma Revolução de Dados

Intermediário12/9/2024, 8:36:14 AM
A Grass fornece modelos de IA e aplicativos acesso à Internet inteira como um conjunto de dados, que é coletado por meio de uma rede de nós ao redor do mundo que estão contribuindo com sua largura de banda ociosa da Internet. Eles têm uma forte tração inicial com mais de 2,5 milhões de usuários.

Sumário Executivo

A IA generativa é a inovação mais importante na memória recente e está se tornando ainda mais importante à medida que o tempo passa. A IA generativa é basicamente um produto de três elementos:

Algoritmos + Dados + Computação = Inteligência

Isso significa que Dados e Computação provavelmente se tornarão dois dos ativos mais importantes do mundo, e o acesso a eles será incrivelmente importante.

Os modelos de IA generativa são ávidos por dados. Os dados em que os modelos de IA generativa mais significativos operam são o valor da Internet de dados, que é uma aproximação da soma de todo o conhecimento humano.

A criptomoeda é tudo sobre dar acesso a novos recursos digitais em todo o mundo e transformar em ativos coisas que não eram ativos antes através de tokens. A Grass faz isso para os Dados.

Grass dá acesso a modelos de IA e aplicativos a toda a Internet como um conjunto de dados em tempo real, que é coletado por meio de uma rede de nós ao redor do mundo que estão contribuindo com sua largura de banda ociosa da Internet. Eles têm uma forte adesão inicial com mais de 2,5 milhões de usuários.[1]

O potencial de mercado de longo prazo para Grass é enorme e está relacionado com o tamanho do mercado de IA e seu crescimento futuro. No passado, a coleta de conjuntos de dados dessa escala era relegada apenas aos maiores gigantes da tecnologia. Grass traz novas economias para os dados, reduzindo os custos. Isso democratiza o acesso aos dados para não apenas atender às grandes empresas de elite, mas também a longa cauda da indústria de IA.

O Problema

O treinamento e ajuste fino do modelo de IA requerem enormes quantidades de dados. Historicamente, grande parte desses dados foi coletada por meio de criadores de modelos de IA raspando dados de sites. Esse processo de raspagem apresenta vários desafios:

  • A raspagem da web é cara. Apenas algumas grandes organizações são capazes de fazer a raspagem da web inteira periodicamente. Isso impede que desenvolvedores de IA menores acessem os dados.
  • Bloqueio de IP. Houve um jogo de gato e rato entre esses serviços de raspagem e os criadores de conteúdo. É bastante simples bloquear um endereço IP para parar a raspagem, tornando difícil alcançar os objetivos de raspagem e reunir os dados necessários para treino e ajuste fino de IA.
  • Recursos desperdiçados. Raspar a web é uma tarefa que pode beneficiar muitos clientes. O hardware, largura de banda e poder de computação necessários para isso é ineficiente se feito por um único cliente.
  • Atualidade dos dados. É difícil e dispendioso pesquisar toda a Internet. Isso torna impraticável para a maioria dos usuários fazer pesquisas frequentes, o que torna os dados menos atualizados, afetando a qualidade dos modelos de IA.

Solução de Grass

Grass tem como objetivo resolver esses problemas, criando uma rede federada de web scrapers. Cada indivíduo que participa na rede Grass contribui com uma parte da sua largura de banda de Internet não utilizada para fornecer uma pequena quantidade de scraping a partir do seu endereço IP. Grass reúne depois os dados de cada um destes nós para formar um conjunto de dados combinado que é útil para o treino e ajuste fino de IA. É um uso elegante e adequado de redes distribuídas alimentadas por criptomoeda.

Existem outros casos de uso para a Internet não utilizada, tais como:

  • Recolha de dados locais / geográficos, como anúncios
  • Realizar pesquisa acadêmica
  • Verificação de preços locais

Hoje, a Grass recolhe dados usando hardware existente (laptops, desktops, etc.). No futuro, a Grass planeia oferecer um dispositivo de recolha de dados, que é um dispositivo de hardware personalizado dedicado exclusivamente à recolha de dados, criando eficiências devido ao dispositivo ser otimizado para essa tarefa específica.

Benefícios da Relva

Existem várias vantagens em usar uma rede distribuída para coleta de dados:

  • Acesso democratizado aos dados da web que se torna mais barato em grande escala. Em vez de um único cliente reunir dados para suas próprias necessidades, o Grass reúne dados em nome de muitos clientes. Esses dados podem ser revendidos várias vezes, criando economias de escala nos dados, reduzindo os custos econômicos da raspagem e tornando o mercado mais eficiente. Em grande escala, o Grass pode hipoteticamente tornar-se a solução de coleta de dados mais econômica para os clientes, criando um efeito de rede econômica em torno de seu protocolo. Isso significa que a coleta de dados está agora disponível para qualquer pessoa, não apenas para um par de grandes empresas que têm os recursos para raspar a web.
  • O bloqueio de IP torna-se inviável. Ao distribuir a raspagem, torna-se muito mais difícil detectar e parar a raspagem, uma vez que cada nó realiza apenas uma quantidade relativamente pequena de captura de dados e é difícil distinguir do tráfego típico da Internet. Isso resulta em conjuntos de dados mais completos para treinamento.
  • A largura de banda da Internet é usada de forma mais eficiente. Como o Grass é efetivamente uma colaboração no consumo de largura de banda não utilizada da Internet, é mais eficiente do que a provisão de nova largura de banda apenas para raspagem.
  • Os dados são mais precisos e recentes. Torna-se mais rentável raspar com mais frequência do que um cliente típico poderia fazer por si próprio. Isso resulta em dados menos obsoletos. Isso é importante, uma vez que os modelos de IA resultantes estão mais atualizados.

O Desafio: Criadores de Conteúdo Que Monetizam Seus Dados

Uma das coisas complicadas de navegar ao raspar dados são os criadores de conteúdo. Isso inclui sites como o NY Times e o Reddit, que começaram a monetizar seus dados licenciando-os para terceiros treinarem modelos de IA. Eles naturalmente protegem os dados de seus sites, já que esses dados representam fluxos de receita altamente lucrativos para eles. De fato, o Reddit proibiu o uso de sua API de desenvolvedor para aprendizado de máquina a fim de proteger seu modelo de negócio de licenciar seus dados para criadores de modelos de IA (ver termos de serviço).aqui).

O que o futuro reserva para os criadores de conteúdo? Bem, considere que, para o conteúdo gerado pelo usuário (UGC), como o Reddit, há um argumento de que os usuários são donos de seus próprios dados (em vez da plataforma), uma vez que o conteúdo foi criado pelos usuários e deve ser de propriedade desses usuários. Este argumento ainda não foi totalmente explorado do ponto de vista legal. Será interessante ficar de olho nisso no futuro. No entanto, se os usuários realmente forem donos de seus dados contribuídos, o Grass poderia representar um caminho hipotético para ajudar esses usuários a monetizar seus próprios dados contribuídos. Por exemplo, o Grass poderia recompensar os próprios contribuidores do Reddit por se voluntariarem para contribuir com seus dados que eles criaram no Reddit.

Para criadores de conteúdo pagos, como o NY Times, o conteúdo é criado por escritores pagos e, como tal, não há argumento para dados de propriedade do usuário. Assim, a Grass poderia simplesmente excluir esses sites de serem raspados. Alternativamente, a Grass pode escalar ao ponto de se tornar viável para a própria Grass se tornar cliente desses sites e pagar taxas de licenciamento. A maneira como isso poderia funcionar hipoteticamente é que os clientes da Grass poderiam pagar pelos dados e, em seguida, a Grass poderia compartilhar a receita de volta para os criadores de conteúdo, permitindo assim a criação de modelos de IA em um orçamento flexível. Alternativamente, a Grass poderia alcançar uma escala tal que poderia negociar um acordo de licenciamento em massa em nome de todos os seus clientes.

Lançamento do Grass

A Grass teve um lançamento extremamente impressionante no início deste ano:

  • A grama teve o airdrop mais amplamente distribuído na história da Solana.[2]
  • Mais de 2 milhões de carteiras reivindicadoo airdrop, causando a rede da Solana a ceder sob pressão.
  • Há mais de 2,5 milhões de usuários totais da Grass em todo o mundo.[3]
  • A Grass tem a capacidade e os dados para treinar o modelo ChatGPT 3.5 da OpenAI.
  • Como demonstração da sua plataforma, a Grass disponibilizou um conjunto de dados composto por 600 milhões de publicações e comentários de 2024 no Reddit (ver aquipara o anúncio eaquipara o conjunto de dados).

No momento da escrita, o token Grass tinha ação de preço positivapós-lançamento (+115%), o que é incomum, já que a maioria dos tokens cai nos dias/semanas seguintes à listagem. Isso provavelmente reflete sua abordagem inteligente em relação à distribuição de airdrops, bem como a crença no futuro e no potencial do Grass. No geral, este é um ótimo começo para a rede e acreditamos que isso abre o caminho para muitos anos prósperos.

Desempenho do Token Grass desde o lançamento em 28 de outubro de 2024

Origem: TradingView.

Comece a contribuirUtilize sua largura de banda de internet não utilizada conectando sua carteira Solana e ganhe o token Grass.

Quer usar os conjuntos de dados da Grass para o seu negócio, pesquisa ou projeto? Entre em contato com a equipe em descubra@grassfoundation.io.

Notas de rodapé

[1] Source: https://www.getgrass.io/.
[2] Source: https://www.google.com/url?q=https://www.theblock.co/post/323805/grass-becomes-most-distributed-solana-airdrop-as-nearly-1-5-million-addresses-claim-tokens&sa=D&source=docs&ust=1732646335082707&usg=AOvVaw0oVvhJL661rmE1ABmJqOyP.
[3] Fonte: https://www.getgrass.io/.

Aviso Legal:

  1. Este artigo é reproduzido de [Hack VC], Todos os direitos autorais pertencem ao autor original [Ed Roman]. Se houver objeções a esta reimpressão, por favor contacte o Gate Learnequipa, e eles vão tratar disso prontamente.
  2. Aviso de Responsabilidade: As opiniões expressas neste artigo são exclusivamente do autor e não constituem qualquer conselho de investimento.
  3. As traduções do artigo para outras línguas são feitas pela equipe Learn da gate. A menos que seja mencionado, copiar, distribuir ou plagiar os artigos traduzidos é proibido.
Comece agora
Registe-se e ganhe um cupão de
100 USD
!