Трава - революція даних

Середній12/9/2024, 8:36:14 AM
Grass дає моделям штучного інтелекту та додаткам доступ до всієї Інтернету як набору даних, який збирається за допомогою мережі вузлів по всьому світу, які надають свою простірну пропускну здатність в режимі очікування. Вони мають сильний початковий нальот з понад 2,5 мільйонами користувачів.

Виконавчий конспект

Генеративний AI є найважливішою інновацією за останню пам'ять і стає ще важливішим з плином часу. Генеративний AI по суті є продуктом трьох елементів:

Алгоритми + Дані + Обчислення = Інтелект

Це означає, що Дані та Обчислення, ймовірно, стануть двома найважливішими активами у світі, і доступ до них буде надзвичайно важливим.

Генеративні моделі штучного інтелекту потребують великої кількості даних. Дані, з якими працюють найбільш значущі генеративні моделі штучного інтелекту, є сукупністю всього людського знання у Інтернеті.

Криптовалюта - це все про надання доступу до нових цифрових ресурсів по всьому світу та перетворення речей, які раніше не були активами, у токени. Grass робить це для даних.

Grass дарує моделям штучного інтелекту та додаткам доступ до цілого Інтернету як набору даних, які надходять у реальному часі, і які збираються за допомогою мережі вузлів по всьому світу, які надають свою бездіяльну Інтернет-пропускну здатність. Вони мають сильний початковий наріст з понад 2,5 мільйонами користувачів.[1]

Довгостроковий потенційний ринок для Grass є масштабним і відносний до розміру ринку штучного інтелекту та його майбутнього зростання. У минулому збір даних такого масштабу був відведений лише найбільшим технологічним гігантам. Grass внесе нові економічні зміни в галузі даних, знижуючи витрати. Це демократизує доступ до даних, щоб не лише обслуговувати елітні великі компанії, але й довший хвіст галузі штучного інтелекту.

Проблема

Тренування та налаштування моделей штучного інтелекту вимагають величезних обсягів даних. Історично багато цих даних накопичувалося за допомогою створювачів моделей штучного інтелекту, які отримували їх, збираючи дані з веб-сайтів. Цей процес збирання даних має кілька викликів:

  • Веб-скрапінг є дорогим. Є лише кілька великих організацій, які здатні періодично скрапінгувати весь Інтернет. Це виключає менших розробників штучного інтелекту від доступу до даних.
  • Блокування IP. Між цими службами парсингу та творцями контенту відбувалася гра в кота і миші. Досить просто заблокувати IP-адресу, щоб зупинити парсинг, ускладнюючи досягнення цілей парсингу та збір необхідних даних для навчання та налаштування штучного інтелекту.
  • Витрачені ресурси. Збір веб-даних - це завдання, яке може бути корисним для багатьох клієнтів. Але апаратне забезпечення, пропускна здатність та обчислювальна потужність, необхідні для цього, є неефективними, якщо вони виконуються лише одним клієнтом.
  • Свіжість даних. Сканувати весь Інтернет є непотрібною та дорогою справою. Це робить його непрактичним для більшості користувачів, щоб сканувати часто, що робить дані менш свіжими/останніми, впливаючи на якість моделей штучного інтелекту.

Рішення Grass

Grass має на меті вирішити ці проблеми, створивши федеративну мережу веб-скраперів. Кожен учасник мережі Grass вносить свою частку не використаної Інтернет-пропускної здатності, щоб забезпечити невелику кількість скрапінгу зі своєї IP-адреси. Потім Grass збирає дані з кожного з цих вузлів, щоб сформувати комбінований набір даних, який корисний для навчання та удосконалення штучного інтелекту. Це елегантне і відповідне використання розподілених мереж, що працюють за допомогою криптовалюти.

Існують інші бізнес-кейси для не використаного Інтернету, такі як:

  • Збір місцевих / геоданих, таких як реклама
  • Виконання академічних досліджень
  • Перевірка місцевих цін

Сьогодні Grass збирає дані за допомогою наявного обладнання (ноутбуки, настільні комп'ютери тощо). У майбутньому Grass планує запропонувати пристрій для збору даних, який є пристроєм спеціального призначення, що повністю присвячений збору даних, що створює ефективність завдяки оптимізації пристрою саме для цієї конкретної задачі.

Переваги трави

Є кілька переваг використання розподіленої мережі для збору даних:

  • Демократизований доступ до даних в Інтернеті, який стає дешевшим при масштабуванні. Замість того, щоб один клієнт збирав дані для своїх власних потреб, Grass збирає дані від імені багатьох клієнтів. Ці дані можуть бути перепродані кілька разів, створюючи економію масштабу на даних, знижуючи економічні витрати на парсинг та зроблячи ринок більш ефективним. На масштабі Grass теоретично може стати найбільш ефективним рішенням для збору даних для клієнтів, створюючи економічний мережевий ефект навколо їх протоколу. Це означає, що збір даних тепер доступний для будь-кого, а не тільки для кількох великих компаній, які мають ресурси для парсингу Інтернету.
  • Блокування IP стає неможливим. Розподіляючи збір даних, стає набагато складніше виявити і зупинити збір даних, оскільки кожен вузол виконує лише відносно невеликий обсяг збору даних і важко відрізнити від типового Інтернет-трафіку. Це призводить до отримання більш повних наборів даних для навчання.
  • Інтернет-потужність використовується ефективніше. Оскільки Grass фактично є спільним споживанням невикористовуваної Інтернет-потужності, вона є ефективнішою, ніж надання нової пропускної здатності лише для збирання даних.
  • Дані більш точні та свіжі. Стане вигідним здійснювати частіший збір, ніж це може робити типовий клієнт самостійно. Це призводить до менш застарілих даних. Це важливо, оскільки наступні моделі штучного інтелекту будуть більш актуальними.

Виклик: творці контенту, які монетизують свої дані

Однією з складних речей, з якими доводиться мати справу при зборі даних, є контент-створювачі. Сюди входять такі сайти, як NY Times і Reddit, які почали монетизувати свої дані, ліцензуючи їх третім сторонам для тренування моделей штучного інтелекту. Вони, звичайно, захищають дані на своїх сайтах, оскільки ці дані представляють для них високоприбуткові джерела доходу. Власне, Reddit заборонив використання свого API для розробки машинного навчання, щоб захистити свою бізнес-модель ліцензування даних AI-розробникам моделей (див. умови обслуговування).тут).

Що майбутнє приховує для творців контенту? Ну, розгляньте, що для контенту, створеного користувачами (UGC), такого як Reddit, є доводи, що користувачі володіють власними даними (а не платформою), оскільки контент створений користувачами і повинен бути власністю цих користувачів. Цей довідка ще не був повністю досліджений з юридичної точки зору. Буде цікаво стежити за цим в майбутньому. Однак, якщо користувачі дійсно володіють своїми внесеними даними, то Grass може представляти гіпотетичний шлях допомогти цим користувачам монетизувати свої власні внесені дані. Наприклад, Grass може винагородити саміх учасників Reddit за добровільне надання своїх даних, які вони створили на Reddit.

Для платних творців вмісту, таких як NY Times, вміст створюється платними письменниками, і, отже, немає аргументу на користь даних, що належать користувачам. Таким чином, Grass може просто виключити ці сайти зі списку для збору даних. Як альтернативу, Grass може масштабуватися до того рівня, коли стане можливим для самого Grass стати клієнтом цих сайтів і платити ліцензійні внески. Теоретично це може працювати так, що клієнти Grass можуть платити за дані, а потім Grass може розділяти прибуток з творцями вмісту, що дозволить створювати моделі штучного інтелекту за гнучким бюджетом. Або ж Grass може досягти такого масштабу, що зможе домовитися про оптову ліцензійну угоду від імені всіх своїх клієнтів.

Запуск трави

Gate має надзвичайно вражаючий старт в цьому році:

  • Трава мала найширше розповсюдження повітряної підтримки в історії Solana.[2]
  • Понад 2 мільйони гаманцівствердженороздача жетонів, що призвела до перевантаження мережі Solana.
  • Всього по всьому світу налічується понад 2,5 мільйонів користувачів Grass.[3]
  • Трава вже має можливість та дані для навчання моделі ChatGPT 3.5 від OpenAI.
  • Як демонстрація їхньої платформи, Grass опублікував набір даних, що складається з 600 мільйонів постів та коментарів з 2024 року на Reddit (див.тутдля оголошення татутдля набору даних).

На момент написання, у токену Grass було позитивна цінова динамікапісля запуску (+115%), що є незвичайним, оскільки більшість токенів падають у дні/тижні після лістингу. Це, ймовірно, відображення їх розумного підходу до розподілу аірдропу, а також віри в майбутнє і потенціал Grass. Загалом, це чудовий початок мережі, і ми віримо, що це прокладе шлях багатьом процвітаючим рокам у майбутньому.

Виступ токена Grass з моменту запуску 28 жовтня 2024 року

Джерело: TradingView.

Почніть сприятиВикористовуйте свою не використану інтернет-пропускну здатність, підключивши свій гаманець Solana та заробляйте токени Grass.

Хочете використовувати набори даних Grass для свого бізнесу, досліджень або проекту? Зв'яжіться з командою на Gate.io.discover@grassfoundation.io.

Виноски

[1] Джерело: https://www.getgrass.io/.
[2] Джерело: https://www.google.com/url?q=https://www.theblock.co/post/323805/grass-becomes-most-distributed-solana-airdrop-as-nearly-1-5-million-addresses-claim-tokens&sa=D&source=docs&ust=1732646335082707&usg=AOvVaw0oVvhJL661rmE1ABmJqOyP.
[3] Джерело: https://www.getgrass.io/.

Відмова від відповідальності:

  1. Ця стаття передрукована з [Gate VC], Всі авторські права належать оригінальному автору [Ед Роман]. Якщо є заперечення до цього повторення, будь ласка, зв'яжіться Gate LearnКоманда впорається з цим швидко.
  2. Відмова від відповідальності: Погляди та думки, висловлені в цій статті, належать виключно автору і не становлять жодної інвестиційної поради.
  3. Переклади статті на інші мови здійснює команда gate Learn. Якщо не зазначено інше, копіювання, розповсюдження або плагіат перекладених статей заборонені.

Трава - революція даних

Середній12/9/2024, 8:36:14 AM
Grass дає моделям штучного інтелекту та додаткам доступ до всієї Інтернету як набору даних, який збирається за допомогою мережі вузлів по всьому світу, які надають свою простірну пропускну здатність в режимі очікування. Вони мають сильний початковий нальот з понад 2,5 мільйонами користувачів.

Виконавчий конспект

Генеративний AI є найважливішою інновацією за останню пам'ять і стає ще важливішим з плином часу. Генеративний AI по суті є продуктом трьох елементів:

Алгоритми + Дані + Обчислення = Інтелект

Це означає, що Дані та Обчислення, ймовірно, стануть двома найважливішими активами у світі, і доступ до них буде надзвичайно важливим.

Генеративні моделі штучного інтелекту потребують великої кількості даних. Дані, з якими працюють найбільш значущі генеративні моделі штучного інтелекту, є сукупністю всього людського знання у Інтернеті.

Криптовалюта - це все про надання доступу до нових цифрових ресурсів по всьому світу та перетворення речей, які раніше не були активами, у токени. Grass робить це для даних.

Grass дарує моделям штучного інтелекту та додаткам доступ до цілого Інтернету як набору даних, які надходять у реальному часі, і які збираються за допомогою мережі вузлів по всьому світу, які надають свою бездіяльну Інтернет-пропускну здатність. Вони мають сильний початковий наріст з понад 2,5 мільйонами користувачів.[1]

Довгостроковий потенційний ринок для Grass є масштабним і відносний до розміру ринку штучного інтелекту та його майбутнього зростання. У минулому збір даних такого масштабу був відведений лише найбільшим технологічним гігантам. Grass внесе нові економічні зміни в галузі даних, знижуючи витрати. Це демократизує доступ до даних, щоб не лише обслуговувати елітні великі компанії, але й довший хвіст галузі штучного інтелекту.

Проблема

Тренування та налаштування моделей штучного інтелекту вимагають величезних обсягів даних. Історично багато цих даних накопичувалося за допомогою створювачів моделей штучного інтелекту, які отримували їх, збираючи дані з веб-сайтів. Цей процес збирання даних має кілька викликів:

  • Веб-скрапінг є дорогим. Є лише кілька великих організацій, які здатні періодично скрапінгувати весь Інтернет. Це виключає менших розробників штучного інтелекту від доступу до даних.
  • Блокування IP. Між цими службами парсингу та творцями контенту відбувалася гра в кота і миші. Досить просто заблокувати IP-адресу, щоб зупинити парсинг, ускладнюючи досягнення цілей парсингу та збір необхідних даних для навчання та налаштування штучного інтелекту.
  • Витрачені ресурси. Збір веб-даних - це завдання, яке може бути корисним для багатьох клієнтів. Але апаратне забезпечення, пропускна здатність та обчислювальна потужність, необхідні для цього, є неефективними, якщо вони виконуються лише одним клієнтом.
  • Свіжість даних. Сканувати весь Інтернет є непотрібною та дорогою справою. Це робить його непрактичним для більшості користувачів, щоб сканувати часто, що робить дані менш свіжими/останніми, впливаючи на якість моделей штучного інтелекту.

Рішення Grass

Grass має на меті вирішити ці проблеми, створивши федеративну мережу веб-скраперів. Кожен учасник мережі Grass вносить свою частку не використаної Інтернет-пропускної здатності, щоб забезпечити невелику кількість скрапінгу зі своєї IP-адреси. Потім Grass збирає дані з кожного з цих вузлів, щоб сформувати комбінований набір даних, який корисний для навчання та удосконалення штучного інтелекту. Це елегантне і відповідне використання розподілених мереж, що працюють за допомогою криптовалюти.

Існують інші бізнес-кейси для не використаного Інтернету, такі як:

  • Збір місцевих / геоданих, таких як реклама
  • Виконання академічних досліджень
  • Перевірка місцевих цін

Сьогодні Grass збирає дані за допомогою наявного обладнання (ноутбуки, настільні комп'ютери тощо). У майбутньому Grass планує запропонувати пристрій для збору даних, який є пристроєм спеціального призначення, що повністю присвячений збору даних, що створює ефективність завдяки оптимізації пристрою саме для цієї конкретної задачі.

Переваги трави

Є кілька переваг використання розподіленої мережі для збору даних:

  • Демократизований доступ до даних в Інтернеті, який стає дешевшим при масштабуванні. Замість того, щоб один клієнт збирав дані для своїх власних потреб, Grass збирає дані від імені багатьох клієнтів. Ці дані можуть бути перепродані кілька разів, створюючи економію масштабу на даних, знижуючи економічні витрати на парсинг та зроблячи ринок більш ефективним. На масштабі Grass теоретично може стати найбільш ефективним рішенням для збору даних для клієнтів, створюючи економічний мережевий ефект навколо їх протоколу. Це означає, що збір даних тепер доступний для будь-кого, а не тільки для кількох великих компаній, які мають ресурси для парсингу Інтернету.
  • Блокування IP стає неможливим. Розподіляючи збір даних, стає набагато складніше виявити і зупинити збір даних, оскільки кожен вузол виконує лише відносно невеликий обсяг збору даних і важко відрізнити від типового Інтернет-трафіку. Це призводить до отримання більш повних наборів даних для навчання.
  • Інтернет-потужність використовується ефективніше. Оскільки Grass фактично є спільним споживанням невикористовуваної Інтернет-потужності, вона є ефективнішою, ніж надання нової пропускної здатності лише для збирання даних.
  • Дані більш точні та свіжі. Стане вигідним здійснювати частіший збір, ніж це може робити типовий клієнт самостійно. Це призводить до менш застарілих даних. Це важливо, оскільки наступні моделі штучного інтелекту будуть більш актуальними.

Виклик: творці контенту, які монетизують свої дані

Однією з складних речей, з якими доводиться мати справу при зборі даних, є контент-створювачі. Сюди входять такі сайти, як NY Times і Reddit, які почали монетизувати свої дані, ліцензуючи їх третім сторонам для тренування моделей штучного інтелекту. Вони, звичайно, захищають дані на своїх сайтах, оскільки ці дані представляють для них високоприбуткові джерела доходу. Власне, Reddit заборонив використання свого API для розробки машинного навчання, щоб захистити свою бізнес-модель ліцензування даних AI-розробникам моделей (див. умови обслуговування).тут).

Що майбутнє приховує для творців контенту? Ну, розгляньте, що для контенту, створеного користувачами (UGC), такого як Reddit, є доводи, що користувачі володіють власними даними (а не платформою), оскільки контент створений користувачами і повинен бути власністю цих користувачів. Цей довідка ще не був повністю досліджений з юридичної точки зору. Буде цікаво стежити за цим в майбутньому. Однак, якщо користувачі дійсно володіють своїми внесеними даними, то Grass може представляти гіпотетичний шлях допомогти цим користувачам монетизувати свої власні внесені дані. Наприклад, Grass може винагородити саміх учасників Reddit за добровільне надання своїх даних, які вони створили на Reddit.

Для платних творців вмісту, таких як NY Times, вміст створюється платними письменниками, і, отже, немає аргументу на користь даних, що належать користувачам. Таким чином, Grass може просто виключити ці сайти зі списку для збору даних. Як альтернативу, Grass може масштабуватися до того рівня, коли стане можливим для самого Grass стати клієнтом цих сайтів і платити ліцензійні внески. Теоретично це може працювати так, що клієнти Grass можуть платити за дані, а потім Grass може розділяти прибуток з творцями вмісту, що дозволить створювати моделі штучного інтелекту за гнучким бюджетом. Або ж Grass може досягти такого масштабу, що зможе домовитися про оптову ліцензійну угоду від імені всіх своїх клієнтів.

Запуск трави

Gate має надзвичайно вражаючий старт в цьому році:

  • Трава мала найширше розповсюдження повітряної підтримки в історії Solana.[2]
  • Понад 2 мільйони гаманцівствердженороздача жетонів, що призвела до перевантаження мережі Solana.
  • Всього по всьому світу налічується понад 2,5 мільйонів користувачів Grass.[3]
  • Трава вже має можливість та дані для навчання моделі ChatGPT 3.5 від OpenAI.
  • Як демонстрація їхньої платформи, Grass опублікував набір даних, що складається з 600 мільйонів постів та коментарів з 2024 року на Reddit (див.тутдля оголошення татутдля набору даних).

На момент написання, у токену Grass було позитивна цінова динамікапісля запуску (+115%), що є незвичайним, оскільки більшість токенів падають у дні/тижні після лістингу. Це, ймовірно, відображення їх розумного підходу до розподілу аірдропу, а також віри в майбутнє і потенціал Grass. Загалом, це чудовий початок мережі, і ми віримо, що це прокладе шлях багатьом процвітаючим рокам у майбутньому.

Виступ токена Grass з моменту запуску 28 жовтня 2024 року

Джерело: TradingView.

Почніть сприятиВикористовуйте свою не використану інтернет-пропускну здатність, підключивши свій гаманець Solana та заробляйте токени Grass.

Хочете використовувати набори даних Grass для свого бізнесу, досліджень або проекту? Зв'яжіться з командою на Gate.io.discover@grassfoundation.io.

Виноски

[1] Джерело: https://www.getgrass.io/.
[2] Джерело: https://www.google.com/url?q=https://www.theblock.co/post/323805/grass-becomes-most-distributed-solana-airdrop-as-nearly-1-5-million-addresses-claim-tokens&sa=D&source=docs&ust=1732646335082707&usg=AOvVaw0oVvhJL661rmE1ABmJqOyP.
[3] Джерело: https://www.getgrass.io/.

Відмова від відповідальності:

  1. Ця стаття передрукована з [Gate VC], Всі авторські права належать оригінальному автору [Ед Роман]. Якщо є заперечення до цього повторення, будь ласка, зв'яжіться Gate LearnКоманда впорається з цим швидко.
  2. Відмова від відповідальності: Погляди та думки, висловлені в цій статті, належать виключно автору і не становлять жодної інвестиційної поради.
  3. Переклади статті на інші мови здійснює команда gate Learn. Якщо не зазначено інше, копіювання, розповсюдження або плагіат перекладених статей заборонені.
Розпочати зараз
Зареєструйтеся та отримайте ваучер на
$100
!