AIの錯覚としての暗号

この記事では、AIと暗号通貨の統合の可能性を探り、真の統合には、暗号をAIワークフローに組み込み、暗号でAIを強化することが必要であることを強調します。
  • 創発:化学で研究される生物系に見られる創発のように、多くの小さな実体が相互作用してより大きな全体を生み出し、個々の構成要素が持たない新しい特徴を示す現象。
  • 幻覚:AIモデルが一見正しいが実際には誤りのある出力を生成することで、モデルが欺瞞的なデータを生成する傾向。

AIと暗号資産の関係は、明確な起伏を示しています。 2016年にAlphaGoが人間のプロ囲碁棋士を打ち負かして以来、Fetch.AI のようなプロジェクトが自然発生的に出現するなど、この2つを組み合わせる試みが暗号資産の世界では目撃されています。 2023年のGPT-4の登場により、WorldCoinの発行に代表されるように、AI+Cryptoのトレンドが復活しました。 人類は、AIが生産性を担当し、クリプトが流通を担当するユートピア時代に突入する準備ができているようです。

この感情は、OpenAIがテキストからビデオへの合成のためのSoraアプリケーションを立ち上げた後にピークに達しました。 しかし、感情にはしばしば不合理な要素が含まれます。 例えば、李益州は、次のような誤解されている部分に属しているように思われる。

  • 特定のAIアプリケーションとアルゴリズム開発の融合。 SoraとGPT-4の基盤となるTransformerの原則はオープンソースですが、両方を使用するにはOpenAIへの支払いが必要です。
  • AIと暗号の組み合わせは、主要なAI巨人が明確な意欲を示していないため、現在、暗号が主導してAIにアプローチしています。 この段階では、AIがCryptoのためにできることは、CryptoがAIのためにできることを上回ります。
  • ブロックチェーンゲーム、GameFi、メタバースプロジェクト、Web3ゲーム、AWユニバースのデジタルペルソナなどのアプリケーションに見られるように、暗号アプリケーションでAI技術を使用することは、AIと暗号の統合と同じではありません。
  • 暗号資産がAI技術開発に貢献できるのは、主に、コンピューティングパワー、データ、モデルの3つのAIコンポーネントにおける分散化とトークンインセンティブです。
  • WorldCoinは、zkMLがAIと暗号技術の交差点に位置し、UBI(ユニバーサル・ベーシック・インカム)理論が初めて大規模に実装されたことで、両者の統合に成功しています。

この記事では、AIアプリケーションを強調する現在のCryptoプロジェクトは、ほとんどがマーケティングの仕掛けと見なされ、私たちの議論を助長していないため、CryptoがAIにもたらすメリットに焦点を当てます。

線形回帰からトランスフォーマーへ

長い間、AIをめぐる議論の焦点は、人工知能の「出現」が「マトリックス」のような感覚を持つ存在を生み出すのか、それともシリコンベースの文明を生み出すのかということでした。 人間とAI技術の相互作用に関する懸念は根強く残っており、最近の例では、ソラの出現や、GPT-4(2023年)、AlphaGo(2016年)、IBMのディープ・ブルーが1997年にチェスの世界チャンピオンを破った例などがあります。

そのような懸念は顕在化していませんが、落ち着いてAIの背後にあるメカニズムを簡単に概説しましょう。

中国の有名な俳優であるJia Lingによる減量メカニズムなど、本質的に単純な線形方程式である線形回帰から始めて、次の一般化を行うことができます。 ここで、xとyは摂取カロリーと体重の関係を表しており、より自然に食べることは体重の増加につながり、体重を減らしたいのであれば食べる量を減らす必要があることを示しています。

ただし、このアプローチにはいくつかの問題があります。 まず、人間の身長と体重には生理的な限界があり、3メートルの巨人や1000キログラムの女性に遭遇する可能性は低いです。 したがって、これらの限界を超える状況を考慮することは、実際的な重要性を欠いています。 第二に、単に食べる量を減らして運動量を増やすことは、減量の科学的原則に従わず、重症の場合、体に害を及ぼす可能性があります。

体重を身長の2乗で割って体重と身長の関係を測るボディマス指数(BMI)をご紹介します。 身長と体重の関係を評価するには、食事、睡眠、運動の3つの要素から、3つのパラメータと2つのアウトプットが必要になります。 線形回帰は明らかに不十分であり、ニューラルネットワークを生み出します。 名前が示すように、ニューラルネットワークは人間の脳の構造を模倣しており、より多くの思考がより多くの合理性につながる可能性があります。 ディープラーニングと呼ばれる思考の頻度と深さを増やすことで(ここでは少し緩い例えをしています)、行動を起こす前に、より徹底的に検討することができます。


AIアルゴリズムの開発経緯の概要

ただし、レイヤー数の増加は無限ではありません。まだ天井があります。 臨界閾値に達すると、有効性が低下する可能性があります。 したがって、既存の情報間の関係をより合理的に理解することが不可欠になります。 例えば、身長と体重の微妙な関係を深く理解したり、これまで気づかなかった要因を発見したり、Jia Lingがトップコーチを見つけたが、減量への願望を直接表現することを躊躇したりします。


このようなシナリオでは、賈玲とコーチはエンコードとデコードで対戦相手を形成し、両者の真意を表す意味を前後に伝えます。 しかし、「痩せたいから、コーチにプレゼントします」というストレートな言葉とは違い、その「意味」の裏には双方の本音が隠されている。

2者間の反復回数が十分であれば、各通信の意味を解読しやすくなるという事実に気づきます。

このモデルを拡張すると、口語的に大規模言語モデル(LLM)と呼ばれるものを表し、単語と文の間の文脈上の関係を調べます。 現在、大規模なモデルは、画像やビデオなどのシナリオを掘り下げるように拡張されています。

AIのスペクトルでは、それが単純な線形回帰であろうと非常に複雑なトランスフォーマーであろうと、それらはすべてアルゴリズムまたはモデルです。 これらに加えて、計算能力とデータという2つの重要な要素があります。


説明:AIの開発経緯、出典: https://ourworldindata.org/brief-history-of-ai

簡単に言えば、AIはデータを処理し、計算を実行し、結果を生み出す機械です。 しかし、ロボットのような物理的な存在と比較すると、AIはより仮想的です。 コンピューティング能力、データ、モデルの観点から、Web2の商用化における現在の運用プロセスは次のとおりです。

  • データは、公開データ、会社所有データ、商用データに分けられ、専門的な注釈と前処理が必要です。 たとえば、Scale AI は、主流の AI 企業にデータの前処理を提供します。
  • コンピューティングパワーは、セルフビルドとクラウドコンピューティングリースの2つのモードに分けられます。 現在、GPUハードウェアはNVIDIAが支配しており、CUDAライブラリは何年も前から準備されています。 ハードウェアとソフトウェアのエコシステムは、1つの企業によって支配されています。 2つ目の選択肢は、MicrosoftのAzure、Google Cloud、AWSなど、ワンストップのコンピューティングとモデル展開サービスを提供するクラウドサービスプロバイダーによるコンピューティングパワーのリースです。
  • モデルは、フレームワークとアルゴリズムに分類できます。 モデルの戦いはすでに終わっており、GoogleのTensorFlowが最初の挫折を乗り越えながら最初に登場し、MetaのPyTorchが後から登場しましたが、リードしています。 しかし、Transformerを導入したGoogleにせよ、PyTorchを導入したMetaにせよ、どちらも商用化においてOpenAIに徐々に遅れをとっています。 それにもかかわらず、彼らの強さは依然として手ごわいままです。現在、アルゴリズムはTransformerによって支配されており、さまざまな大規模モデルが主にデータソースと詳細の点で競合しています。


AIの作業プロセス

前述したように、AIアプリケーションには、Vitalik氏が言及したコード修正など、すでに活用されている幅広い領域があります。 別の視点から見ると、CryptoのAIへの貢献は、主に分散型データ市場、分散型コンピューティングパワープラットフォームなどの非技術分野に焦点を当てています。 分散型大規模言語モデル(LLM)の実験がいくつか行われています。 ただし、AIで暗号コードを分析することと、ブロックチェーン上で大規模なAIモデルを実行することは根本的に異なることに注意することが重要です。 一部の暗号要素をAIモデルに組み込むことは、完璧な統合とは見なされません。

現在、Cryptoは生産とインセンティブに優れています。 クリプトでAIの生産パラダイムを無理に変える必要はありません。 合理的な選択は、CryptoをAIワークフローに統合し、CryptoでAIを強化することです。 ここでは、私が要約したいくつかの潜在的な統合を紹介します。

  1. DePINのデータ収集などの分散型データ生成と、財務分析、セキュリティ分析、データトレーニングのための豊富なトランザクションデータを含むオンチェーンデータのオープン性。
  2. 分散型の前処理プラットフォームでは、従来の事前トレーニングでは乗り越えられない技術的障壁はありません。 ヨーロッパと米国の大型モデルの背後には、第三世界の手動アノテーターの高負荷労働があります。
  3. 分散型コンピューティングパワープラットフォーム:分散型インセンティブと、個人の帯域幅、GPUコンピューティングパワー、その他のハードウェアリソースの利用。
  4. zkMLは、データの脱感作などの従来のプライバシー手法では問題を完全に解決できない可能性があるためです。 zkMLは、データの方向性を隠蔽し、オープンソースモデルとクローズドソースモデルの真正性と有効性を効果的に評価することができます。

これら4つの側面は、暗号がAIに力を与えることができると私が考える潜在的なシナリオです。 AIは用途の広いツールであり、AI for Cryptoの分野とプロジェクトについてはここではこれ以上説明しません。自分で探索できます。

暗号は現在、主に暗号化、プライバシー保護、および経済設計において役割を果たしていることがわかります。 唯一の技術的な統合の試みはzkMLです。 ここで、少しブレインストーミングをしてみましょう:将来、Solana TPSが本当に100,000+に達することができ、FilecoinとSolanaの組み合わせが完璧であれば、オンチェーンのLLM環境を作ることができるでしょうか? これにより、真のオンチェーンAIが確立され、暗号がAIに統合されている現在の不平等な関係が変わる可能性があります。

AIワークフローへのWeb3統合

周知の通り、NVIDIA RTX 4090グラフィックスカードは、現在、東アジアの某国では入手困難な貴重な商品です。 さらに深刻なのは、個人、中小企業、学術機関もグラフィックスカードの危機に直面していることです。 結局のところ、大企業は大きな支出者です。 個人購入やクラウドプロバイダー以外の第3の道が開かれれば、純粋に投機的な目的から脱却し、実用的なビジネス価値を持つことは明らかです。 AIのためのWeb3の論理的なアプローチは、「Web3を使わなければプロジェクトは持続しない」というものであるべきです。


Web3の視点から見たAIワークフロー

データの出所:Grass and DePIN Automotive Ecosystem

Wynd Networkによって導入されたGrassは、アイドル状態の帯域幅を販売するためのマーケットプレイスです。 Grassは、データの取得と配布のためのオープンネットワークとして機能し、単純なデータ収集と販売とは一線を画しています。 Grassには、ますます閉鎖的なネットワーク環境をナビゲートするためのデータのクリーニングと検証のための機能があります。 さらに、GrassはAIモデルと直接連携し、すぐに使えるデータセットを提供することを目指しています。 AI データセットには、AI モデルの特定のニーズを満たすために広範な手動微調整を含む、専門的な処理が必要です。

これを拡張して、Grassはデータ販売の問題に取り組み、Web3のDePINセクターはAIが必要とするデータを生成できます。 この分野は、主に車両の自動運転に焦点を当てています。 従来、自動運転では、企業は対応するデータを蓄積する必要がありました。 しかし、DIMO や Hivemapper などのプロジェクトは車両上で直接動作し、ますます多くの運転情報や道路データを収集しています。

これまでの自動運転のシナリオでは、車両認識技術や高精度地図が不可欠でした。 高精度な地図などの情報は、NavInfoのような企業によって蓄積され、業界の障壁となっています。 新規参入者がWeb3データを活用すれば、競合他社を追い越すチャンスがあるかもしれません。

データの前処理:AIに隷属する人間を解放する

人工知能は、手動注釈とインテリジェントアルゴリズムの2つの部分に分けることができます。 ケニアやフィリピンなどの第三世界の地域では、手作業による注釈の価値曲線が最も低いため、このタスクは人が担当します。 一方、欧米のAI前処理会社は、収益の大部分を占め、その後、AIの研究開発企業に販売しています。

AIの進歩に伴い、より多くの企業がこのビジネスに注目しています。 競争に直面して、データアノテーションの単価は下がり続けています。 このビジネスは、キャプチャの認識などのタスクと同様に、技術的なしきい値がなく、0.01元などの超低価格でデータにラベルを付けることを主な目的としています。


出典: https://aim.baidu.com/product/0793f1f1-f1cb-4f9f-b3a7-ef31335bd7f0

このシナリオでは、パブリックAIなどのWeb3データアノテーションプラットフォームが実用的なビジネス市場を持っています。 AI企業とデータアノテーションワーカーを結びつけ、単純な低価格競争モデルをインセンティブシステムに置き換えています。 ただし、Scale AIのような成熟した企業は、アノテーション技術の信頼できる品質を保証していることに注意する必要があります。 分散型データアノテーションプラットフォームにとって、品質管理と不正使用の防止は絶対に必要です。 基本的に、これはC2B2Bエンタープライズサービスであり、データの規模と量だけでは企業を納得させることはできません。

ハードウェアの自由度: レンダー ネットワークと Bittensor

ビットコインのマイニングリグとは異なり、現在、専用のWeb3 AIハードウェアはないことを明確にする必要があります。 既存のコンピューティングパワーとプラットフォームは、成熟したハードウェアから暗号インセンティブレイヤーが追加され、基本的にDePINセクターに分類されます。 ただし、データ ソース プロジェクトとは異なるため、ここでは AI ワークフローに含まれています。

DePINの定義については、以前書いた記事「ヘリウム前のDePIN:ビットコイン、Arweave、STEPNの探索」を参照してください。

Render Networkは、当初はAI向けに設計されたものではなく、長い歴史を持つプロジェクトです。 2017年に運用を開始し、その名前が示すようにレンダリングに焦点を当てています。 当時、GPUは需要がありませんでしたが、徐々に市場機会が生まれました。 GPU市場、特にNVIDIAが独占するハイエンドGPUは、法外な価格により、レンダリング、AI、メタバースユーザーの参入を妨げました。 需要と供給をつなぐチャネルが構築できれば、シェアサイクルのような経済モデルが成立するチャンスがあるかもしれません。

さらに、GPU リソースはハードウェアの実際の転送を必要としません。これらは、ソフトウェア・リソースを使用して割り当てることができます。 特筆すべきは、Render Networkが2023年にSolanaエコシステムに切り替え、Polygonを放棄したことです。 Solanaへの移行は、復活する前から、時間の経過とともに正しい決断であることが証明されています。 GPUの使用と分散には、高速ネットワークが重要な要件です。

Render Networkが確立されたプロジェクトと見なすことができるとすれば、Bittensorは現在勢いを増しています。

BitTensorはPolkadot上に構築されており、経済的インセンティブを通じてAIモデルをトレーニングすることを目的としています。 ノードは、最小限のエラーまたは最大の効率でAIモデルをトレーニングするために競い合い、暗号プロジェクトの古典的なオンチェーンプロセスに似ています。 ただし、実際のトレーニング プロセスには NVIDIA GPU と従来のプラットフォームが必要であり、Kaggle などの競技プラットフォームと似ています。

zkMLとUBI:ワールドコインの二面性

ゼロ知識機械学習(zkML)は、データ漏洩、プライバシー障害、モデル検証などの問題に対処するために、AIモデルのトレーニングプロセスにzkテクノロジーを導入します。 最初の2つは理解しやすいもので、zkで暗号化されたデータは、個人情報やプライベートな情報を漏洩することなくトレーニングすることができます。

モデル検証とは、クローズドソースモデルを評価することです。 zk技術では、目標値を設定できるため、クローズドソースモデルは、計算プロセスを開示することなく、結果検証を通じてその能力を証明できます。

Worldcoinは早くからzkMLを構想していただけでなく、ユニバーサル・ベーシック・インカム(UBI)も提唱していました。 そのビジョンでは、将来のAIの生産性は人間の要求限界をはるかに超えるでしょう。 真の課題はAIの利益の公平な分配であり、UBIの概念は$WLDトークンを通じてグローバルに共有され、公平性の原則を遵守するために実在の人物の生体認証が必要です。

もちろん、zkMLとUBIはまだ初期段階の実験段階ですが、興味深い開発であり、今後も注意深く見守っていきたいと思います。

結論

トランスフォーマーや大規模言語モデル(LLM)に代表されるAIの開発は、線形回帰やニューラルネットワークと同様に、徐々にボトルネックに直面しています。 限界収益が減少するため、モデルパラメータやデータ量を無期限に増やすことは現実的ではありません。

AIは知恵を伴って出現する種蒔き役なのかもしれないが、幻覚の問題は現状では深刻だ。 暗号がAIを変えることができるという信念は、自信の形であり、標準的な幻覚であることがわかります。 クリプトの追加は、技術的には幻覚の問題を解決しないかもしれませんが、少なくとも公平性と透明性の観点からいくつかの側面を変えることができます。

参照:

  1. OpenAI:「GPT-4テクニカルレポート」、2023年。arXiv:2303.08774 です。
  2. Ashish Vaswani、Noam Shazeer、Niki Parmar、Jakob Uszkoreit、Llion Jones、Aidan N. Gomez、Lukasz Kaiser、Illia Polosukhin:「注意はすべてあなたが必要とする」、2017年。arXiv:1706.03762 です。
  3. Jared Kaplan、Sam McCandlish、Tom Henighan、Tom B. Brown、Benjamin Chess、Rewon Child、Scott Gray、Alec Radford、Jeffrey Wu、Dario Amodei:「ニューラル言語モデルのスケーリング法則」、2020年。arXiv:2001.08361 です。
  4. Hao Liu、Wilson Yan、Matei Zaharia、Pieter Abbeel:「RingAttentionによる100万本のビデオと言語の世界モデル」、2024年。arXiv:2402.08268 です。
  5. マックス・ローザー (2022) - 「人工知能の簡単な歴史:世界は急速に変化しました–次に何が起こるか?」 OurWorldInData.org 日オンライン公開。 入手先: 'https://ourworldindata.org/brief-history-of-ai' [オンラインリソース]
  6. ゼロ知識機械学習(ZKML)の紹介
  7. 暗号とAIの交差点を理解する
  8. GrassはAIのデータレイヤー
  9. Bittensor:ピアツーピアのインテリジェンス市場

免責事項:

  1. この記事は[佐爷歪脖山]からの転載ですが、すべての著作権は原作者[佐爷]に帰属します。 この転載に異議がある場合は、 Gate Learn チームに連絡していただければ、迅速に対応いたします。
  2. 免責事項:この記事で表明された見解や意見は、著者のものであり、投資アドバイスを構成するものではありません。
  3. 記事の他言語への翻訳は、Gate Learnチームによって行われます。 特に明記されていない限り、翻訳された記事を複製、配布、盗用することは禁止されています。

AIの錯覚としての暗号

中級3/5/2024, 10:04:31 AM
この記事では、AIと暗号通貨の統合の可能性を探り、真の統合には、暗号をAIワークフローに組み込み、暗号でAIを強化することが必要であることを強調します。
  • 創発:化学で研究される生物系に見られる創発のように、多くの小さな実体が相互作用してより大きな全体を生み出し、個々の構成要素が持たない新しい特徴を示す現象。
  • 幻覚:AIモデルが一見正しいが実際には誤りのある出力を生成することで、モデルが欺瞞的なデータを生成する傾向。

AIと暗号資産の関係は、明確な起伏を示しています。 2016年にAlphaGoが人間のプロ囲碁棋士を打ち負かして以来、Fetch.AI のようなプロジェクトが自然発生的に出現するなど、この2つを組み合わせる試みが暗号資産の世界では目撃されています。 2023年のGPT-4の登場により、WorldCoinの発行に代表されるように、AI+Cryptoのトレンドが復活しました。 人類は、AIが生産性を担当し、クリプトが流通を担当するユートピア時代に突入する準備ができているようです。

この感情は、OpenAIがテキストからビデオへの合成のためのSoraアプリケーションを立ち上げた後にピークに達しました。 しかし、感情にはしばしば不合理な要素が含まれます。 例えば、李益州は、次のような誤解されている部分に属しているように思われる。

  • 特定のAIアプリケーションとアルゴリズム開発の融合。 SoraとGPT-4の基盤となるTransformerの原則はオープンソースですが、両方を使用するにはOpenAIへの支払いが必要です。
  • AIと暗号の組み合わせは、主要なAI巨人が明確な意欲を示していないため、現在、暗号が主導してAIにアプローチしています。 この段階では、AIがCryptoのためにできることは、CryptoがAIのためにできることを上回ります。
  • ブロックチェーンゲーム、GameFi、メタバースプロジェクト、Web3ゲーム、AWユニバースのデジタルペルソナなどのアプリケーションに見られるように、暗号アプリケーションでAI技術を使用することは、AIと暗号の統合と同じではありません。
  • 暗号資産がAI技術開発に貢献できるのは、主に、コンピューティングパワー、データ、モデルの3つのAIコンポーネントにおける分散化とトークンインセンティブです。
  • WorldCoinは、zkMLがAIと暗号技術の交差点に位置し、UBI(ユニバーサル・ベーシック・インカム)理論が初めて大規模に実装されたことで、両者の統合に成功しています。

この記事では、AIアプリケーションを強調する現在のCryptoプロジェクトは、ほとんどがマーケティングの仕掛けと見なされ、私たちの議論を助長していないため、CryptoがAIにもたらすメリットに焦点を当てます。

線形回帰からトランスフォーマーへ

長い間、AIをめぐる議論の焦点は、人工知能の「出現」が「マトリックス」のような感覚を持つ存在を生み出すのか、それともシリコンベースの文明を生み出すのかということでした。 人間とAI技術の相互作用に関する懸念は根強く残っており、最近の例では、ソラの出現や、GPT-4(2023年)、AlphaGo(2016年)、IBMのディープ・ブルーが1997年にチェスの世界チャンピオンを破った例などがあります。

そのような懸念は顕在化していませんが、落ち着いてAIの背後にあるメカニズムを簡単に概説しましょう。

中国の有名な俳優であるJia Lingによる減量メカニズムなど、本質的に単純な線形方程式である線形回帰から始めて、次の一般化を行うことができます。 ここで、xとyは摂取カロリーと体重の関係を表しており、より自然に食べることは体重の増加につながり、体重を減らしたいのであれば食べる量を減らす必要があることを示しています。

ただし、このアプローチにはいくつかの問題があります。 まず、人間の身長と体重には生理的な限界があり、3メートルの巨人や1000キログラムの女性に遭遇する可能性は低いです。 したがって、これらの限界を超える状況を考慮することは、実際的な重要性を欠いています。 第二に、単に食べる量を減らして運動量を増やすことは、減量の科学的原則に従わず、重症の場合、体に害を及ぼす可能性があります。

体重を身長の2乗で割って体重と身長の関係を測るボディマス指数(BMI)をご紹介します。 身長と体重の関係を評価するには、食事、睡眠、運動の3つの要素から、3つのパラメータと2つのアウトプットが必要になります。 線形回帰は明らかに不十分であり、ニューラルネットワークを生み出します。 名前が示すように、ニューラルネットワークは人間の脳の構造を模倣しており、より多くの思考がより多くの合理性につながる可能性があります。 ディープラーニングと呼ばれる思考の頻度と深さを増やすことで(ここでは少し緩い例えをしています)、行動を起こす前に、より徹底的に検討することができます。


AIアルゴリズムの開発経緯の概要

ただし、レイヤー数の増加は無限ではありません。まだ天井があります。 臨界閾値に達すると、有効性が低下する可能性があります。 したがって、既存の情報間の関係をより合理的に理解することが不可欠になります。 例えば、身長と体重の微妙な関係を深く理解したり、これまで気づかなかった要因を発見したり、Jia Lingがトップコーチを見つけたが、減量への願望を直接表現することを躊躇したりします。


このようなシナリオでは、賈玲とコーチはエンコードとデコードで対戦相手を形成し、両者の真意を表す意味を前後に伝えます。 しかし、「痩せたいから、コーチにプレゼントします」というストレートな言葉とは違い、その「意味」の裏には双方の本音が隠されている。

2者間の反復回数が十分であれば、各通信の意味を解読しやすくなるという事実に気づきます。

このモデルを拡張すると、口語的に大規模言語モデル(LLM)と呼ばれるものを表し、単語と文の間の文脈上の関係を調べます。 現在、大規模なモデルは、画像やビデオなどのシナリオを掘り下げるように拡張されています。

AIのスペクトルでは、それが単純な線形回帰であろうと非常に複雑なトランスフォーマーであろうと、それらはすべてアルゴリズムまたはモデルです。 これらに加えて、計算能力とデータという2つの重要な要素があります。


説明:AIの開発経緯、出典: https://ourworldindata.org/brief-history-of-ai

簡単に言えば、AIはデータを処理し、計算を実行し、結果を生み出す機械です。 しかし、ロボットのような物理的な存在と比較すると、AIはより仮想的です。 コンピューティング能力、データ、モデルの観点から、Web2の商用化における現在の運用プロセスは次のとおりです。

  • データは、公開データ、会社所有データ、商用データに分けられ、専門的な注釈と前処理が必要です。 たとえば、Scale AI は、主流の AI 企業にデータの前処理を提供します。
  • コンピューティングパワーは、セルフビルドとクラウドコンピューティングリースの2つのモードに分けられます。 現在、GPUハードウェアはNVIDIAが支配しており、CUDAライブラリは何年も前から準備されています。 ハードウェアとソフトウェアのエコシステムは、1つの企業によって支配されています。 2つ目の選択肢は、MicrosoftのAzure、Google Cloud、AWSなど、ワンストップのコンピューティングとモデル展開サービスを提供するクラウドサービスプロバイダーによるコンピューティングパワーのリースです。
  • モデルは、フレームワークとアルゴリズムに分類できます。 モデルの戦いはすでに終わっており、GoogleのTensorFlowが最初の挫折を乗り越えながら最初に登場し、MetaのPyTorchが後から登場しましたが、リードしています。 しかし、Transformerを導入したGoogleにせよ、PyTorchを導入したMetaにせよ、どちらも商用化においてOpenAIに徐々に遅れをとっています。 それにもかかわらず、彼らの強さは依然として手ごわいままです。現在、アルゴリズムはTransformerによって支配されており、さまざまな大規模モデルが主にデータソースと詳細の点で競合しています。


AIの作業プロセス

前述したように、AIアプリケーションには、Vitalik氏が言及したコード修正など、すでに活用されている幅広い領域があります。 別の視点から見ると、CryptoのAIへの貢献は、主に分散型データ市場、分散型コンピューティングパワープラットフォームなどの非技術分野に焦点を当てています。 分散型大規模言語モデル(LLM)の実験がいくつか行われています。 ただし、AIで暗号コードを分析することと、ブロックチェーン上で大規模なAIモデルを実行することは根本的に異なることに注意することが重要です。 一部の暗号要素をAIモデルに組み込むことは、完璧な統合とは見なされません。

現在、Cryptoは生産とインセンティブに優れています。 クリプトでAIの生産パラダイムを無理に変える必要はありません。 合理的な選択は、CryptoをAIワークフローに統合し、CryptoでAIを強化することです。 ここでは、私が要約したいくつかの潜在的な統合を紹介します。

  1. DePINのデータ収集などの分散型データ生成と、財務分析、セキュリティ分析、データトレーニングのための豊富なトランザクションデータを含むオンチェーンデータのオープン性。
  2. 分散型の前処理プラットフォームでは、従来の事前トレーニングでは乗り越えられない技術的障壁はありません。 ヨーロッパと米国の大型モデルの背後には、第三世界の手動アノテーターの高負荷労働があります。
  3. 分散型コンピューティングパワープラットフォーム:分散型インセンティブと、個人の帯域幅、GPUコンピューティングパワー、その他のハードウェアリソースの利用。
  4. zkMLは、データの脱感作などの従来のプライバシー手法では問題を完全に解決できない可能性があるためです。 zkMLは、データの方向性を隠蔽し、オープンソースモデルとクローズドソースモデルの真正性と有効性を効果的に評価することができます。

これら4つの側面は、暗号がAIに力を与えることができると私が考える潜在的なシナリオです。 AIは用途の広いツールであり、AI for Cryptoの分野とプロジェクトについてはここではこれ以上説明しません。自分で探索できます。

暗号は現在、主に暗号化、プライバシー保護、および経済設計において役割を果たしていることがわかります。 唯一の技術的な統合の試みはzkMLです。 ここで、少しブレインストーミングをしてみましょう:将来、Solana TPSが本当に100,000+に達することができ、FilecoinとSolanaの組み合わせが完璧であれば、オンチェーンのLLM環境を作ることができるでしょうか? これにより、真のオンチェーンAIが確立され、暗号がAIに統合されている現在の不平等な関係が変わる可能性があります。

AIワークフローへのWeb3統合

周知の通り、NVIDIA RTX 4090グラフィックスカードは、現在、東アジアの某国では入手困難な貴重な商品です。 さらに深刻なのは、個人、中小企業、学術機関もグラフィックスカードの危機に直面していることです。 結局のところ、大企業は大きな支出者です。 個人購入やクラウドプロバイダー以外の第3の道が開かれれば、純粋に投機的な目的から脱却し、実用的なビジネス価値を持つことは明らかです。 AIのためのWeb3の論理的なアプローチは、「Web3を使わなければプロジェクトは持続しない」というものであるべきです。


Web3の視点から見たAIワークフロー

データの出所:Grass and DePIN Automotive Ecosystem

Wynd Networkによって導入されたGrassは、アイドル状態の帯域幅を販売するためのマーケットプレイスです。 Grassは、データの取得と配布のためのオープンネットワークとして機能し、単純なデータ収集と販売とは一線を画しています。 Grassには、ますます閉鎖的なネットワーク環境をナビゲートするためのデータのクリーニングと検証のための機能があります。 さらに、GrassはAIモデルと直接連携し、すぐに使えるデータセットを提供することを目指しています。 AI データセットには、AI モデルの特定のニーズを満たすために広範な手動微調整を含む、専門的な処理が必要です。

これを拡張して、Grassはデータ販売の問題に取り組み、Web3のDePINセクターはAIが必要とするデータを生成できます。 この分野は、主に車両の自動運転に焦点を当てています。 従来、自動運転では、企業は対応するデータを蓄積する必要がありました。 しかし、DIMO や Hivemapper などのプロジェクトは車両上で直接動作し、ますます多くの運転情報や道路データを収集しています。

これまでの自動運転のシナリオでは、車両認識技術や高精度地図が不可欠でした。 高精度な地図などの情報は、NavInfoのような企業によって蓄積され、業界の障壁となっています。 新規参入者がWeb3データを活用すれば、競合他社を追い越すチャンスがあるかもしれません。

データの前処理:AIに隷属する人間を解放する

人工知能は、手動注釈とインテリジェントアルゴリズムの2つの部分に分けることができます。 ケニアやフィリピンなどの第三世界の地域では、手作業による注釈の価値曲線が最も低いため、このタスクは人が担当します。 一方、欧米のAI前処理会社は、収益の大部分を占め、その後、AIの研究開発企業に販売しています。

AIの進歩に伴い、より多くの企業がこのビジネスに注目しています。 競争に直面して、データアノテーションの単価は下がり続けています。 このビジネスは、キャプチャの認識などのタスクと同様に、技術的なしきい値がなく、0.01元などの超低価格でデータにラベルを付けることを主な目的としています。


出典: https://aim.baidu.com/product/0793f1f1-f1cb-4f9f-b3a7-ef31335bd7f0

このシナリオでは、パブリックAIなどのWeb3データアノテーションプラットフォームが実用的なビジネス市場を持っています。 AI企業とデータアノテーションワーカーを結びつけ、単純な低価格競争モデルをインセンティブシステムに置き換えています。 ただし、Scale AIのような成熟した企業は、アノテーション技術の信頼できる品質を保証していることに注意する必要があります。 分散型データアノテーションプラットフォームにとって、品質管理と不正使用の防止は絶対に必要です。 基本的に、これはC2B2Bエンタープライズサービスであり、データの規模と量だけでは企業を納得させることはできません。

ハードウェアの自由度: レンダー ネットワークと Bittensor

ビットコインのマイニングリグとは異なり、現在、専用のWeb3 AIハードウェアはないことを明確にする必要があります。 既存のコンピューティングパワーとプラットフォームは、成熟したハードウェアから暗号インセンティブレイヤーが追加され、基本的にDePINセクターに分類されます。 ただし、データ ソース プロジェクトとは異なるため、ここでは AI ワークフローに含まれています。

DePINの定義については、以前書いた記事「ヘリウム前のDePIN:ビットコイン、Arweave、STEPNの探索」を参照してください。

Render Networkは、当初はAI向けに設計されたものではなく、長い歴史を持つプロジェクトです。 2017年に運用を開始し、その名前が示すようにレンダリングに焦点を当てています。 当時、GPUは需要がありませんでしたが、徐々に市場機会が生まれました。 GPU市場、特にNVIDIAが独占するハイエンドGPUは、法外な価格により、レンダリング、AI、メタバースユーザーの参入を妨げました。 需要と供給をつなぐチャネルが構築できれば、シェアサイクルのような経済モデルが成立するチャンスがあるかもしれません。

さらに、GPU リソースはハードウェアの実際の転送を必要としません。これらは、ソフトウェア・リソースを使用して割り当てることができます。 特筆すべきは、Render Networkが2023年にSolanaエコシステムに切り替え、Polygonを放棄したことです。 Solanaへの移行は、復活する前から、時間の経過とともに正しい決断であることが証明されています。 GPUの使用と分散には、高速ネットワークが重要な要件です。

Render Networkが確立されたプロジェクトと見なすことができるとすれば、Bittensorは現在勢いを増しています。

BitTensorはPolkadot上に構築されており、経済的インセンティブを通じてAIモデルをトレーニングすることを目的としています。 ノードは、最小限のエラーまたは最大の効率でAIモデルをトレーニングするために競い合い、暗号プロジェクトの古典的なオンチェーンプロセスに似ています。 ただし、実際のトレーニング プロセスには NVIDIA GPU と従来のプラットフォームが必要であり、Kaggle などの競技プラットフォームと似ています。

zkMLとUBI:ワールドコインの二面性

ゼロ知識機械学習(zkML)は、データ漏洩、プライバシー障害、モデル検証などの問題に対処するために、AIモデルのトレーニングプロセスにzkテクノロジーを導入します。 最初の2つは理解しやすいもので、zkで暗号化されたデータは、個人情報やプライベートな情報を漏洩することなくトレーニングすることができます。

モデル検証とは、クローズドソースモデルを評価することです。 zk技術では、目標値を設定できるため、クローズドソースモデルは、計算プロセスを開示することなく、結果検証を通じてその能力を証明できます。

Worldcoinは早くからzkMLを構想していただけでなく、ユニバーサル・ベーシック・インカム(UBI)も提唱していました。 そのビジョンでは、将来のAIの生産性は人間の要求限界をはるかに超えるでしょう。 真の課題はAIの利益の公平な分配であり、UBIの概念は$WLDトークンを通じてグローバルに共有され、公平性の原則を遵守するために実在の人物の生体認証が必要です。

もちろん、zkMLとUBIはまだ初期段階の実験段階ですが、興味深い開発であり、今後も注意深く見守っていきたいと思います。

結論

トランスフォーマーや大規模言語モデル(LLM)に代表されるAIの開発は、線形回帰やニューラルネットワークと同様に、徐々にボトルネックに直面しています。 限界収益が減少するため、モデルパラメータやデータ量を無期限に増やすことは現実的ではありません。

AIは知恵を伴って出現する種蒔き役なのかもしれないが、幻覚の問題は現状では深刻だ。 暗号がAIを変えることができるという信念は、自信の形であり、標準的な幻覚であることがわかります。 クリプトの追加は、技術的には幻覚の問題を解決しないかもしれませんが、少なくとも公平性と透明性の観点からいくつかの側面を変えることができます。

参照:

  1. OpenAI:「GPT-4テクニカルレポート」、2023年。arXiv:2303.08774 です。
  2. Ashish Vaswani、Noam Shazeer、Niki Parmar、Jakob Uszkoreit、Llion Jones、Aidan N. Gomez、Lukasz Kaiser、Illia Polosukhin:「注意はすべてあなたが必要とする」、2017年。arXiv:1706.03762 です。
  3. Jared Kaplan、Sam McCandlish、Tom Henighan、Tom B. Brown、Benjamin Chess、Rewon Child、Scott Gray、Alec Radford、Jeffrey Wu、Dario Amodei:「ニューラル言語モデルのスケーリング法則」、2020年。arXiv:2001.08361 です。
  4. Hao Liu、Wilson Yan、Matei Zaharia、Pieter Abbeel:「RingAttentionによる100万本のビデオと言語の世界モデル」、2024年。arXiv:2402.08268 です。
  5. マックス・ローザー (2022) - 「人工知能の簡単な歴史:世界は急速に変化しました–次に何が起こるか?」 OurWorldInData.org 日オンライン公開。 入手先: 'https://ourworldindata.org/brief-history-of-ai' [オンラインリソース]
  6. ゼロ知識機械学習(ZKML)の紹介
  7. 暗号とAIの交差点を理解する
  8. GrassはAIのデータレイヤー
  9. Bittensor:ピアツーピアのインテリジェンス市場

免責事項:

  1. この記事は[佐爷歪脖山]からの転載ですが、すべての著作権は原作者[佐爷]に帰属します。 この転載に異議がある場合は、 Gate Learn チームに連絡していただければ、迅速に対応いたします。
  2. 免責事項:この記事で表明された見解や意見は、著者のものであり、投資アドバイスを構成するものではありません。
  3. 記事の他言語への翻訳は、Gate Learnチームによって行われます。 特に明記されていない限り、翻訳された記事を複製、配布、盗用することは禁止されています。
今すぐ始める
登録して、
$100
のボーナスを獲得しよう!