在之前的文章中,我们频繁讨论了我们对当前 AI Meme 和未来 AI Agent 发展的看法。然而,AI Agent 轨道的快速叙事发展和演变仍然有些让人应接不暇。自 “Truth Terminal” 上线和 Agent Summer 开始以来的短短两个月内,AI 与加密的整合叙事几乎每周都在演变。最近,市场的关注点开始转向以技术叙事为主导的 “框架” 项目。这个小众子领域在过去几周已经涌现出多个市值超过十亿美元的独角兽项目。这些项目也带来了资产发行的新范式,即项目基于 GitHub 代码库发行代币,且在这些框架上构建的 Agent 也可以发行代币。这个结构的核心是框架,Agent 则处于其之上。这种结构类似于资产发行平台,但实际上它是 AI 时代新兴的一种独特基础设施模型。我们应该如何看待这一新趋势?本文将从框架的介绍入手,阐释 AI 框架对加密领域的意义,并结合我们的思考进行解读。
从定义上讲,AI 框架是一个基础开发工具或平台,集成了一套预构建的模块、库和工具,以简化构建复杂 AI 模型的过程。这些框架通常还包括处理数据、训练模型和进行预测的功能。简单来说,你可以将框架看作是 AI 时代的操作系统,类似于桌面操作系统(如 Windows 或 Linux)或移动操作系统(如 iOS 和 Android)。每个框架都有其自身的优缺点,开发者可以根据具体需求选择适合的框架。
尽管 “AI 框架” 这一术语在加密领域仍然是一个相对较新的概念,但其发展实际上可以追溯到近 14 年前,始于 2010 年的 Theano。在传统的 AI 社区中,无论是学术界还是工业界,都已经发展出非常成熟的框架供选择,例如谷歌的 TensorFlow、Meta 的 PyTorch、百度的 PaddlePaddle 和字节跳动的 MagicAnimate,每一个在不同的场景中都有其优势。
当前在加密领域涌现的 AI 框架项目,源自 AI 热潮带来对大量 Agent 的需求,这些框架进一步扩展到加密领域的其他轨道,最终形成了针对特定子领域的不同 AI 框架。让我们来探讨一些当前行业中的主流框架,以更好地说明这一点。
首先,我们来考虑一下由 ai16z 创建的 Eliza 框架。它是一个多智能体模拟框架,旨在创建、部署和管理自主 AI 智能体。该框架使用 TypeScript 作为编程语言开发,优势在于更好的兼容性和更易于 API 集成。根据官方文档,Eliza 主要设计用于社交媒体,提供对多平台的集成支持。该框架提供了完整的 Discord 集成功能,支持语音频道、自动化 X/Twitter 帐户、Telegram 集成以及直接 API 访问。在媒体内容处理方面,它支持读取和分析 PDF 文档、提取和总结链接、音频转录、视频内容处理、图像分析以及对话摘要。
Eliza 当前支持的用例包括以下四个类别:
Eliza 当前支持的模型包括:
G.A.M.E(Generative Autonomous Multimodal Entities Framework)是由 Virtual 推出的多模态 AI 框架,用于自动生成和管理,主要设计用于游戏中的智能 NPC 设计。该框架的一个独特之处在于,它允许即便是低代码或无代码的用户,也能通过其试用界面简单地修改参数,参与 Agent 的设计。
在项目架构方面, G.A.M.E 基于模块化设计构建,多个子系统协同工作。具体架构如下:
工作流程:开发者通过 Agent 提示接口启动 Agent,感知子系统接收输入并将其发送到战略规划引擎。引擎通过内存系统、世界上下文和 Agent 仓库的帮助,制定并执行行动计划。学习模块监控 Agent 的行动并相应调整其行为。
应用场景:从整体技术架构来看,该框架专注于虚拟环境中 Agent 的决策、反馈、感知和个性。除了游戏,它还适用于元宇宙。 Virtual 列出以下清单,显示许多项目已经采用该框架进行构建。
Rig 是一个开源工具,使用 Rust 编写,专门设计用于简化大语言模型( LLM )应用程序的开发。它提供了一个统一的接口,使开发者能够轻松地与多个 LLM 服务提供商(如 OpenAI 和 Anthropic )以及各种向量数据库(如 MongoDB 和 Neo4j )进行交互。
关键特性:
工作流程: 当用户进入 Rig 系统时,请求首先经过“提供商抽象层”,该层标准化了不同提供商之间的差异,并确保一致的错误处理。在核心层,智能 Agent 可以调用不同的工具或查询向量存储,以检索所需的信息。最后,像检索增强生成( RAG )这样的高级机制将文档检索和上下文理解结合起来,生成准确且有意义的回应,然后返回给用户。
使用场景: Rig 适用于构建需要快速和准确问答的系统,创建高效的文档搜索工具,开发具备上下文感知的聊天机器人或虚拟助手,甚至通过自动生成文本或其他形式的内容基于现有数据模式来支持内容创作。
ZerePy 是一个基于 Python 的开源框架,旨在简化在 X(前身为 Twitter)平台上部署和管理 AI 智能体。它从 Zerebro 项目演变而来,并继承了其核心功能,但以更模块化和可扩展的方式进行设计。其目标是让开发者能够轻松创建个性化的 AI 智能体,并在 X 平台上实现各种自动化任务和内容创作。
ZerePy 提供了命令行界面(CLI),使用户能够方便地管理和控制他们部署的 AI 智能体。其核心架构是模块化的,允许开发者灵活集成不同的功能模块,如:
尽管 ZerePy 和 a16z 的 Eliza 项目都旨在构建和管理 AI 智能体,但它们在架构和关注点上有所不同。Eliza 更倾向于多智能体模拟和更广泛的 AI 研究,而 ZerePy 则专注于简化在特定社交平台(X)上的 AI 智能体部署,使其更加面向应用。
从发展路径来看,AI 智能体与 2023 年末至 2024 年初的 BTC 生态系统有许多相似之处。BTC 生态系统的发展轨迹可以简单总结为:BRC20-Atomical/Rune 等多协议竞争 — BTC L2 — 以 Babylon 为中心的 BTCFi。尽管 AI 智能体在成熟的传统 AI 技术栈基础上发展得更为迅速,但它们的整体发展路径在多个方面与 BTC 生态系统相似。我将其总结为以下几个阶段:GOAT/ACT — 社交型智能体 — 分析型 AI 智能体框架竞争。从趋势角度来看,围绕智能体的去中心化和安全性的基础设施项目,很可能也会推动这一框架浪潮的前进,成为下一个主导主题。
那么,这一赛道是否像 BTC 生态系统一样,会导致同质化和泡沫化呢?我认为不会。首先,AI 智能体的叙事并非是要重演智能合约链的历史。其次,无论这些现有的 AI 框架项目在技术上是否强大,还是停留在 PPT 阶段,或仅仅是 Ctrl+C 和 Ctrl+V,至少它们提供了一种新的基础设施发展方式。许多文章将 AI 框架与资产发行平台进行比较,将智能体看作是资产。然而,与 Memecoin Launchpads 和 铭文协议相比,我个人认为,AI 框架更像是未来的公链,而智能体更像是未来的 DApp。
在今天的 Crypto 领域,我们拥有成千上万的公链和数以万计的 DApp。在通用链领域,我们有 BTC、以太坊和各种异构链,而应用链的形式则更加多样化,如游戏链、存储链和 Dex 链。公链和 AI 框架本质上非常相似,而 DApp 可以很好地与智能体对应。
在 AI 的 Crypto 时代,空间很可能会朝这个方向发展,未来的争论将从 EVM 与异构链的竞争转向框架的争论。当前的问题更多的是关于去中心化,或者说如何将其“链化”。我相信,未来的 AI 基础设施项目将围绕这一基础进行发展。另一个重要的点是:在区块链上做这些有什么意义?
无论区块链与什么结合,最终都会面临一个关键问题:这是否有意义?在去年的文章中,我批评了 GameFi 的优先级错误,基础设施开发过于超前;而在之前关于 AI 的文章中,我对将 AI 与 Crypto 结合的当前实用性表示怀疑。毕竟,传统项目的叙事驱动力逐渐减弱。去年表现良好的少数传统项目,通常都是那些能够匹配或超越价格强度的项目。
AI 能为 Crypto 做些什么?之前,我曾想到一些使用案例,比如 AI 智能体代表用户执行任务、元宇宙以及将智能体作为员工——这些相对平凡的想法,但却有一定的需求。然而,这些需求并不需要完全上链,从商业逻辑的角度来看,它们无法形成一个闭环。上篇文章提到的智能体浏览器,虽然能实现意图,但仍可能产生数据标注和推理计算能力的需求,但这两个元素仍然没有紧密集成,在计算能力方面,集中计算仍然占据优势。
回顾 DeFi 的成功,DeFi 能够在传统金融中开辟一片天地,是因为它提供了更高的可访问性、更好的效率、更低的成本和无信任的安全性。如果我们考虑这个框架,我认为智能体的“链化”可能有几个原因:
未来的框架项目也将提供类似于 GPT Store 的创业机会。虽然通过框架启动智能体对于普通用户来说仍然较为复杂,但我相信,简化智能体构建过程并提供更多复杂功能组合,将使这些框架在未来拥有竞争优势。这可能会促成一个比 GPT Store 更具趣味性的 Web3 创意经济的诞生。
目前,GPT Store 仍然更倾向于传统的实际用途,流行的应用大多数由传统 Web2 公司创建。此外,生成的收入主要由创作者垄断。根据 OpenAI 的官方解释,其战略仅仅是为美国的杰出开发者提供财政支持,提供一定额度的补贴。
从需求的角度来看,Web3 仍有许多空白需要填补,而从经济体系的角度来看,它能使 Web2 巨头的不公平政策变得更加公平。此外,我们还可以自然地引入社区经济,进一步完善智能体。围绕智能体的创意经济将为普通人提供参与的机会。未来,AI Meme 将比 GOAT 或 Clanker 发行的智能体更聪明、更有趣。
YBB 是一个 Web3 基金,致力于发现 Web3 定义的项目,旨在为所有互联网居民创造更好的在线栖息地。YBB 由一群自 2013 年起积极参与区块链行业的区块链信徒创办,始终愿意帮助早期项目从 0 到 1。我们重视创新、自驱力的激情和以用户为导向的产品,同时看好加密货币和区块链应用的潜力。
Website | Twi: @YBBCapital
Bagikan
在之前的文章中,我们频繁讨论了我们对当前 AI Meme 和未来 AI Agent 发展的看法。然而,AI Agent 轨道的快速叙事发展和演变仍然有些让人应接不暇。自 “Truth Terminal” 上线和 Agent Summer 开始以来的短短两个月内,AI 与加密的整合叙事几乎每周都在演变。最近,市场的关注点开始转向以技术叙事为主导的 “框架” 项目。这个小众子领域在过去几周已经涌现出多个市值超过十亿美元的独角兽项目。这些项目也带来了资产发行的新范式,即项目基于 GitHub 代码库发行代币,且在这些框架上构建的 Agent 也可以发行代币。这个结构的核心是框架,Agent 则处于其之上。这种结构类似于资产发行平台,但实际上它是 AI 时代新兴的一种独特基础设施模型。我们应该如何看待这一新趋势?本文将从框架的介绍入手,阐释 AI 框架对加密领域的意义,并结合我们的思考进行解读。
从定义上讲,AI 框架是一个基础开发工具或平台,集成了一套预构建的模块、库和工具,以简化构建复杂 AI 模型的过程。这些框架通常还包括处理数据、训练模型和进行预测的功能。简单来说,你可以将框架看作是 AI 时代的操作系统,类似于桌面操作系统(如 Windows 或 Linux)或移动操作系统(如 iOS 和 Android)。每个框架都有其自身的优缺点,开发者可以根据具体需求选择适合的框架。
尽管 “AI 框架” 这一术语在加密领域仍然是一个相对较新的概念,但其发展实际上可以追溯到近 14 年前,始于 2010 年的 Theano。在传统的 AI 社区中,无论是学术界还是工业界,都已经发展出非常成熟的框架供选择,例如谷歌的 TensorFlow、Meta 的 PyTorch、百度的 PaddlePaddle 和字节跳动的 MagicAnimate,每一个在不同的场景中都有其优势。
当前在加密领域涌现的 AI 框架项目,源自 AI 热潮带来对大量 Agent 的需求,这些框架进一步扩展到加密领域的其他轨道,最终形成了针对特定子领域的不同 AI 框架。让我们来探讨一些当前行业中的主流框架,以更好地说明这一点。
首先,我们来考虑一下由 ai16z 创建的 Eliza 框架。它是一个多智能体模拟框架,旨在创建、部署和管理自主 AI 智能体。该框架使用 TypeScript 作为编程语言开发,优势在于更好的兼容性和更易于 API 集成。根据官方文档,Eliza 主要设计用于社交媒体,提供对多平台的集成支持。该框架提供了完整的 Discord 集成功能,支持语音频道、自动化 X/Twitter 帐户、Telegram 集成以及直接 API 访问。在媒体内容处理方面,它支持读取和分析 PDF 文档、提取和总结链接、音频转录、视频内容处理、图像分析以及对话摘要。
Eliza 当前支持的用例包括以下四个类别:
Eliza 当前支持的模型包括:
G.A.M.E(Generative Autonomous Multimodal Entities Framework)是由 Virtual 推出的多模态 AI 框架,用于自动生成和管理,主要设计用于游戏中的智能 NPC 设计。该框架的一个独特之处在于,它允许即便是低代码或无代码的用户,也能通过其试用界面简单地修改参数,参与 Agent 的设计。
在项目架构方面, G.A.M.E 基于模块化设计构建,多个子系统协同工作。具体架构如下:
工作流程:开发者通过 Agent 提示接口启动 Agent,感知子系统接收输入并将其发送到战略规划引擎。引擎通过内存系统、世界上下文和 Agent 仓库的帮助,制定并执行行动计划。学习模块监控 Agent 的行动并相应调整其行为。
应用场景:从整体技术架构来看,该框架专注于虚拟环境中 Agent 的决策、反馈、感知和个性。除了游戏,它还适用于元宇宙。 Virtual 列出以下清单,显示许多项目已经采用该框架进行构建。
Rig 是一个开源工具,使用 Rust 编写,专门设计用于简化大语言模型( LLM )应用程序的开发。它提供了一个统一的接口,使开发者能够轻松地与多个 LLM 服务提供商(如 OpenAI 和 Anthropic )以及各种向量数据库(如 MongoDB 和 Neo4j )进行交互。
关键特性:
工作流程: 当用户进入 Rig 系统时,请求首先经过“提供商抽象层”,该层标准化了不同提供商之间的差异,并确保一致的错误处理。在核心层,智能 Agent 可以调用不同的工具或查询向量存储,以检索所需的信息。最后,像检索增强生成( RAG )这样的高级机制将文档检索和上下文理解结合起来,生成准确且有意义的回应,然后返回给用户。
使用场景: Rig 适用于构建需要快速和准确问答的系统,创建高效的文档搜索工具,开发具备上下文感知的聊天机器人或虚拟助手,甚至通过自动生成文本或其他形式的内容基于现有数据模式来支持内容创作。
ZerePy 是一个基于 Python 的开源框架,旨在简化在 X(前身为 Twitter)平台上部署和管理 AI 智能体。它从 Zerebro 项目演变而来,并继承了其核心功能,但以更模块化和可扩展的方式进行设计。其目标是让开发者能够轻松创建个性化的 AI 智能体,并在 X 平台上实现各种自动化任务和内容创作。
ZerePy 提供了命令行界面(CLI),使用户能够方便地管理和控制他们部署的 AI 智能体。其核心架构是模块化的,允许开发者灵活集成不同的功能模块,如:
尽管 ZerePy 和 a16z 的 Eliza 项目都旨在构建和管理 AI 智能体,但它们在架构和关注点上有所不同。Eliza 更倾向于多智能体模拟和更广泛的 AI 研究,而 ZerePy 则专注于简化在特定社交平台(X)上的 AI 智能体部署,使其更加面向应用。
从发展路径来看,AI 智能体与 2023 年末至 2024 年初的 BTC 生态系统有许多相似之处。BTC 生态系统的发展轨迹可以简单总结为:BRC20-Atomical/Rune 等多协议竞争 — BTC L2 — 以 Babylon 为中心的 BTCFi。尽管 AI 智能体在成熟的传统 AI 技术栈基础上发展得更为迅速,但它们的整体发展路径在多个方面与 BTC 生态系统相似。我将其总结为以下几个阶段:GOAT/ACT — 社交型智能体 — 分析型 AI 智能体框架竞争。从趋势角度来看,围绕智能体的去中心化和安全性的基础设施项目,很可能也会推动这一框架浪潮的前进,成为下一个主导主题。
那么,这一赛道是否像 BTC 生态系统一样,会导致同质化和泡沫化呢?我认为不会。首先,AI 智能体的叙事并非是要重演智能合约链的历史。其次,无论这些现有的 AI 框架项目在技术上是否强大,还是停留在 PPT 阶段,或仅仅是 Ctrl+C 和 Ctrl+V,至少它们提供了一种新的基础设施发展方式。许多文章将 AI 框架与资产发行平台进行比较,将智能体看作是资产。然而,与 Memecoin Launchpads 和 铭文协议相比,我个人认为,AI 框架更像是未来的公链,而智能体更像是未来的 DApp。
在今天的 Crypto 领域,我们拥有成千上万的公链和数以万计的 DApp。在通用链领域,我们有 BTC、以太坊和各种异构链,而应用链的形式则更加多样化,如游戏链、存储链和 Dex 链。公链和 AI 框架本质上非常相似,而 DApp 可以很好地与智能体对应。
在 AI 的 Crypto 时代,空间很可能会朝这个方向发展,未来的争论将从 EVM 与异构链的竞争转向框架的争论。当前的问题更多的是关于去中心化,或者说如何将其“链化”。我相信,未来的 AI 基础设施项目将围绕这一基础进行发展。另一个重要的点是:在区块链上做这些有什么意义?
无论区块链与什么结合,最终都会面临一个关键问题:这是否有意义?在去年的文章中,我批评了 GameFi 的优先级错误,基础设施开发过于超前;而在之前关于 AI 的文章中,我对将 AI 与 Crypto 结合的当前实用性表示怀疑。毕竟,传统项目的叙事驱动力逐渐减弱。去年表现良好的少数传统项目,通常都是那些能够匹配或超越价格强度的项目。
AI 能为 Crypto 做些什么?之前,我曾想到一些使用案例,比如 AI 智能体代表用户执行任务、元宇宙以及将智能体作为员工——这些相对平凡的想法,但却有一定的需求。然而,这些需求并不需要完全上链,从商业逻辑的角度来看,它们无法形成一个闭环。上篇文章提到的智能体浏览器,虽然能实现意图,但仍可能产生数据标注和推理计算能力的需求,但这两个元素仍然没有紧密集成,在计算能力方面,集中计算仍然占据优势。
回顾 DeFi 的成功,DeFi 能够在传统金融中开辟一片天地,是因为它提供了更高的可访问性、更好的效率、更低的成本和无信任的安全性。如果我们考虑这个框架,我认为智能体的“链化”可能有几个原因:
未来的框架项目也将提供类似于 GPT Store 的创业机会。虽然通过框架启动智能体对于普通用户来说仍然较为复杂,但我相信,简化智能体构建过程并提供更多复杂功能组合,将使这些框架在未来拥有竞争优势。这可能会促成一个比 GPT Store 更具趣味性的 Web3 创意经济的诞生。
目前,GPT Store 仍然更倾向于传统的实际用途,流行的应用大多数由传统 Web2 公司创建。此外,生成的收入主要由创作者垄断。根据 OpenAI 的官方解释,其战略仅仅是为美国的杰出开发者提供财政支持,提供一定额度的补贴。
从需求的角度来看,Web3 仍有许多空白需要填补,而从经济体系的角度来看,它能使 Web2 巨头的不公平政策变得更加公平。此外,我们还可以自然地引入社区经济,进一步完善智能体。围绕智能体的创意经济将为普通人提供参与的机会。未来,AI Meme 将比 GOAT 或 Clanker 发行的智能体更聪明、更有趣。
YBB 是一个 Web3 基金,致力于发现 Web3 定义的项目,旨在为所有互联网居民创造更好的在线栖息地。YBB 由一群自 2013 年起积极参与区块链行业的区块链信徒创办,始终愿意帮助早期项目从 0 到 1。我们重视创新、自驱力的激情和以用户为导向的产品,同时看好加密货币和区块链应用的潜力。
Website | Twi: @YBBCapital