介绍在之前的文章中,我们频繁讨论了我们对当前 AI Meme 和未来 AI Agent 发展的看法。然而,AI Agent 轨道的快速叙事发展和演变仍然有些让人应接不暇。自 “Truth Terminal” 上线和 Agent Summer 开始以来的短短两个月内,AI 与加密的整合叙事几乎每周都在演变。最近,市场的关注点开始转向以技术叙事为主导的 “框架” 项目。这个小众子领域在过去几周已经涌现出多个市值超过十亿美元的独角兽项目。这些项目也带来了资产发行的新范式,即项目基于 GitHub 代码库发行代币,且在这些框架上构建的 Agent 也可以发行代币。这个结构的核心是框架,Agent 则处于其之上。这种结构类似于资产发行平台,但实际上它是 AI 时代新兴的一种独特基础设施模型。我们应该如何看待这一新趋势?本文将从框架的介绍入手,阐释 AI 框架对加密领域的意义,并结合我们的思考进行解读。
一、什么是框架?从定义上讲,AI 框架是一个基础开发工具或平台,集成了一套预构建的模块、库和工具,以简化构建复杂 AI 模型的过程。这些框架通常还包括处理数据、训练模型和进行预测的功能。简单来说,你可以将框架看作是 AI 时代的操作系统,类似于桌面操作系统(如 Windows 或 Linux)或移动操作系统(如 iOS 和 Android)。每个框架都有其自身的优缺点,开发者可以根据具体需求选择适合的框架。
尽管 “AI 框架” 这一术语在加密领域仍然是一个相对较新的概念,但其发展实际上可以追溯到近 14 年前,始于 2010 年的 Theano。在传统的 AI 社区中,无论是学术界还是工业界,都已经发展出非常成熟的框架供选择,例如谷歌的 TensorFlow、Meta 的 PyTorch、百度的 PaddlePaddle 和字节跳动的 MagicAnimate,每一个在不同的场景中都有其优势。
当前在加密领域涌现的 AI 框架项目,源自 AI 热潮带来对大量 Agent 的需求,这些框架进一步扩展到加密领域的其他轨道,最终形成了针对特定子领域的不同 AI 框架。让我们来探讨一些当前行业中的主流框架,以更好地说明这一点。
1.1 Eliza
首先,我们来考虑一下由 ai16z 创建的 Eliza 框架。它是一个多智能体模拟框架,旨在创建、部署和管理自主 AI 智能体。该框架使用 TypeScript 作为编程语言开发,优势在于更好的兼容性和更易于 API 集成。根据官方文档,Eliza 主要设计用于社交媒体,提供对多平台的集成支持。该框架提供了完整的 Discord 集成功能,支持语音频道、自动化 X/Twitter 帐户、Telegram 集成以及直接 API 访问。在媒体内容处理方面,它支持读取和分析 PDF 文档、提取和总结链接、音频转录、视频内容处理、图像分析以及对话摘要。
Eliza 当前支持的用例包括以下四个类别:
AI 助手应用:客户支持代理、社区管理员、个人助手。社交媒体角色:自动化内容创作者、互动机器人、品牌代表。知识工作者:研究助手、内容分析师、文档处理员。互动角色:角色扮演角色、教育辅导员、娱乐机器人。
Eliza 当前支持的模型包括:
开源本地推理模型:如 Llama3、Qwen1.5、BERT。通过 OpenAI API 进行云推理。默认配置为 Nous Hermes Llama 3.1B。与 Claude 集成以处理复杂查询。
1.2 G.A.M.EG.A.M.E(Generative Autonomous Multimodal Entities Framework)是由 Virtual 推出的多模态 AI 框架,用于自动生成和管理,主要设计用于游戏中的智能 NPC 设计。该框架的一个独特之处在于,它允许即便是低代码或无代码的用户,也能通过其试用界面简单地修改参数,参与 Agent 的设计。
在项目架构方面, G.A.M.E 基于模块化设计构建,多个子系统协同工作。具体架构如下:
Agent 提示接口:开发者与 AI 框架互动的接口。通过该接口,开发者可以启动会话并指定会话 ID、Agent ID、用户 ID 及其他参数。感知子系统:负责接收输入信息、进行综合处理并将其发送到战略规划引擎,还负责处理来自对话处理模块的响应。战略规划引擎:整个框架的核心,分为高层规划器和低层策略。高层规划器负责制定长期目标和计划,而低层策略则将这些计划转化为具体的行动。世界上下文:包含环境信息、世界状态和游戏状态数据,帮助 Agent 理解当前的上下文。对话处理模块:处理消息和响应,生成对话或反应作为输出。链上钱包操作员:可能与区块链技术应用相关,尽管具体功能尚不明确。学习模块:从反馈中学习并更新 Agent 的知识库。工作记忆:存储最近的动作、结果和当前计划等短期信息。长期记忆处理器:根据重要性、时效性和相关性等因素提取并排序关于 Agent 及其工作记忆的重要信息。Agent 仓库:存储 Agent 的目标、反思、经验和特征。行动规划者:根据低层策略生成具体的行动计划。计划执行器:执行由行动规划者生成的行动计划。
工作流程:开发者通过 Agent 提示接口启动 Agent,感知子系统接收输入并将其发送到战略规划引擎。引擎通过内存系统、世界上下文和 Agent 仓库的帮助,制定并执行行动计划。学习模块监控 Agent 的行动并相应调整其行为。
应用场景:从整体技术架构来看,该框架专注于虚拟环境中 Agent 的决策、反馈、感知和个性。除了游戏,它还适用于元宇宙。 Virtual 列出以下清单,显示许多项目已经采用该框架进行构建。
1.3 Rig
Rig 是一个开源工具,使用 Rust 编写,专门设计用于简化大语言模型( LLM )应用程序的开发。它提供了一个统一的接口,使开发者能够轻松地与多个 LLM 服务提供商(如 OpenAI 和 Anthropic )以及各种向量数据库(如 MongoDB 和 Neo4j )进行交互。
关键特性:
统一接口:无论使用哪个 LLM 提供商或向量存储, Rig 都提供一致的访问方法,大大减少了集成工作的复杂性。模块化架构:该框架采用模块化设计,包括“提供商抽象层”、“向量存储接口”和“智能 Agent 系统”等关键组件,确保系统的灵活性和可扩展性。类型安全:利用 Rust 的特性, Rig 实现了类型安全的嵌入操作,确保代码质量和运行时安全性。高性能:该系统支持异步编程,优化了并发处理能力。内置的日志和监控功能有助于维护和故障排除。
工作流程:
当用户进入 Rig 系统时,请求首先经过“提供商抽象层”,该层标准化了不同提供商之间的差异,并确保一致的错误处理。在核心层,智能 Agent 可以调用不同的工具或查询向量存储,以检索所需的信息。最后,像检索增强生成( RAG )这样的高级机制将文档检索和上下文理解结合起来,生成准确且有意义的回应,然后返回给用户。
使用场景:
Rig 适用于构建需要快速和准确问答的系统,创建高效的文档搜索工具,开发具备上下文感知的聊天机器人或虚拟助手,甚至通过自动生成文本或其他形式的内容基于现有数据模式来支持内容创作。
1.4 ZerePy
ZerePy 是一个基于 Python 的开源框架,旨在简化在 X(前身为 Twitter)平台上部署和管理 AI 智能体。它从 Zerebro 项目演变而来,并继承了其核心功能,但以更模块化和可扩展的方式进行设计。其目标是让开发者能够轻松创建个性化的 AI 智能体,并在 X 平台上实现各种自动化任务和内容创作。
ZerePy 提供了命令行界面(CLI),使用户能够方便地管理和控制他们部署的 AI 智能体。其核心架构是模块化的,允许开发者灵活集成不同的功能模块,如:
LLM 集成:ZerePy 支持 OpenAI 和 Anthropic 的大语言模型(LLMs),允许开发者选择最适合其应用的模型。这使得智能体能够生成高质量的文本内容。X 平台集成:该框架直接与 X 的 API 集成,允许智能体执行诸如发布、回复、点赞和转发等任务。模块化连接系统:该系统允许开发者轻松地为其他社交平台或服务添加支持,从而扩展框架的功能。记忆系统(未来计划):尽管当前版本尚未完全实现,ZerePy 的设计目标包括集成记忆系统,使智能体能够记住以前的互动和上下文信息,从而生成更连贯和个性化的内容。
尽管 ZerePy 和 a16z 的 Eliza 项目都旨在构建和管理 AI 智能体,但它们在架构和关注点上有所不同。Eliza 更倾向于多智能体模拟和更广泛的 AI 研究,而 ZerePy 则专注于简化在特定社交平台(X)上的 AI 智能体部署,使其更加面向应用。
二. BTC 生态系统的复制品从发展路径来看,AI 智能体与 2023 年末至 2024 年初的 BTC 生态系统有许多相似之处。BTC 生态系统的发展轨迹可以简单总结为:BRC20-Atomical/Rune 等多协议竞争 — BTC L2 — 以 Babylon 为中心的 BTCFi。尽管 AI 智能体在成熟的传统 AI 技术栈基础上发展得更为迅速,但它们的整体发展路径在多个方面与 BTC 生态系统相似。我将其总结为以下几个阶段:GOAT/ACT — 社交型智能体 — 分析型 AI 智能体框架竞争。从趋势角度来看,围绕智能体的去中心化和安全性的基础设施项目,很可能也会推动这一框架浪潮的前进,成为下一个主导主题。
那么,这一赛道是否像 BTC 生态系统一样,会导致同质化和泡沫化呢?我认为不会。首先,AI 智能体的叙事并非是要重演智能合约链的历史。其次,无论这些现有的 AI 框架项目在技术上是否强大,还是停留在 PPT 阶段,或仅仅是 Ctrl+C 和 Ctrl+V,至少它们提供了一种新的基础设施发展方式。许多文章将 AI 框架与资产发行平台进行比较,将智能体看作是资产。然而,与 Memecoin Launchpads 和 铭文协议相比,我个人认为,AI 框架更像是未来的公链,而智能体更像是未来的 DApp。
在今天的 Crypto 领域,我们拥有成千上万的公链和数以万计的 DApp。在通用链领域,我们有 BTC、以太坊和各种异构链,而应用链的形式则更加多样化,如游戏链、存储链和 Dex 链。公链和 AI 框架本质上非常相似,而 DApp 可以很好地与智能体对应。
在 AI 的 Crypto 时代,空间很可能会朝这个方向发展,未来的争论将从 EVM 与异构链的竞争转向框架的争论。当前的问题更多的是关于去中心化,或者说如何将其“链化”。我相信,未来的 AI 基础设施项目将围绕这一基础进行发展。另一个重要的点是:在区块链上做这些有什么意义?
三.链上的意义无论区块链与什么结合,最终都会面临一个关键问题:这是否有意义?在去年的文章中,我批评了 GameFi 的优先级错误,基础设施开发过于超前;而在之前关于 AI 的文章中,我对将 AI 与 Crypto 结合的当前实用性表示怀疑。毕竟,传统项目的叙事驱动力逐渐减弱。去年表现良好的少数传统项目,通常都是那些能够匹配或超越价格强度的项目。
AI 能为 Crypto 做些什么?之前,我曾想到一些使用案例,比如 AI 智能体代表用户执行任务、元宇宙以及将智能体作为员工——这些相对平凡的想法,但却有一定的需求。然而,这些需求并不需要完全上链,从商业逻辑的角度来看,它们无法形成一个闭环。上篇文章提到的智能体浏览器,虽然能实现意图,但仍可能产生数据标注和推理计算能力的需求,但这两个元素仍然没有紧密集成,在计算能力方面,集中计算仍然占据优势。
回顾 DeFi 的成功,DeFi 能够在传统金融中开辟一片天地,是因为它提供了更高的可访问性、更好的效率、更低的成本和无信任的安全性。如果我们考虑这个框架,我认为智能体的“链化”可能有几个原因:
降低成本:智能体链化能否降低使用成本,从而实现更大的可访问性和更多的用户选择?这最终可能让普通用户参与到传统上只有 Web2 科技巨头 AI “租赁”的领域。安全性:根据最简单的定义,智能体是能够与虚拟或现实世界互动的 AI。如果智能体能够干预现实世界,甚至进入我的虚拟钱包,那么基于区块链的安全解决方案可能会变得不可或缺。区块链特有的金融玩法:智能体能否在区块链上创造一套独特的金融机制?例如,在 AMM(自动化做市商)中,流动性提供者(LP)允许普通用户参与自动化做市。同样地,如果智能体需要计算能力或数据标注,用户可以基于对系统的信心,以 USDT 的形式投资于这些协议。或者,处于不同应用场景下的智能体可以形成新的金融结构。DeFi 互操作性:虽然 DeFi 目前缺乏完美的互操作性,但智能体可能通过使推理过程透明且可追踪,从而解决这个问题,填补这一空白。
四.创造力?未来的框架项目也将提供类似于 GPT Store 的创业机会。虽然通过框架启动智能体对于普通用户来说仍然较为复杂,但我相信,简化智能体构建过程并提供更多复杂功能组合,将使这些框架在未来拥有竞争优势。这可能会促成一个比 GPT Store 更具趣味性的 Web3 创意经济的诞生。
目前,GPT Store 仍然更倾向于传统的实际用途,流行的应用大多数由传统 Web2 公司创建。此外,生成的收入主要由创作者垄断。根据 OpenAI 的官方解释,其战略仅仅是为美国的杰出开发者提供财政支持,提供一定额度的补贴。
从需求的角度来看,Web3 仍有许多空白需要填补,而从经济体系的角度来看,它能使 Web2 巨头的不公平政策变得更加公平。此外,我们还可以自然地引入社区经济,进一步完善智能体。围绕智能体的创意经济将为普通人提供参与的机会。未来,AI Meme 将比 GOAT 或 Clanker 发行的智能体更聪明、更有趣。
关于 YBBYBB 是一个 Web3 基金,致力于发现 Web3 定义的项目,旨在为所有互联网居民创造更好的在线栖息地。YBB 由一群自 2013 年起积极参与区块链行业的区块链信徒创办,始终愿意帮助早期项目从 0 到 1。我们重视创新、自驱力的激情和以用户为导向的产品,同时看好加密货币和区块链应用的潜力。
Website | Twi: @YBBCapital
免责声明:
本文转载自【YBB Capital】。所有版权归原作者【YBB Capital Researcher Zeke】所有如对转载有异议,请联系 Gate Learn 团队,他们将及时处理。本文所表达的观点仅代表作者个人意见,不构成投资建议。Gate Learn 团队将文章翻译为其他语言。未经注明,严禁复制、分发或抄袭翻译文章。