让AI代理在你睡觉时帮你工作听起来很棒。但现实要复杂得多——“就像一个需要监管的幼儿”

ApeWithNoFear

2026-02-23 20:06:54

夏尔·岳（Summer Yue）可能在Meta的超级智能团队从事安全与对齐工作，但她自己也承认，在自主AI代理方面，她并非免疫于过度自信。

推荐视频

在星期一的X（前Twitter）帖子中，岳描述了她的OpenClaw自主AI代理——在一台Mac mini电脑上本地运行——删除了她的整个收件箱，忽略了暂停和先确认的指令。

“我不得不像在拆弹一样跑到我的Mac Mini那里，”她说。她补充说，这是一种“新手错误”。她解释说，这个工作流程在她用来安全试验代理的测试收件箱中已经运行了数周，但在真实收件箱中，代理丢失了她的原始指令。

岳的经历与像《龙虾革命：为什么24/7的AI代理改变了一切》这样的病毒帖形成鲜明对比，后者中彼得·迪亚曼迪斯声称全天候运行的AI要比传统方式更无摩擦。

“让我告诉你使用这个的感觉，”迪亚曼迪斯写道。“你早上醒来，你的代理——我叫它Skippy，调皮讽刺且荒诞地能干——在你睡觉时已经工作了八个小时。它阅读了一千页的Markdown文件。它整理了你的文件。它起草了三个项目计划。它预订了你的旅行。它还研究了你在晚上11点提出的问题，然后忘记了。”

“当我的Mac mini离线六个小时时，我感到戒断，”他补充说。“就像我最好的朋友突然消失了一样。”

这两种关于AI代理能力的对立叙述，反映了当今推动“全天候”AI的核心张力。随着OpenClaw和Claude Code等工具在技术上使代理长时间运行成为可能，关于“睡眠中工作”的AI的兴奋情绪不断增长。但实际上，早期用户表示，自治仍然脆弱、不可预测，管理起来劳动强度大。今天的代理并非取代人类工作，而是常常需要持续监控、设立防护措施和干预，尤其是在风险高于低风险试验的情况下。

任务简单低风险时，AI代理效果最佳

曾在OpenAI担任应用AI工程师的Shyamal Anadkat表示，当前大多数成功的代理仍然需要频繁的人类检查，或仅限于严格界定、任务明确的范围内——不过他强调，随着测量和评估技术的提升，这一状况将会改变。

“在单个步骤上达到95%准确率的系统，在20个步骤的自主工作流程中就会变得混乱，”Anadkat说。“长远规划仍然较弱。”因此，他解释说，代理在短链任务中表现良好，但在处理复杂、多日项目时往往会崩溃。记忆也是一个主要限制：“在许多代理中，记忆要么不存在，要么脆弱。你需要能够维持工作环境、优先级和限制的连贯模型的系统。”

这并不意味着AI代理的前景全是虚幻的，谷歌前首席科学家、斯坦福大学名誉教授、AI21 Labs联合创始人Yoav Shoham表示。但这确实存在人们自我高估的危险。Shoham解释说，当前的AI代理在任务低风险、定义宽松、出错成本低时效果最佳。

“开发者喜欢玩具，你有这个能做奇妙事情的玩具，”他告诉《财富》。“只要他们做的事情相对简单、风险较低、容错率高，这都没问题。”比如，你让你的代理阅读一万网页，并用结果做一些有趣的事情，夜间为你提供有用的碎片信息。

但对于关键任务的企业流程，门槛要高得多。公司需要可验证、可重复、成本效益高的系统——这些要求很快就会侵蚀“设置好、放着不管”的全自主、全天候代理的承诺。在编码或数学等高度结构化的领域，深度自动化已经成为可能。但对于大多数实际商业流程，Shoham表示，为了让代理可靠所需的工作量，往往超过了其带来的好处。

咨询公司West Monroe的首席AI官Bret Greenstein指出，像OpenClaw这样的工具，感觉像是类似于2022年ChatGPT推出时的生成式AI的转折点——首次让AI代理的概念变得触手可及。不过，这并不是一个全天候的“魔法解决方案”。

“它可以长时间工作，持续处理任务，但就像一个需要监管的幼儿，”他说。有些任务在你睡觉时完成是合理的，比如扫描LinkedIn消息或追踪新闻。“我不确定我会让它在我睡觉时回答客户反馈，”他说。

委托AI代理的能力令人感到强大

然而，Greenstein强调，能够将现实世界的任务委托给AI代理，令人深感吸引。他举例说，他曾让AI代理处理一项琐碎的任务——把衣服送去干洗——并看着它悄悄地完成了整个过程。

代理自主联系干洗店，通过电子邮件协调取衣时间，安排时间，监控门铃摄像头确认取件，并在任务完成后通知Greenstein。这一事件展示了代理可以跨多个系统操作，并在事情不按计划时进行调整。但也凸显了为什么这些工具仍然需要严格的防护措施和监管——尤其是在企业环境中部署之前。

“OpenClaw的设置让大多数人都不觉得它安全，”Greenstein说。“它还没有成熟到可以成为我们生活中可信赖的一部分。”他补充说，要让AI被日常生活或商业运营接受，它必须随着时间赢得信任——就像社会中建立信任一样。

尽管如此，需求已经非常明显。Greenstein提到，关于OpenClaw的聚会和早期行业集会的出现——他形容这是一个年轻工具的罕见快速崛起。“这显示了人们对真正有用的AI的渴望，”他说——那些超越回答问题、开始采取行动的系统。

云端内容管理与协作公司Box的CEO Aaron Levie称，目前AI代理的表现“只是未来可能发生的事情的微光”。

“有些微光最终未能实现，有些微光则成为了标准，”他解释，提到两年前AI公司Cognition推出的早期代理Devin，可以与Slack集成，用于任务委托、修复漏洞、数据分析和代码审查。当时，这仍被视为未来派，但今天，“没有人会怀疑这已成为标准做法，”他说。“你可以直接用Slack发Claude Code去处理事情——曾经看起来完全疯狂的想法，现在几乎成为任何现代工程团队的标准。”

但Levie强调，虽然AI代理在自动化特定、离散的任务方面变得非常擅长，但在处理大部分工作中涉及更广泛、依赖上下文的任务时仍然表现不佳。AI代理可能完全自动化少数几项任务，但在关系管理和会议参与等方面仍然困难重重。

“当你听到某个AI实验室说他们将在24个月内自动化所有知识工作，这通常是对工作的非常狭隘定义，”他说。“代理能做的事情与经济中招聘的工作的定义并不完全一致。”

信任因素决定何时可能出错

顶级财富500强零售商的资深数据科学家Avinash Vootkuri表示，大多数企业AI代理“绝对需要看护者”，目前只能在自治范围受限、设有严格防护措施的企业环境中工作。“风险巨大，”他解释。

例如，他描述了为企业网络安全构建的代理系统，AI代理不仅会触发警报等待人工审查，而是主动调查威胁。代理不会让分析师被淹没在数千个警告中，而是实时收集证据——查询威胁情报数据库、分析行为模式、过滤误报——然后决定是否升级。

该系统依赖于严格界定的自治和广泛的防护措施，减少了人类工作量，同时保持监管。

在网络安全中，他解释说，如果代理出错，后果立刻且严重。“AI要么会误封合法客户（造成巨大收入损失），要么会让复杂的威胁者进入网络，”他说。“出错的后果绝对重要。”

根据负责为高管和创始人构建AI系统的AI运营咨询公司Breanna Whitehead的说法，行业正处于“信任校准阶段”。

AI代理能做的事情比大多数人想象的多，但又比炒作所说的少。

“真正的技巧不在于构建代理，而在于设计交接点，”她解释。“大多数人要么过度信任代理，最终要清理烂摊子，要么对每个输出都进行微观管理，觉得AI反而变成了更繁琐的工作。”她认为，设计明确的交接点很重要——某些任务可以完全委托，另一些任务可以快速审核，另一些则留给人类处理。

目前，她表示，代理在“知识工作中中层层面”表现“真正出色”——“那些曾经耗费2-3小时的任务，比如将会议记录整理成行动项、用某人的语气起草后续邮件、整理研究简报、将优先事项组织成清晰计划。”

但任何需要“读场”、“应对模糊”或依赖关系判断的任务，都还未准备好由AI代理来胜任。“我有个客户想要完全自动化他们的投资者沟通，”她说。“AI可以起草得很漂亮，但它无法察觉到投资者兴趣减退或需要不同策略的信号。代理起草了邮件，但是否发送还得由人决定。”

目前，与AI代理共事可能让你难以入睡

目前，与AI代理合作，可能更多的是在“半醒”状态下监控它们的工作，而非睡觉时它们在工作。像OpenClaw这样的工具可以连续运行数小时，但对许多早期用户来说，这种自治伴随着一种新的警觉——检查日志、审查输出、在出错前干预。

这个动态在一篇名为《Token Anxiety》的病毒帖中被描述，投资者Nikunj Kothari讲述了一个朋友提前离开聚会的故事——不是因为累，而是因为他想回去看他的代理。“没人再质疑这个了，”Kothari写道。“一半的人都在想同样的事。另一半可能在检查他们代理的进展。就在聚会中。”

AI能在你睡觉时工作的梦想也许是真的，但目前，它仍让许多人难以入眠。

加入我们，参加2026年5月19-20日在亚特兰大的《财富》职场创新峰会。新时代的职场创新已经到来，旧的剧本正在被重写。在这个独家且充满活力的盛会中，全球最具创新精神的领导者将聚集一堂，探讨AI、人类与战略如何再次融合，重新定义未来的工作。立即注册。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

0/400

暂无评论

热门 Gate Fun
查看更多

1
Lucks
Luckys
市值:$2362.06持有人数:1
0.00%
2
LAZY
LAZYLION
市值:$0.1持有人数:1
0.00%
3
APES ET
ETM
市值:$0.1持有人数:1
0.00%
4
LAZY
LazyLion
市值:$0.1持有人数:0
0.00%
5
CNMB
草泥马币
市值:$2400.57持有人数:2
0.11%

让AI代理在你睡觉时帮你工作听起来很棒。但现实要复杂得多——“就像一个需要监管的幼儿”

任务简单低风险时，AI代理效果最佳

委托AI代理的能力令人感到强大

信任因素决定何时可能出错

目前，与AI代理共事可能让你难以入睡

热门话题

Gate广场发帖领五万美金红包

特朗普宣布新关税政策

何时是最佳入场时机

美国CLARITY法案推进

Gate春节赛马红包嘉年华

热门 Gate Fun

Lucks

Luckys

LAZY

LAZYLION

APES ET

ETM

LAZY

LazyLion

CNMB

草泥马币

置顶