为万亿代理而构建

  • levie_
  • 发布于 10小时前
  • 阅读 30

这篇文章探讨了AI代理的快速发展及其对软件和工作方式的深远影响。文章指出,代理正变得高度自治,并将成为未来软件的主要用户。因此,软件开发需转向“API优先”策略,并催生新的基础设施、工具和商业模式,以适应“万亿代理”的时代。

Image

在过去的几个月里,代理(agents)发生了一些大事。去年底,我们开始达到一个临界点,编码代理能够完成运行时间更长的任务,并且在整个开发过程中不再需要太多的手把手指导。

这些代理不再是只拥有基本工具的聊天机器人。相反,这些代理通常拥有自己的沙盒计算环境,能够为遇到的任何问题编写和运行代码,直接与 API 和 CLI 交互,拥有自己的文件系统和长期记忆等等。这套核心原语、代理线束最佳实践的普遍进展,以及代理工具使用和软件开发方面惊人的模型进展,让我们得以一窥能够处理任何任务的代理的未来。

虽然这种架构最初由 Claude Code、Devin、Codex、Factory、Cursor 或 Replit 等编码代理混合定义,但我们最近已经跨越鸿沟,进入个人体验和知识工作的各个领域,这得益于 Claude Cowork、Perplexity Computer、Manus,当然还有 OpenClaw 等代理,后者通过让代理在其自己的持久环境中 24/7 运行,将事物推向了更远的未来。

由于能力快速发展,代理将被引入到几乎所有工作领域。代理将被部署来审查每一份合同、处理大多数客户支持案例的一线工作、审计每家公司的财务状况、筛选每一项医学研究以进行药物发现、生成几乎所有将被编写的代码、创建大多数销售和咨询演示文稿,为消费者在网络上进行交易,总而言之,将参与社会中几乎所有其他具有经济价值的任务。

而且,这不仅仅是关于执行我们今天已经完成的任务。我们将使用代理完成比以前多得多的事情——我们将使用代理运行以前无法负担的模拟,我们将使用它们以多种不同选项构思我们的每一个想法,我们将开展更多的项目,因为启动成本低且易于关闭,我们将审查每一份数据而不是抽样信息。

综上所述,我们可以预期组织中的几乎每位员工都将有许多代理为其工作,不难想象一家企业中的代理数量将比员工数量多 100 倍甚至 1000 倍。由于数万亿代理的运行,代理将成为未来所有软件的主要用户。

鉴于大多数软件是为人类使用而构建的,这意味着我们将看到软件的未来面貌发生重大转变。那么接下来会发生什么?

制造代理想要的东西

保罗·格雷厄姆(Paul Graham)曾以最简单的术语阐述如何构建软件:制造人们需要的东西。

这一建议促成了 21 世纪一些最重大的软件成功案例,并推动了一场运动,旨在构建易于使用、易于采用、无需行话即可解决清晰问题、定价直观等工具。

现在,前进的道路是制造代理想要的软件。虽然代理最大的用户往往是开发者或至少是高度技术性的用户,他们通常有自己的工具偏好,但在一个代理为知识工作者完成任何类型任务的世界里,这种偏好将逐渐消失。除非企业已经有标准,否则代理将主导任何特定工作流程中采用什么。

这可能意味着他们注册的工具、他们编写的代码、他们使用的库、他们利用的技能等等。代理更容易采用,并且能最好地解决代理(和用户)问题的平台,将比那些不能解决的平台发展得快得多。代理不会去参加你的网络研讨会或看你的广告;它们只会使用最适合这项工作的工具,而你会希望那是你的工具。

API 优先设计

这一建议最重要的含义是,你所构建的一切都必须是 API 优先的。如果你的功能没有 API,那么它就等于不存在。如果它不能通过 CLI 或 MCP 服务器暴露出来,你就处于劣势。如果你有令人困惑的 API 和相互冲突的路径供代理遵循,你只是在损害自己对代理有用的机会。在 Box,我们专注于为代理构建文件系统,我们一直在仔细检查我们 API 的每个方面,以找出在代理世界中哪些地方会出问题,从而达到通常只有 UX 设计才会关注的可用水平。

正如为用户设计意味着在构建软件时设身处地为他们着想一样,思考代理会遇到什么时也是如此。例如,YCombinator 的 Jared Friedman 提醒所有人:“即使是最好的开发者工具,也大多仍然不允许你通过 API 注册账户。这在 Claude Code 时代是一个很大的缺失,因为它意味着 Claude 无法自行注册。现在,将所有账户管理功能放入你的 API 应该是基本要求了。”如果代理不能轻松注册你的服务并开始使用它,那么你对代理来说基本上就无效了。

商业模式的演变

在一个代理将成为未来软件最大用户的世界中,商业模式也存在重大影响。在某些情况下,用户席位启动代理可能很舒服地适用于基于席位的软件商业模式,但代理有大量使用场景并不整齐地附着到现有用户,或者因为它们的工作负载量现在完全不同。例如,只需几个词或几行文本,一个代理可能在软件中完成数小时等同于人类的工作,然后只将最终输出暴露给最终用户。

这最终将意味着部分软件的商业模式演变,因为任何想要在代理未来中生存下来的工具都需要在其系统中内置某种形式的基于消费量或使用量的商业模式,甚至支持代理能够为这些服务自行支付费用。

面向代理的基础设施和工具的新时代

“把电脑给人类是个好主意。更好的主意是把电脑给电脑,这样它们就能像我们用电脑工作一样,生成同样的输出。” — Aravind Srinivas, Perplexity

由于代理拥有自己使用的电脑,能够编写和执行自己的代码,调用常用技能进行重复操作,以及利用外部工具和服务,这为代理使用全新的技术集合创造了机会。试想一下用户在电脑上做什么,代理将需要一套专门为它们设计的功能。

其中一些核心服务自然会来自现有参与者,因为代理正在利用现有数据,或者现有的人类用户与系统上的代理用户之间的协作或连接具有价值。同样,也会出现全新的类别,因为问题空间与人类用户以前所需或能做的事情如此不同,以至于从头开始设计服务是合情合理的。

代理专属基础设施

例如,很明显代理将需要拥有自己的基础设施来运行,并且规模将是我们前所未见的。下一个超大规模提供商(或现有提供商)将建立在这样一个理念之上:未来的服务器农场将不再用于我们的应用程序,而是用于我们的代理。E2B、Daytona、Modal 和 Cloudflare 都在朝这个方向努力,这些沙盒环境将匹敌我们以前见过任何计算规模。

数据访问与企业系统集成

代理还需要访问企业中的核心文件,并能够管理自己的数据以用于内存和长时间运行的工作,这正是我们 Box 专注于构建的。同样,主要企业系统需要变得 API 优先,以使代理能够处理组织中的关键服务和数据——例如 HRIS、CRM、工作流、数据湖和其他主要系统。那些提供最无缝工具,使代理能够从任何地方操作这些数据的产品,将最有机会赢得这些未来的工作负载。

代理的身份、通信与财务管理

代理可能还需要身份,并能够与他人沟通;例如,Agentmail 正在为代理提供邮箱,以便它们拥有自己的持久电子邮件来工作。Parallel、Exa 和其他公司正在为代理作为最大的用户在网络上抓取信息的世界重建网络搜索。许多类型的代理将需要管理自己的预算,包括使用 Stripe 或 Coinbase 钱包的支出,我们可能最终会为微交易找到一个真实的用例,即代理可以利用付费工具和信息。

安全、合规与治理

安全、合规和治理将成为这些代理面临的一个主要问题。在一个代理访问并处理工作流中敏感信息,或执行受监管工作流(如制药或银行领域)的世界中,公司将需要管理并保留这些代理所做的所有工作。长期运行的代理可能需要拥有自己的身份,允许它们认证到服务,对它们可以采取的行为类型以及在企业中可以访问的数据进行严格控制。我们将需要全新的软件和平台来帮助解决这些挑战,就像我们随着时间的推移为人类和应用程序构建的那样。

总而言之,我们显然正在进入一个软件新时代,在这个时代,我们需要专门为代理大规模使用设计和构建我们的工具。在一个数万亿代理正在工作的世界中,这将开启一种全新的软件工作方式。

  • 原文链接: x.com/levie/status/20307...
  • 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
点赞 0
收藏 0
分享
本文参与登链社区写作激励计划 ,好文好收益,欢迎正在阅读的你也加入。

0 条评论

请先 登录 后评论
levie_
levie_
江湖只有他的大名,没有他的介绍。