本文探讨了去中心化AI领域中最有前景的想法和技术,包括计算、数据、模型和评估的去中心化方法,以及多代理系统和代理经济的发展方向。文章提出了38个关于去中心化和分布式AI的构想,并探讨了相关的机遇和挑战,强调了在AI领域实现无偏见、无需许可和开放创新的重要性。
构建什么,投资什么,以及对去中心化 AI 的期望:去中心化和分布式 AI 中的 38 个想法、开放机会和挑战
本文探讨了最具有前景的想法和技术,这些想法和技术将实现真正的去中心化 AI:一种公正、无需许可且对创新和可组合性开放的 AI。关于为什么会发生这种情况以及它将产生什么经济影响的论点在本文章的第一部分中概述:智能互联网。
在过去的一年中,我们看到了对去中心化 AI 越来越感兴趣,这主要是由以下因素驱动的:
互连、可组合 AI 系统的新兴特性和价值。与 Web 类似,许多实际的 AI 用例不仅需要单个模型,还需要多智能体协作才能提供无缝的用户体验。
对少数组织或民族国家中心化和控制最强大的 AI 模型的担忧。
需要在机器学习研究和开发中进行更开放、无需许可的实验,特别是来自私人实验室的实验。
闭源、闭权重模型中存在的偏见和缺乏透明度的问题。
去年,去中心化 AI 项目激增,虽然这些项目很简单,但在估值方面取得了相对成功。这些项目主要集中在 token 门控的聊天机器人、GPU 租赁服务和基于 LLM 的自主代理上。虽然这些实验令人印象深刻且常常很有趣,但我认为去中心化 AI 的真正价值比这些表面应用更深层次。
在这篇文章中,我将探讨研究、产品开发和公司建设的最关键方向,这将使有用且普遍可访问的去中心化和分布式 AI 成为可能。
计算是指运行和训练 AI 系统所需的处理能力。去中心化计算分配计算负载,提高弹性并减少对 AI 功能的集中控制。
最终目标
计算服务是无需信任、无需许可、私有且价格与当前云产品具有竞争力的。 开发人员在 AWS 上运行代理代码和推理时,不应感受到 UX 方面的差异,同时还可以受益于增强的无需信任(无需信任硬件提供商)、无需许可(无需寻求托管任何内容的许可)和隐私(确保无人看到他们的代码和数据)的特性。
去中心化计算应该是通用的,处理范围广泛的任务,而不仅仅是 EVM 代码执行或小型模型推理。这种通用性确保了任何计算作业,无论其性质如何,都可以受益于去中心化系统提供的增强的安全性、隐私性和弹性。通过适应多样化的工作负载,去中心化计算可以吸引更广泛的用户群。
训练和推理应该是通信高效的:应该可以在去中心化环境中运行复杂的 AI 模型,因为它可能更可靠、受到审查保护且具有成本效益。去中心化系统的主要挑战是互联网上相对不可靠和缓慢的通信(与数据中心结构相比)。鉴于训练和推理都需要通信高效,以降低对网络带宽和可靠性的依赖。该领域取得了一定的进展,Petals,DiLoCo和DiPaCo等方法显示出希望和吸引力。
可靠性:web3 云应提供某种形式的 SLA 或可靠性保证,以便与 AWS 和 GCP 竞争(并不是说它们没有中断,但它们确实拥有品牌名称)。
替代基础设施解决方案: 目前,训练和推理的事实标准是位于某些数据中心的 Nvidia GPU,但还有其他的基础设施选项,例如高通推理加速器 Cloud AI 100,它能够提供相同的性能,但 CAPEX 降低 2 倍,功耗降低 4 倍。一些公司,如 tinygrad 及其 tinybox 解决方案,或 Lambda Labs 及其 AI 就绪工作站。这里的核心思想是从住宅电源插座中获取尽可能多的计算能力。
Etched 和 Groq 等公司正在构建 LLM 专用加速器,称为语言处理单元,能够每秒生成多达 300 个 token。
Exo 等公司展示了即使在两台消费类笔记本电脑上运行最大的可用开源模型的能力,使企业无需为其构建专用基础设施即可运行其模型。这种方法还可以通过重复使用部分摊销的消费类硬件并将负载分配到整个电网来为循环经济做出贡献。
数据是 AI 的命脉,对于学习和决策至关重要。去中心化数据可提高隐私性、减少垄断并增加训练数据集的多样性。
最终目标
数据激励网络将利用机制设计原则来鼓励创建和验证高质量的数据集。这些系统将奖励贡献者生成有价值的数据,并奖励验证者确保其准确性,从而创建一个自我维持的数据生产和管理生态系统。
大规模合成数据生成将变得可供广泛的用户使用。与更大的 SoTA LLM 相比,更小和更专业的模型(SLM、微调模型或专家 RAG 支持的 AI 应用程序)可以生成更高质量的合成数据。
数据的范围将扩展到文本之外,涵盖各种不同的模式。这将包括视觉数据(图像、视频、3D 模型)、音频、代码和领域特定数据类型,如 DNA 序列或化合物。
持续更新和管理的数据集将充当 AI 系统的动态知识库。这些数据集的设计旨在与 RAG 技术或模型微调轻松集成,使 AI 模型能够随时掌握最新信息并适应不断变化的环境,而无需完全重新训练。
模型是经过训练可以执行各种任务(从语言处理到视频或音乐生成)的核心 AI 系统。去中心化模型可以促进 AI 功能的多样性,减少对少数主要参与者的依赖,并允许根据特定需求或文化/法律/商业环境定制专门的模型。
最终目标
由大型去中心化贡献者网络创建的持续预训练模型。 与之前的示例类似,这将提供最相关和最新的结果。此外,此类模型可以使用去中心化计算网络(在第一章中讨论)来确保持续的正常运行时间和不间断的预训练。
公平、可验证和去中心化的模型创建和推理补偿。 这可以确保透明度和信任,因为所有参与者都可以验证奖励的合法性。支持模型共同所有权和基于个人贡献的某种形式的“ML 版税”。
模型补偿的另一面是模型融资。这可能包括类似于 ICO 的众筹机制(或 TGE,或当前流行的任何术语,以避免与庞氏骗局相关联)。作为一名投资者,我可以用我的时间、计算资源、工作或财务贡献来支持模型创建。作为回报,我将获得未来模型利润的一部分,由去中心化网络强制执行。
使用机制设计来货币化社区拥有的模型的使用。
谷歌最近的一篇论文发明了一种他们称之为“token 拍卖”的新原语。这种拍卖允许市场参与者直接竞标 token 输出,该输出可用于广告目的。例如,两家公司(一家航空公司和一家度假村)都可以竞标,以便最终消息同时提及这两个品牌,并宣传使用 B 航空公司前往度假村 A 的美好旅程。即使如此,这仍然使模型输出的透明度和偏见问题有待解决,但这是一个值得考虑和构建的有趣的原语。
评估是用于评估和改进 AI 性能的指标。去中心化评估可确保多样化的测试场景和公正的性能评估,这对于开发值得信赖的 AI 至关重要。
最终目标
能够在特定(可能狭窄)领域中以去中心化的方式对 AI 应用程序进行基准测试和评估。
能够不仅针对公共基准集进行评估,还可以使用 封闭测试集和非常专业的、可能由人工评分的任务。
针对实际业务问题的评估对于区分真正有用的模型和仅适用于随意对话的模型至关重要。不幸的是,这些评估确实很难获得,并且大多数数据集都是专有的。应该有一种以私密方式贡献这些数据集的机制。
对代理的评估是一个更具挑战性的问题,因为代理彼此交互,对一个代理有益的东西对另一个代理则没有那么有益。应该有一种机制来普遍评估协作和多代理环境中的代理行为。目前,存在许多专门的基准(OpenToM 用于心智理论,InfiBench 用于编码问答,Infiagent-dabench 用于数据分析,SWEbench 用于软件工程技能,GAIA 用于通用助手)。但是,对于多代理 (IOI) 设置,需要一种新型的评估方法。
现在,从单个模型转移到智能体,我们将讨论能够自主完成任务和解决问题的更复杂的系统。
智能体是被设计用于 AI 生态系统中的特定任务的自主 AI 实体。去中心化智能体支持多样化、独立的 AI 参与者。数百万个协同工作的 AI 智能体将推动我们走向 AGI,并自动化人们今天所做的各种工作。
智能体可以像将几个 LLM 链接在一起一样简单——使用更小、更便宜的 LLM 来执行简单的任务,如自然语言分类,并使用更复杂的模型来执行高级推理、编码或分析。
MAS 是用于复杂问题解决的交互式 AI 智能体网络。由于无需信任的运行时可组合性,去中心化 MAS 促进了新兴行为。去中心化 MAS 系统还可以在创建新功能或市场条件发生变化(例如,用于特定模型或智能体的计算价格)时持续适应多智能体系统。
最终目标
存在高效的工作流编排系统。多智能体系统中的编排可以高度动态,如果某些事情没有按计划进行,可以随时适应。它能够根据给定任务优先考虑成本还是质量来选择不同的最佳路径。该系统会持续索引可用智能体的区域,并通过集成新的智能体和移除性能不佳的智能体来增强其注册表。它会保留详细的日志并跟踪每个智能体的声誉,使用此反馈循环来提高未来使用的质量。
智能体可以管理预算(以真实货币、token 或计算分配的形式)来预算和规划多智能体工作流。一旦这成为现实,就需要一套新的工具,例如 AI 原生的会计、检查,甚至信贷。
智能体可以有效地交流数据、意图、背景。这种交流可以涉及自然语言或机器可读数据,例如直接在系统之间传递嵌入或甚至是权重。
多智能体系统具有容错性和分布式,这意味着即使某些智能体发生故障或受到损害,它们也可以继续运行。
能够“唤醒”自己以完成任务的自主智能体。可以将其视为智能 cron 调度程序或智能合约自动化系统,如 Keep3r Network,但适用于自主智能体。
多智能体系统是可解释和可审计的,允许利益相关者理解和验证智能体的决策过程。例如,使用去中心化 AI 的金融服务可以提供透明和可追溯的交易记录,从而确信符合监管标准并在用户之间建立信任。
产品利用机制设计来指导和控制多智能体系统中智能体的交互。特别是在两个或多个智能体具有不同或矛盾的目标的用例中(例如,因为它们代表具有不同目标的用户)。
存在一个系统来针对用户指定的最终目标评估和比较 LLM、智能体、工具之间的路由效率。这样的系统可以使用强化学习技术来预测结果路由请求,甚至在评估步骤之前。WithMartian 正在构建,Scade.pro 提供了一个单一的无需代码的界面来实时测试和比较各种 AI 和 LLM 路由算法。
Martian 帮助比较各种 LLM。Lmsys 正在构建 LLM 的一个开源路由器。
AI 记忆和同理心,允许智能体记录、预处理和后处理用户交互,记录长期记忆图。未来,随着每个用户拥有越来越多的 AI 应用程序,在这些应用程序之间自动共享上下文(以保护隐私和 SSI 兼容的形式)将带来更有用和令人愉悦的用户体验。
AI-人沟通工具,类似于一个邮箱,你作为客户可以在其中查看已完成任务的所有收据和日志、评论和决策请求、反馈以及 AI 智能体的其他信息查询。
智能体经济是指 AI 智能体充当自主经济参与者、参与交易、决策和价值创造的系统。AI 智能体的工具市场将是一个平台,智能体可以在其中访问和临时使用各种功能、工具和功能,以提高其完成某些任务的能力。
最终目标
智能体工具和功能的市场。任何 AI 智能体都可以无需信任地使用该工具(API、ABI、函数调用),同时保证其输出。
人工参与市场允许 AI 智能体雇用人类来完成任务,从而有效地结合 AI 和人类的能力。去中心化这一点可确保公平的补偿和人类在 AI 生态系统中的多样化参与。此类任务可能需要做一些现实生活中的工作(发送包裹、拍照)或获取人类的判断(评估网页设计选项,为 LLM 撰写的诗歌提供人类反馈)。
用于自主智能体进入和执行合同关系的全球的、无需许可的且AI 优先的签约空间。这将需要使用:
1、用于 AI 智能体的 承诺设备,以确保智能体遵守约定的条款
2、记录和检索合同以供参考和审计的媒介
3、加密工具来实现承诺,并可选择通过零知识证明之类的东西来保护隐私
4、用于“AI 合同空间”的构建块,类似于预编译或法律模板,以简化此类合同的创建。
AI 原生 AMM 可以成为用于购买服务以及与 AI 智能体之间创建协议的工具。智能体根据自己的供给曲线提供可以完成的工作,并且购买 token 本身就构成了执行该工作的数字合同。该合同可以包括不履约的处罚、仲裁程序和保险。由于区块链的无需信任的性质,你可以与承包商组装一个复合且复杂的合同图,以完成一个模型/应用程序/智能体无法单独处理的更复杂的用户任务。并且为用户找到将提供最高质量但最便宜的结果的优化配置的任务是一种新型的 AI-MEV 搜索。
就像合同一样,AI 智能体需要一种运作和适应社会规范和制度的方式。它们需要一个系统来使行动与社会价值观保持一致。
本文 建议,为了实现这一目标,智能体必须学会预测哪些行为可能受到制裁,指导智能体决策以选择符合社区规范的行动,并学习哪些机构通过与其他智能体的互动被视为权威机构。
AI 金融 以用于 AI 智能体在彼此和外部实体(如个人用户或法人实体)之间交换价值的简单工具开始,但可能会扩展到专门为智能体经济构建的更复杂的金融原语中,例如信贷(以计算的形式)、token 化、套期保值、指数和管理基金。
AI 辅助网络安全 指的是网络安全的未来,其中攻防双方都由 AI 智能体组成,它们积极地探测、渗透测试并尝试寻找新的漏洞。它变成了 24/7 的战争,具有自我进化的工具,例如模糊安全性和进化算法,使战场不断变化且高度动态。在这种环境下,涉及数十亿美元的风险,并且进攻和防御 AI 智能体之间的持续军备竞赛推动了网络安全能力的快速发展。
AI 的安全性 是一个非常复杂且难以解决的主题,因为每天都会出现新的向量攻击。以下是 ICML 2024 中的几个论文示例:
1、发表的最有趣的论文之一是题为“窃取生产语言模型的一部分”。这项研究引入了一种新型的模型窃取攻击,该攻击针对黑盒生产语言模型,例如 OpenAI 的 ChatGPT 和 Google 的 PaLM-2。该攻击旨在从这些模型中提取精确且重要的信息,特别侧重于恢复嵌入投影层。
2、另一篇值得注意的论文是“大型语言模型中的水印窃取”,该论文探讨了具有水印的模型的漏洞。水印是一种用于在模型输出中嵌入可识别信息以追踪和验证模型使用的技术。但是,本文揭示了即使是具有水印的模型也容易受到可以学习和复制水印规则的攻击。
3、当然还有其他常见的嫌疑,如提示注入、数据中毒和模型篡改攻击,这些攻击需要可靠的安全和审计机制。
AI 辅助治理 将增强人类的能力,以实现更快、更好和更具包容性的协调。智能体系统对于不同级别的协调任务将是有价值的:
1、AI 助手,可帮助你分解、总结和理解群体、公司、DAO 或政治中最紧迫的问题
2、AI 副驾驶员将协助你做出决策,同时考虑你的历史、偏好和价值观
3、AI 调解员将协助团体(从 2 人到数百万人)调解冲突、审议复杂问题,以公正的形式达成共识
4、AI 评估员将帮助跟踪治理决策的有效性,并使用复杂的数据分析来找到最佳决策
5、AI 代表将充当每个选民、股东或团体成员的个人民主代表,尽最大努力捍卫个人价值观和目标
6、最后,AI 管理的组织甚至国家将成为一种新的治理模式,其中人工智能系统承担协调和决策的主要作用。这种系统将处理大量数据,以基于客观分析而不是个人利益或政治动机做出知情的、公正的决策。它将以完美的效率实施政策和分配资源,消除人为管理系统中固有的浪费和腐败。最后,基于实时的控制论反馈,不断地适应和优化治理结构。
AI 的治理,这意味着递归地利用前一点中描述的技术来管理新的 AI 模型、智能体和系统的开发。
如果你正在构建上述任何系统、产品和/或协议,请与我们联系:https://cyber.fund/contact
cyber•Fund 正在为去中心化 AI 领域的创始人、研究人员提供初创企业资金、研究和 OSS 补助。
- 原文链接: cyber.fund/content/de-ai...
- 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!