Concrete ML v1.5版本发布,引入了新的DataFrame API,支持在加密存储的数据上工作,并增加了加速神经网络的新选项,速度可提高2-3倍。同时,发布了一个新的演示,展示如何安全地匿名化文本数据,以便在使用ChatGPT查询知识库时不会泄露任何个人身份信息。该版本旨在推动隐私保护的机器学习和加密协作。
/
2024 年 4 月 8 日
-
Andrei Stoian
在此版本中,Concrete ML v1.5 引入了一个新的 DataFrame API,该 API 支持使用加密的存储数据。这项新功能扩展了 Concrete ML 的主要用例,即私有推理,并标志着朝着保密协作迈出的又一步。
此外,Concrete ML v1.5 添加了一个新选项,可以将神经网络的速度提高 2-3 倍。它配备了改进的 FHE 模拟模式,可以快速评估此功能对神经网络准确性的影响。
最后,一个新的演示展示了如何安全地匿名化文本数据,以使用 ChatGPT 查询知识库,而无需泄露任何个人身份信息。
DataFrames 是一种编程范式,可简化表格数据的操作。DataFrames 通过存储异构数据和数据模式(包括数据类型和列名)来创建可移植的数据容器。此外,DataFrames 还具有查询和筛选存储数据的功能,很像数据库引擎。
DataFrames 在数据科学中很受欢迎,用于在运行统计分析或训练模型之前存储和预处理数据。Concrete ML v1.5 从流行的 Pandas 包中汲取灵感,并为用户提供了一个 API 来加密、连接和解密 DataFrames。此功能允许多方在加密的存储数据上进行协作,作为私有模型推理或训练的输入,标志着保密协作的又一步。有关更多详细信息,请参见示例工作流程。
Concrete ML v1.5 引入了一个选项,允许用户在 FHE 模型中,在速度和预测的准确性之间进行权衡,与等效的明文模型相比。通过选择新选项,用户可以实现 2-3 倍的速度提升。例如,当允许这种噪声时,FHE 原语可以更快地计算激活函数。Concrete ML v1.5 为用户提供了在两种模式之间进行选择的可能性:(1)与明文模型相比,确保完全的准确性,但以较低的速度运行,以及(2)保持模型准确性,同时允许神经网络 logits 中存在一些噪声,但实现更快的执行速度。用户可以通过改进的 FHE 模拟模式来验证是否保持了准确性。
随着 Concrete ML v1.5 的发布,我们发布了一个新的 HuggingFace 空间,该空间展示了如何在加密的文本数据上私下执行匿名化模型。虽然 ChatGPT 没有提供回答加密查询的方法,但使用 FHE 进行匿名化可以帮助安全地从发送给 ChatGPT 的文档和查询中删除个人身份信息。通过这种方法,公司可以构建匿名化的知识库,并将其用于与 ChatGPT 的检索增强生成 (RAG)。
[视频教程] 使用 Concrete ML 处理加密的 DataFrames \ 在本教程中,Zama 团队成员 Roman Bredehoft 将向你展示如何使用 Concrete ML 处理加密的 DataFrames。 2024 年 5 月 21 日\ \ Roman Bredehoft
Concrete ML
教程
Zama 产品发布 - 2024 年 4 月 \ 随时了解 Zama 2024 年 4 月的产品发布,其中包括 TFHE-rs、Concrete、Concrete ML 和 fhEVM 的改进... 2024 年 4 月 9 日\ \ Zama 团队
公告
TFHE-rs v0.6:GPU 上的零知识支持和有符号整数运算 \ TFHE-rs v0.6 引入了零知识证明、GPU 增强和其他加密功能。 2024 年 4 月 8 日\ \ Jean-Baptiste Orfila, Arthur Meyre, Agnes Leroy
公告
TFHE-rs
Concrete v2.6:近似 PBS、输入压缩、扩展的可组合函数、速度改进 \ Concrete v2.6 引入了近似可编程自举 (PBS)、输入压缩和其他增强功能。 2024 年 4 月 8 日\ \ Quentin Bourgerie
公告
Concrete
fhEVM v0.4:新的加密类型和异步解密 \ fhEVM v0.4 引入了新的加密类型、新的异步解密 API 和标准 fhEVM 合约库。 2024 年 4 月 8 日\ \ Clément Danjou
公告
fhEVM
Concrete ↗ Concrete ML ↗ FHEVM ↗ TFHE-rs ↗
博客 文档 ↗ GITHUB ↗ FHE 资源 ↗ 研究论文 ↗ 赏金计划 ↗ FHE 状态操作系统
与专家交谈 联系我们 X Discord Telegram 所有社区频道
隐私对于电子时代的开放社会是必要的。隐私不是秘密。私事是不想让全世界知道的事情,而秘密是不想让任何人知道的事情。隐私是有选择地向世界展示自己的力量。如果双方有某种交易,那么双方都会记住他们的互动。每一方都可以谈论他们自己对这件事的记忆;谁能阻止它呢?可以制定法律来禁止它,但言论自由,甚至比隐私更重要,是开放社会的基础;我们不寻求限制任何言论。如果许多人在同一个论坛一起发言,每个人都可以与所有其他人交谈,并将关于个人和其他方的知识汇总在一起。电子通信的力量已经促成了这种群体言论,它不会仅仅因为我们可能想要它消失而消失。既然我们渴望隐私,我们必须确保交易的每一方只知道该交易直接需要的知识。由于任何信息都可以被谈论,我们必须确保我们尽可能少地透露信息。在大多数情况下,个人身份并不重要。当我在商店购买杂志并将现金交给店员时,没有必要知道我是谁。当我要求我的电子邮件提供商发送和接收消息时,我的提供商不需要知道我在和谁说话,我在说什么,或者别人在对我说什么;我的提供商只需要知道如何将消息发送到那里,以及我欠他们多少费用。当我的身份被交易的底层机制泄露时,我没有隐私。我不能在这里有选择地展示自己;我必须总是展示自己。因此,开放社会中的隐私需要匿名交易系统。到目前为止,现金一直是主要的此类系统。匿名交易系统不是秘密交易系统。匿名系统使个人能够在需要时以及仅在需要时显示他们的身份;这是隐私的本质。开放社会中的隐私也需要密码学。如果我说了一些话,我希望只有我打算让其听到的人才能听到。如果我的讲话内容对全世界都是可用的,那么我就没有隐私。加密是为了表明对隐私的渴望,而使用弱加密是为了表明对隐私的渴望不是那么强烈。此外,当默认设置为匿名时,为了有保证地显示自己的身份,需要密码签名。我们不能期望政府、公司或其他大型的、没有面孔的组织出于善意而给予我们隐私。谈论我们对他们有利,我们应该期望他们会谈论。试图阻止他们的言论是与信息现实作斗争。信息不仅仅是想要自由,它是渴望自由。信息会扩展以填满可用的存储空间。信息是谣言更年轻、更强大的表弟;信息比谣言跑得更快,有更多的眼睛,知道更多,但比谣言理解得更少。如果我们希望拥有任何隐私,我们必须捍卫我们自己的隐私。我们必须团结起来,创建允许进行匿名交易的系统。几个世纪以来,人们一直在用耳语、黑暗、信封、紧闭的门、秘密握手和信使来捍卫自己的隐私。过去的技术不允许强大的隐私,但电子技术可以。我们密码朋克致力于构建匿名系统。我们正在用密码学、匿名邮件转发系统、数字签名和电子货币来捍卫我们的隐私。密码朋克编写代码。我们知道必须有人编写软件来捍卫隐私,而且由于除非我们所有人都这样做,否则我们无法获得隐私,因此我们将编写它。我们发布我们的代码,以便我们的密码朋克伙伴可以练习和玩弄它。我们的代码可供所有人免费使用,在全球范围内。我们不太关心你是否不赞成我们编写的软件。我们知道软件无法被销毁,并且广泛分散的系统无法被关闭。密码朋克谴责对密码学的法规,因为加密从根本上说是一种私人行为。事实上,加密行为将信息从公共领域中移除。即使是反对密码学的法律也只能达到一个国家的边界和其暴力的触及范围。密码学将不可避免地遍布全球,以及它使之成为可能的匿名交易系统。为了使隐私得到广泛的应用,它必须是社会契约的一部分。人们必须聚集在一起,为了共同利益而部署这些系统。隐私的范围只延伸到一个人在社会中的同伴的合作。我们密码朋克寻求你的问题和你的担忧,并希望我们能够让你参与进来,这样我们才不会欺骗自己。但是,我们不会因为某些人可能不同意我们的目标而改变我们的路线。密码朋克正在积极地使网络更安全,以保护隐私。让我们一起前进。前进。作者:Eric Hughes。1993 年 3 月 9 日。
- 原文链接: zama.ai/post/concrete-ml...
- 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!