Concrete ML v1.8 发布,旨在实现去中心化的私有 LLAMA 微调。此版本改进了 LLM 混合微调的速度和可用性,通过优化的 FHE 后端和新的低秩近似 API。Concrete ML 现在支持 Python 3.12,确保与最新的工具和框架兼容。该版本还提供了一个更好的 API,用于在加密数据上微调 LLM,并添加了一个优化的 FHE 后端,加速了计算。
/
2025 年 1 月 14 日
-
Andrei Stoian
Concrete ML v1.8 标志着在实现大型语言模型(LLM)的隐私保护微调方面迈出了重要一步。此版本通过针对 LLM 优化的 FHE 后端和新的低秩近似 API,提高了 LLM 混合微调的速度和可用性。
此外,Concrete ML v1.8 现在支持 Python 3.12,确保与最新的工具和框架兼容。
Concrete ML 为 LLM 提供微调功能,作为一个客户端-服务器协议:
第一步,开发人员需要编译一个 LLM,使其以这种方式与 FHE 一起工作。在部署模型之前,他们可以在自己的机器上检查编译后的模型是否能产生良好的结果。为了简化此工作流程,Concrete ML v1.8 引入了 一个微调 API,其灵感来自 HuggingFace PEFT LoraTrainer,从而使此过程更加高效。
from concrete.ml.torch.lora import LoraTrainer
lora_trainer = LoraTrainer(
model=peft_model,
optimizer=optimizer,
loss_fn=causal_lm_loss,
lr_scheduler=lr_scheduler,
training_args=training_args_dict,
n_layers_to_skip_for_backprop=3,
)
lora_trainer.compile(inputset, n_bits=16)
lora_trainer.train(dataloader, num_epochs=EPOCHS, fhe="execute", device=device)
如代码片段所示,与 HuggingFace LoraTrainer 相比,Concrete ML 只需要一个额外的编译调用。
此外,这个新版本允许开发人员有效地使用 GPU 在自己的机器上评估编译后的模型,从而显著加快开发过程。查看此 notebook 了解如何在 LLAMA 上使用新的 API。
Concrete ML v1.8 为 LLM 微调用例添加了一个 优化的 FHE 后端。利用 GPU,此后端显著加快了计算速度。该后端实现的底层操作是加密矩阵 - 明文矩阵乘法,其中加密矩阵表示私有用户数据,明文矩阵包含模型的原始权重。
该后端的关键亮点是高效的压缩 – 输入和输出都被压缩到仅比非加密数据大 4 倍左右的大小。
在当前的实现中:
这代表着向前迈出的重要一步,预计未来版本的进一步优化将使成本和延迟降低 4 倍。
总而言之,Concrete ML v1.8 使在加密数据上安全地微调 LLM 更容易、更快速,使我们离可扩展和去中心化的 AI 解决方案更近了一步。请继续关注未来的更多更新!
[视频教程] 使用 Concrete ML 在加密数据上微调 LLM 模型 \ 在本教程中,Zama 团队成员 Andrei Stoian 向你展示如何使用 Concrete ML 在加密数据上微调 LLM 模型。 2025 年 2 月 5 日\ \ Andrei Stoian
Concrete ML
教程
Concrete ↗ Concrete ML ↗ FHEVM ↗ TFHE-rs ↗
博客 文档 ↗ GITHUB ↗ FHE 资源 ↗ 研究论文 ↗ 赏金计划 ↗ FHE STATE OS
与专家交谈 联系我们 X Discord Telegram 所有社区渠道
在电子时代,隐私是开放社会所必需的。隐私不是秘密。私事是不想让全世界知道的事情,但秘密是不想让任何人知道的事情。隐私是有选择地向世界展示自己的力量。如果双方有某种交易,那么每一方都有对其互动的记忆。每一方都可以谈论他们自己对这件事的记忆;谁能阻止它呢?你可以通过法律来禁止它,但是言论自由,甚至比隐私更重要,是开放社会的基础;我们不寻求限制任何言论。如果许多方在同一个论坛中一起发言,每一方都可以向所有其他人发言,并将关于个人和其他方的知识汇总在一起。电子通信的力量使这种群体发言成为可能,并且它不会仅仅因为我们可能想要它消失而消失。既然我们渴望隐私,我们必须确保交易的每一方只知道该交易直接需要的知识。由于任何信息都可以被谈论,我们必须确保我们尽可能少地透露信息。在大多数情况下,个人身份并不重要。当我在商店购买杂志并把现金交给店员时,没有必要知道我是谁。当我要求我的电子邮件提供商发送和接收消息时,我的提供商不需要知道我在和谁说话,或者我在说什么,或者别人在对我说什么;我的提供商只需要知道如何将消息发送到那里,以及我欠他们多少费用。当我的身份被交易的底层机制揭示时,我就没有隐私。我不能在这里有选择地展示自己;我必须总是展示自己。因此,开放社会中的隐私需要匿名交易系统。到目前为止,现金一直是主要的这种系统。匿名交易系统不是秘密交易系统。匿名系统使个人能够在需要时以及只有在需要时才披露自己的身份;这是隐私的本质。开放社会中的隐私也需要密码学。如果我说什么,我希望只有我打算让其听到的人才能听到。如果我的讲话内容对全世界都可用,我就没有隐私。加密是指示对隐私的渴望,而使用弱密码学加密是指示对隐私没有太多的渴望。此外,当默认设置为匿名时,为了有把握地揭示自己的身份,需要密码签名。我们不能期望政府、公司或其他大型、无面目的组织出于其善意而给予我们隐私。谈论我们对他们有利,我们应该期望他们会谈论。试图阻止他们的言论是与信息现实作斗争。信息不仅仅是想要自由,它渴望自由。信息会膨胀以填充可用的存储空间。信息是 Rumor 的年轻、更强大的表弟;信息比 Rumor 的脚步更快,眼睛更多,知道的更多,但比 Rumor 理解的更少。如果我们希望拥有任何隐私,我们必须捍卫自己的隐私。我们必须走到一起,创建允许进行匿名交易的系统。几个世纪以来,人们一直在用耳语、黑暗、信封、关闭的门、秘密握手和信使来捍卫自己的隐私。过去的技术不允许强大的隐私,但电子技术可以。我们这些密码朋克致力于构建匿名系统。我们正在通过密码学、匿名邮件转发系统、数字签名和电子货币来捍卫我们的隐私。密码朋克编写代码。我们知道必须有人编写软件来捍卫隐私,而且由于除非我们都这样做,否则我们无法获得隐私,所以我们将编写它。我们发布我们的代码,以便我们的密码朋克伙伴可以练习和使用它。我们的代码供全世界所有人免费使用。如果你不认可我们编写的软件,我们不太关心。我们知道软件无法被销毁,并且一个广泛分散的系统无法被关闭。密码朋克谴责对密码学的监管,因为加密从根本上说是一种私人行为。事实上,加密行为将信息从公共领域移除。即使是反对密码学的法律也只能延伸到一个国家的边界及其暴力的触及范围。密码学将不可避免地遍布全球,随之而来的是它所实现的匿名交易系统。为了使隐私得到广泛传播,它必须成为社会契约的一部分。人们必须走到一起并部署这些系统以实现共同利益。隐私的范围只延伸到社会中同伴的合作程度。我们这些密码朋克寻求你的问题和你的担忧,并希望我们可以与你互动,以便我们不会自欺欺人。然而,我们不会因为有些人可能不同意我们的目标而改变我们的路线。密码朋克正在积极地使网络对隐私更安全。让我们一起快速前进。前进。埃里克·休斯著。1993 年 3 月 9 日。
- 原文链接: zama.ai/post/concrete-ml...
- 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!