使用全同态加密和Zama Concrete ML的加密图像水印

ZamaFHE
发布于 2025-03-27 22:53
阅读 3312

本文介绍了Zama Bounty Program Season 7的获奖方案，该方案使用全同态加密（FHE）和Concrete ML实现了加密图像的隐形水印。该方案包含一个编码器神经网络（用于嵌入水印）和一个解码器神经网络（用于提取水印）。文章还讨论了该方案的性能和水印提取方法，以及其在版权保护、身份验证和篡改检测等方面的应用潜力。

不可见图像水印是一种将隐藏信息嵌入到数字图像中而不明显改变其外观的技术。

在 Zama Bounty Program 第 7 季期间，我们挑战开发者社区开发一个系统，该系统可以使用 Concrete ML，[Zama 的机密 AI 库](https://github.com/zama-ai/concrete-ml)，使用全同态加密 (FHE) 对加密图像执行不可见水印操作。鉴于生成式人工智能的最新发展和 [欧盟人工智能法案](https://www.europarl.europa.eu/RegData/etudes/BRIE/2023/757583/EPRS_BRI%282023%29757583_EN.pdf) 等监管举措，这种方法尤其具有现实意义，这些举措推动了对人工智能生成内容的可靠数字水印技术的发展。

实际上，FHE 可用于创建一个无需信任的服务，该服务允许在所有生成的图像上实现标准化，从而满足 GenAI 输出中对归属和可追溯性日益增长的需求。

应用包括：

- 版权保护：证明所有权。
- 身份验证：验证基于嵌入式水印的图像的真实性。
- 篡改检测：识别和定位篡改。
- 数字媒体跟踪：监控图像在平台上的分发和使用情况。

借助 FHE，所有这些应用都可以在不将原始内容暴露给水印服务的情况下执行，从而确保隐私并符合新兴法规。

#### 关注获奖作品

以下两张图片在普通人看来可能完全相同，但其中一张包含不可见的水印。最先进的水印方法通常依赖于机器学习模型，而部署此类模型最方便的方法是通过在线服务。但是，这里有一个关键问题：**用户如何确保上传到在线水印嵌入服务的图像保持私密？**

![](https://cdn.prod.website-files.com/622ef9de9152c97467eac748/67e51850c493fdbcbb9ec198_Twitter%20post%20creatives%20(1).jpg)

在上面的示例中，右侧的图像（包含不可见的水印）是由 Github 用户 [Soptq](https://github.com/Soptq) 使用 FHE 构建的 [隐私保护机器学习](https://github.com/Soptq/concrete-watermarking/) 模型生成的。

它的模型包含两个部分：

- 一个私下嵌入水印的编码器神经网络 (NN)。
- 一个从图像中提取水印的解码器神经网络（如果存在）。

水印是一个 11 位的代码，为了提高其鲁棒性，它通过纠错方案进行了扩充，总共达到了 16 位。由于在使用 [Concrete ML](http://github.com/zama-aI/concrete-ml) 时，量化感知训练 (QAT) 模型具有最佳的准确率-延迟权衡，因此获胜的解决方案使编码器网络适应 QAT 与 [Brevitas](https://github.com/Xilinx/brevitas) 一起使用。通常，解码器用于检测公共图像上的任何水印，因此它没有转换为 FHE。

**编码器概述。**

编码器模型由两个主要模块组成：

- 水印图像创建模块
- 水印嵌入模块

``` python
def forward(self, image: torch.Tensor, watermark=None):
## 量化输入
watermark = self.quant_watermark(watermark)
watermark = self.watermark2image(watermark)

image = self.quant_image(image)
watermark = self.quant_image(watermark)
inputs = torch.cat([image, watermark], dim=1)
```

在上面的代码片段中，水印图像由水印位创建，然后与输入图像连接。quant\_image 成员是一个 QuantIdentity Brevitas 量化器。由于两个输入已连接，因此它们必须共享相同的量化，如该代码所示。

forward 函数的第二部分创建一个带有跳跃连接的 [MUNIT 图像转换网络](https://arxiv.org/abs/1804.04732)。同样，对于连接的层输出，会小心地处理量化。

``` python
enc = []
x = self.pre(inputs)
for layer in self.enc:
	enc.append(x)
	x = layer(x)

enc = enc[::-1]
for i, (layer, skip) in enumerate(zip(self.dec, enc)):
	if i < self.config.num_down_levels - 1:
		x = layer(x, skip)
	else:
		skip = self.quant_dec(skip)
		inputs = self.quant_dec(inputs)
		x = layer(x, torch.cat([skip, inputs], dim=1))
```

**欠采样和反射填充。**

由于 Concrete ML 中无法使用多种类型的层，例如 Upsample、Repeat 和 Reflection Padding，因此赏金获得者使用其他 PyTorch 运算符优雅地实现了它们：

``` python
class QuantUpsample(nn.Module):
    def __init__(self, scale_factor):
        super(QuantUpsample, self).__init__()
        self.s = scale_factor

def forward(self, x):
        n, c, h, w = x.shape
        out = x.reshape(-1, c, h, 1, w, 1)
        out = torch.cat([out] * self.s, dim=-3)
        out = torch.cat([out] * self.s, dim=-1)
        out = out.reshape(-1, c, h * self.s, w * self.s)
        return out

class Reflection1xPad2d(nn.Module):
    def __init__(self):
        super(Reflection1xPad2d, self).__init__()

def forward(self, x):
        x_pad_right = x[:, :, :, [-2]]
        x_pad = torch.cat([x, x_pad_right], dim=3)

x_pad_bottom = x_pad[:, :, [-2], :]
        x_pad = torch.cat([x_pad, x_pad_bottom], dim=2)

return x_pad

```

**模型编译和执行。**

使用优化的量化参数编译模型：rounding\_treshold\_bits，它 [可确保](https://docs.zama.ai/concrete-ml/explanations/advanced_features#rounded-activations-and-quantizers) 准确率和延迟之间的最佳权衡。

``` python
quant_encoder = compile_brevitas_qat_model(
	encoder,
  (train_sub_set, secret_compile_set),
  rounding_threshold_bits={"n_bits": 7, "method": "approximate"},
  configuration=config,
  verbose=False,
  output_onnx_file="tmp.onnx",
)
```

在上面的代码中，train\_sub\_set 是图像的代表性集合，而 secret\_compile\_set 是一组带有错误代码的 16 位水印。Concrete ML 使用这两个集合来确定 FHE 兼容编译模型的密码参数。

最后，可以将该模型应用于具有 secret 变量中的新水印的加密图像输入：

``` python
encoded_input = quant_encoder.forward(
	input.numpy(),
	np.expand_dims(secret.numpy(), 0),
	fhe="execute"
)
```

水印最初是一个 11 位字符串，通过添加纠错位将其扩展为 16 位：

``` python
secret: tensor([[1., 0., 0., 0., 1., 0., 1., 0., 0., 1., 1.]])
secret+ECC: tensor([[1., 0., 0., 1., 0., 0., 0., 0., 0., 1., 0., 1., 0., 0., 1., 1.]])

```

关于性能的说明：在桌面 CPU 上，完整的执行过程大约需要 20 分钟，而在功能更强大的服务器上，运行速度会快几倍。

**水印提取。**

最后，为了从图像中提取水印，应用了第二个神经网络。在典型的用例中，图像权利所有者会检查他们在网上找到的图像是否是他们拥有权利的图像的副本。

``` python
noised_decoded_secret = decoder(noised_input) > 0.5
noised_secret_bits = tensor2bitarray(noised_decoded_secret[0])
noised_secret = hamming_decode(noised_secret_bits)
noised_secret = bitarray2tensor(noised_secret).unsqueeze(0).float()
print("Original secret", original_secret)
print("Decoded secret", noised_secret)
print("Secret recovered? ", torch.all(noised_secret == original_secret).item())

## 原始 secret tensor([[1., 0., 0., 0., 1., 0., 1., 0., 0., 1., 1.]])
## 解码 secret tensor([[1., 0., 0., 0., 1., 0., 1., 0., 0., 1., 1.]])
## secret 恢复了吗？ True

```

#### **结论**

获奖作品的作者Soptq 成功地实现了一个用于嵌入水印的先进的神经网络。这种方法对各种图像转换具有很强的抵抗力，包括模糊、噪声、重采样、裁剪和 JPEG 压缩。这种鲁棒性是通过独特的训练过程实现的，在该过程中，会随机应用转换，并挖掘出难分样本，以使模型专注于最具挑战性的场景。

亚军解决方案利用了基于 DCT 的分解方法。与获胜的解决方案相比，它提供了更快的性能，但其对图像转换的抵抗力却较低。你可以在此 [Hugging Face space](https://huggingface.co/spaces/horaizon27/fhe_image_watermarking) 上探索第二名的解决方案。

展望未来，私有水印有潜力证明图像的所有权和真实性。它还可以在 [检测图像篡改](https://news.mit.edu/2023/using-ai-protect-against-ai-image-manipulation-0731) 方面发挥关键作用——这在生成式人工智能时代是一个日益严重的问题，在生成式人工智能时代，虚假信息和隐私风险比以往任何时候都更加普遍。

对于 [Zama Bounty Program 的第 8 季](https://github.com/zama-ai/bounty-program/issues/143)，我们邀请社区探索 FHE 如何使用机器学习模型来提高生物年龄估计的隐私性。

#### 附加链接

- Star [Zama 的 Concrete ML GitHub 存储库](http://github.com/zama-ai/concrete-ml) 以支持我们的工作。
- 查看 [Concrete ML 文档](https://docs.zama.ai/concrete-ml)。
- 在我们的 [社区渠道](https://zama.ai/community) 上获得支持。
- 参与 [Zama Bounty Program](https://github.com/zama-ai/bounty-program) 以获得现金奖励！

>- 原文链接： [zama.ai/post/encrypted-i...](https://zama.ai/post/encrypted-image-watermarking-using-fully-homomorphic-encryption)
>- 登链社区 AI 助手，为大家转译优秀英文文章，如有翻译不通的地方，还请包涵～

不可见图像水印是一种将隐藏信息嵌入到数字图像中而不明显改变其外观的技术。

在 Zama Bounty Program 第 7 季期间，我们挑战开发者社区开发一个系统，该系统可以使用 Concrete ML，Zama 的机密 AI 库，使用全同态加密 (FHE) 对加密图像执行不可见水印操作。鉴于生成式人工智能的最新发展和欧盟人工智能法案等监管举措，这种方法尤其具有现实意义，这些举措推动了对人工智能生成内容的可靠数字水印技术的发展。

实际上，FHE 可用于创建一个无需信任的服务，该服务允许在所有生成的图像上实现标准化，从而满足 GenAI 输出中对归属和可追溯性日益增长的需求。

应用包括：

版权保护：证明所有权。
身份验证：验证基于嵌入式水印的图像的真实性。
篡改检测：识别和定位篡改。
数字媒体跟踪：监控图像在平台上的分发和使用情况。

借助 FHE，所有这些应用都可以在不将原始内容暴露给水印服务的情况下执行，从而确保隐私并符合新兴法规。

关注获奖作品

以下两张图片在普通人看来可能完全相同，但其中一张包含不可见的水印。最先进的水印方法通常依赖于机器学习模型，而部署此类模型最方便的方法是通过在线服务。但是，这里有一个关键问题：用户如何确保上传到在线水印嵌入服务的图像保持私密？

在上面的示例中，右侧的图像（包含不可见的水印）是由 Github 用户 Soptq 使用 FHE 构建的隐私保护机器学习模型生成的。

它的模型包含两个部分：

一个私下嵌入水印的编码器神经网络 (NN)。
一个从图像中提取水印的解码器神经网络（如果存在）。

水印是一个 11 位的代码，为了提高其鲁棒性，它通过纠错方案进行了扩充，总共达到了 16 位。由于在使用 Concrete ML 时，量化感知训练 (QAT) 模型具有最佳的准确率-延迟权衡，因此获胜的解决方案使编码器网络适应 QAT 与 Brevitas 一起使用。通常，解码器用于检测公共图像上的任何水印，因此它没有转换为 FHE。

编码器概述。

编码器模型由两个主要模块组成：

水印图像创建模块
水印嵌入模块

def forward(self, image: torch.Tensor, watermark=None):
## 量化输入
watermark = self.quant_watermark(watermark)
watermark = self.watermark2image(watermark)

image = self.quant_image(image)
watermark = self.quant_image(watermark)
inputs = torch.cat([image, watermark], dim=1)

在上面的代码片段中，水印图像由水印位创建，然后与输入图像连接。quant_image 成员是一个 QuantIdentity Brevitas 量化器。由于两个输入已连接，因此它们必须共享相同的量化，如该代码所示。

forward 函数的第二部分创建一个带有跳跃连接的 MUNIT 图像转换网络。同样，对于连接的层输出，会小心地处理量化。

enc = []
x = self.pre(inputs)
for layer in self.enc:
    enc.append(x)
    x = layer(x)

enc = enc[::-1]
for i, (layer, skip) in enumerate(zip(self.dec, enc)):
    if i &lt; self.config.num_down_levels - 1:
        x = layer(x, skip)
    else:
        skip = self.quant_dec(skip)
        inputs = self.quant_dec(inputs)
        x = layer(x, torch.cat([skip, inputs], dim=1))

欠采样和反射填充。

由于 Concrete ML 中无法使用多种类型的层，例如 Upsample、Repeat 和 Reflection Padding，因此赏金获得者使用其他 PyTorch 运算符优雅地实现了它们：

class QuantUpsample(nn.Module):
    def __init__(self, scale_factor):
        super(QuantUpsample, self).__init__()
        self.s = scale_factor

    def forward(self, x):
        n, c, h, w = x.shape
        out = x.reshape(-1, c, h, 1, w, 1)
        out = torch.cat([out] * self.s, dim=-3)
        out = torch.cat([out] * self.s, dim=-1)
        out = out.reshape(-1, c, h * self.s, w * self.s)
        return out

class Reflection1xPad2d(nn.Module):
    def __init__(self):
        super(Reflection1xPad2d, self).__init__()

    def forward(self, x):
        x_pad_right = x[:, :, :, [-2]]
        x_pad = torch.cat([x, x_pad_right], dim=3)

        x_pad_bottom = x_pad[:, :, [-2], :]
        x_pad = torch.cat([x_pad, x_pad_bottom], dim=2)

        return x_pad

模型编译和执行。

使用优化的量化参数编译模型：rounding_treshold_bits，它可确保准确率和延迟之间的最佳权衡。

quant_encoder = compile_brevitas_qat_model(
    encoder,
  (train_sub_set, secret_compile_set),
  rounding_threshold_bits={"n_bits": 7, "method": "approximate"},
  configuration=config,
  verbose=False,
  output_onnx_file="tmp.onnx",
)

在上面的代码中，train_sub_set 是图像的代表性集合，而 secret_compile_set 是一组带有错误代码的 16 位水印。Concrete ML 使用这两个集合来确定 FHE 兼容编译模型的密码参数。

最后，可以将该模型应用于具有 secret 变量中的新水印的加密图像输入：

encoded_input = quant_encoder.forward(
    input.numpy(),
    np.expand_dims(secret.numpy(), 0),
    fhe="execute"
)

水印最初是一个 11 位字符串，通过添加纠错位将其扩展为 16 位：

secret: tensor([[1., 0., 0., 0., 1., 0., 1., 0., 0., 1., 1.]])
secret+ECC: tensor([[1., 0., 0., 1., 0., 0., 0., 0., 0., 1., 0., 1., 0., 0., 1., 1.]])

关于性能的说明：在桌面 CPU 上，完整的执行过程大约需要 20 分钟，而在功能更强大的服务器上，运行速度会快几倍。

水印提取。

noised_decoded_secret = decoder(noised_input) > 0.5
noised_secret_bits = tensor2bitarray(noised_decoded_secret[0])
noised_secret = hamming_decode(noised_secret_bits)
noised_secret = bitarray2tensor(noised_secret).unsqueeze(0).float()
print("Original secret", original_secret)
print("Decoded secret", noised_secret)
print("Secret recovered? ", torch.all(noised_secret == original_secret).item())

## 原始 secret tensor([[1., 0., 0., 0., 1., 0., 1., 0., 0., 1., 1.]])
## 解码 secret tensor([[1., 0., 0., 0., 1., 0., 1., 0., 0., 1., 1.]])
## secret 恢复了吗？ True

结论

亚军解决方案利用了基于 DCT 的分解方法。与获胜的解决方案相比，它提供了更快的性能，但其对图像转换的抵抗力却较低。你可以在此 Hugging Face space 上探索第二名的解决方案。

展望未来，私有水印有潜力证明图像的所有权和真实性。它还可以在检测图像篡改方面发挥关键作用——这在生成式人工智能时代是一个日益严重的问题，在生成式人工智能时代，虚假信息和隐私风险比以往任何时候都更加普遍。

对于 Zama Bounty Program 的第 8 季，我们邀请社区探索 FHE 如何使用机器学习模型来提高生物年龄估计的隐私性。

附加链接

Star Zama 的 Concrete ML GitHub 存储库以支持我们的工作。
查看 Concrete ML 文档。
在我们的社区渠道上获得支持。
参与 Zama Bounty Program 以获得现金奖励！

原文链接： zama.ai/post/encrypted-i...

登链社区 AI 助手，为大家转译优秀英文文章，如有翻译不通的地方，还请包涵～

本文参与登链社区写作激励计划，好文好收益，欢迎正在阅读的你也加入。

使用全同态加密和Zama Concrete ML的加密图像水印

关注获奖作品

结论

附加链接

0 条评论

文章目录