ICICLE V3.5 版本引入了完全 CUDA 优化的非交互式 Sumcheck 协议实现,可用于多线性多项式的任意函数。
Ingonyama 与 Starkware 合作,通过 CUDA 后端加速 Starkware 的 Stwo 证明器,在不改变 Stwo 前端设计的前提下,ICICLE-Stwo 在多个 CPU/GPU 配置中实现了比 Starkware 优化后的 SIMD 后端 3.25x-7x 的性能提升. ICICLE-Stwo 仓库完全开源,可直接替换标准 Stwo 证明器。
CUDA - cuda-fixnum源代码导读
本文讲述了在深度学习和LLM中实现可复现性的挑战,特别是使用Nvidia GPU时,浮点运算的非结合性以及硬件差异会导致结果不一致。文章分享了通过重写GEMM CUDA kernel,避免使用Tensor Cores,并确保运算顺序的确定性来解决这一问题,最终在不同硬件上实现了模型输出的一致性。
本文介绍了ICICLE V1.6.0版本的一系列更新,包括稳定的Golang绑定、多GPU支持、向量运算API、Grumpkin曲线支持、NTT改进和MSM改进。这些更新旨在提升零知识证明(ZKP)加速的性能和效率,并扩展ICICLE的应用范围,如支持更大的电路和更多编程语言。
本文介绍了ICICLE库的更新,该库使用CUDA加速GPU上的ZK证明。主要更新包括:支持Poseidon哈希和优化的Merkle树构建器,新的混合基数NTT算法,改进的MSM设计,以及修复了Rust绑定在Windows上的支持问题。还包括性能测试结果,展示了Poseidon哈希树构建器和NTT算法的性能提升。
ICICLE 是一个使用 CUDA-enabled GPUs 进行 ZK 加速的库。最新版本引入了 ECNTT、列式 NTT 处理、MSM 预计算等新特性,并优化了编译时间。即将发布的 v2 版本将提供丰富的多项式 API,并支持在 GPU 内部运行端到端的证明器。