如何运用 Julia 言语完成「同态加密+机器学习」？

学术plus
2019-12-16 18:31:46 3

+关注

引言

假设你正在开发一款先进的机器学习模型，并计划将其部署，以提供服务给用户。最简单的方法是直接发布模型，让用户在本地运行。然而，这种方法存在一些问题：

存储空间不足：机器学习模型通常较大，用户的设备可能无法容纳。
频繁更新：模型需要定期更新，频繁在网络上传输大型模型可能不太实际。
高昂的成本：开发模型需要大量的时间和计算资源，收费模式可能是降低成本的一种选择。

因此，一种常见的解决方案是将模型作为API部署在云端。尽管这种方式提高了便利性，但也带来了数据隐私和安全的问题。用户的数据可能会被远程服务器处理，而这些服务器可能不可信。因此，如何在保护用户隐私的同时，提供高效的服务成为了一个重要的议题。

同态加密（Homomorphic Encryption）

同态加密是一种允许在加密数据上直接进行计算的技术，而无需先解密数据。这种技术使得在不暴露原始数据的情况下处理数据成为可能。本文将介绍如何利用Julia语言实现基于同态加密的数据处理，具体来说，是用于手写数字识别任务的机器学习模型。

同态加密的基本概念

同态加密技术的核心在于能够在加密状态下直接对数据进行计算，而无需解密。这种加密方案允许对加密数据执行某些特定的操作，如加法或乘法，从而得到相应的加密结果。这些操作包括但不限于以下几种：

部分同态：仅支持单一操作（如加法或乘法）。
有限同态：支持多种操作，但对电路大小有限制。
全同态：支持任意复杂的计算操作，没有大小限制。

目前，已经有许多高效的同态加密软件包，其中最为知名的是Microsoft SEAL和PALISADE。本文使用的是一种名为CKKS（Cheon-Kim-Kim-Song）的同态加密方案，其主要优点是对近似数值的支持较好。

使用Julia实现同态加密

本文将以一个简单的示例展示如何使用Julia语言实现同态加密。首先，我们需要引入相关库，并生成必要的密钥对。

```julia using ToyFHE

选择参数

ℛ = NegacyclicRing(2N, (40, 40, *40)) params = CKKSParams(ℛ) scale = FixedRational{2^40}

生成密钥对

kp = keygen(params) ```

接下来，我们将数据进行加密，并展示如何进行基本的加法和乘法运算。

```julia

加密数据

plain = CKKSEncoding{Tscale}(zero(ℛ)) plain .= OffsetArray(vec([1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0]), 0:(N÷2-1)) c = encrypt(kp.pub, plain)

解密数据

decrypt(kp.priv, c)

加法

decrypt(kp.priv, c + c)

乘法

csquared = c * c decrypt(kp.priv, csquared) ```

为了进一步优化计算效率，我们需要处理密文的长度和规模。这可以通过密文的重新线性化（keyswitch）和模切换（modswitching）来实现。

```julia

重新线性化

ek = keygen(EvalMultKey, kp.priv) clength2 = keyswitch(ek, c_squared)

模切换

csmaller = modswitch(clength2) decrypt(kp.priv, csmaller) ```

机器学习模型

接下来，我们将介绍如何在加密数据上运行一个简单的机器学习模型。本文将使用Flux.jl库构建一个卷积神经网络（CNN），并在加密数据上进行推理。

```julia

定义模型

function reshapeandvcat(x) let y = reshape(x, 64, 4, size(x, 4)) vcat((y[:, i, :] for i in axes(y, 2))...) end end

model = Chain( Conv((7, 7), 1 => 4, stride=(3, 3), x -> x.^2), reshapeandvcat, Dense(256, 64, x -> x.^2), Dense(64, 10), ) ```

高效计算

在实际应用中，我们需要高效地处理加密数据上的卷积和矩阵乘法。通过一些技巧，可以将这些计算转化为加密数据上的有效操作。

卷积

卷积操作可以分为多个步骤，包括窗口提取、向量重构和加密。以下是具体步骤：

```julia

提取窗口

function publicpreprocess(batch) ka = OffsetArray(0:7, 0:7) I = [[batch[i′*3.+(1:7), j′*3.+(1:7), 1, k] for i′ = ka, j′ = ka] for k = 1:64] Iij = [[I[k][l...] for l in product(ka, ka)] for k = 1:64] end

加密窗口

Iij = publicpreprocess(batch) CIij = map(Iij) do Iij plain = CKKSEncoding{Tscale}(zero(plaintextspace(ckks_params))) plain .= OffsetArray(vec(Iij), 0:(N÷2-1)) encrypt(kp, plain) end ```

矩阵乘法

矩阵乘法可以通过旋转向量来实现。以下是具体的实现方法：

julia function encrypted_matmul(gk, weights, x::ToyFHE.CipherText) result = repeat(diag(weights), inner=64) .* x rotated = x for k = 2:64 rotated = ToyFHE.rotate(gk, rotated) result += repeat(diag(circshift(weights, (0, (k-1)))), inner=64) .* rotated end result end

结论

通过以上步骤，我们展示了如何使用Julia语言实现基于同态加密的机器学习模型。这种技术不仅提高了数据安全性，还保证了在保护用户隐私的同时，提供高效的服务。希望本文能为读者提供有价值的参考。

图灵汇

责任编辑：：学术plus

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。

同态加密言语运用机器完成如何学习 Julia

刘雯蕊

2019-12-17

引言

同态加密（Homomorphic Encryption）

同态加密的基本概念

使用Julia实现同态加密

选择参数

生成密钥对

加密数据

解密数据

加法

乘法

重新线性化

模切换

机器学习模型

定义模型

高效计算

卷积

提取窗口

加密窗口

矩阵乘法

结论

机器学习很复杂？弄清楚过程三部曲你就完全入门了