区块链 > 区块链技术 > 全同态加密详细解释

区块链中最近崛起全同态加密FHE是什么?全同态加密解读

2024-07-14 18:42:59 佚名
简介最近火爆区块链技术圈的全同态加密(FHE)是什么?全同态加密(FHE)讲给未来带来什么?今天脚本之家小编将给大家详细解读全同态加密(FHE),需要的朋友一起看看吧

什么是全同态加密(FHE)?全同态加密(FHE)能给我带来什么?多年来,全同态加密(FHE)一直是一个承诺强大端到端加密的理念,预示着强大数据隐私的未来。最近的发展开始将 FHE 从理论梦想转变为实际现实。尽管各公司竞相成为首个实现强大、完全功能的 FHE 版本的先驱,但许多公司正在合作共同应对这项强大技术的复杂性。今天脚本之家小编给大家详细解读全同态加密(FHE),希望大家喜欢!

当我第一次听说“全同态加密”(FHE)时,我对区块链领域倾向于给时髦概念起长名称感到好奇。多年来,我们遇到了许多席卷整个行业的时髦词汇,最近的一个是“零知识证明”(ZKPs)。

经过一番调查和探索正在使用 FHE 构建产品的新公司,我注意到了一个充满了一套全新工具的前景。在未来的几个月和几年里,FHE 可能会像 ZKPs 一样成为席卷整个行业的下一个重大技术。公司正在利用密码学和云计算各个领域的最新进展,为通向一个强大的、保护数据隐私的未来铺平道路。问题不在于我们是否能实现这一点,而在于何时实现,我相信 FHE 可能是推动数据隐私和所有权进步的关键推动因素。

在接下来的几周里,我将深入学习更多关于 FHE 的知识,并研究其局限性、潜力和应用。我将在一系列文章中分享我的研究结果,探讨围绕 FHE 的对话的不同方面。本周,我将介绍这项技术,并讨论为何它最近引起了很多关注。许多行业内的人都在谈论它,包括来自 Multicoin Capital 的 Kyle Samani[4],他说:

“FHE 是密码学的圣杯。随着时间的推移,FHE 将重塑所有计算的结构,无论是在 web2 还是 web3 中。”

什么是同态性(Homomorphism)?

解决问题的关键是理解“同态”的含义。追溯其根源,同态性起源于数学,被定义[5]为两个相同类型的代数结构之间保留核心组件的映射。

如果你和我一样更喜欢一个更实际的定义,数学背后的一个基本原则是,两个群体不需要完全相同才能具有相同的核心属性。例如,想象两个水果盒:

盒子 A 包含小水果。
盒子 B 包含大水果。

尽管个别水果大小不同,但在盒子 A 中榨一个小苹果和一个小橙子会产生与在盒子 B 中榨一个大苹果和一个大橙子相同口味的混合果汁。榨果汁以产生相同口味类似于保留两个盒子之间的核心组件。假设我们的主要关注点是相同的口味,那么我们从哪个盒子榨果汁并不重要,因为果汁的数量大小不是我们关注的重点。在关注的地方(口味)两个盒子是等价的,因此它们之间的差异(大小和数量)对其主要功能(产生特定果汁口味)没有影响。

与同态性类比,我们捕捉到了它的两个主要特征:

什么是全同态加密?

将这一切与本文的中心主题联系起来, 全同态加密[6] (FHE)是一种特定的数据加密方法,使人们能够在加密数据上执行计算而不泄露原始数据。理论上,对加密数据执行的分析和计算应该产生与对原始数据执行的相同结果。通过 FHE,我们建立了加密数据集中的数据与原始数据集中的数据相对应的 1:1 关系。在这种情况下,核心组件的保留是能够在任一数据集上执行任何计算并产生相同结果的能力。

在这样的背景下,许多公司已经采取预防措施来保护用户数据并保持差异化隐私。公司很少以原始、未加密的形式在云端或其数据库中存储数据。因此,即使攻击者控制了公司的服务器,他们仍然必须绕过加密才能读取和访问数据。然而,当数据仅仅加密并闲置时,数据就不再有趣。当公司希望对数据进行分析以得出有价值的见解时,他们除了解密数据之外别无选择。一旦解密,数据就会变得脆弱。然而,通过端到端加密,FHE 变得非常有用,因为我们不再需要解密数据来进行分析;这只是揭示了可能性的冰山一角。

一个关键的考虑是公司是否应该被允许阅读和存储我们的个人信息。许多人对此的标准回应是,公司需要查看我们的数据才能为我们提供更好的服务。

如果 YouTube 不存储我的观看和搜索历史等数据,算法就无法充分发挥作用,向我展示我感兴趣的视频。因此,许多人认为在数据隐私和获得更好服务之间进行权衡是值得的。然而,通过 FHE,我们不再需要做出这种权衡。像 YouTube 这样的公司可以在加密数据上训练他们的算法,并为最终用户产生相同的结果,而不侵犯数据隐私。具体来说,他们可以对我的观看和搜索历史等信息进行同态加密,分析它而无需查看它,然后根据分析向我展示我感兴趣的视频。

FHE 是迈向一个未来的重要一步,其中我们的数据不再是我们自愿向组织免费提供的有价值商品。

 同态与全同态加密,到底是个啥?

如果直接看 Portal Ventures 的原文,您可能会对全同态加密(FHE)的复杂数学描述感到困惑。

事实上,密码学的世界充满了深奥和技术性,但我们完全可以用简单和通俗的方式来解释这些概念。在这一节中,笔者试图为您提供一些更直观、更易于理解的例子,帮助您深入了解全同态加密。

首先,想象一个“秘密魔盒”。您可以将任何物品放入这个盒子,并锁定它。一旦锁定,您就不能看到或触摸盒子里的内容。但是,令人惊奇的是,这个魔盒允许您在不打开它的情况下,改变里面物品的颜色或形状。

如上图所示,全同态加密(Fully Homomorphic Encryption)可以被视为一个魔法盒子:

你的信封 (Your Envelope): 这代表你想加密的原始数据。

魔法盒子操作 (Magic Box Operation): 即使不解密或打开信封,你也可以在信封里的数据上进行操作(如加、减等计算)。

新的信封 (New Envelope): 经过魔法盒子操作后,你会得到一个新的加密结果。

这就是同态加密的基本思想:在不了解数据本身的情况下,也能对加密的数据进行操作。

这个通俗的例子有助于搞清楚"全同态加密"在干什么。但实际上,这个概念本身还是有点听君一席话如听一席话。那么,什么又叫做“全”和“同态”?

什么叫做“全”(Fully)?

在密码学中,加密方案可以支持多种操作,比如加法、乘法等。当我们说一个加密方案是“全同态”的,我们意味着这个加密方案支持在加密数据上进行任意数目的基本运算(例如加法和乘法)而不需要解密。这与部分同态加密(如只支持加法或只支持乘法的方案)形成对比。

什么叫做“同态”(Homomorphic)?

"同态"来自于希腊文,意思是“相同的形状或结构”。在密码学中,当我们说加密方案是同态的,意味着有些运算在明文上的效果与在密文上的效果是一样的。换句话说,如果你在加密的数据上进行某种运算,然后解密结果,这和你先解密数据然后在解密后的数据上进行相同的运算是等价的。

例如,考虑一个支持同态加法的加密方案。假设你有两个数字:3 和 4。你可以先加密这两个数字,然后使用这个同态加密方案将两个加密的数字相加。最后,你解密相加后的结果。得到的解密结果将是7,这与你直接在明文3和4上相加得到的结果是一样的。

但是,您可能会问,我们如何在非数字上进行这些加减乘除操作呢?实际上,我们可以使用特定的编码方法将非数字数据转化为数字形式,从而在它们上进行加法和乘法等运算。这意味着全同态加密的应用不仅仅限于数学计算,它还可以被广泛应用于其他领域。

为了更直观地解释这个概念,让我们考虑医疗数据的例子。

假设医院有一些患者数据,比如年龄和血糖值,但出于隐私考虑不希望直接发送给云服务提供商进行分析。

通过使用全同态加密,医院可以先将这些数据加密。

想象一下,云服务提供商需要计算所有患者的平均年龄(这需要加法和除法)和血糖值的总和与患者数量的乘积(这涉及加法和乘法)。

所有这些计算都可以在加密的数据上完成,而无需解密。云服务提供商在不解密数据的情况下完成计算,然后将加密的结果返回给医院。这确保了数据的隐私,同时也满足了数据处理的需求。

这就是全同态加密的魅力所在,它为我们提供了一个既安全又灵活的数据处理方法。

全同态加密的应用

正确应用全同态加密(FHE)是所有存储用户数据部门的突破。我们正在看一个技术,它可能改变我们对数据隐私的整体态度,以及公司可以接受的侵犯限度。

让我们从研究 FHE 如何重塑医疗保健行业[7]的数据实践开始。许多医院保存着存储在其数据库中的患者的私人记录,出于道德和法律原因,他们必须保持保密。然而,这些信息对于外部医学研究人员来说是有价值的,他们可以分析这些数据以推断疾病和潜在治疗方法的重要见解。一个拖慢研究进展的主要障碍是在将数据外包给研究人员时保持患者数据的绝对保密。有许多方法可以对患者记录进行匿名化或伪匿名化。但它们并不完美,可能会透露某人太多信息,使其可识别,或者不足以揭示有关他们病例的足够信息,使得难以获得有关疾病的准确见解。使用全同态加密(FHE),医院可以对患者数据进行加密,从而更轻松地保护云中的患者隐私。医学研究人员可以在加密数据上执行计算和运行分析功能,而不会损害患者的隐私。由于加密数据集与原始数据之间存在一对一映射,因此从加密数据集中获得的结果提供了可以应用于实际案例的真实见解。FHE 可以快速推动医疗保健行业的发展。

另一个 FHE 的激动人心的应用是人工智能(AI)训练。目前,人工智能领域面临隐私问题,这阻碍了公司访问许多用于完善 AI 算法的广泛数据集。训练 AI 的公司必须在使用有限的公共数据集、支付大量资金购买私人数据集或创建数据集之间做出选择,这对用户较少的小公司来说是具有挑战性的。FHE 应该解决阻止许多数据集提供者进入该市场的隐私问题。因此,FHE 的改进可能导致可用于训练 AI 的数据集数量增加。这将使 AI 训练更具财务可及性和精细化,因为可用数据集的多样化增加。

全同态加密的过去局限

如果全同态加密(FHE)确实能改变现代大数据,为什么我们还没有看到更多实际应用呢?

尽管多年来人们一直在讨论和研究 FHE,但实际上,在实践中实现 FHE 非常困难。核心挑战在于执行 FHE 所需的计算能力。全同态安全数据集可以产生与其原始数据形式相同的分析结果。这是一个具有挑战性的壮举,需要大量计算速度和能力,其中许多对现有计算机实施起来是不切实际的。在原始数据上通常需要几秒钟的操作,在同态加密数据集上可能需要几小时甚至几天。这种计算挑战造成了一个自我延续的循环,许多工程师推迟了进行 FHE 项目,从而减缓了其发展并限制了其全部优势的实现。

工程师在 FHE 中面临的计算问题的一个具体例子是如何解决“ 噪声错误[8] ”。在对同态加密数据集进行计算时,许多工程师在每次进行计算时都会产生多余的噪声或错误。当只需要进行几次计算时,这是可以容忍的,但在多次分析之后,噪声可能变得如此明显,以至于原始数据变得难以理解。数据几乎丢失了。

为什么现在?

就像生成式人工智能[9]曾被认为是有限和原始的,然后成为主流一样,全同态加密(FHE)正朝着类似的进展方向发展。许多行业领袖,甚至超越区块链领域的领导者,已经聚集起来,组织了大量的 FHE 研究和开发。这促进了最近几项行业发展,推动了这项技术的进步的引人注目的叙述。

DPRIVE 计划

2021 年 3 月,微软、英特尔和国防高级研究计划局(DARPA)同意启动一个多年计划[10] ,以加速全同态加密(FHE)的发展。名为虚拟环境中的数据保护(DPRIVE)的这个计划标志着 FHE 的重大进展。它展示了两个专门从事云计算和计算机硬件的行业巨头,联合起来解决数据隐私问题。他们发起了这个计划,建立了能够管理 FHE 计算速度的计算机和软件,并制定了准确实施 FHE 的指导方针,防范由于不正确使用而可能产生的数据泄霏。

作为 DPRIVE 计划的一部分,工程师们已经着手解决先前提到的“噪声错误”,探索降低噪声水平以保留原始数据的方法。一个有前途的解决方案是设计大算术字长[11] (LAWS)数据表示。虽然传统的计算机处理器(CPU)通常使用 64 位字长,但工程师们正在开发能够处理 1024 位或更多位字长的新型硬件,采用 LAWS。这种方法是有效的,因为研究表明,更长的字长直接影响信噪比。简单地说,更长的字长在 FHE 中的每一次附加计算中产生更少的噪声,允许在达到数据丢失阈值之前执行更多的计算。通过构建新的硬件来解决这些挑战,参与 DPRIVE 计划的工程师们大大减少了执行 FHE 所需的计算负载。

为了加快计算速度,接近使 FHE 快 100,000 倍的目标,DPRIVE 团队着手进行持续的旅程,设计新的数据处理系统,超越传统处理和图形单元的能力。他们开发了一个新的多指令多数据[12] (MIMD)系统,能够同时管理多个指令和数据集。MIMD 类似于建造一条新的高速公路,而不是使用现有设备不足的道路来容纳 FHE 的快速实时计算所需的交通量。

DPRIVE 计划的有趣之处在于在计算机数学计算中广泛使用“ 并行性[13] ” 。这使开发人员能够同时执行多个大数计算。你可以将并行性视为同时部署一群数学家来同时处理巨大数学问题的不同部分,而不是让他们一个接一个地完成各自的工作。尽管同时执行多个计算有助于快速解决问题,但计算机必须进行空气冷却以防止过热。

2022 年 9 月,在启动该计划一年半后,微软、英特尔和 DARPA 宣布[14]他们已成功完成 DPRIVE 计划的第一阶段。他们目前正在进行 DPRIVE 的第二阶段。Intel 还推出[15]了自己的全同态加密工具包,为开发人员提供工具,以促进云中更快的全同态加密。Intel 设计了这个工具包,确保与最新的数据处理和计算进展兼容。它包括专门为格密码定制的特殊功能,与 Microsoft Seal 无缝运行的集成,全同态加密方案的样本,以及指导用户的技术文档。

Google 的 Private Join and Compute[16] 开源库为开发人员提供了多方计算(MPC)工具。这种计算方法允许各方通过合并其不同的数据集获得共享见解,而不会将原始数据暴露给彼此。Private Join and Compute 将来自 FHE 的加密技术与私有集合交集(PSI)相结合,以优化数据保密性实践。PSI 是另一种加密方法,允许具有不同数据集的各方识别共同元素或数据点,而不会透露其数据。Google 在推进数据隐私方面的方法不仅仅集中于 FHE;它通过将 FHE 与其他有影响力的数据实践集成,优先考虑更广泛的 MPC 概念。

备受推崇的全同态加密开源库的日益可用性值得注意。然而,当观察到备受推崇的公司在其运营中尝试这些库时,情况变得更加引人注目。2021 年 4 月,纳斯达克,一家著名的股票交易所和全球资本市场技术实体, 将[17] FHE 纳入其运营。纳斯达克利用 Intel 的 FHE 工具和高速处理器,通过使用全同态加密来识别包含敏感信息的数据集中的有价值见解和潜在的非法活动,从而通过反洗钱工作和欺诈检测来应对金融犯罪。

最近的融资

除了前面提到的公司进行的研究和开发外,还有其他几家公司最近为专注于全同态加密(FHE)的倡议获得了大量资金支持。

Cornami[18],一家大型技术公司,因开创性地开发专为全同态加密设计的可扩展云计算技术而备受赞誉。他们从事众多努力,旨在创建支持 FHE 比传统 CPU 更有效的计算系统。他们还指导旨在保护加密数据免受量子计算威胁的倡议。2022 年 5 月,Cornami 宣布[19]成功进行了一轮 C 系列融资,由 Softbank 领投,筹集了 6800 万美元,使其总筹资达到 1.5 亿美元。

Zama[20]是区块链行业的另一家公司,正在构建开源全同态加密工具,开发人员可以利用这些工具构建使用 FHE、区块链和人工智能的令人兴奋的应用程序。Zama 已经开发了全同态以太坊虚拟机(fhEVM)作为其产品之一。这种智能合约协议使得在链上的交易数据在处理过程中保持加密。探索使用 Zama 库进行各种应用程序的开发人员对其性能印象深刻,即使在复杂的用例中也是如此。Zama 在 2022 年 2 月[21]成功完成了 4200 万美元的 A 轮融资,由 Protocol Labs 领投,使其总筹资达到 5000 万美元。

Fhenix[22]也是一个新兴项目,将 FHE 引入区块链。他们的目标是将 FHE 应用扩展到除保密支付之外的领域,为 FHE 在去中心化金融(DeFi)、桥接、治理投票和 Web3 游戏等领域的令人兴奋的用例[23]打开大门。2023 年 9 月,Fhenix 宣布[24]成功完成了 700 万美元的种子轮融资,由 Multicoin Capital 和 Collider Ventures 领投。

为何FHE很重要?

当前,对加密数据进行计算的现有方法并不理想。它们在资源使用和时间消耗上都相对昂贵。

因此,行业标准流程是,在进行计算之前,由第三方(即公司)对数据进行解密。

以一个具体的例子来说,想象一下您有一个数据文件,其中包含一些高调个体的财务信息。

我们称这个文件为“M”。我们需要某个公司对这些数据进行分析。

目前的流程是怎样的呢?首先,我使用如RSA或AES这样的加密函数对M进行加密。此时,M变成了E(M),其中E是加密函数。

接下来,我将E(M)发送给公司服务器。公司现在通过相关的解密函数D来解密E(M)为明文,即D(M)。

公司直接对文件M进行明文进行分析操作。

操作完后,再把M加密一次,生成一个E(M')。

公司再把加密的M'并将其发送回给我,然后我再次解密它。

发现了吗,这里的关键问题在于,当公司解密M并将其存储在其服务器上进行计算时,第三方可以访问原本应受保护的敏感数据。如果该人员遭到黑客攻击或有恶意意图,这就会引发问题。

全同态加密(FHE)通过允许对加密数据进行计算来解决此问题。公司不再需要解密E(M)。它直接在加密数据上进行分析。没有解密的需要,也不需要信任假设。

综上所述,全同态加密的引入解决了当前数据处理流程中的一个关键问题,即在第三方处理数据时可能暴露的隐私风险。FHE为我们提供了一个在保证数据隐私的同时,有效地处理加密数据的方法。

FHE在Crypto中如何应用?

全同态加密(FHE)为加密世界开启了一扇新的大门,为我们带来了许多之前无法想象的应用场景。Poly Venture的原文对场景的描述比较简单,我们试着用一张表更有条理的做出了一个解读。

FHE vs ZK vs MPC,傻傻分不清?

在了解了全同态加密(FHE)后,很容易将其与其他熟悉的技术,如零知识证明(ZK)和多方计算(MPC)相提并论。乍一看,它们似乎都致力于解决相似的隐私和计算问题。但这三者之间实际上有哪些联系和区别呢?

首先,我们先了解一下这三种技术的基本定义:

FHE:允许在加密数据上执行计算,而无需解密。

ZK:允许一方向另一方证明某个陈述是真实的,而无需揭示任何关于该陈述的具体信息。

MPC:使多方能够共同在他们的私有数据上执行计算,而不向其他参与者泄露输入数据。

然后,让我们从多个维度来看看他们的异同和交集:

目的:

FHE的主要目的是在不解密的情况下进行计算。

ZK的目标是证明一个事实的正确性而不泄露有关该事实的任何信息。

MPC的目标是允许多方安全地共同计算,而不泄露各自的输入。

隐私与计算:

在ZK中,计算不一定是私有的。例如,尽管你可以使用ZK来验证银行账户余额是否超过100,000美元,但进行这样的验证的计算不一定是私有的。

与此相反,FHE确保了计算的隐私性,因为所有的计算都在加密数据上进行。

限制与挑战:

MPC需要至少一个诚实的服务器,并且可能受到DDoS攻击、沉默合谋攻击和通信开销的影响。

ZK主要用于证明正确性,而不是隐私技术。

FHE尽管提供了强大的隐私,但计算效率较低,对资源的需求较大。

在加密领域的应用:

FHE可以用于构建更加隐私的智能合约和其他区块链应用。

ZK被用于创建可扩展的区块链解决方案,如zk-rollups。

MPC主要用于私钥管理和托管。

交叉使用:

MPC可以与FHE结合,形成阈值FHE,通过将一个FHE加密密钥分割成多个,并给每个参与者一个来增强安全性。

zkFHE是零知识证明和全同态加密的结合,正在被研究,以实现在FHE智能合约上的zk-rollups。

总体来说,尽管FHE、ZK和MPC在某些方面有所重叠,但它们都有各自独特的优势和应用场景。在加密世界中,这三种技术都为增强隐私和安全性提供了巨大的潜力,但它们的结合和进一步的研究仍然是加密社区的一个活跃领域。

最后,我们也可以给出一张省流版的表格,将上述技术放在一起进行比较,帮助大家更加直观的进行理解。

 接下来会发生什么?

多年来,全同态加密(FHE)一直是一个承诺强大端到端加密的理念,预示着强大数据隐私的未来。最近的发展开始将 FHE 从理论梦想转变为实际现实。尽管各公司竞相成为首个实现强大、完全功能的 FHE 版本的先驱,但许多公司正在合作共同应对这项强大技术的复杂性。通过实施各种跨团队计划和开发与其他库集成的开源库,这种合作精神是显而易见的。

根据我的调查,围绕 FHE 的讨论似乎是深远的。在接下来的几周里,我很高兴深入研究,分享我在 FHE 研究中的更多见解。具体来说,我迫不及待地探索以下主题:

FHE 的新兴应用。

零知识证明(ZKPs)与 FHE 之间的相互作用。

将 FHE 与私有集合交集(PSI)集成以推进安全多方计算(MPC)。

像 Zama 和 Fhenix 这样的新公司,在 FHE 领域开创性发展。

FHE的未来展望

通过上文可以感觉到,全同态加密(FHE)显然是一种强大的技术。

但为什么它还没有被广泛采用,甚至在加密CT中很少提及?一方面由于理解技术本身有一定门槛,另一方面则在于FHE技术目前还面临一些挑战,难以轻松以商业化形态走进大众视野。

面临的挑战可能有:

计算密集:当我们的密文互相作用时,为了维持安全性,会添加更多的噪声。FHE方案使用“自举”技术来减少噪声,但这非常计算密集,资源消耗很大。

功能有限:FHE的计算仅限于加法、乘法及其变种/组合。例如,不能在FHE中使用if语句,因为内容是加密的。此外,构建相对复杂的操作,如比较和除法,需要仔细规划基本逻辑,这导致了更复杂的编程技巧和计算效率较低。

兼容性/组合性问题:现有的应用程序和服务提供商并不是为了在加密数据上进行计算而构建的。这限制了FHE与现有技术的整合,并增加了开发FHE兼容应用所需的惯性。

可能的解决方案:

硬件加速器:某些FHE方案,如nuFHE和cuFHE,可以使用GPU加速,但主要的突破将来自更快的FPGA和ASIC。其他技术,如光子技术,也正在被研究,以加速FHE的硬件用例。

新的编程范式:就像在Python上用于复杂数学的包如pandas和numpy,FHE库也将被构建。目前,Zama和Sunscreen是两个为FHE构建此类库和SDK的项目。此外,还需要构建专门的编译器,以使开发人员能够统一FHE、ZKP和MPC。

FHE与现有解决方案之间的整合:将构建解决方案,使现有工具与FHE兼容,作为工具和FHE加密数据之间的中间层。

最后,Portal Ventures在原文的结论部分再次强调:

“FHE是计算的圣杯,我们正在接近它的商业化。价值和计算正在向开放、无需许可的网络过渡,我们相信FHE将支撑大部分所需的基础设施和应用程序”。

此外,它们也表达了对于目前正在研究FHE的项目的兴趣。因此,我们可以看到的是,VC对FHE有兴趣,或者说VC会率先对尚未走进大众视野的硬核技术感兴趣。

历史表明,基于新技术的加密项目,往往都带有闪亮的光环和较高的估值,并且受到各路资本的追捧。

在下一场盛宴开始前,我们的确应该多花时间,提前研究入场嘉宾的身份,才能在宴会开始时应对自如。

本站提醒:投资有风险,入市须谨慎,本内容不作为投资理财建议。

相关文章