随着各类 AI 技术模型的进一步成熟,AI 正在被广泛应用于包括 AIGC、自动驾驶、医疗、大数据分析、汽车制造等在内的诸多领域,它通过运算分析在某些场景中智能执行,让生产、工作效率得到质的飞跃。

但另一面,AI 计算带来效率提升的同时,也存在数据泄露的风险。AI 计算需要以来自于不同领域的数据作为燃料,并在此基础上进行分析执行,但这些数据可能会涉及到个人以及商业机密,比如医疗记录、财务信息、个人识别信息、汽车制造参数数据等等,这也引发了人们对于 AI 时代数据安全的担忧。

一个例子是,在去年,微软人工智能研究团队意外泄露了大量数据,这些数据包括用户信息、聊天记录和邮件等敏感信息,虽然该事件并未进一步发酵,但很多科技企业开始重新审视 AI 数据安全问题。另一个例子是,以具备卓越 AIGC 能力的 ChatGPT 模型,其就曾被意大利数据保护局曾指控,涉嫌非法收集用户数据,违反GDPR。而在今年的 3 月 25 日,OpenAI 官方对 ChatGPT 一次临时中断服务的调查报告中承认,该起事故中约有 1.2% 的 ChatGPT Plus 的用户数据可能被泄露。

Privasea 提出了一种基于全局通态加密技术为基础的机器学习方案(FHEML),在该方案的支持下,AI 可以在无需解密加密数据的情况下进行处理与分析,杜绝了 AI 计算以及机器学习过程中所面临的数据泄露隐患,该方案满足包括欧盟的一般数据保护条例(GDPR)的在内的系列合规要求。与此同时,Privasea 通过构建一个 DePIN 众筹算力网络,以为网络中所需要的庞大计算资源提供强大的支撑。Privasea 正在为数据保护、AI 计算机器学习、算力供应以及合规等多个方面,找到了一个新的平衡点。

日前,由币安Labs早期投资的项目Privasea 因其创新的 FHEML 解决方案,而备受 AI和Depin 领域以及加密市场的关注。目前,该项目已经获得了两轮战略融资,包括在预种子/种子轮融资中,获得了共计的 500 万美元,以及在近期,又由 OKX Ventures 、野村证券 Nomura group 控股的 Laser Digtal 、软银参股的孵化器 Tanelabs 等参投的新一轮战略私募轮融资。

本文将进一步对 Privasea 项目进行介绍,以增进读者对于 Privasea 的了解。

1.FHE 技术为何能成为 AI 领域,杜绝数据泄露风险的重要方案?

FHE( Fully Homomorphic Encryption )即全同态加密,它是一种允许对加密数据进行计算的加密形式,即数据被转换成了一个数学结构,使得在保持数据加密状态的同时也能执行计算。这意味着可以在数据保持加密状态的同时进行处理和分析,而处理的结果仍然是加密的。此后,这些加密的结果可以安全地返回给数据的所有者,只有他们可以解密并查看最终结果。

该方案的核心优势在于,前期为数据安全提供了前所未有的保护层,并且尤为适用于 AI 计算以及机器学习领域等。例如,在 AI 环境中,用户可以将加密的数据上传到至 AI 端(或云端)进行存储和计算,而无需担心云服务提供商或其他未授权第三方访问他们的敏感信息。此外,即使在数据传输过程中数据被截获,没有相应的解密密钥,攻击者也无法理解数据的内容。

所以相对于 ZKP(零知识证明)、MPC (多方计算)以及 TEE(受信执行环境)等方案,FHE 更适用于 AI 领域构建self-custodial数据方案,作为密码学的皇冠,甚至被很多人认为是end game。

当然,FHE 方案本身也存在一定的挑战,在这种及其复杂的数学结构中,简单的算术运算在加密数据上执行时都会变得非常复杂,转换和维持这种结构需要大量的计算资源。所以对于 FHE 方案的运算效率需要大量的算力作为支撑,而巨大的算力消耗也将带来巨大的计算资源成本。好的一面是,Privasea 正在通过搭建一套 DePIN 系统,来合理的解决了 FHE 方案所面临的计算资源问题,并推动 FHE 在 AI 领域的规模性采用。

2.Privasea:基于 FHEML 解决方案的 DePIN AI 计算网络

上文提到,Privasea 网络是一个以 FHEML 技术方案为基础,并通过引入区块链激励层,让以从分散的资源点中获得源源不断的计算资源,其旨在解决 AI 领域所面临的潜在数据泄漏问题,并有望成为最安全的 AI ML 方案。与此同时,Privasea 的链下数据安全方案,是目前能够兼顾合规特性,比如满足欧盟的一般数据保护条例(GDPR)的在内的系列法规。

在 Privasea 网络的系统中,包含四个重要的组件,在进行协同计算工作的同时,进一步为系统提供安全和私密的 AI 能力:

  • Privasea FHE Pipeline

Privasea FHE pipeline是Privasea网络的核心组件。这个库建立在zama的THFE-RS库的基础上,并且经过了专门的定制适配,以便更好地满足Privasea项目的需求。通过利用zama的THFE-RS库的强大功能,Privasea FHE库能够提供安全高效的全同态加密(Fully Homomorphic Encryption)方案,从而保护用户的数据。

  • Privasea API

通往 Privasea AI 网络的门户,Privasea API 为开发者提供了一个应用程序编程接口,以将保护数据安全的AI能力集成到他们的应用程序中。该组件提供了一系列工具和功能,以实现与网络的无缝交互。

  • Privanetix

Privanetix 是一个去中心化的计算节点网络,利用众多计算节点的力量来促进加密数据的安全和高效处理。这些高性能计算节点,将共同工作以安全地执行关键的机器学习算法。Privanetix 中的每个节点都配备适用于各种任务模型的FHEML的pipeline,并能够以极高的效率对加密数据进行推理操作,以实现在保护数据保密性的同时,支持高效协作式 AI 应用。

  • Privasea 智能合约套件

Privasea 智能合约系统是 Privanetix 节点的激励驱动,该机制有效地跟踪 Privanetix 节点的注册和贡献,验证它们的计算,并相应地分配奖励。通过利用智能合约,该机制确保了透明度、公平性,并积极激励网络内的参与,这也是 Privasea 网络计算性能的保证 。同时,该组件也将以经济因素为基础,以防止 Privanetix 节点作恶。

基于这套系统,Privasea 为 AI 计算,在用户数据安全、分布式计算资源之间,找到了新的平衡点。而在其通用解决方案的基础上,期定制解决方案也具备两个重要特性,即效率和用户友好性。即用户即便没有密码学或编程能力的用户,也能够易于访问。用户可以轻松导航并利用网络的能力,使他们能够执行FHE AI计算,而无需专门的专业知识。

所以基于 Privasea 网络,用户可以轻松使用 FHE 方案,来加密他们的数据或模型,并将它们上传到 Privasea AI 网络中。上传成功后,用户就可以访问网络中的分布式计算资源,以加密状态对其数据进行机器学习或其他计算。网络支持多种计算模型,包括神经网络、决策树、聚类分析和其他模型,这些模型可以是网络上公开可用的,也可以由用户提供。

目前 Privasea 网络也正在为分布式存储链 BNB Greenfield 进行集成,即生态中的数据将通过 BNB Greenfield 以分布式的方式存储。这意味着用户具备数据的绝对控制权并能灵活利用数据,可以将他们的个人模型,无论是公开还是加密信息上传到网络并以分布式的方式存储,加密结果可以返回给用户或者使用 FHE 密钥转换功能与他人共享。这将进一步提供一种安全分享加密数据的方式,以实现数据价值循环,保护用户数据并促进数据价值共享。

3.以合为导向的链下数据计算方案

Privasea 网络的特性是链下数据安全,完全不涉及资产交易部分,能够兼顾审查特性而非链上完全抗审查,这种方式既通过密码学严格保护了用户的数据安全,又能在需要时支持合规审计来满足任何国家在 AML、反洗钱的法律规定。

与此同时,Privasea 网络能够满足包括欧盟的一般数据保护条例(GDPR)等在内的系列法规,这些规定对个人资料的收集、处理和存储都有严格的要求。Privasea 的链下特性,确保个人数据在模型训练和推理过程中得到保护,而不会类似于 Worldcoin 收集人类身份信息数据。

与此同时,Privasea 网络的另一个关键目标是保护用户的敏感数据免受未经授权的访问。通过在 AI 计算、学习期间使用 FHE 加密敏感数据,网络充当了防止数据泄露和未经授权的入侵的坚固屏障,进一步通过密码学技术加强了数据安全。

4.Privasea 系统的潜在用例

Privasea 方案能够与诸多具备验证、计算分析需求的诸多场景高度结合,以用于数据的保护,潜在场景包括生物识别、医疗、金融、安全云数据计算、匿名投票系统等等。

  • 生物识别

目前,以 Privasea 技术方案为基础,首个生物识别(面部识别)应用即将面向市场。在该人脸识别应用中,客户端安全地嵌套在用户设备上,以 FHE 技术为基础,通过加密的方式对客户端密钥进行保护,同时保证服务器数据计算过程永久加密,在实现加密人脸比对的同时保护个人信息。

在该示例中,当用户通过客户端上传其面部特征照片时,系统不是发送原始图像,而是在本地将它们转换为加密矢量,保留独特的属性,这些向量使用客户端密钥进行安全加密,在传输到Privasea 网络强化的后端服务器进行严格保护。这也意味着这些原始图像是被屏蔽的,用户可以对 Privasea AI 数据库可信。

而当用户与替代图像进行面部匹配时,客户端在本地提取面部特征,通过加密保护嵌入向量,并将其安全地发送到我们的服务器。在密文域内,服务器将执行人脸匹配算法,同时保持数据保密性。经过细致的处理后,服务器会提供加密的结果,可以使用客户端的密钥专门解密以确认匹配。

所以从始至终,用户存储在 Privasea (实际上,这些加密数据以分布式的方式存储)中的面部数据都是以加密的形态存在,并以 FHE 方案为基础在加密的状态完成面部对比,从始至终不会泄露原始面部数据,并能够保证数据安全。而以该方案为基础,能进一步衍生出包括Proof of Human,Secure KYC等在内的一系列类似的应用场景。

  • 医疗

Privasea 网络的潜在应用示例可以包括医学图像处理,比如基于其高性能计算资源来对一些医学诊断影像进行分析。基于 Privasea 网络系统,医疗专业人员和研究人员可以使用分布式的计算资源网络来处理医学图像,同时保持患者数据安全。

一个示例是,放射科医生可以使用 Privasea AI 网络处理一项研究中的大量医学图像数据集。该网络可以用来将处理工作负载分布在多个节点上,合并结果以提高分析的准确性。在处理和分析阶段,患者数据将被加密和保护。

包括 X 光或 MRI 等在内的扫描医学影像数据,可以使用 FHE 方案进行加密,并以加密数据的形式存储或者传输,并通过 Privasea AI 对加密的医学图像进行处理,在这个过程中,网络为 AI 处理提供了一个分布式的计算资源网络。该方式能够有效的保护患者的数据,同时还有望对 AI 模型进行有效训练。而在医疗处理完成后,加密的医学图相在被解密,可供医疗专业人员使用。

通过结合使用 FHE 加密和 Privasea AI 网络,可以在保护患者数据的同时,安全高效地处理医学图像。该系统不仅提升了医学图相领域提供了一个可拓展、提升成本效益的解决方案,同时也进一步提升了患者信任。前沿技术的采用,也有望让医疗效率、医疗水平进一步实现提升。

在金融领域中,Privasea 网络基于 PHE 方案以及 Privasea AI 网络,也能够为包括银行交易、贷款审查等在内的系列场景建立数据保护,并有望进一步提升金融机构处理业务的准确率与效率,并有望大幅处理降低成本。

目前,Privasea 已被纳入 Google Cloud Web3 启动计划,这也意味着 Privasea 的基于 FHE AI 网络,有望进一步通过更好的 Google Cloud service集成,以服务于更多的潜在用例。

此外,作为目前 FHE 技术领域的佼佼者,Privasea 也始终在致力于推动密码学技术在加密行业的进一步采用。据悉在今年 3 月底,Privasea 将联合 Zama等头部 Web3 FHE 赛道的创业公司,开展以 “致力于 FHE 在web2和web3中的研究发展和应用推动”为主题的闭门学术研讨会。此前,该系列技术会议已经连续举办三年,并在 FHE 技术方案的创新上不断取得突破。

5.未来展望

在 AI 技术的发展进程中,潜在的数据泄露风险正在成为最大的阻碍因素,很多人认为 AI 的发展甚至正在挑战数据法律法规,这也让具备提升效率的 AI 技术目前难以在诸多潜在应用场景中落地。而算力资源的不足,也同样是 AI 模型难以有效训练、AI 技术难以规模性采用的一个重要症结。

Privasea 系统以 FHEML 方案为基础,支持在加密数据上直接进行复杂计算,为各类场景提供数据保护的同时,兼具可审计性,并符合各类数据法规的要求。与此同时,Privasea 通过引入分布式的计算网络 Privanetix,通过激励层以 DePIN 的方式,吸引不同的计算节点将分散的算力资源引入网络中,建立一套面向 Web3 的算力众筹网络,这将为 FHE 的加密运算、AI 的模型训练与计算,提供源源不断的算力支持,并引领新一轮 DePIN AI 算力众筹的全新革命。

在 Privasea 网络的推动下,FHE 方案有望被规模性采用,并成为加密领域的主流方案。AI 也能够技术也能够在保证数据安全、符合数据法规的前提下,与法律法规相适配,与各类场景深入的融合,并被广泛的采用,以更好的成为提升人类生产力的工具。

与此同时,Privasea 网络也正在构建一套以合规为特点的数据价值流转体系,通过建立真正的用户数据主权,让数据拥有者掌握数据价值,构建一套全新范式的数据价值体系。以此为基础,Privasea 有望成为万亿应用市场的全新价值载体,并不断凸显价值。