Ebpay

亿信ABI

一站式数据分析平台

ABI(ALL in one BI)是Ebpay历经18年匠心打造的国产化BI工具,技术自主可控。它打通从数据接入、到数据建模与处理、再到数据分析与挖掘整个数据应用全链路,可满足企业经营中各类复杂的分析需求,帮助企业实现高效数字化转型。

在线免费试用 DEMO体验 视频介绍

亿信ABI

一站式数据分析平台

Ebpay深耕商业智能十多年,
打造一体化的填报、处理、可视化平台。

隐私计算能否成为数据流通困境的破局者?

时间:2022-06-26来源:小亿浏览数:102

两个富豪狭路相逢,如何在互不透底的情况下比较出来到底谁更富有?姚期智院士在1982年提出了这个经典问题,同时也给出了“多方安全计算”的技术解决方案。这个方案经过近四十年的演变,在当前数字经济的背景下,与其他前沿技术相结合,逐渐形成了一个全新的火热赛道——“隐私计算”。什么是隐私计算?

我们可以参考上面的“富翁问题”来形象地理解其本质,即如何在保证数据给予方不泄露原始数据的前提下,对数据进行分析计算,让数据在流通与融合过程中“可用不可见”。现在的隐私计算主要是以多方安全计算、联邦学习、可信执行环境为代表,混淆电路、秘密分享、不经意传输等作为底层密码学技术,同态加密、零知识证明、差分隐私等作为辅助技术的技术体系。

01、历经演变隐私计算迎来大爆

权威国际咨询组织IDC中国发布的 《IDC Perspective: 隐私计算全景研究》报告中透露,2021年中国隐私计算市场规模突破8.6亿元人民币,未来有望实现110%以上的市场增速。艾瑞咨询发布的《2022年中国隐私计算行业研究报告》预测,2025年中国隐私计算市场规模将达到145.1亿元,2030年中国隐私计算市场规模将达800~900亿元。隐私计算演变开展至今,为何在近年突然大火?这不得不提到数据安全这一把不断悬在数据流通领域的“达摩克利斯之剑”。

数字经济飞速开展,数据要素的重要性已然确立,然而现在的数据基础设施、数据交易生态并不完善。再加之数据安全相关的法律法规与市场监管趋严,我国分别于2021年9月1日和11月1日实施《数据安全法》和《个人信息保护法》,使得在数据共享和利用中保护数据和隐私安全成为必要条件。于是,数据所有者对于数据流通往往是保守的,不敢给也不愿给:这一方面是出于数据合规方面的谨慎考虑;另一方面则是出于将数据视作资产的竞争与保密意识。

要解决这一矛盾,就得解决数据的安全性问题,让数据隐私在得到保障的情况下,安全地流通。对此,隐私计算无疑是一个能兼顾数字经济开展和数据隐私保护的较好方案。

隐私计算的核心能力在于让数据可用不可见,它一方面能顺利获得密码学和隐私保护技术来保证数据传输的私密性,从而更好地保证原始数据的安全;另一方面又能顺利获得隐私计算的“数据不动,模型和结果移动”来让各方在数据不离开本地数据库的前提下,完成数据的交互,碰撞和建模,从而保障数据资产的安全性,促进数据要素的流通与价值的发挥。

02、实现数据“可用不可见”的技术体系

那么,数据的“可用不可见”是如何顺利获得隐私计算实现的呢?

这主要是依赖于技术手段,排除掉传统的人为权限控制的不可控性,顺利获得完全不泄露计算过程中的任何中间信息作为隐私保护手段,让数据“可算不可识”,从而实现数据在参与方之间的“可用不可见”。

现在,主流的隐私计算技术分三大方向:一是以多方安全计算为代表的基于密码学的隐私计算技术,二是以可信执行环境为代表的基于可信硬件的隐私计算技术,三是以联邦学习为代表的人工智能和隐私保护融合衍生的技术。

1、多方安全计算

多方安全计算不是单一的技术,它包括秘密分享、不经意传输、混淆电路、同态加密、零知识证明等多种技术。它是顺利获得密码学协议的方式构建虚拟的计算框,从而解决各方间的信任问题。其原理是在数据的拥有方布置一些计算节点,在节点之间设置多方安全计算协议进行交互,最后得到计算结果。

由于密码学原理的复杂性,多方安全计算的性能相对较低且技术开发难度较大,近几年产业界的高度关注使得其性能得以迅速提升,技术可用性得到很大的提升。

2、可信执行环境

可信执行环境的核心思想是构建一个独立于操作系统而存在的可信的、隔离的机密空间,数据计算仅在该安全环境内进行,顺利获得依赖可信硬件来保障其安全。其具体操作是,用硬件构建一个安全保险箱,数据拥有方把数据用公钥加密后放到该安全保险箱中,硬件中的可信执行环境用私钥对数据进行解密,然后计算结果。TEE技术的核心在于硬件技术,该技术未来的产业方向在于打造自主可控、安全可靠的国产TEE芯片等安全产品。

3、联邦学习

联邦学习是一种新兴的人工智能基础技术,在 2016 年由谷歌最先提出,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私前提下,在多参与方或多计算结点之间召开高效率的机器学习。

联邦学习的本质是分布式的机器学习,在保证数据隐私安全的基础上,实现共同建模,提升模型的效果。联邦学习同样构建了一个安全保险箱,但安全程度没有那么高。该技术会刻意做一些安全性上的退让和妥协,从而极大提高计算的性能,但不可避免会泄露部分中间信息。

03、新兴技术赛道广泛行业应用

顺利获得以上的技术逻辑,隐私计算为区块链、AI、物联网等技术带来了新的开展方向,在一定程度上实现了数据的流通,有助于了数据的价值应用,在许多行业均有相关应用。现在,隐私计算技术较为成熟应用的行业有金融、政务、医疗等有刚性需求的行业,主要的应用场景有有金融风控、医疗健康、身份验证等。

1. 金融

随着《要素市场化配置综合改革试点总体方案》、央行《金融科技开展规划2022—2025》等顶层设计文件相继出炉,加之去年落地的《个人信息保护法》的助推,能解决数据安全合规流通问题的隐私计算在金融行业应用前景广阔。

在金融领域,为了进行风控管理,金融组织需要融合多方组织的数据,构建有效而准确的风控模型,但是数据泄露风险和数据安全保护趋严使得传统的风控方式受到了限制。同时,在资产营销方面,面对现有的客户,金融组织无法仅顺利获得自己单方的数据判断客户的相关信息,跨组织信息又很难获取。以征信系统为例,银行、小贷公司等金融组织需要顺利获得多个信息渠道对潜在用户的历史记录进行多维度计算分析。但由于这些数据具有很高的隐私性,且很多信息渠道并不具备足够安全可靠的信息传输管控技术,征信系统的数据丰富性不足或者维度缺失。
    
运用隐私计算技术,可以帮助金融组织优化风控模型,防范金融诈骗,支撑融资贷款等服务,也可以顺利获得跨组织、跨行业的数据安全融合,发掘特定客户,进行精准营销。

2. 政务

2022《政府工作报告》提到,要建设数字信息基础设施,推进5G规模化应用,促进产业数字化转型,开展智慧城市、数字乡村。政务数据涉及医保、社保、公积金、税务、司法、交通等方方面面,隐私安全尤为重要,如能利用隐私计算技术打通政务数据、挖掘数据潜能,那么智慧城市、智慧乡村建设将如虎添翼。举例来说,隐私计算技术可以给予政府数据与电信企业、互联网企业等社会数据融合的解决方案,比如可以联合多部门的数据对道路交通状况进行预判,实现车辆路线导航的最优规划,减缓交通堵塞。

因此,政务方面,国内多地已将隐私计算纳入城市数字化开展规划(如数字政府、数字社会建设)中。据公开报道,广东省去年7月发布的《广东省数据要素市场化配置改革行动方案》中,就提出了构建包含隐私计算在内的新型数据基础设施;成都也将在全国率先建设基于超算中心的隐私计算平台。

3. 医疗

在医疗领域,数据较为敏感,并且基于医疗数据的各项科学研究通常需要大量样本,单一数据源的数据量很难满足海量的数据需求,而数据共享过程中又会带来隐私泄露的风险。应用隐私计算技术进行多方协同过程中,能够有效的防止关联敏感信息的医疗数据被泄露,保证数据安全。

隐私计算在医疗领域的典型应用场景主要有医疗组织间的数据共享和跨组织跨域的医疗数据开放两大类。前者属于医疗组织、制药企业、基因测序组织、科研组织之间的横向场景,以增加样本数量进行建模;后者则纳入了保险公司、运营商、政务系统、互联网等外部数据,以增加样本特征进行建模。

IDC判断,随着合规标准的逐步细化与推出,制造业、能源等行业对隐私计算的需求也将稳步上升。同时随着医疗领域将模型方面完善、信息化建设跟进,这一市场将迎来高速增长生物医疗,是下一个竞争市场与爆发点。

04、风口之下这些问题仍待解决

毋庸置疑,隐私计算已迎来其开展应用落地的黄金时期,但风口之下,仍处于行业应用初期的隐私计算,仍有许多待完善的地方。

就拿现在大约占据了隐私计算市场七到八成的份额的金融行业来说,其实其在隐私计算落地应用的步伐,也并不大:相关招标项目的金额有限,多在几十万元到数百万元,超过300万元的项目已是少数。究其背后原因,则是隐私计算技术在从实验室走向工程化、生产级输出过程中,面临的技术限制、流通限制、产业生态、商业模式等一系列问题。
      
1、技术限制

(1)效率问题
尽管隐私计算单一技术理论基础完善,但应对庞大的数据体量,隐私计算的性能和算力上也相应受到掣肘。隐私计算作为一种“密文计算”,相对于“明文计算”的效能仍旧有限,比如同态计算的密文扩张规模可达1到4个数量级。虽然技术开展已经大幅提升了密文运算的算力,但在本地建模上相较明文计算,密文运算要慢5~10倍,特别是在对多方海量数据的生产级运算方面。

(2)安全性问题
在安全性上,隐私计算单一技术并不是万无一失。以联邦学习为例,IDC顺利获得调查发现,联邦学习是隐私计算重要开展方向。但是联邦学习技术仍然较为新兴,在安全性、去中心化架构、模型可解析性等各方面,仍然任重道远。
诸多隐私计算技术的应用,从侧面反映出并没有任何一项技术能够解决所有场景下出现的问题,每项技术本质都是在计算的精度、计算性能和计算安全性上做折中和妥协。未来只有技术能力能够支撑较大规模的计算和良好的安全性后,才能使隐私计算真正助力整个数据要素市场流动。

2、 流通限制

隐私计算的核心目标是安全地链接并发挥数据价值,因此互联互通是隐私计算大规模落地应用前亟待解决的问题。

一是与需方原有系统的联通。许多需方往往经过多年的技术积淀已有较为成熟的系统架构,且各系统间紧密链接,对现有系统的改造牵一发而动全身。这就导致隐私计算技术的使用很多时候只能从一个迷你的测试场景做起,再逐渐过渡到一个新的系统。

二是不同厂商间的联通。现在,隐私计算的技术种类庞杂,且相关厂商众多,各厂商实行的架构不同,不同技术、厂商架构之间如何联通成为难题。

三是数据流通的所属权问题。用于丰富数据模型的数据特征等产品的所属权问题也存在争议,解决谁授权、向谁付费将会是隐私计算在更广行业领域中应用的门槛。

3、 产业生态

第一时间是产业应用的丰富度不足。现在隐私计算的各个厂商大多处在同质化竞争的阶段,尚未形成产业生态。不过,相信未来随着整个行业的开展,慢慢会有新的角色分工出现,基于开放设计,每个角色都能够在生态位上找到适合自己的商业模式。

再者就是有价值的数据源较为稀缺。当前无论是出于对数据安全性的担忧,还是法律法规的确权问题,都导致没有很多有价值的数据源进入市场、有助于数据市场的开放,因此隐私计算的市场需求也会受到压制。

4、商业模式

从商业模式上来看,现在隐私计算平台是作为第三方平台存在的,这在一定程度上仍然会存在数据安全问题。

而且尽管数据合规需求从根本上鞭策了相关企业进行数据安全的改造和升级,但当前隐私计算的商业模式还处于早期探索期。从收入形态来看,顺利获得搭建隐私计算技术基础设施,产品售卖和平台搭建是主要来源;另一类是顺利获得给予SaaS服务,主要面向中小客户群体,比如多中心的隐私计算保护需求或者跨域分析、咨询服务等商业模式已初具雏形。更多的模式还在探索期,在市场逐步成熟的条件下,营业模式也将与时俱进。

05、小结

随着大数据开展和应用的不断深入,市场各方对跨源、跨领域、跨用户的数据流通共享需求日益增大,隐私计算技术在近几年得到了广泛关注和迅速开展。然而,隐私计算技术要实现大规模的落地应用,仍需要在性能、技术融合、安全等方面进一步提升,并且在一些非技术因素上形成相关配套。

相信在健全完善的法律法规、丰富多样的应用实践、成熟可用的开源技术等多方生态共同作用下,隐私计算行业将迎来蓬勃开展,隐私计算平台有望成为数据合规流通基础设施的关键一环,在保证安全的前提下持续有效释放数据要素价值,促进数字经济高质量开展。
(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询

在线咨询

点击进入在线咨询