摘要:传统的数据处理方式通常是数据经过转换隐藏重要数据后再进行分析,虽然可以保护数据隐私,但在数据源变化时响应速度慢,且随着数据量的增加,系统变得越来越庞大和复杂。
在医疗领域,不同医院之间需要共享患者数据,以提供更全面准确的诊断和治疗方案。
传统的数据处理方式通常是数据经过转换隐藏重要数据后再进行分析,虽然可以保护数据隐私,但在数据源变化时响应速度慢,且随着数据量的增加,系统变得越来越庞大和复杂。
在数据空间中,通过联邦计算(FC)技术,各医院的数据可安全地在本地存储和处理,在保持数据隐私和安全的前提下,共同进行数据分析和计算,以及机器学习,仅共享必要的分析结果,既保护了患者隐私,又实现了医疗数据的有效整合利用,提高了诊断效率和治疗效果。
某电力公司大数据信息共享服务平台除了服务于业务开展外,主要支撑发改委、能源局等政府部门数据共享。该电力公司建立一个与政府部门等其他单位交换数据的数据空间,就需要利用隐私计算技术解决数据要素共享问题,在流转模式下实现“原始数据不出域”的目标,保证数据在共享融合过程中的“可用、不可见”状态,打破部门、区域之间的信息烟囱,实现真正的信息共享和数据价值的传递。
作为数据安全的核心技术,隐私计算正被应用到可信数据空间建设等领域,在不同机构之间共享数据,实现数据的流通价值。
合规、溯源、治理、保障,隐私计算为数据空间建设“打底”
数据已经成为一种新型生产要素,可以为企业实体和整个社会带来商业价值。因此,数据驱动型经济超越了数据持有者的界限,旨在创建一个与不同利益相关者的数据访问、共享、流通市场,由此诞生了数据空间。
在数据空间中,就数据资产而言,企业愿意加入数据访问共享计划,以控制其专有技术、市场份额、知识产权、商业秘密、竞争力以及合规性和道德原则,赋予企业足够的信任,让他们成为数据访问共享市场的参与者,由此产生了保障数据安全的隐私计算等技术。
隐私计算技术是数据空间的核心技术之一,可用于保证数据空间中的信任和数据主权的治理策略。因此,隐私计算应该是“两用”技术,以高效和有效集成到数据空间中,在数据访问共享经济中实现不同的目的。
专家分析认为,隐私计算在数据空间建设中的主要作用包括以下几个方面:
首先,满足合规需求。在数据空间中,要满足像“个人信息保护法”、GDPR等多方面的合规要求。隐私计算技术能充当双重用途工具,既满足这些多样化的合规要求,为数据空间共享和交换在合规性及多主体利益平衡方面提供保障,避免因违反规定或忽视相关方诉求而阻碍共享和交换的正常开展,同时增强数据空间的信任机制,为数据空间中的各方提供了技术信任保障。
其次,满足溯源需求。隐私计算技术为数据空间提供可追溯性支持,助力实现数据空间内多方面的追溯需求。数据空间中像数据货币化、知识产权控制、计费流程、专利管理以及数据访问共享市场合同履行等环节,都需要可追溯性工具来保障流程清晰、责任明确。隐私计算技术能够通过相应的技术手段,对数据的使用、流转等过程进行记录与追踪,从而满足这些追溯相关的需求,让数据空间内各项业务开展得更有序、可查。
再次,构建有效治理模型。数据空间需要有合理的治理模型,而不是零散、无计划地实施数据保护策略。隐私计算技术及相关隐私工具要通过融入数据空间的设计,集成到治理模型当中,以此发挥促进数据主权实施、增强利益相关者对数据访问共享信任的作用。若缺乏这样的集成与有序构建,数据空间共享和交换会因低效、无效以及信任缺失而难以顺利实现。
最后,保障多方面权益与目标达成。隐私计算技术为数据空间实现提供多重要保障,全方位守护数据空间的运行。
不同组织和部门之间往往存在数据孤岛现象,由于担心数据安全和隐私问题,数据难以共享和流通。隐私计算使得数据在加密状态下可以进行跨组织、跨领域的计算和分析,各方可以在不泄露自身数据隐私的前提下,共同参与数据的联合计算和挖掘,实现数据的互联互通,如医疗领域中不同医院之间可以在隐私计算的支持下共享数据进行疾病研究。
在数据空间的交易场景中,隐私计算为数据提供方和需求方搭建了一个安全的交易环境。数据提供方可以在确保数据隐私和安全的前提下将数据出售或共享给需求方,需求方则可以在不获取原始数据的情况下对数据进行分析和利用,从而促进数据市场的繁荣和发展。
跨系统全程守护,隐私计算要解决5大问题
数据与其他生产要素最本质的区别在于,数据隐私是数据流动过程中产生价值的根本出发点,而数据的安全流通是数字经济发展的关键问题,国家陆续出台了多项法律法规和政策,如《网络安全法》《数据安全法》《个人信息保护法》三法为主,推动了隐私计算行业的快速发展。
第一,隐私计算应该面向隐私信息全生命周期保护。
隐私作为敏感个人信息,虽特定场景下有诸多保护方法,但缺全生命周期的体系化支撑,阻碍数据共享与流通。
专家指出,隐私计算是以面向隐私信息全生命周期保护为核心的计算理论与方法,涉及隐私信息相关权能分离时的诸多可计算模型与系统,涵盖信息从产生到销毁全流程计算操作,以及支持海量用户的系统设计理论。其计算环节有收集、脱敏等,各环节与全生命周期各阶段对应,保障多系统业务流程中的隐私。
第二,隐私计算重点解决5类问题。隐私计算是一种保护数据隐私的新型技术,允许数据在共享和分析的过程中保持机密性。行业专家指出,隐私计算重点解决以下5个问题:
跨系统全程守护问题。在数据从诞生到最终被处理完的整个过程中,不管进行什么计算操作,都要保证隐私信息不被泄露。
灵活规则调整问题。隐私保护的规则是由三方面因素确定的,即数据所有者的想法、正在使用数据的人受到的限制,以及接收数据的人能够保护数据的能力,在数据的整个生命周期中,这个规则会根据实际情况不断地进行调整优化。
按需精准保护问题。同样的信息,在同一个使用场景的不同时段,或者在不同的使用场景中,受到的保护精细程度是不一样的,要根据具体需求来确定保护的力度和方式。
动态优化保护问题。通过对当前隐私保护的效果进行评估,根据评估结果灵活地调整敏感数据模糊处理的算法和参数。
侵权行为追查问题。把隐私信息在整个使用过程中每个环节的操作情况自动记录下来,保证隐私信息在整个生命周期里都是合法、规范地被使用的,一旦出现侵权行为也能有据可查。
第三,隐私计算涉及众多技术。隐私计算涉及很多技术,未来也会出现新的技术与算法。
在这些技术,可信执行环境(TEE)基于硬件的安全隔离环境,通过使用专门的硬件和软件技术,确保数据在处理和存储过程中的安全性和隐私性,防止外部攻击。
作为一种分布式机器学习框架,联邦学习允许不同的参与方在不共享原始数据的情况下,共同训练一个机器学习模型。
多方安全计算(MPC)允许多个参与方在不泄露各自输入数据的情况下,共同计算一个函数的输出,使用特殊的加密算法和协议,确保每个参与方只能获得计算结果,而无法得知其他参与方的输入数据。
不同的隐私计算技术各有特点,分别适用于不同的场景和需求。在实际应用中,它们可以单独使用,也可以结合使用,以提供更强大的数据隐私保护。
落地数据流通和个人信息保护,隐私计算形成2大应用与两种商业模式
目前来看,隐私计算两大类典型应用:
一是数据流通利用。基于隐私计算延伸控制思想,实现数据流通及使用控制,并对数据要素多轮交易进行延伸控制。依靠隐私计算的按需脱敏,助力数据要素的差异化定价。运用隐私计算的存证与取证,支撑数据流通利用过程中的风险识别、预警以及争议仲裁工作。
二是个人信息保护。隐私计算能够平衡个人信息保护和新型信息服务模式对数据利用的需求,其存证与取证可有效地支撑隐私侵权行为溯源、个人信息保护合规判定等。
隐私计算可以支撑数据域内和出域场景下个人信息的迭代延伸控制,根据服务的不同阶段或者不同场景实现差异化按需保护,支持跨系统保护的量化映射,以实现隐私跨系统保护的一致性,基于保护效果评估反馈实现保护算法和参数的自适应改进。
隐私计算形成了两类商业模式,市场规模不断增大。目前,隐私计算行业已经形成了两类商业模式:
一种是基础产品服务,通过提供软件产品、技术服务和解决方案等服务,按项目计费。
具体而言,市场有不少企业提供软硬件集成的隐私计算一体机,更加符合实际应用场景需求,如比蚂蚁摩斯隐私计算一体机、星云Clustar隐私计算软硬件一体机等。
大多数有隐私计算业务的公司销售隐私计算系统软件,如蚂蚁摩斯多方安全计算平台、华控清交PrivPy多方安全计算平台、同盾科技智邦平台iBond、瑞莱智慧隐私保护机器学习平台RealSecure、金智塔科技的“金智塔”隐私计算平台、天冕科技的天冕联邦学习平台WeFe、富数科技阿凡达安全计算平台、洞见科技INSIGHTONE洞见数智联邦平台、蓝象智联GAIA平台等。
另一种是数据运营,基于隐私计算平台开发数据增值产品、建立数据智能模型、服务不同客户场景产生的平台性运营收入。例如洞见科技通过构建基于“隐私计算+区块链”的公共数据授权运营平台,为惠州农商银行等客户提供服务,在普惠金融等领域实现数据增值和智能模型建立,产生平台运营收入。
海信和华通智研院共同组建的青岛公共数据运营团队打造“公共数据授权运营平台”,利用隐私计算技术构建安全可控的数据环境,提供数据托管、数据产品等服务,实现平台运营收入。
隐私计算的市场规模呈现增长态势。根据中研网消息,2023年中国隐私计算平台市场以12.8%的市场增速实现8.9亿元的市场规模,预计2024年市场规模将超过9亿元。
根据共研产业研究院发布的《2023-2029年中国隐私计算行业调查与投资分析报告》,预计2025年我国隐私计算行业基础产品服务和数据运营市场规模将分别达到95.9亿元和49.2亿元。
艾瑞咨询预计,到2025年隐私计算市场规模将比2023年的20.6亿元大幅度增长5倍,达到103.8亿元。
跨界潮涌,多元企业抢滩隐私计算前沿阵地
参考国内的市场研究机构的研究报告,我们将目前国内隐私计算服务市场格局分为以下几个层次:
第一类,科技巨头与云服务商。目前,目前,象蚂蚁集团、京东集团、字节跳动等科技巨头,都开始在在隐私计算方向发力,旗下多个业务板块都推出了隐私计算产品。包括阿里云、腾讯云、百度云、京东云、金山云、华为云、优刻得等云服务商都推出了隐私计算服务。
第二类,隐私计算的初创公司,如华控清交、星云Clustar、数牍科技、蓝象智联、洞见科技、锘崴科技、翼方健数、冲量在线、光之树、融数联智、摩联科技、隔镜科技、神谱科技、同态科技、凯馨科技、煋辰数智等公司。
这些隐私计算初创公司通常技术创新性强,专注于前沿的隐私保护技术研发,如联邦学习、安全多方计算、同态加密等,致力于通过独特算法与架构,打破数据隐私与共享利用之间的矛盾,为数据流通构建安全通道。
另外,其市场适应性强,面对各行业痛点,量身定制贴合其合规需求、业务流程的数据隐私解决方案,面向医疗、金融、政务等数据敏感领域,助力客户在保障数据安全前提下挖掘数据价值。
第三类,从大数据、区块链、AI等方面进入隐私计算领域的公司。大数据基础软件公司星环科技,区块链公司如矩阵元、Oasis、ARPA、趣链科技、零幺宇宙、宇链科技、翼帆数科、熠智科技,以及工智能公司瑞莱智慧、医渡云、渊亭科技等,都推出隐私计算相关方案与服务。
这些从大数据、AI、区块链等不同领域切入隐私计算的公司,都在积极解决行业发展中面临的数据安全问题,并为用户提供相应安全解决方案。例如,区块链公司本身就注重数据的加密与不可篡改特性。它们将区块链技术与隐私计算深度融合,在金融、供应链等行业应用场景中,通过隐私计算的加密机制和区块链的分布式账本等协同作用,为用户打造安全的数据交互环境,解决数据在流转、存储、使用过程中的安全问题,提供全方位的数据安全解决方案。
第四类,网络安全公司进入隐私计算。如阿里安全、腾讯安全、百度安全、安恒信息、神州融安、瓶钵科技、沙海科技等。
网络安全公司技术融合强,凭借深厚网络安全技术功底,将加密、访问控制等与隐私计算融合,全方位防护数据;场景落地快,依托原有客户资源,如为阿里、腾讯生态内企业迅速适配隐私计算方案,解决数据协作难题;产品多元化,像安恒信息等推出涵盖数据脱敏、加密传输、多方计算等多款产品,满足不同行业数据安全与隐私需求。
第五类,应用公司。金融科技公司比如同盾科技、百融云创、富数科技、天冕科技、金智塔科技、冰鉴科技、甜橙金融等,推出隐私计算方案。
同盾科技注重多场景适配,保障数据跨域协同安全;百融云创聚焦精准营销,赋能业务拓展;富数科技擅长联邦学习优化;天冕科技强化数据加密全流程管控;金智塔科技依托区块链保障溯源;冰鉴科技、甜橙金融等也都紧扣金融需求,筑牢数据隐私屏障。
从目前,企业推出的隐私计算解决方案来看,呈现是两大发展趋势:
第一、多种技术融合满足多需求场景的需求。
从技术的运用方式来看,虽然存在单个技术如联邦学习的成功应用案例,但是在整体的隐私计算领域,采用多种技术的融合方式越来越多。
不同的数据场景有着复杂多样的需求,单一技术往往难以全面满足。比如在涉及多方数据交互且数据类型多样的智慧城市建设场景中,可能需要结合差分隐私技术来进一步增强数据隐私性,同时利用同态加密技术来确保在加密数据上进行计算操作的正确性,再加上联邦学习来促进不同部门数据的联合建模分析,从而实现城市交通流量预测、能源消耗优化等多项目标。
蚂蚁密算提出的“密态计算”技术体系是通过综合利用密码学、可信硬件和系统安全的隐私保护计算技术,其计算过程确保数据可用不可见,计算结果能够保持密态化,实现计算全链路保障,防止数据泄漏和滥用,最终实现多方数据高效汇聚、更大规模的数据安全流通。另外,数据价值的快速验证,也是密态计算实现数据要素在产业端流通的重要优势。
在金融领域,农业农村部大数据发展中心联合网商银行发起的“农户秒贷”项目,基于密态计算技术构建了密态时空计算平台,入选了国家数据局首批“数据要素x”典型金融案例,目前超600万农户获得贷款额度。
第二、隐私计算中核心技术在典型应用场景中持续发展。
联邦学习技术解决方案长盛不衰。过去几年,苹果、谷歌和其他科技巨头一直在大力投资联邦学习。联邦学习是机器学习的去中心化形式。它通常用于训练ML 模型以触发建议功能。
2021年Google AI宣布,通过使用联合学习在用户交互上负责任地训练神经网络模型,同时保护用户隐私,从而提高了智能文本选择的性能。这项工作是 Android新的Private Compute Core安全环境的一部分,它使Google能够将模型在某些类型实体上的选择准确性提高多达20%。
Apple在其产品上使用联邦学习(FL)技术及其变体(如Federated Tuning (FT))来执行设备计算和用户隐私推荐的组合。对于Apple来说,围绕联合评估FE和FT的应用占据了系统使用量的很大一部分。
联合评估(FE)发生在用户交互历史记录上,与实时A/B实验相比,大大缩短了周转时间,FE可以快速识别最有前途的ML系统或模型候选者。
如星环科技的数据隐私计算平台,以及讯飞智元的联邦学习平台等,能够在数据共享和计算过程中,确保数据的隐私性和安全性。
区块链技术方案在隐私计算解决方案中也占据不少份额。云象区块链推出的隐私计算数据安全平台YunPCDS,是一款融合多方安全计算、联邦学习、隐私保护和区块链技术的产品,能实现“数据可用不可见”,在跨机构数据合作(如联合风控、联合营销等)时确保数据安全和隐私。
趣链科技推出的BitXMesh数据协作平台,融合区块链与多方安全计算等技术,首创跨网闸数据交换协议等算法,可支撑千机构间的隐私数据共享和联邦计算,能做到数据“可用不可见,可控可计量”。
多方安全计算解决方案正呈现不断增加的态势,反映出其在数据隐私保护和协作计算方面的巨大潜力。多方安全计算作为隐私计算的关键技术,能够在多个参与方之间实现数据的联合计算,而无需暴露各自的敏感信息,在当今数据驱动的时代显得尤为重要。
华控清交推出的隐私计算平台采用了先进的多方安全计算技术,专注于解决数据共享中的隐私保护问题。平台结合了同态加密、零知识证明等多种隐私保护技术,提供全面的数据安全保障。
翼方健数提供的隐私计算解决方案同样聚焦于多方安全计算,旨在推动医疗健康领域的数据共享与合作。
Opaque Systems在几年前就推出了一个多方机密AI和分析平台Opaque Platform,通过提供首个多方机密分析和AI解决方案使对TEE中的加密数据运行无摩擦分析成为可能,实现安全的数据共享,并首次使多方能够执行协作分析,同时确保每一方只能访问他们拥有的数据。
如果说科技巨头在隐私计算的投入到了收获的季节,那么现在则要持续创新突破,携手各方拓展应用边界,让隐私计算惠及更多行业,为数据安全流通、产业协同发展注入源源不断的动力。
来源:数据猿