原创 | 工业互联网数据要素化:隐私计算可信数据空间初露端倪

6月22日,中央深改委第26次会议审议通过了《关于构建数据基础制度更好发挥数据要素作用的意见》,对数据确权、流通、交易、安全等方面做出部署。会议明确,促进数据高效流通使用、赋能实体经济。深改委相关工作部署,意味着数据要素市场化正呈加速态势。

工业互联网、工业大数据的发展,无疑推动着工业数据要素市场的发展和成形。尽管工业大数据目前主要在企业内部或供应链间分享流通,但进一步的跨域流通和交易需求已经不远——这需要以安全为前提。目前,业界正在探索隐私计算等技术体系,推进工业数据要素资源的交换流通与交易,其中之一,就是中国信通院牵头,数十家工业与ICT界企业及院校参与的“可信数据空间”体系的研发。

数字经济视角的要素市场

近年来,部分地方政府相继出台数据条例、数字经济条例,其核心组成部分就是数据生产要素。其中,共享、流通、交易是数据要数市场化的重要途径,也是产业界关注的重点。

数据要素市场是一个强技术属性市场,共享或交易,仅有法规、制度,难免会沦为一纸空文。需要一套基于法规、制度和国际规则的技术体系,能保证过程中数据的安全、各方权益,这个技术体系可以是无感的、流通交易中任意一方不可篡改的。

而从数字经济国际合作(事实上数字经济天然具有国际合作的属性)的角度,研究提出甚至是中国能作为国际合作规则主导力量之一的“中国方案”的呼吁不绝于耳。这个中国方案,技术体系必须是其中之一。目前,中国数字经济体量位于世界第二,美国居首。

当前,地方数据交易所或公共数据服务平台所共享或交易的数据以政务数据为主。但数据作为生产要素,已全面融入生产、流通、消费和服务等经济社会各个环节。尤其在工业互联环境下,数据驱动所有业务。工业大数据的跨企业、跨行业流通、交易不可避免,确保安全成为前提。

隐私计算能否解决这一问题呢?

综合网络信息,隐私计算是一类技术统称,旨在保护数据不泄露的前提下,实现数据分析计算。他可以针对不同的应用场景、信任环境和需求,将不同技术、算法、接口集成在一个平台上,结合人工智能、机器学习、区块链等跨学科技术,为需求方提供综合的解决方案。

根据百度百科,目前主流的隐私计算技术主要分为三大方向:第一类是以多方安全计算为代表的基于密码学的隐私计算技术;第二类是以联邦学习为代表的人工智能与隐私保护技术融合衍生的技术;第三类是以可信执行环境为代表的基于可信硬件的隐私计算技术。

实际场景中,上述技术往往组合使用,在保证原始数据安全和隐私性的同时,完成对数据的计算和分析任务。据称,隐私计算已在金融、政府、医药等行业场景初步商业落地,应用模式包括跨域分布式身份认证、数据授权分享、区块链钱包管理与隐私交易、数据安全匹配、多方联合建模、安全建模应用等。

在工业,隐私计算刚刚开始。

什么是可信数据空间

为解决工业数据资源共享流通中的技术、标准、应用与产业培育等主要问题,中国信通院提出了面向工业数据可信、安全共享和流通的新型基础设施——可信工业数据空间(Trusted Industrial Data Matrix)。并为此联合多家企业搭建“面向3D模型可信共享流通的工业数据空间测试床”,针对实际应用场景和技术路径进行了验证,取得了良好的效果。

可信数据空间可以认为是数据与资源共享的数字化基础设施,旨在促进不同利益攸关方之间可信、安全、透明的进行数据共享、交换、流通与交易,从而实现数据的“可用不可见、可用不可存、可控可计量”。

——这看起来有些“费劲”。我们从时间线看看可信数据空间的发展。

2021年11月26日,中国信通院组织举办《可信工业数据生态链-系统架构1.0白皮书》研讨会(第二次)。华为、北交大、中国电信、华控清交、东方电气、沈鼓、青岛四方、国能信控、光华冠群、北大、航天工业信息技术中心、工业大数据应用技术国家工程实验室、东风设计院、石化盈科、百度、智能云科、中汽数据及中车株洲等研究机构和企业代表参会。

2021年12月24日,工业互联网产业联盟发布《可信工业数据空间架构1.0》白皮书。该白皮书系统阐述了可信工业数据空间的概念内涵、行业需求、应用价值、实施路径等内容,为探索工业数据要素市场化提出发展思路和实现路径。

2022年1月19日,中国信通院举行可信工业数据空间生态链大会。大会正式发布《可信工业数据空间系统架构1.0》白皮书,同时宣布成立可信工业数据空间生态链(TDMC)。

工信部信发司副司长王建伟出席了本次生态链会议,他表示,探索建设可信工业数据空间,是推动工业数据在更大范围、更加充分和有序地共享流通的有效手段,也是激发数据要素价值、扩大数据生产力乘数效应的重要途径。

中国信通院院长余晓晖在发言中总结了可信工业数据空间领域主要工作成果,提出“下一步将围绕数据要素市场建设加强规则体系、技术产业和应用模式研究,探索构建我国数据要素市场化建设的发展路线,依托生态链与各方一道积极推进可信工业数据空间产业实践走深走实”。

2个月后的3月24日,中国信通院牵头提出IEEE P 3158《可信数据空间系统架构》在IEEE标准协会成功立项。标准由IEEE SA标准委员会下的Trusted Data Matrix工作组组织开展研究和编制工作,中国信通院信息化与工业化融合研究所副总工程师韦莎任工作组主席。

5月11日,IEEE P 3158《可信数据空间系统架构(Standard for Trusted Data Matrix System Architecture)》工作组首次全体会议召开。来自北交大、南理工、北航、天津大学、中国电信、中国移动、国家电网、东方电气、浙江中控、阿里、华控清交、数鑫科技、西门子、中国核能协会等单位的40余位国内外专家,以及IEEE标准协会中国战略合作负责人王亮迪博士、IEEE标准协会高级项目经理Jonathan Goldberg出席会议。

6 月 6 日 – 7 日,IEEE P 3158《可信数据空间系统架构(Standard for Trusted Data Matrix System Architecture)》工作组举行第二次全体会议,确定下一步工作方向。会上,9家单位通过可信工业数据空间生态链总体组初审,并经执行委员会审议通过,正式加入到TDMC。

上述背景显示出,围绕可信数据空间,1个准联盟、1个技术体系逐渐成型,1个国内国际标准正在研制。

是什么与有何用

那么,可信数据空间看起来致力于解决工业数据共享、流通、交易的技术问题,通过技术规则激活工业数据要素价值,这与隐私计算有何关系?——提出这个问题,是希望弄清楚,可信数据空间到底是什么。

工业数据空间是一个为数据安全流动和应用而搭建的数据流通、运行、管理环境。不同于数据平台,它由一个个经过技术认证的数据盒子相互连接而成,数据在盒子之间加密传递,并在盒子中进行运算和应用。盒子采用一套数据控制技术,构建了特殊的使用环境,在盒子中数据的天然属性被限制,并赋予数据提供者全程掌控数据流向和使用方式的能力。工业数据空间可保证数据在使用完毕后,从使用方的盒子中自动删除,从而满足数据提供方对数据主权的掌控。

在技术基础上,工业互联网产业联盟今年1月在1.0白皮书发布上所指出的,工业数据空间是基于数据使用控制、隐私计算、安全技术、存证溯源等技术综合构建的,遵从统一标准的,覆盖数据全生命周期的数据管控系统和价值生态体系,是实现数据要素高效配置的新型基础设施。

其主要功能,一是为数据拥有者提供数据适用对象、范围、方式的控制能力,消除流通顾虑,释放数据供给;二是为数据处理者提供数据流通处理的日志存证,提供内外部合规记录,实现数据资源有效管理;三是为数据供需双方提供数据要素流通的中间服务,便利供需对接,促进应用场景和数据价值化配置。

白皮书提出了可信工业数据空间的总体架构,这包括业务视图、功能视图、技术视图,以及相应的5类角色、2种模式、5个功能层次、7类主要技术。

可见,在可信数据空间的架构中,隐私计算只是其中一种技术。事实上,工业数据共享、流通,在供应链或在企业内部已经有较长时间的存在,如协同研发涉及到的研发数据、工业智能中机器学习需要的大量数据等众多场景,探索已经有较长时间。

可以说,工业数据空间实现了两大价值。

一是,让数据像实物一样被管理。数据定向传递,只传递给希望给到的接受方。供需双方就数据使用时长、条数、次数、是否允许下载等达成的共识,在空间内自动执行。数据在达到条件后会被自动清除,保障提供方对数据主权的控制。

二是,数据处理行为存证,提供数据使用、流动、交易、合规证据。数据的供、需及处理各方都是实名制参与。数据全生命周期全过程行为可留存日志备查。为数据供需企业、交易中介、政府管理部门提供数据安全内部审计、合法依规及安全风险评估的可靠证据。而且这一过程不会读取数据内容,企业无需担心敏感信息泄漏。

我们注意到,3月24日,中国信通院牵头提出IEEE P 3158《可信数据空间系统架构》在IEEE标准协会成功立项。

IEEE电气与电子工程师协会呢,最熟知也最知名的可能是期刊也就是出版物,每年出版的电气电子和计算机科学领域的技术文献约占世界总量的1/3,而且其文献的引用率在电子、通信和其他领域也名列前茅。此外,IEEE也是世界权威的标准制定机构,目前已经为通信、信息技术、发电产品等制定了许多现行产业标准,其中包括著名的IEEE 802。

IEEE标准协会即IEEE SA的一大特点是市场驱动,个人会员、团体(公司)会员,都可以发起标准制定请求,立项后,由发起人和IEEE SA推荐的专家共同进行标准制定,以及后续的确认、批准、发布、测试等流程。IEEE P 3158《可信数据空间系统架构》的立项,是一个开端。

国际数据空间及隐私计算

可信数据空间,国际上还有一个相对早一些的联盟和标准,这就是IDSA。其牵头单位是大名鼎鼎的德国弗劳恩霍夫协会,说到这个,都会联系到工业4.0、CPS等。

2014年,德国联邦教研部提出了“工业数据空间行动”,旨在构建一个安全可信的工业数据交换空间,目的就是消除数据流通、交易的信任问题。弗劳恩霍夫协会是这个行动的牵头单位。为落实“工业数据空间行动”,2016年协会联合大众汽车等18家成员企业成立“工业数据空间联盟”(IDSA)。2017年,联盟推出“工业数据空间参考架构模型1.0”。随着数字经济的发展,“工业数据空间联盟”变更为“国际数据空间联盟”,行业也不仅仅是工业了。2019年,国际数据空间参考架构模型3.0发布,目前已成为正式标准。

数据空间(IDS)是一种基于标准通信架构、实现数据安全流通共享的虚拟空间架构。在后来的欧洲云(Gaia-X)项目中,也融入了国际数据空间的理念与相关标准。虽然Gaia-X项目前途未卜,但在项目中关于“数字主权”的探索,如果成功,未必不值得借鉴。

根据官方信息,数据空间(IDS)是具有自主权的数据进行交换和处理的空间。数据提供方将数据通过IDS连接器(IDS Connector)传入数据空间的设备。允许其他人使用这些数据,同时保留对使用人、使用方式、使用时间、使用目的和使用价格的控制。

IDS 连接器是一个专用的软件组件(可以理解为一个网关),为各参与者提供将数据使用规则附加在数据空间中,执行使用规则并无缝追踪数据来源的功能。连接器是数据与服务的网关,也为各应用程序和软件提供可信任的运行环境。此外,数据空间还包括应用程序、代理服务、交换所、身份认证管理、数据描述以及认证程序等组件。

2021年,工业互联网平台卡奥斯曾发布消息,与弗劳恩霍夫协会合作的海尔海外洗衣机工厂智能衣物检测案例使用了IDS的相关技术。生产商可通过洗衣机内的传感器收集洗衣数据,经由COSMOPlat平台计算优化洗涤程序,IDS技术确保用户拥有数据主权,实现数据的安全、可控交换。消息称,卡奥斯COSMOPlat是欧盟以外首个将平台架构融入到欧洲的数据和云主权中的工业互联网平台。

近期,与可信空间、隐私计算的还有两件事。

一件是由深圳数据交易有限公司(简称“深数交”)、华为云计算技术有限公司(简称“华为云”)、深圳数鑫科技共同发起成立的“国际数据空间创新实验室”正式发布。实验室主要聚焦孵化并构建自主知识产权、安全、可信、可控、可追溯的数据流通技术体系,借鉴国际数据空间(IDS)理念和参考架构的同时,充分融合国内数据流通产业特点、行业应用场景、数据保护及交易法规等。

在其定位中,有两点值得注意:一是通过将数据空间解决方案与隐私计算等现有流通技术体系的融合,构建完整的可信数据流通体系,能支撑落地更广泛的数据流通交易场景;二是实验室构建的可信数据流通体系能更好支撑与欧盟、日本等以IDS构建数据流通体系的发达经济体,实现跨境数据流通。

也就是说,IDS是其技术底座;再就是其工作目标除了支撑国内,还瞄准了数据跨境的需求。

另一件,是隐私计算的标准探索。

据报道,今年3月份,IEEE-SA全票通过了《隐私计算一体机技术要求》(P3156)立项,并在IEEE-SA成立了隐私计算一体机工作组,该标准由蚂蚁集团、国内外专家共同参与筹备,是全球首个隐私计算一体机国际标准。

2021年12月,蚂蚁集团向IEEE-SA提交了《隐私计算一体机技术要求》的立项申请,针对隐私计算一体机框架、功能要求、性能要求和安全要求等问题提出标准解决方案。经过为期2个多月的3轮评审后,正式通过立项评审。

为何是蚂蚁集团提出呢?资料显示,从2015年开始蚂蚁集团推进隐私计算技术及其规模化应用,为解决行业面临的数据信任难点、数据孤岛等问题提出了多项创新性技术方案,隐私计算一体机就是其中之一。

2021年世界互联网大会期间,蚂蚁集团发布了首个隐私计算一体机产品,针对隐私计算应用场景中数据安全、算力不足、运算速度慢等问题,利用蚂蚁自研的芯片、硬件、软件实现了隐私计算软硬件一体化解决方案,大大降低了隐私计算开发门槛。

目前,隐私计算一体机作为隐私计算产业落地的重要技术探索,在国内外受到行业关注。

除了国际标准,中国信通院联合蚂蚁集团在隐私计算联盟制定了《隐私计算一体机技术规范》团体标准,目前也已经形成征求意见稿。

主要参考文章:
搜图网 | 中国信通院发布《可信工业数据空间架构1.0》
中国信通院微信订阅号 | 数字化转型案例说 | 中国信通院实践工业数据可信流通新路径
钛媒体 | 隐私计算:如何解决数据隐私之痛?
德国弗劳恩霍夫应用研究促进协会北京代表处官网 | 国际数据空间 (IDS) – 探索数据未来
中国信息化 | 从用德国数据空间的实践探索看如何构建数据流通共享生态

点赞

发表评论

邮箱地址不会被公开。 必填项已用*标注