摘要
√ 区块链与隐私计算的结合是必然,二者互为刚需。没有隐私计算,区块链无法解决隐私保护问题,无法为更多数据源提供服务;没有区块链,隐私计算无法解决数据确权与利益分配问题,多方数据协作难以达成。
√ 区块链与隐私计算结合,未来将形成大规模数据流通网络,推动数据资产化的发展。同时,将使得全社会重新确定数据权责以及利益分配机制。
√ 区块链与隐私计算的应用,目前主要有五个方向:解决单点实际问题、扩大联盟链应用范围、提供网络安全相关服务、建立为企业提供服务的区块链+隐私计算基础平台、建立同时为企业和个人提供服务的区块链+隐私计算基础平台。
√ 区块链与隐私计算结合的应用要大规模落地需要三个前提条件:一是全社会数字化程度的提升;二是技术的进一步成熟;三是法律法规的完善与数据交易商业模式的形成。其中,前两个条件更为关键。
研究机构:零壹智库
发布机构:零壹财经、《陆家嘴》杂志
研究支持:蚂蚁链、八分量
报告主编:柏亮 于百程
执行主编:温泉
报告调研:温泉 刘翌 朱戈奇 陈丽姗
报告撰写:温泉 朱戈奇 刘翌 陈丽姗
视觉设计:张艳茹
目录
前言
一、问题的缘起
(一)区块链对隐私计算的需求是如何出现的
(二)隐私计算对区块链的需求是如何出现的
二、实践探索
(一)实践方向
(二)行业图谱
三、应用案例
(一)政务应用
(二)金融应用
(三)物流与供应链应用
(四)医疗应用
(五)其他应用
四、关键问题展望
(一)区块链与隐私计算的结合是必然趋势吗
(二)二者结合会改变什么
(三)为什么目前区块链+隐私计算的应用尚未大规模普及
(四)应用的大规模普及,还需要解决哪些问题
(五)区块链+隐私计算的应用中还蕴藏着哪些趋势
致谢
前言
在研究隐私计算的发展趋势时,我们发现一个现象:入局隐私计算的公司当中,有不少是有区块链背景的公司。
这引发了我们的好奇——
从2017年底开始,区块链爆火,区块链被认为是改变世界的技术,未来互联网的基础设施。虽然后来的发展证明,区块链的爆火当中有相当大成分是泡沫,但是从2017年至今,区块链获得了长足的发展。
首先,2019年10月24日,习近平总书记在中央政治局第十八次集体学习时强调“要把区块链作为核心技术自主创新的重要突破口,明确主攻方向,加大投入力度,着力攻克一批关键核心技术,加快推动区块链技术和产业创新发展”。至此,区块链上升至国家战略。
其次,从区块链企业发展上看,截至2021年12月,中国共有120810家企业在企业名称/曾用名、经营范围或产品资料等工商登记信息中含有“区块链”字样。目前中国已经形成了以粤琼闽、鲁苏浙和陕川渝为代表的区块链企业三大聚集区。
再次,从区块链产业应用端上看,区块链主要分布于行业应用、拓展性技术及解决方案、区块链底层基础建设三大领域。行业应用端,金融应用和政务民生居多,同时还涉及医疗、农业、教育等多个实体领域,以及NFT和元宇宙等新赛道。
与此同时,隐私计算也在飞速发展。作为目前可以实现数据“可用不可见”的唯一技术解,隐私计算可以平衡数据利用与数据保护的矛盾,被认为将成为未来数字社会的基础设施。
2021年是隐私计算规模化落地元年,隐私计算正在进入金融、政务、医疗等领域的真实商业场景。
这两种被认为会改变未来的技术为什么会结合?二者结合会改变什么?
这是我们想要研究的核心问题。
一、问题的缘起
(一)区块链对隐私计算的需求是如何出现的
在中国,区块链与隐私计算最初的相遇是在2017年。最初的探索是从微众银行、万向控股、蚂蚁集团的探索开始的。
2017年,微众银行牵头研发的区块链底层平台FISCO BCOS正式开源,进一步推动分布式商业生态系统的形成。
之后,围绕FISCO BCOS,微众银行联合多方构建了国产联盟链开源生态圈,生态内涌现了大量基于FISCO BCOS研发的应用。而对隐私计算的需求,是在实际业务开展过程中发现的。
通过对微众区块链团队的访谈,零壹智库得知微众区块链团队对隐私计算技术的探索开始于2017年初。当时,团队发现FISCO BCOS在应用过程中的新需求——区块链本质上是一个共享账本,应用过程中需要将数据上链,上链后数据对所有人都是透明的。但对金融和医疗这类对数据隐私保护需求比较强的数据源方来说,需要在保证数据安全的基础上实现数据流通,做到“数据可用不可见”。因此,微众区块链团队开始了对隐私计算技术的探索。
万向区块链董事长肖风也曾在公开演讲中介绍,BCOS开源之后,其对隐私计算也日渐关注。因为区块链除了性能、安全性、互操作性、易用性等技术尚未成熟之外,另外一个十分重要的课题就是:区块链应该带来的是隐私保护之下的数据共享。因此, 2017年开始,万向便着手准备隐私计算方面的工作。[1]
在媒体公开报道中可见的是,万向在这方面最显著的进展是对其投资的公司矩阵元的支持。创业公司矩阵元于2016年8月获得万向控股1.5亿元A轮融资,该公司于2017年9月联合联合中科院信息安全国家重点实验室、武汉大学、上海交通大学发布多方安全计算企业级应用平台。[2]这是零壹智库在调研中发现的中国最早的多方安全计算企业级应用平台。
这个平台,严格地来说还不是区块链+隐私计算的技术平台,但是已经开始将区块链和隐私计算技术相结合。矩阵元MPC平台保证多个参与方的数据无需先归集后分析,将数据保存在本地进行协同计算。该平台可满足用户自定义的计算逻辑,作为一个通用平台,可部署在多个应用场景。与此同时,基于MPC平台,矩阵元推出了相应的区块链密钥恢复方案。该解决方案基于用户的生物信息与多个中心共同协作通过MPC技术对密钥进行加密和解密。中心无法单独获取密钥,只有与用户共同计算才能进行密钥恢复。这个平台可支持毫秒级时延的两方计算,且参与方的数量可持续增加。[3]
与此同时,蚂蚁集团也在行动。在对蚂蚁链的访谈中,零壹智库得知,2017年蚂蚁链自主研发的摩斯安全计算平台(MORSE)正式应用于内部业务。2018年云栖大会上,摩斯安全计算平台(MORSE)正式公开发布。
摩斯采用多方安全计算MPC、可信执行环境TEE双引擎的技术架构,并结合差分隐私、区块链等技术,实现数据可用不可见,解决机构数据协同计算过程中的数据安全和隐私保护问题。该平台提供安全模型、安全统计、安全查询、安全匹配、安全策略、安全脚本、安全联盟等安全计算能力。
在国外,区块链技术在应用过程中也出现了对隐私计算技术的需求。零壹智库的访谈对象之一Oasis Labs的发展历程就非常典型。[4]
Oasis Labs创始人兼CEO、加州大学伯克利分校计算机系教授宋晓冬是网络安全领域的研究者,被称为“计算机安全教母”。宋晓冬对区块链的关注是从对网络安全的研究开始的,因为区块链的核心就是安全和分布式计算。
宋晓冬曾作为发起人之一创建了著名的区块链联盟IC3。IC3 是由美国国家科学基金会于2015年资助成立的一个区块链联盟,由康奈尔大学、加州大学伯克利分校、伊利诺伊州香槟分校和以色列理工学院等学术机构联合发起,不少企业巨头和金融机构也相继加入。作为一个由美国国家科学基金会资助的大型跨组织项目,IC3 组织吸引了众多知名高校的教授与研究生参与,是业界顶级的研究机构。宋晓冬希望,能通过聚集更多高校的研究人员以推进加密货币、分布式系统、智能合约等技术的基础设施搭建,让区块链与分布式系统走进学术与工业界,吸引更多教授、学生、工程师参与到区块链行业,从而成为行业的中流砥柱。
但是,在此过程中宋晓冬发现,区块链产业生态仍不健全、公链平台缺乏应用开发者参与贡献。这其中的重要因素之一是隐私保护问题。
通过与很多DApp(Decentralization Application,即“去中心化应用”)开发团队聊天,宋晓冬发现大多数团队想开发的应用都需要处理敏感数据。他们很想有一种在能使用区块链平台时保护数据隐私的方法,比如构建分散式信用评分模型,分散式欺诈检测,基于区块链的基因组数据和物联网的数据市场等等。所有这些应用程序都需要保护数据隐私。没有隐私保护,这些应用根本不可能实现。而当时的区块链平台无法提供这样的隐私保护功能。这让宋晓冬看到了市场对于隐私保障区块链平台的需求。
2018年,宋晓冬领导创建了Oasis Labs,致力于构建基于区块链的云计算平台,旨在解决当下区块链在性能、安全、隐私上的痛点。
随着时间的推移,在不同的领域、基于不同的需要和理解,都开始出现将区块链与隐私计算技术结合的探索。
比如, 杭州趣链科技有限公司(简称“趣链科技”,成立于2016年)本身是做区块链技术出身,专注于数据共享平台。在实际业务的运行中,趣链科技发现区块链的公开性使得数据缺乏隐私保护,在科研场景中部分数据不能入库,为银行搭建的金融数据共享平台也无法真正实现多方数据共享。能否保护敏感数据的隐私和安全直接影响各场景下数据流通和共享。于是,趣链科技在2019年开始在区块链技术中引入隐私计算技术。
再如,北京八分量信息科技有限公司(简称“八分量”,成立于2016年)最初的业务是提供可信计算服务。在这项服务的提供过程中,八分量也将区块链技术与可信计算技术相结合进行应用。因为可信计算技术主要是用来保障服务器自身安全,机构一旦将自身数据给外部机构使用之后,就很难把控数据用途。而应用区块链技术,机构将自身数据给到外部机构之后,可以对数据的使用进行存证溯源,这样可以进一步跟踪数据用途,保障数据不被滥用。但是,随着对隐私保护监管的加强,在业务实践中,八分量发现,可信计算与区块链结合之后,仍然需要进一步与隐私计算技术相结合,这样才能做好链上数据的隐私保护,才会有更多的机构愿意将数据上链。因此,从2019年11月开始,八分量就开始了将隐私计算与区块链、可信计算技术相结合的尝试。
再如,杭州宇链科技有限公司(简称“宇链科技”,成立于2018年)最初的业务是以区块链技术赋能基础设施建设。在为安全生产领域提供区块链平台建设的过程当中,宇链科技发现,安全生产领域企业往往因为使用或者制造危化品而面临风险,但企业生产数据缺乏可信度使得这类公司难以寻求保险。为解决安全生产领域缺乏保险的行业问题,宇链科技在2020年初开始组建隐私计算团队,推动隐私计算和区块链技术的融合。
另一方面,数据使用在法律层面监管趋严的态势同样推动了区块链与隐私计算技术的融合。
世界各国对隐私数据保护的力度不断加大。《欧盟一般数据保护条例》(General Data Protection Regulation,GDPR)于2018年5月25日在28个成员国生效。《加利福尼亚州消费者隐私保护法案》(CCPA)于2020年1月1日起正式实施。在中国,与隐私保护相关的基础法律也都陆续开始实施。2017年6月,《网络安全法》开始施行。2021年,《数据安全法》及《个人信息保护法》通过,并分别于9月及11月开始施行。
在此背景下,央企和国企在保护隐私安全方面开始提前布局,其对政策理解和对法规的执行逐步传导至其他商业企业。商业企业出于上市、运行等风险控制的考虑,越来越重视数据上链使用的合规性。
大环境下,一批“新生”的区块链企业在创立之初就将隐私计算技术纳入技术范畴。比如,零幺宇宙(上海)科技有限公司系2020年与上海树图区块链研究院共同发起的。认识到加密技术和分布式计算结合的重要性,以及数据合规法规加强和执行力度提升,零幺宇宙在创立之初便将技术发展路径定为融合发展区块链技术和隐私计算,在已经成熟的区块链底层技术上,不断投入研究隐私计算技术。
(二)隐私计算对区块链的需求是如何出现的
隐私计算技术对区块链技术的刚需,最初只体现在隐私计算的技术流派之一可信执行环境(TEE)的应用当中。
比如2020年创立的冲量在线,主打TEE技术,目前已经在很多金融、政务、运营商项目中结合应用TEE和区块链技术。这是因为,对TEE技术在落地过程中与区块链技术具备天然的互补性,通过区块链技术提供对于算法和数据的不可篡改存证,结合TEE的可信度量能力,可以更好地保障数据在传入和传出可信执行环境前未被篡改,并且在数据“可用不可见”的协作过程中构建起多方之间的信任。
此外,大多数隐私计算技术最初是独立发展的,并没有与区块链技术结合的刚需。事实上,在本报告发布的时候,隐私计算对区块链技术的刚性需求在现实当中也尚未大规模地呈现出来。虽然2021年是隐私计算规模化落地元年,但是区块链技术在隐私计算技术的落地当中并非标配。
不过,业界对此已经有了前瞻性的认知。已有机构看到,区块链与隐私计算的结合是未来的必然趋势,技术融合解决方案的探索正在进行当中。
2020年1月,微众银行发布了即时可用场景式隐私保护高效解决方案WeDPR。WeDPR融合了区块链技术与隐私计算技术,使得实际商业场景中的敏感数据在区块链上可以得到更好的隐私保护。WeDPR为“区块链+隐私计算”的融合发展探索出新路径,助力落地更多的应用场景,可应用于支付、供应链金融、跨境金融、投票、选举、榜单、竞拍、招标、摇号、抽检、审计、隐私数据聚合分析、数字化身份、数字化资质凭证、智慧城市、智慧医疗等广泛业务场景。2021年5月,结合区块链和安全多方计算的优势,微众银行又推出多方大数据隐私计算平台WeDPR-PPC。
2021年10月22日,在云栖大会上,蚂蚁集团旗下蚂蚁链推出全新区块链网络平台FAIR。这是蚂蚁链区块链架构的全新升级。在新架构上,隐私计算成为一种原生能力,在出厂设置中就与区块链一起融合到单个系统内。这是业内首个提出将隐私计算作为原生能力的区块链网络平台。在未来,这有可能成为数据资产流转的“高速公路”。目前,FAIR平台已经开始在政务领域、大型企业中落地,并且在金融等更多领域的探索正在进行当中。
在接受零壹智库访谈时,微众银行和蚂蚁链都提到未来隐私计算技术对区块链技术的刚需。因为区块链技术主要是用于解决多方数据协作的问题。目前隐私计算技术处于落地应用的初期而且主要用于两方之间的数据协作,对区块链的需求尚未显现出来。未来,当隐私计算技术行至深水区、需要处理多方数据协作问题时,对区块链技术的需求就会凸显。
二、实践探索
在区块链与隐私计算融合的好处被意识到之后,业界进行了诸多实践探索。下面我们分两个部分来展示实践中的探索,一为实践方向,一为行业图谱。
(一)实践方向
零壹智库在调研中发现的探索有如下五种类型:
1、探索解决实际问题的具体应用
以杭州宇链科技有限公司为代表的一类公司致力于融合区块链和隐私计算技术,解决数据孤岛、数据安全等多方合作中的数据安全信任问题,为多方主体提供互惠合作的信任平台,形成“区块链+隐私计算+”的模式,解决实际问题。
杭州宇链科技有限公司(以下简称“宇链科技”)成立于2018年,最初的业务是以区块链技术赋能基础设施建设,研发并推出自主可控的区块链底层系统和安全芯片,实现了“芯片+云+链”三位一体的区块链平台并且实现了商业化落地。宇链科技的产品以公共安全、工业互联网、医疗数据、政务数据、公益志愿等为主要应用场景。其中,在公共安全领域的区块链平台建设方面落地应用较多。
2020年初,宇链科技开始组建隐私计算团队,推动隐私计算和区块链技术的融合。其原因是,宇链科技在为安全生产领域提供区块链平台建设的过程当中,发现了该领域的一个市场空白。安全生产领域企业包括印染企业、环保企业、电子工厂、制衣企业等,常常在生产过程中使用或制造危化品。国内保险公司往往因为危化品具有风险、企业生产数据缺乏可信度而拒绝提供保险。宇链科技发现隐私计算+区块链技术能够搭建安全生产企业与保险公司的信任沟通平台,将企业的核心工业安全数据流通起来,起到企业核心工业安全数据可用而不可见的作用,发挥企业数据价值,解决安全生产领域缺乏保险的行业问题。
由此,宇链科技打开了“区块链+隐私计算+保险”的蓝海市场。未来,宇链科技希望在安全生产领域成为提供“区块链+隐私计算”服务的平台级公司。2021年上半年,宇链科技与浙商财产保险股份有限公司签署了战略合作协议,以区块链和隐私计算为支撑,打造保险科技服务平台,通过可信数据基础设施,提供保前、保中、保后的全流程服务。在保前,整合企业在生产过程中存在的风险、隐患和事故多维度数据,并结合隐私计算进行精细化风控建模分析、风险量化;在保中,通过保险一张图实现风险识别、风险感知和风险预警;在保后,基于可信数据基础设施实现可信理赔,避免骗保等情况发生。同时,在后厨、物流、危化品等领域,宇链科技与杭州市萧山区政府、河南焦作市监管局、嘉兴桐乡市公安等政府客户开展合作打造了许多隐私计算+区块链产业的标杆案例。
在安全生产领域,宇链科技在隐私计算+区块链技术的市场化应用仍处于初级阶段,需要在商业化合作场景中进一步丰富隐私计算数据流通的标准设定、架构规划、协议制定等内容,接下来将基于浙江杭州的试点推广至全国,做好产品的标准化、场景的可复制,构建全国性安全生产网络平台。
2021年9月1日,《新安全生产法》正式实行,对国内企业安全生产技术和事故赔偿标准提出了更高的要求,而国内安全生产行业普遍缺失保险,一旦发生安全事故将面临巨额赔款。与此同时国家和各省市地区相继发布推动安全生产责任保险发展的相关政策,从目前来看,安责险将在全国范围内作为生产经营单位安全生产标准化评定的必要条件,演化成安全生产社会化服务体系。因此,未来在安全生产领域,保险的市场空间巨大,对区块链+隐私计算平台服务的需求也巨大。
[page][/page]
2、探索扩大联盟链应用范围
以杭州趣链科技有限公司为代表的一类公司通过引入隐私计算技术,为已有联盟链提供数据交换、数据保护、数据共享的信任平台,提升联盟链的数据交换效率,扩大联盟链的应用范围。
杭州趣链科技有限公司(以下简称“趣链科技”)成立于2016年,专注于数据共享平台。趣链科技提出“链上链下协同”的概念,研发出数据共享与安全计算平台BitXMesh,实行链上授权、链下交换的数据协作模式。在金融、政务、医疗、司法、新能源等领域实现了商业化落地,与住建部、中国人民银行、四大行总行、沪深交易所等政府机构、企业开展过合作。
2019年,趣链科技在为多个银行搭建金融数据共享平台时,发现区块链技术在隐私保护能力和数据处理性能上无法满足客户的需求。以金融风控为例,个人用户的开卡信息、银行的黑名单都是敏感数据,如果以公开透明的明文信息进行展示,很容易产生数据泄露,致使数据被非法交易,从而危害到企业利益、侵犯用户个人隐私。以数据处理为例,抵押贷款信用评级需要使用多家银行、多个企业的多种业务数据,区块链技术更侧重于数据的可信确权以及便于流通审计溯源、不善于跨机构数据的隐私安全计算。趣链科技发现,隐私计算既能拓展平台的数据储存和处理能力,还能保证敏感数据的隐私和安全。因此,开始在区块链技术中引入隐私计算,推动技术融合。
在技术应用的探索中,趣链科技发现,隐私计算技术的应用,可以帮助大大拓展联盟链的业务节点规模。未来,随着互联网硬件设施基础能力的提升,这也会使得联盟链的价值进一步提升。
目前,趣链科技的区块链与隐私计算技术相结合的应用已经在金融领域落地。趣链科技与央行分支机构、银行开展合作,运用区块链+隐私计算技术创新了数据报送模式。趣链科技在江西南昌成功落地金融业数据共享平台,将以此为标杆性案例,推广至全国更多的省市。
基于数据共享平台的可复制性,趣链科技接下来会将平台拓展至医疗、科研、新能源、司法等应用场景中。趣链科技认为,除了金融领域,医药行业、科研机构等领域,也存在不信任的多方主体需要共享隐私数据的市场需求,但由于行业数据涉及隐私、数据格式不统一、收益分配机制不完善等问题难以达成合作,区块链技术+隐私计算可以实现隐私数据的“可用不可见”,合作双方的互惠共赢,从而满足这一市场缺口。
截至2021年,趣链科技通过搭建区块链平台,与超过百余个客户开展了合作,实现了区块链技术的多场景落地。在区块链平台实现数据互联互通的基础上,趣链科技融入隐私计算,提升了区块链平台的数据处理和数据保护能力,降低了联盟链的准入门槛,助力更多中小企业以低成本加入联盟链,拓展了客户群体。
目前,趣链科技看到,越来越多的项目将区块链和隐私计算技术融合作为招标的硬性指标。未来,趣链科技将继续推动区块链技术和隐私计算的融合,建设多领域、多主体的数据共享平台,实现数据的价值流转,形成更大规模的链上“联盟”,打造数据共享互惠的区块链产业生态。
3、提供网络安全相关服务
在区块链与隐私计算技术相结合的实践当中,入局者并非只有区块链公司和隐私计算公司。还有一类是从安全领域出发的公司,他们的主要业务是网络安全或者信息安全,从保障安全的角度出发,将区块链与隐私计算技术相结合进行应用。八分量是其中的典型代表。
八分量创立于2016年11月。创立之初,八分量的主要业务是以可信计算为核心技术做企业数据安全解决方案,产品是以可信计算为基础的持续免疫系统,帮助企业用户解决“内网安全”的问题。八分量的愿景是提供可信数据服务,保障数据安全。
可信计算诞生于20世纪80年代,在中国的发展是从2000年开始的。当时人们己经认识到,大多数安全隐患来自于微机终端,因此必须提高微机的安全性。这样,绝大多数不安全因素将从终端源头被控制,对于广泛使用的微机,只有从芯片、主板、操作系统做起,综合采取措施才能提高微机的安全性。正是这一技术思想推动了可信计算的产生和发展。
在计算机系统中,软件和硬件都有可能存在恶意程序或受到非法破坏,这些攻击主要是利用计算机命令执行过程中的逻辑缺陷。传统的信息安全防护主要采用防火墙、入侵监测和病毒防范技术,对发现的漏洞进行封堵查杀。漏洞被发现后才能解决,这在安全防护上相对被动,并且只能处理已知的威胁,对未知的威胁无能为力。近年来,恶意用户攻击手段逐步升级,防护者的安全投入不断增加,维护与管理变得更加复杂和难以实施,信息系统的使用效率大大降低,而对新的攻击毫无防御能力。安全防护手段在终端架构上缺乏控制,这是一个非常严重的安全问题,难以应对利用逻辑缺陷的攻击。补丁难打、漏洞难防已经是当前信息安全防御的主要问题之一。
可信计算正是为了解决计算机和网络结构上的不安全,从根本上提高安全性的技术方法。可信计算是从逻辑正确验证、计算体系结构和计算模式等方面的技术创新,以解决逻辑缺陷不被攻击者所利用的问题,形成攻防矛盾的统一体,确保完成计算任务的逻辑组合不被篡改和破坏,实现正确计算。它是“主动防护”的思路,它通过采用运算和防御两套架构,在计算运算的同时进行安全防护,使得计算机只能执行规定的操作,而不能执行设计者和软件编写者所禁止的行为。比如,八分量的持续免疫系统可以实时监控已经拿到最高权限的外部入侵者,一旦发现恶意删除、拷贝以及篡改等违规行为,会及时锁定目标并限制行为。
创立之后,八分量在业务推进中发现了新的需求,前后经历了两次创新,逐步将可信计算技术与区块链技术、隐私计算技术结合起来。
第一次创新是在2017年前后。八分量在为一家金融机构提供服务的过程中,金融机构提出了新的需求。随着全社会数字化发展程度的提高,机构之间有了交互数据的需求。金融机构在将自身数据提供给其他机构时,遇到了新的问题——数据给到对方之后,就不可控了,对方拿到数据之后会如何使用,金融机构无从知晓。但是,金融机构内部的数据与个人隐私高度相关,金融机构想要对数据用途有所把控,保障数据安全、不泄露。为了满足这一需求,八分量将可信计算技术与区块链技术结合起来应用。由于区块链技术具有两大核心特点:一是数据难以篡改,二是去中心化。这使得区块链可以起到存证、溯源的作用。这样,金融机构将数据分享给外部机构之后,外部机构运用数据所进行的所有操作都可以记录在区块链上,金融数据就可以对数据用途进行监控。通过这一创新,八分量推出了“可信数据服务平台”,将应用推广至金融、能源、产业互联网等多个领域。
第二次创新是在2019年之后。2019年10月之后,由于对个人隐私数据监管的加强,市场对保护隐私数据的需求上升。从2019年11月开始,八分量开始研发将隐私计算技术与区块链、可信计算技术相结合的全新产品——八分量隐私计算及跨链大数据平台。在可信计算与区块链相结合的基础上,再进一步结合隐私计算技术,可以使得更多的机构愿意将自己的数据上链,从而在更多场景中开发新的应用。此前,由于区块链上的数据对所有参与方都是公开透明的,不少机构有信息泄露的顾虑,因此不愿将数据上链,特别是金融、医疗等涉及个人隐私数据的行业。
与其他机构不同,八分量对自身的定位是“可信数据服务商”,因此八分量隐私计算及跨链大数据平台的设计是围绕提供可信数据服务而打造的整体的解决方案。
该平台有如下几个特点:
第一,可信计算技术的应用,可以增强上链数据的可信度。此前区块链领域一个重要的问题是,数据上链之后的使用过程可以被记录并且不易被篡改,但是数据从链下到链上的真实性却无法保证。但是,如果在给出数据的计算机的源头就应用可信计算技术和区块链技术,就可以一方面保证本地的数据不被篡改,另一方面保证数据从本地上链的过程也被记录在区块链上、也不能被轻易篡改。这就进一步增强了上链数据的可信度。
第二,通过算法的改进和可信计算技术的应用,具有更高的性能。一方面, 应用可信计算技术,该平台可以使区块链网络利用更少的节点、更高效率地达成共识。从而提升区块链网络的性能,目前可以使得区块网络每秒钟完成上万笔交易。另一方面,通过算法的改进,该平台的性能进一步提升。以联邦学习为例,该平台的联邦学习算法性能优于目前主流联邦开源框架性能2~10倍。
第三,该平台具有更高的安全性。一方面,可信计算技术可以保障共识节点的状态,使共识节点的运行不易受攻击,从而提升节点安全性。另一方面,该平台技术路线丰富,可以通过多种技术融合来优化技术在场景中的应能用。例如,通过TEE与联邦学习技术的结合,该平台增强了联邦学习技术的安全性与效率。
此前,八分量的可信数据服务平台在金融、政务、物流与供应链领域落地较多。未来,八分量也将从这三个领域开始推广隐私计算及跨链大数据平台的落地应用。
特别是在物流和供应链行业,八分量看到了隐私计算及跨链大数据平台广阔的应用前景。物流与供应链领域是一个需要处理大量数据的领域。比如,日常生活中,很容易发生虚开发票、物流信息造假的问题,这会使得数据与现实脱节,造成表面上的虚假繁荣。此前,此类现象很难监管,因为没有区块链技术,上下游信息不容易追溯,没有隐私计算技术,企业不愿将自己的信息上链,很难查询其他企业的相关数据。但是应用隐私计算及跨链大数据平台之后,如果发票虚开,很容易被发现。因为一家企业开出的发票信息,监管者可以核查是否有上下游对应的关联信息,还可以交叉比对不同企业的信息,真实与否很容易判断。
未来,八分量将进一步将技术深化发展。八分量认为,隐私计算未来有可能发展成信息安全系统的标配,国家有可能实施安全等级评定,就像现在对信息系统提出安全等级保护的要求一样。因此,未来隐私计算技术的发展有可能向组件化、模块化的方向发展。八分量的技术发展有可能进一步深入到隐私计算模组、一体机以及芯片层面,形成完整的可信数据解决方案。
4、区块链+隐私计算基础平台(To B方向)
这是零壹智库在调研中发现的全新的业务方向。这一方向的典型代表是蚂蚁FAIR平台。此外,微众银行WeDPR平台、腾讯云区块链可信计算平台、平安集团加马区块链隐私协作平台、矩阵元基于隐私计算的新一代联盟区块链平台PlatOne等都是此类平台。这类平台通过结合隐私计算技术和区块链技术,搭建区块链+隐私计算基础平台,为多个行业的企业提供服务。这个方向,也是巨头扎堆投入的方向。
10月22日,2021杭州云栖大会上,蚂蚁集团旗下蚂蚁链推出数据隐私协作平台FAIR。
FAIR平台是面向数据隐私计算与协作融合的一体化产品。核心基于区块链和隐私计算技术,提供包括数据接入发布、协作计算、价值分配和流转的全生命周期处理能力,是面向未来数据要素流通领域所设计的数据交付平台。基于智能合约编排、调度,实现数据从分类分级导入、发布注册、授权计算到价值流转分配全链路的可信、可证和隐私安全。
得益于蚂蚁链在底层技术的积累,该平台融合了多方安全计算(MPC)、可信执行环境(TEE)、联邦学习(FL)三类主流的隐私计算技术。此外,通过深度融合软硬件技术,构建了自主安全计算硬件并获得CFCA安全认证,联合达摩院计算技术实验室和阿里安全双子座实验室等团队设计的全同态硬件加速,实现了百倍以上的性能提升。
这是蚂蚁链区块链架构的全新升级。在新架构上,隐私计算成为一种原生能力,在出厂设置中就与区块链一起融合到单个系统内。这是业内首个提出将隐私计算作为原生能力的区块链网络平台。在未来,这有可能成为数据资产流转的“高速公路”。
随着数据资产化的发展,人们渐渐认识到,对于数据资产的流转来讲,没有隐私计算,不能解决数据本身的安全和隐私保护问题;没有区块链,不能解决数据的确权问题以及在更大范围内的数据网络协作问题。将区块链和隐私计算二者结合起来,建设大规模数据流通网络,在目前的实践中成为有所共识的探索方向。因此,蚂蚁链提出,升级区块链架构,让隐私计算成为一种原生能力。
“原生”的意思并不是简单地把区块链和隐私计算技术放到一起,而是根据整体要实现的数据交付目标,来定义在数据流转的关键阶段和节点所需要的协议和计算方式。
目前,行业内的通用做法是,通过双系统架构将两者结合。对于客户来说,需要采购、配置两套系统才能实现协作目标,且在协作过程中,两套系统的适配能力和安全也存在挑战。
区块链和隐私计算技术的结合,不是简单相加就可以的,二者的结合需要解决许多新的问题。数据资产的交付比实体商品的交付更加复杂,交付过程中要保障各方的权益,要保证整个过程是可审计、可验真的,这不仅需要隐私计算和区块链的技术来做点的支撑,还需要许多大大小小的协议对基础数据的安全认证、隐私加密保护和存储等进行规定,从而将整个过程串联起来。因此,简单的隐私计算或区块链应用,都很难全面地、体系化地解决这个问题。
FAIR的诞生,正是对目前区块链与隐私计算技术发展过程中面临的一系列问题的系统化的解决方案。
FAIR的名称,源自2016年欧盟提出的开放科学数据的FAIR原则。
当前,科学研究正由“观察实验”、“理论分析”、“计算模拟”向数据驱动科学发现研究范式转变。一方面,新的科学发现越来越依赖于多源数据的集成整合与分析;另一方面,新的数据不断生成,这些数据规模巨大、类型繁多、格式各异且处于高速增长状态,给数据的管理保存、集成分析、共享利用等都带来了重大挑战。面对这些挑战,定义一些共同接受的原则以指导科学数据的开放与公开,促进科学数据的共享利用成为现实迫切需要。
为确保能同时被人和机器所使用,FAIR 原则阐明了“数据对象”应具有的基本属性,即可发现(Findable)、可获取(Accessible)、互操作(Interoperable)和可重用(Re-usable),每个主要原则又包含若干具体细则。
FAIR原则提出之后,欧盟的“开放科学数据”(Open Science Data,OSD)已走在全球前列,且呈现出与“开放政府数据” (Open Government Data,OGD)相互融合、协调发展的趋势。目前,FAIR 原则已成为欧盟制定数据战略、政策和法规的重要指导原则之一。
蚂蚁的FAIR平台,在数据流转的原则方面,对欧盟提出的FAIR原则进行了进一步拓展。蚂蚁加入了可审计(Auditable)和可回收(Re-cyclable)的原则。可审计(Auditable),指的是数据流转的全过程可以被监督和审计,以确保数据合规使用。这是为了确保隐私计算名副其实,为了预防在隐私计算技术的掩护下盗取数据的行为发生。可回收(Re-cyclable),指的是整个体系支持用户数据撤回。
图:蚂蚁链隐私数据协作网络示意图
来源:蚂蚁链
FAIR平台有几个显著的特点:
首先,不同类型、不同格式的数据源都可以接入。在实际应用场景中,不同机构和部门的数据都不一样,很难要求所有的数据源有同构的数据库。FAIR平台将不同行业、不同类型的数据都做了分级分类,方便各类数据接入。
第二,FAIR平台是一个开放平台。FAIR平台上的隐私计算算法分为两类:一类是蚂蚁研发的,偏通用和常见的算法;另一类是可以由用户贡献的算法。未来,FAIR平台可以自由加入,如果有提供隐私计算算法的公司加入FAIR平台,可以得到FAIR的生态支持,得到很好的发展。
第三,FAIR平台围绕区块链和隐私计算的技术特性,提供软硬件一体化的一体机产品。首先,蚂蚁链在安全计算硬件密码卡方面投入巨大。对安全计算平台来说,密钥管理至关重要,如果密钥丢失,别人就可以拿着失主的身份去合法合规地做所有的事情,就像拥有密码一样。为了确保安全,蚂蚁链自研密码卡,具备国密三级资质,支持密钥生成、公钥导出,用于保护计算节点私钥安全。
其二,蚂蚁链也自研了隐私计算硬件,拿到了CFCA中国金融认证中心的资质。这个资质核心的点是防信道攻击,可应用于智能合约的隐私保护,通用机密计算。支持国产化基于CPU的通用TEE机密计算能力。
其三,蚂蚁链自研了全同态加密加速技术,推出面向全同态加密算法的定制计算加速器,提升基础算子两个数量级以上的性能。同时还推出高性能智能网卡,支持大规模组网和隐私计算密集数据通信的加速。
第四,在性能提升方面,FAIR平台有硬核技术支撑。
首先,FAIR平台联合达摩院计算技术实验室和阿里安全双子座实验室等团队设计的全同态硬件加速,实现了百倍以上的性能提升。
与此同时,2021年6月,蚂蚁链发布了区块链高速通信网络BTN(Blockchain Transmission Network)。BTN是数字世界的“高速公路”,它通过智能路由算法、高效传输协议、传输优化算法、虚拟专线保障等技术,在全球多个城市间架起了高速通信网络,提升区块链网络的稳定性、连通性和实时性,通过在传输层和应用层两侧加密,保障数据在传输链路上安全不泄露,为可信数字时代的大规模互联互通打下基础。
在政务领域和大型企业,该方案已经被广泛应用于多个市县的数据开放共享的管理流程中,已适配多个行业、区域的数据管理条例,并逐步沉淀多个创新的数据场景服务。
[page][/page]
5、区块链+隐私计算基础平台(To C方向)
以Oasis Labs(绿洲实验室,以下简称“Oasis”)为代表的一类公司通过结合隐私计算技术和区块链技术,搭建区块链+隐私计算基础平台,为个人提供服务。
Oasis Labs成立于2018年,为Oasis Network的主要技术研发团队,负责Oasis的整体开发以及技术升级等工作。
Oasis Network于 2020 年 11 月 19 日正式上线,是全球首个具有隐私保护功能和可拓展性的去中心化高性能区块链网络。Oasis Network面向全球市场,和宝马、谷歌云、基因公司等开展过合作,以医疗领域、金融领域、数字广告营销领域为主要应用场景。目前,Oasis在中国市场已经开始了初期的推广落地。
与前述主要为企业提供服务的区块链+隐私计算基础平台不同,Oasis Network同时也可以让个人用户更好地掌控自己的数据权益。应用Oasis Network,用户不仅能够掌握自己的隐私数据,还能通过共享隐私数据获得收益。
在Oasis Network创始团队的设想中,这将推动构建负责任的数据经济——通过数据确权,实现数据资产化,使得数据在使用过程中能够很好地保护数据权益,在利用数据要素推动经济发展的同时,也能够很好地保护个人隐私。这也可以进一步揭开更广泛的去中心化金融(DeFi)市场。
成立之初,Oasis将隐私计算和区块链技术进行融合作为技术发展路线。其原因是,Oasis关注到在不信任的多方合作中、在企业对用户进行数据分析过程中,区块链技术仅能进行数据确权、保证流程公开透明,但不能对敏感数据进行保护、防止数据泄漏。Oasis认为隐私计算+区块链技术能为数据创建一个安全和隐私保护的信任层,既能保障用户数据权益,又能实现数据资产化,激励和保障有价值的数据最大化使用。
图:Oasis 网络商业模式示意图
来源:Oasis Labs
此外,为了更好地帮助企业拥有足够的数据来开发更符合用户需求的产品、制定良好的营销策略,Oasis推出Cleanroom帮助企业间或企业内部不同部门搭建AI模型,分析用户数据。不同企业、不同企业部门可以将数据上传到区块链平台,经过隐私计算对数据进行处理和加密,企业通过多次联合训练AI模型,计算出用户需求、制定业务发展方向。其中,通过使用隐私计算技术,企业可以约束各个部门、其他企业的数据查询范围、规范查询内容、防止原始数据探取,减少敏感数据的非法利用和泄漏。
Oasis认为,数据作为第五种生产要素会越来越重要,隐私计算将成为区块链技术落地中的刚需,帮助用户、数据拥有者、数据使用者实现多方合作共赢。当前,区块链和隐私计算的市场以To B为主,随着硬件技术和软件技术的发展和用户数据隐私观念的提升,用户对个人数据确权、拥有个人“数据金库”的需求会越来越大,技术融合将在C端市场打开巨大的市场缺口。
Oasis 认为,“数据金库”的出现可以帮助打破数据孤岛。目前,用户的数据分散于各类应用软件中。例如,一个人的消费数据可能分散于支付宝、淘宝、微信、美团等移动APP中。数据孤岛的形成,使得无法将各类数据联合起来进行价值挖掘和应用,这大大限制了数据价值的发挥。如果“数据金库”出现,将可以使每个人很好地管理自己的所有数据,并从数据的分享和使用中获益。
这一转变的发生,是有法律支持的——个人用户有权从第三方调用自己产生的数据。欧盟的GDPR和美国的 CCPA等法案中涉及用户的一项重要权益,即“portability(可携带权)”,即第三方应用不能封锁个人数据,一旦个人有下载的诉求,APP需要提供便利的API利于个人拷贝数据。美国公司已陆续为用户提供API,如果在这方面功能缺失,个人客户可以提出诉讼,而公司也将面临巨额的罚款。
在中国的《个人信息保护法》当中,也有相关的条款。《个人信息保护法》第四十五条规定:“个人有权向个人信息处理者查阅、复制其个人信息”,“个人请求查阅、复制其个人信息的,个人信息处理者应当及时提供。个人请求将个人信息转移至其指定的个人信息处理者,符合国家网信部门规定条件的,个人信息处理者应当提供转移的途径。”
未来,Oasis致力于推动隐私计算和区块链技术的进一步融合,以区块链技术进行数据确权,以隐私计算技术确保数据安全,实现数据资产化,建设数据安全交易的全球网络。
(二)行业图谱
以上为零壹智库在调研过程中发现的比较具有代表性的几类探索方向。目前,有越来越多的公司都开始意识到区块链与隐私计算技术融合所带来的价值。因此,在该领域探索的公司,不止前文所提及的几个公司。
通过可以公开获取的信息,按照前述的五个探索方向,零壹智库对这些公司进行了梳理和大致的分类:
第一类,探索解决实际问题的具体应用。目前看来,在这一类别的公司是最多的。
在这其中,我们又发现了四个小的类别。这其中包括:隐私计算创业公司冲量在线、洞见科技、光之树、零幺宇宙;金融科技公司翼支付、联易融、纸贵科技;大数据公司京信数科、杭州医康慧联;区块链公司宇链科技。
第二类,是探索扩大联盟链应用范围。在这个类别里,我们暂时只发现趣链科技一家公司。
第三类,是提供网络安全相关服务。其中包括八分量、奇安信、安恒信息。
第四类,是为企业提供区块链+隐私计算基础平台的公司。这个方向是巨头扎堆的方向,其中包括蚂蚁链、微众银行、腾讯云、京东数科海益信息、壹账通、矩阵元等。
第五类,是致力于做通过为企业提供服务、最终为个人提供服务的区块链+隐私计算基础平台的公司。这类公司,我们目前暂时只发现Oasis Network一家。
这里,需要说明的是,这张行业图谱可能并未穷尽目前该领域的所有公司。目前,不少公司都储备有区块链和隐私计算技术,但是并不作为主推业务,或者其产品尚未通过信通院相关测评,此类公司暂时未包含在内。这个领域发展比较迅速,每过一段时间都会出现新的公司,我们也会根据行业情况持续更新。
图 区块链+隐私计算行业图谱
来源:零壹智库(制图:张艳茹)
三、应用案例
上一部分,我们介绍的是区块链与隐私计算技术结合方面的探索。这一部分,我们将介绍,目前这两种技术的结合,在实践中应用在哪些场景,解决了哪些典型的问题。
(一)政务应用
1、政务数据查询
在进行城市交通管理、政务数据治理的过程中,政府部门之间共享信息往往过程复杂、流程繁复、延时性高。且由于数据权责划分不清,经常导致数据使用和修改存在越位、缺乏记录的问题,使得数据不全、不准、用管不同步、更新不实时。
区块链+隐私计算技术则能够帮助政府提升社会治理数字化、智能化、精准化水平。区块链技术能够明确数据权责归属,保障数据更新及时、更新有存证;隐私计算技术防止数据泄露、越权修改,能够提高政务服务和管理水平,加强综合监管,提升业务透明度。
比如判断一个用户是不是低保户,这个场景就可以应用FAIR平台来解决问题。要判断低保户,需要查询个人的纳税、固定资产、车辆情况。这个需求,地方政府的大数据局一般无法满足。政务数据往往散见于地方政府的各个部门,不少地方政府有大数据局,但是大数据局也并不拥有这些完整的数据,这就需要在不同政府机构进行查询,最后形成新的数据资产。应用FAIR平台,可以在不同的数据源之间发起查询,此后,形成新的数据资产,再重新确权、鉴权、流转。整个过程,FAIR平台都可以很好地支持。这是一个非常典型的政务数据公开的协作方式,许多政务数据的查询都以类似的方式进行。
2、综合政务数据打造企业信用指数
2022年,八分量、中物联联合相关部委,利用隐私计算技术打造企业信用指数和相关计算系统,以利于社会及时了解企业、行业、区域及全国的企业信用状况的总体变化趋势。同时,也面向全国企业的首席执行官、财务和业务管理人员等提供一个有用的评估工具,用它作为整个商业交易循环的基准和预测的手段。
企业信用指数算法需要汇聚多个维度的数据,包括企业经营数据、工商数据、税务数据、资产数据、信贷数据、交易数据、银行流水数据、财务数据、供应链数据等相关数据。通过隐私计算产品在不交换原始数据的情况下,完成企业信用指数计算。
八分量通过在管理方节点部署隐私计算系统,一方面实现对数据应用的监管和安全管控;另一方面基于指数模型实现系统自主计算执行和验证。在每一个数据点,均可达到数据无需明文暴露,无需出域,仅与算法隐私计算节点协同工作,即可完成密文运算。同时,在各方数据流通过程中,需要对数据流通进行监管,这其中运用了区块链技术。
(二)金融应用
1、隐私计算+联合风控评分
数据方在进行风控、定价、营销时,缺乏相应模型来分析、评估用户各维度数据,而模型方,则希望能持续使用外部数据来检验并更新自身风控模型,以提升模型质量。双方诉求的满足,需数据方与模型方协作进行联合预测。然而,各机构的数据对于本机构来说属于核心资产,数据、模型直接互通牵涉利益和合规风险,实际场景中,各机构数据往往不能出库,难以实现跨机构的数据互通。
微众银行“隐私计算+联合风控评分”场景解决方案,为上述难题提供解题思路。该方案中,数据方与模型方优势互补,开展协作预测,可基于安全多方计算(MPC),在密文形式下进行数据、模型参数的传输与计算。同时,借助区块链的可信数据治理机制,将隐私计算全流程涉及的参与方身份、数据源、模型源、关键中间计算结果与隐私计算结果的哈希进行存证审计,合法合规地最大化了自由数据价值,支持大数据多方协同生产。
图:联合风控评分示意图
来源:微众银行
联合风控评分的应用具有以下优势:
业务提效:汇集多数据源与模型源,实现优势互补的数据协作,降低坏账率,提升风控评估质量;
功能完善:支持多种主流的模型预测算法,包括逻辑回归、神经网络、决策树等;
性能优异:可支撑大规模数据下的金融风控预测;
安全合规:数据与模型参数的原文均不出库,保护数据安全与模型安全,满足合规要求;
灵活易用:支持多种部署及调用方式,模型方可直接载入现有模型,实现对模型的高效调用。
2、数字联盟类应用
在金融领域,不少业务场景需要联合多方数据进行分析和判断,这不是两方或者三方数据可以解决的,在这类应用当中,同时使用区块链和隐私计算技术是较好的解决方案。以光之树科技落地的股权质押数字联盟应用案例为例。
某金融登记结算机构构建的基于其主要业务的股权质押数字联盟,通过目前与券商、银行直连的接口,实现:
第一,敏感数据保护、数据有效性验证、节点间数据安全传输方案、访问记录可追溯,提高在股权质押全流程中的数据流转效率和信息披露环节及时性;
第二,在联盟成员协作的基础上,由监管驱动型联盟向产业价值型联盟转型,正在寻求向投融资对接、风控服务输出等业务上发展的可能性。
图:光之树科技股权质押数字联盟示意图
来源:光之树科技
在此过程中,光之树科技提供包括天机可信计算框架、顶层设计和联合运营在内的整体解决方案,打造以登记结算机构等金融基础设施核心机构为主体,以股权出质人、质权人、代理人和司法机构共同参与的数字联盟。通过包括可信计算环境、PBFT共识算法、智能合约和分布式存储等一系列技术,首先将数据分级分类,明确数据储存和读取方式;其次保证上链、读取过程中数据可靠性、流通过程中数据安全性,设置访问权限来避免数据泄露,从而提供质押全流程在线化登记结算服务。数字联盟参与方之间形成互联互通的数据沟通机制,能及时精准的反映股权质押情况,提供风险预警,形成有效监督机制。
3、金融征信与监管
趣链科技与央行分支机构、银行开展合作,运用区块链+隐私计算技术创新了数据报送模式,在江西南昌成功落地金融业数据共享平台,建立了融资联合征信平台,解决了机构数据共享的问题。
在传统情况下,个人、机构的征信数据由银行定期、集中报送到央行,央行根据征信数据完成征信报告,具有较高的时间成本。
趣链科技以区块链技术为基础打造数据流通平台,以隐私计算技术链接银行业务系统,搭建出一个金融业数据共享平台,平台中提供了丰富的风控算法、编程规则,不同的银行可以根据自身的业务需求在平台上部署不同的风险模型、上传业务数据。业务数据经过隐私计算处理后以密文形式进行展现。央行可以在平台上实时查询、计算不同银行的数据,银行间可以在平台上实现数据的交换、流通,提升了央行实时监管的能力、银行数据互通的效率。
图:互联网金融行业安全数据联盟示意图
来源:趣链科技
(三)物流与供应链应用
税务部门在监管各个企业汇总的税务数据时,无法准确识别税务信息(如发票)是否造假,税务信息背后到底有没有发生真实交易行为发生。因此,监管部门希望通过税务数据的上下游信息来核查,判断数据是否可信。然而,上下游企业的核心数据,涉及生产经营,这些数据非常敏感,随着国内数据安全监管的完善,某行业协会希望能在合法合规的背景下打通产业链上下游数据,实现数据共享,数据流通和数据可信验证。
八分量提供隐私计算及跨链大数据平台,来解决各企业间的数据安全、数据共享、数据流通和数据验证问题。基于平台设计的安全性、先进性、高可用性,针对各环节各企业产生的数据,包括合同流、发票流、物流、资金流,分别记录在各自企业的区块链系统中。因为涉及到企业核心数据,各链之间的数据不共享,不可互相访问、不可明文互相查验。借助隐私计算,八分量实现了数据密态下的流通与利用,通过各企业间数据的交叉验证来判断税务(发票)信息是真实可信,保证各企业间的数据在检验数据可信与否之后,还要让那些提供虚假信息的数据源不可抵赖。平台框架如下:
图 八分量隐私计算及跨链大数据平台框架图
来源:八分量 平台有几大核心功能:
第一,各企业区块链数据聚合与存储。各企业的税务信息、税务上游信息订货方产生的数据、和下游物流信息、第三方流水信息等,可以通过平台系统+区块链的接口对接完成数据上链并进行流转,链上数据可查询,实现各企业产生的关键核心业务数据聚合、流通。
第二,节点安全和状态监控。反映区块链中每个节点的可信值以及一段时间内的交易频率,可以对不同间维度的数据进行监控和分析。
第三,区块链关键数据存储与日志存储审计追溯。存储层以区块链技术为核心,实现高效的数据加密存储,日志存储审计可追溯,有了区块链的加持,使得任何虚假数据,都不可抵赖,不可篡改的记录在链上。极大提高了企业提供虚假内容的造假成本,极大降低了监管的难度,防止通过任何方式进行恶意修改。
第四,数据风控分析报告。通过从链上获取发票订单所需企业上下游数据,可以通过分析税务信息匹配到的物流流转信息条数,合同信息、订单流水信息的数量来判断税务信息的真实性,识别税务数据是否虚假。
更具体地来说,该平台可以实现如下价值:
第一,实现数据加密共享。在各自企业的区块链系统中,因为涉及到企业核心数据,各链之间的数据不共享,不可互相访问、不可明文互相查验。借助隐私计算,八分量实现数据密态下的流通、共享、利用和验证。
第二,实现数据可信可查。对数据的可信度完成了度量。满足更多验证条件的数据,就具备更高的可信度。而那些无法得到验证的数据,一旦涉及虚假信息,因为记录在区块链,数据可溯源,任何一方不可抵赖。监管可根据情况,进行更加深入的调查。
第三,提升数据风控能力。强化数据整合,打破企业间的孤岛数据,实现各企业数据共享、数据互通、数据验证,便于监管各个数据流的数据真实性,极大的提升了该协会识别各企业税务信息是否虚假的风控能力。
(四)医疗应用
医疗行业里的病人数据具有高度隐私性,且对共享需求极大。但目前,医疗行业缺乏一套记录患者完整医疗信息的数据系统,且存在数据分类模糊、数据泄露风险高等问题。医疗数据质量不高严重影响了后续的数据流通、共享和应用,制约了整个行业医疗服务质量的提升。
区块链和隐私计算的技术则可以用来解决病人数据泄漏、数据共享风险的问题。区块链技术对医疗记录进行存储、防篡改,保证数据和病历记录的真实性;隐私计算技术对医疗记录进行隐私处理,防止数据泄漏。目前区块链技术在医疗领域的具体应用场景主要是,多方在区块链平台上对医疗数据进行共享,满足获取患者历史数据、将共享数据用于建模和图像检索、辅助医生治疗和健康咨询等。
2020年9月,星云基因与Oasis Network达成合作。使用 Oasis Network的框架,客户可以保留其基因组数据的所有权,而星云基因可以在不查看客户原始信息的情况下对数据进行分析。该产品现已在 Oasis的测试版中提供给星云基因的用户。
据了解,这一过程的具体实现是这样的:
当用户购买基因测试的试剂盒并提交样品后,他们可以登录星云基因获取测试报告,获悉新的基因变异和风险评分。
而在双方合作后,用户在星云基因的数据将被存储在Oasis 的平台Parcel上。在创建Oasis账户后,客户可查看数据使用政策并进行授权,其基因数据将通过Parcel加密并加载于安全飞地 (Secure Enclave,隐私计算技术的一种,可以理解为可信执行环境,通过为应用程序及其使用的数据提供隔离计算环境来保护隐私安全)环境中。
图:Oasis采取TEE可信执行环境护航数据隐私示意图
来源:Oasis Lab
星云基因每一次调用数据和分析使用前,Parcel都将验证客户的授权和使用用途与政策所述的符合性。只有在客户授权的情况下,星云基因才有权在Secure Enclave这个安全的运行环境下执行代码、调用数据,并根据最新的科学发现生成新的基因报告。另外,Parcel 用户可以随时返回 Oasis Steward 应用程序,查看访问其基因组数据的时间和方式的完整历史记录。他们还可以使用 Oasis Steward 应用程序随时撤销权限,确保他们可以完全控制自己的基因组数据。
与此同时,除了数据确权和监控用途,用户可以实际获取分享数据的收益。如果有医药公司需要调取星云基因数据库做研究,需要根据调用次数和数据体量向个人用户支付费用。
这里,需要解释的是,Oasis Network的Parcel平台是为了降低Oasis Network的使用门槛而建立的平台。由于涉及密码学,对于部分企业和个人来说,不知道如何在Oasis网络上部署智能合约,也无法理解隐私计算技术的具体流程。应用Parcel平台,普通的程序员,只需要输入数据、确定共享者,企业端的数据便可进入Oasis网络并经后续处理。
图:Oasis Parcel 工作机制示意图
来源:Oasis Labs
(五)其他应用
1、匿踪查询
匿踪查询,也称隐私信息检索,是指查询方隐藏被查询对象关键词或客户ID信息,数据服务方提供匹配的查询结果却无法获知具体对应哪个查询对象。数据不出门且能计算,杜绝数据缓存、数据泄漏、数据贩卖的可能性。
WeDPR-PPC匿踪查询方案基于不经意传输、隐私求交等隐私计算技术,当数据方对查询方所查用户进行隐私检索时,仅返回是否检索成功,但无法获知所查用户身份,实现匿踪查询的效果。区块链有助实现可信身份验证、数据治理与存证审计。
图 WeDPR-PPC匿踪查询方案示意图
来源:微众银行
WeDPR-PPC匿踪查询方案应用场景广泛,如金融反洗钱反欺诈、疫情健康数据查询、身份核查等多个业务场景,适用于查询过程中需要保护所查信息隐私的各类场景。
2、版权保护
随着互联网的发展,数字产品存在可复制性强、可盗用性高等版权保护问题。由区块链技术上衍生出的虚拟货币权益证明NFT (Non-fungible Token)通过为数字音乐等艺术数据提供知识产权标记,推动知识产权的保护、授权与交易。
2021年8月,零幺宇宙和阿里拍卖开展合作,作为技术提供方为阿里拍卖生态伙伴提供基于树图共识算法的联盟链的数字藏品存管配套服务。用区块链技术完成数字资产确权,构建多方合作生态,在版权确权、维权、授权、衍生品溯源等方面提供数字化标准、素材库、标品库,通过版权局或者公证处来出权威证书,确保拍卖后数据的归属权在链上视线转移,保证资产的唯一性。通过引入隐私计算,数字资产在链上可公开的信息里只展示部分数据、降低分辨率,实现了数据资产的保护,推动版权数字化和版权的发行交易,实现数字产品的资产确权。在文学、美术、音乐、数字作品等领域得到了越来越多的应用。
2022年3月,零幺宇宙旗下“光笺链”已取得网信办境内区块链服务备案,可提供数字身份、文件存证、数字藏品、品牌数字权益等全方位数字资产管理服务。目前光笺链上存证藏品金额已逾千万。2022年4月,零幺宇宙接入国家级版权交易保护联盟链,将数字文创业务纳入国家级数字文创规范治理生态矩阵数字文化产权登记流转体系。零幺宇宙相关数字文创产品将在国家级版权交易保护联盟链上存证并在获得相关“数字登记证明”后,可依法依规通过“数字文化产权登记托管流转专区”进入国家级版权交易保护联盟链超级节点进行转让流通。
图 零幺宇宙数字文创平台“光笺收藏家”首页
来源:零幺宇宙
3、低碳数字底座
零幺宇宙采用“区块链+隐私计算”技术组合助力碳计量与碳资产管理数字化。通过隐私计算实现碳信息采集的过程加密,避免企业和国家经济数据泄露;用区块链实现碳信用和碳资产的分布式存证,提高第三方认证的可信流通。通过区块链+隐私计算技术组合,融合边缘侧分布式架构设计,零幺宇宙开发软硬一体的产品组合,为某国家级创新示范区提供一套边缘、聚合、存储、调用、智能决策的数据治理体系,保障数据流动中的可用不可见、可信可追溯,实现城市运行中的标志数据存证、碳计量、碳预测相关功能,创新实现一套具有分布式学习能力的低碳数字底座。
图 零幺宇宙光笺低碳园区治理平台可视化界面
来源:零幺宇宙
四、关键问题展望
(一)区块链与隐私计算的结合是必然趋势吗
我们目前对这个问题的思考框架是:如果不与隐私计算技术结合,区块链技术的应用是否受到限制、无法向前发展;如果不与区块链技术结合,隐私计算技术是否受到限制、无法向前发展。如果二者对彼此都是刚需,那么它们相结合的趋势就是必然。以下为我们对这个问题的思考:
1、隐私计算技术的应用是否区块链技术的刚需
区块链技术有巨大的优势,但是如果没有隐私计算技术,区块链技术的应用会大大受到限制,因为无法解决链上数据的隐私保护问题,这使得大量涉及敏感数据的场景不愿应用区块链技术,比如金融和医疗领域。
(1)区块链技术的局限性
第一,链上数据公开透明,数据的合规处理和隐私保护能力不足
区块链作为分布式账本系统,数据的公开透明尽管有利于存证、防篡改,但也存在数据可轻易被复制、泄漏个人隐私的风险。区块链在公有链上要求不同节点对交易和交易状态进行验证、维护,形成共识,因此每个参与者都能拥有完整的数据备份,所有的交易数据公开透明。如果知道某个参与者的账户,就很容易获取其每一笔交易记录,从而据此推断其社会身份、财产状况等。以消费场景为例,平台之间存在竞争壁垒,用户也希望保留消费隐私,因此区块链缺乏对用户流水、物流信息、营销情况等与企业、个人隐私相关的数据缺乏保护能力,往往导致数据拥有方不愿意让数据进入流通环节。
在链上系统的交易不再受中心账本的控制,用户通过使用唯一的私钥进行交易,交易过程被加密且加密前数据很难还原,仅以私钥作为交易凭证使得区块链内的交易变得更加匿名和不可控。在分布式账本系统上,所有的转账以地址形式进行,一但发生了诈骗或者洗钱等金融犯罪,即便可以公开查询地址,但对资金追踪的难度极大,且私钥作为交易凭证很难证明使用者的身份,因此许多企业、个人通过区块链进行洗钱等违法交易,不利于数据的合规处理和合法共享。
第二,数据处理能力不足,制约技术的进一步落地和商业化拓展
链上计算受限于网络共识的性能,使得链上交易难以具备实时性和高效率,区块链智能合约的计算能力需要扩展。以最大的加密支付系统比特币为例,每秒钟只能够处理大约3到7笔交易[5],且当前产生的交易的有效性受网络传输影响,往往需要等待10分钟左右的记账周期才能让网络上的节点共同知道交易内容。此外,如果链上有两个及以上节点同时竞争到记账权力,则还需要等待下一个记账周期才能确认交易的准确性,最终由区块最长、记账内容最多的链来完成确认。
完全去中心化的系统与现实中大部分现有体系的兼容性不足,缺乏链上链下协同、多业务发展的系统和功能,制约区块链技术的进一步落地。在区块链的技术落地过程中,首先,各行业本身具有成熟的体系,区块链完全去中心化的形式不一定适合所有的领域和行业;其次,区块链的平台设计和实际运行成本巨大,其所具备的低效率和延迟性的交易缺陷非常明显,是否能够弥补原系统更换的损失需要经过一定的精算和比较;此外,使用区块链存储数据需要对原有数据格式进行整理,涉及到政务、司法领域的敏感数据,更需要建立链接线上和线下数据的可信通道防止数据录入有误,这带来了较高的人力、物力成本。
(2)隐私计算技术对区块链技术的帮助
隐私计算技术保障数据从产生、感知、发布、传播到存储、处理、使用、销毁等全生命周期过程中的隐私性,弥补区块链技术的隐私保护能力,实现数据的“可用不可见”。通过引入隐私计算技术,用户的收支信息、住址信息等个人数均以密文的形式呈现,在平台进行数据共享的过程中,既能防止数据泄露,又能够保障用户个人隐私的安全,有利于进一步打破数据孤岛效应,推动更大范围内的多方数据协作。
隐私计算技术可与区块链技术形成技术组合,提升数据处理能力、扩大可应用范围。隐私计算技术通过对数据进行规范化处理,能够提升数据处理、数据共享的效率,提升区块链的数据处理能力。此外,隐私计算技术+区块链技术的技术组合能够应用于缺乏中心化系统、但又对敏感数据分享有强烈需求的合作领域,扩展区块链技术的应用场景。
2、区块链技术的应用是否隐私计算技术的刚需
(1)隐私计算技术的局限性
第一,数据共享缺乏安全检验,制约数据流通的可信性
数据共享的整个流程涉及到采集、传输、存储、分析、发布、分账等多个流程,隐私计算主要是解决全流程的数据“可用不可见”的问题,但是难以保证数据来源可信和计算过程可信。
从数据来源可信的角度来说,在数据采集的环节,数据内容本身可能不完整,数据的录入可能会存在失误;在数据传输的环节,数据的传输可能会被其他的客户端攻击,导致数据在传输的过程中泄漏;在数据的储存环节,储存数据的角色方有可能会篡改数据或者将数据复制转卖到黑市,这些都不会被隐私计算技术记录。如果无法保证数据共享各方的身份得到“可信验证”,就有可能导致数据的隐私“名不副实”。从计算过程可信的角度来说,在数据分析和发布的环节,数据的共享方有可能私自篡改数据的运行结果和发布内容,对最终数据处理的结果进行造假。因此,一旦信息经过验证并添加到隐私计算的环境中,很难发现数据是否被篡改、被泄漏,很难防止不同时间点不同节点的数据造假的情况,在涉及到金融、政务、医疗、慈善等关键领域里,如果数据有误则产生的一系列法律问题则难以追究。
第二,业务水平整体层次不齐,制约技术平台的扩展
当前,隐私计算的技术实现路径主要分为三种:多方安全计算、联邦学习、TEE可信执行环境。三种技术路径存在各自的应用缺陷和问题,由于行业内不同公司对于技术的掌握能力和研发能力有限,导致技术平台的实际应用范围有限,可扩展能力不足。
多方安全计算尽管具有复杂高标准的密码学知识,但其计算性能在实际应用的过程中存在效率低的缺陷。随着应用规模的扩大,采用合适的计算方案保证运算时延与参与方数量呈现线性变化是目前各技术厂商面临的一大挑战。多方安全计算虽然能保证多方在数据融合计算时候的隐私安全,但是在数据的访问、控制、传输等环节,仍然需要匹配其他的技术手段防止数据泄露、篡改。[6]
联邦学习技术目前在业内的应用通常以第三方平台为基础模型,在基础模型之上进行隐私计算,这样的基础模型本身存在被开发者植入病毒的隐患。此外,联邦学习的机制默认所有的参与方都是可信方,无法规避某个参与方恶意提供虚假数据甚至病害数据,从而对最终的训练模型造成不可逆转的危害。由于联邦学习需要各个参与式节点进行计算,因此节点的计算能力、网络连接状态都将限制联邦学习的通信效率。
TEE可信执行环境在国内目前核心硬件技术掌握在英特尔、高通、ARM等少数外国核心供应商中,如果在关键领域从国外购买,则存在非常高的安全风险和应用风险。
第三,数据共享缺乏确权机制,制约数据流通的应用性
隐私计算通过使用多方数据共同计算、产生成果,然而在实际合作的过程中,由于各个数据共享方业务水平不同、数据质量不一导致在数据处理的每一个环节难以实现合理的确权。按照常规的利益分配机制,拥有高质量数据、高成果贡献率的数据拥有方理应从中获取更多的利润,但是隐私计算仅考虑到数据的“可用不可见”,数据共享方难以从最终结果来判断谁的数据对于成果的贡献最大,造成利益分配的不公平。
如果缺乏合理的成果贡献评估机制和利益分配机制,就会难以激励数据所有者和其他数据持有者进行合作。尤其是在不信任的多方合作的场景下,会更加增加合作的信任成本,使得多方协作难以达成,制约数据流通的实际应用性。
(2)区块链技术对隐私计算技术的帮助
区块链技术通过数据流通的所有环节、所有参与者进行记录,实现数据共享流程中的权责分明,提升了数据流通的可信性。在数据传输的环节,区块链记录数据的提供者,确认数据提供方身份的真实性和有效性,有利于数据确权,为公平可行的利益分配机制提供参考;在数据储存的环节,区块链保证数据的每一次修改都有迹可循,防止数据的恶意篡改。区块链技术可作为隐私计算技术的底层平台,保证了加密数据本身的真实有效性,提升了隐私计算平台里数据流通的可信性,拓展隐私计算技术的应用范围。
3. 结论
隐私计算技术和区块链技术的融合是必然的趋势。对于数据资产的流转来讲,没有隐私计算,不能解决数据本身的安全和隐私保护问题;没有区块链,不能解决数据的确权问题以及在更大范围内的数据网络协作问题。将区块链和隐私计算二者结合起来,建设大规模数据流通网络,在目前的实践中成为有所共识的探索方向。
(二)二者结合会改变什么
1、形成大规模数据流通网络和数据要素市场
当前,数据流通存在三方面问题:数据拥有方的数据保护和数据确权难以实现;不同来源数据的整合处理成本过高、缺乏统一标准;数据利益的分配机制不完善。
如前文所述,区块链和隐私计算技术相结合,可以一方面解决隐私保护问题,一方面解决数据确权和多方协作问题,从而建立大规模的数据流通网络。
在大规模数据流通网络建立的基础上,真正意义上的数据要素市场才能够形成,数据作为生产要素的价值才能够被充分发掘出来。
2、推动数据资产化的发展
所谓资产,是指由企业过去的交易或事项形成的,由企业拥有或者控制的,预期会给企业带来经济利益的资源。
数据的资产化就是让数据在市场上发现价值,能够为企业创造新的经济利益。
大规模数据流通网络和数据要素市场的形成,将大大推动数据价值的发现、数据资产化的发展。
从企业一侧来看,企业的生产经营活动当中沉淀下来的数据会成为宝贵的资产。一方面,对这些数据的分析和运用,将推动企业改善自身的业务;另一方面,与外部机构进行数据的共享,能够推动数据发挥出更大的价值,企业自身也将从中获取更多收益。这会反过来进一步推动企业的数字化转型和对数据资产的管理。未来,对数据资产的盘点可能成为企业在资产负债表、现金流量表、利润表之外的“第四张表”。
数据资产化的发展,也会推动围绕数据价值挖掘形成全新的服务体系。其中包括数据确权、定价、交易等各个环节。
上海社会科学院信息研究所副所长丁波涛将未来数据资产服务体系中的机构分成四类:第一类提供中介服务,包括数据经纪人,还有数据代理。
第二类提供数据评估,由于数据市场信息不对称或信息混乱,需要提供合规评估、数据质量和数据价格的评估。
第三类提供价格咨询,如提供法律、经济咨询或者是上市辅导等的咨询服务企业。
第四类提供专业技术服务,包括数据开发、数据处理服务、数据交付服务等。
数据资产化的发展,带来的将是人们认知的提升、生产效率的提高、生产要素的重组、创新的产生、经济的发展以及全社会整体福利的提升。
3、对现有业态的改变
区块链与隐私计算的结合,将提升企业和个人分享数据、利用数据的积极性,进一步推动打破“数据孤岛”。
其对现有业态的改变主要体现在以下几个层面:
第一,这将带来新的数据和科技变革。
首先,这将推动数据密态时代的到来。数据密态时代的核心,是数据流通使用方式的巨大改变,数据将以密态形式在主体间流动和计算,显著降低数据泄露的风险,并在合规前提下支撑各种形态业务的发展。此前,数据被加密之后只能用来传输或者存储,但是未来数据在加密状态下可以被计算。这将带来一系列新的问题和挑战,引发许多相关技术领域的连锁反应。
其二,这将重塑大数据产业。随着数据流通的安全化,以往较为敏感的数据领域逐渐开放。以政务数据为例,隐私计算使联合政务、企业、银行等多方数据建模和分析成为可能,进一步释放数据应用价值,创造了多样化的应用机遇。
其三,人工智能产业将获得新一轮的发展。数据、算法和算力是人工智能发展的三要素。近几年来,由于缺乏可用的数据,人工智能的发展遭遇瓶颈。未来,5G和物联网的发展将使得万物互联,数据量大幅增长。区块链+隐私计算技术的应用,可以使得人工智能利用海量数据优化模型,真正迈向“智能化”。
其四,这将为区块链产业的发展带来新的机遇。区块链与隐私计算相结合,将拓展联盟链的节点数量,从而进一步扩大可协同利用的数据资源的范围。
第二,在科技变革的基础之上,区块链与隐私计算相结合,将给许多传统产业带来变革。
在政务领域,一方面,可以实现政府不同部门之间的互联互通及数据共享,从而促进政府不同部门的协同,提高政府的效率以及决策质量,推动智慧城市的建设;另一方面,可以促进政务数据与民间数据的双向开放。政务数据向社会开放,可以为企业或学界所用,释放更多价值。民间的数据源向政府开放,可以提高政府在决策以及政务流程等方面的效率。
在金融领域,支付、征信、信贷、证券资管等各个领域都会因之发生变化。总体来看,主要是影响到金融的风控和营销两个方面。区块链与隐私计算技术的结合,可以在符合法律规定、不泄露各方原始数据的前提下,扩大数据来源,包括利用金融体系外部的互联网数据,实现多方数据共享,联合建模,从而有效识别信用等级、降低多头信贷、欺诈等风险,也有助于信贷及保险等金融产品的精准定价;同样,内外部多方数据的共享融合也有助于提高金融机构的反洗钱甄别能力。
在医疗领域,未来在疾病治疗、药物研究、医疗保险等多个领域,区块链与隐私计算都能助推医疗信息化建设,带来巨大变革。在疾病治疗和药物研究方面,区块链与隐私计算结合,能够促进更多的医疗数据被联合起来进行分析和研究,从而为许多疾病的治疗带来新的突破。在医疗保险方面,区块链与隐私计算技术结合,主要是可以使得保险公司可以应用到更多的数据,改善保险产品的设计、定价、营销,甚至可以促进保险公司对客户的健康管理等。
区块链与隐私计算技术相结合,目前应用的重点领域是政务、金融、医疗领域,但是未来其应用将不仅仅局限于这三个领域,还将在更多领域发挥作用。
第三,数据权利、利益将重新分配。
这可能是区块链与隐私计算技术相结合所带来的最为核心,也是最为深刻的,与每一个人的切身利益都息息相关的变革。
首先,这涉及到每个产业链不同环节利益的重新分配。
以前述在广告营销领域的应用落地为例,此前广告营销的利益分配主要是在广告主与渠道商之间。但是,未来应用区块链和隐私计算技术,可以在更大范围内进行数据协作,则要解决广告主、多个渠道方、消费者之间多方数据协作的问题,这其中就涉及到多方之间权责的划分、利益的重新分配。
其次,这还涉及到企业与个人之间利益的重新分配。
这个结论主要是源于Oasis Network的商业模式所带来的冲击。Oasis Network的商业模式当中,最关键的一点是,可以让个人用户更好地掌控自己的数据权益。应用Oasis Network,用户不仅能够掌握自己的隐私数据,还能通过共享隐私数据获得收益。
Oasis Network的商业模式能够成立,其主要法律依据是:个人用户有权从第三方调用自己产生的数据。
欧盟的GDPR,美国的 CCPA等法案中涉及用户的一项重要权益,即“portability(可携带权)”。即第三方应用不能封锁个人数据,一旦个人有下载的诉求,APP需要提供便利的API利于个人拷贝数据。美国公司已陆续为用户提供API,如果在这方面功能缺失,个人客户可以提出诉讼,而公司也将面临巨额的罚款。
在中国的《个人信息保护法》当中,也有相关的条款。《个人信息保护法》第四十五条规定,“个人有权向个人信息处理者查阅、复制其个人信息”、“个人请求查阅、复制其个人信息的,个人信息处理者应当及时提供。个人请求将个人信息转移至其指定的个人信息处理者,符合国家网信部门规定条件的,个人信息处理者应当提供转移的途径。”
目前,中国公司的区块链+隐私计算探索主要集中在To B服务领域,但是区块链是全球化的商业,如果美国已经出现这样的模式,中国大概率不会完全不受影响。
伴随着消费级软硬件技术能力的提升,区块链与隐私计算技术结合,会逐步对个人与机构之间的数据服务进行变革。对于个人用户而言,将有机会获得自身隐私数据的完全掌控权,并为数据业务过程中所涉及的数据隐私需求获得更强的技术性保障。
目前关于To C服务的相关问题,国内业界还在探讨当中。
(三)为什么目前区块链+隐私计算的应用尚未大规模普及
第一,区块链+隐私计算的落地应用,主要是在涉及需要多方数据协作的情况,目前实际需求尚未爆发。
从隐私计算技术发展的角度来看,目前隐私计算尚在落地初期,解决的主要是两方之间的数据协作问题,涉及到多方的场景还不多,因此很多时候还没有体会到对区块链+隐私计算应用的需要。
从区块链技术发展的角度来看,区块链技术在许多领域的应用目前并非刚需。不少问题可以应用区块链解决,但是不用区块链技术也能解决,而应用区块链技术解决的成本更高。因此,目前区块链项目的建设主要是政务部门和大型企业较为积极,因为政府和大型企业从长远发展的角度来考虑,可以做前瞻性的投资建设和技术布局,但是大多数商业机构需要衡量投入与产出。
区块链技术与隐私计算技术结合,主要是用于处理数据协作问题。从数据治理的角度来看,目前大多数机构都在处理自身内部的数据治理问题,内部的数据体系梳理好之后,才涉及到与外部进行数据协作,因此还需要时间。
第二,区块链+隐私计算的落地应用较为复杂,涉及到新商业模式的创造、权责以及利益的重新分配,因此需要的时间更长。以在广告营销领域的应用落地为例,目前的大多数应用都只是落地了隐私计算平台,主要涉及两方数据协作,直接应用隐私计算技术,延续此前商业应用即可。但是,如果引入区块链技术,则要解决广告主、渠道方、消费者之间多方数据协作的问题,这其中可能涉及到多方之间权责的划分、利益的重新分配,新商业模式的形成需要时间进行探索。
(四)应用的大规模普及,还需要解决哪些问题
区块链+隐私计算的应用在大规模铺开之前,还需要具备三方面的条件:
第一,从外部环境来看,需要全社会整体的数字化水平的提高。打个比方,区块链+隐私计算将来会形成数据流通的高速公路,但是路上要有足够的车。目前全社会的数字化正在快速推进当中,大多数机构都是正在进行自身内部的数据治理,他们需要先处理好自己的数据,之后才能产生更多的与外部数据进行协作的需求,这还需要时间。
第二,从技术发展来看,技术成熟尚需投入。区块链+隐私计算技术的应用,实际上是牺牲了数据流通的效率、提升了安全性,但是数据流通的效率也非常重要,未来需要在效率和安全这两个方面形成一定的平衡,安全要保障,足够的效率也要满足,这其中涉及到许多技术的研发、行业标准的制定,技术产品化的发展和完善、技术成本的进一步降低,还需要时间。
第三,还需要相关法律法规的完善,以及数据交易商业模式的形成。不过,这一条件与前两个条件相比,其在目前的重要性相对次之。因为随着需求的爆发、技术的完善,相关的法律法规以及商业模式就会随之形成,这一条件在现阶段并非限制区块链与隐私计算技术落地应用的最关键因素。
(五)区块链+隐私计算的应用中还蕴藏着哪些趋势
1、国产化的趋势
区块链+隐私计算的应用,涉及网络安全、数据安全,未来将成为新基建的重要组成部分。这是关乎网络空间主权、国家安全和未来发展利益的重要方面,因此这个领域的国产化是未来趋势。
在区块链+隐私计算技术应用的国产化当中,软件的国产化是相对容易实现的。难点在于硬件的国产化,其中最难的部分是芯片的国产化。
这一部分的发展,与信创领域的发展相关。信创,即信息技术应用创新产业,其是数据安全、网络安全的基础,也是新基建的重要组成部分。信创涉及到的行业包括IT基础设施:CPU芯片、服务器、存储、交换机、路由器、各种云和相关服务内容;基础软件:数据库、操作系统、中间件;应用软件:OA、 ERP、办公软件、政务应用、流版签软件;信息安全:边界安全产品、终端安全产品等。
在区块链+隐私计算领域,目前已经有企业在尝试产品的国产化。例如,前文提到的,蚂蚁链自研了密码卡、隐私计算硬件以及自研可信上链芯片,同时还推出了摩斯隐私计算一体机。创业公司如星云Clustar、融数联智也在进行相关国产化硬件产品的研发。
2、软硬件技术相结合、更多技术融合发展的趋势
目前,在区块链与隐私计算技术相结合的实践中,也呈现出了软硬件技术相结合、更多技术融合发展的趋势。
这主要是缘于几方面的需求:
第一,是加强数据安全性的需求。
隐私计算主要是解决数据在计算过程中不泄露的问题,区块链主要是解决存证问题,二者结合仅能解决数据安全的一部分问题。数据从产生到计算再到消亡,会涉及采集、传输、存储、计算、销毁等多个环节,其生命周期可能会有数十年之久,要真正保障数据安全需要一个更加全方位的、体系化的解决方案,以使得每个环节上都有对应的技术体系保障数据安全。
在数据采集阶段需要精心设计设备可信架构,在网络传输阶段需要合理运用安全协议,在存储阶段需要兼顾加密与性能,在数据计算阶段需要灵活选择可信执行环境与密态运算。除此以外,计算环境的可信与安全在防御纵深建设上也至关重要。这些安全保障能力的技术图谱会涉及到可信计算、软硬件供应链安全、隔离技术、网络与存储的透明加密、密钥管理、可信执行环境等等。这其中每一个技术点都有软硬件结合、多种技术融合发挥的空间。
第二,是提升计算性能的需求。
隐私计算的性能目前还比较低,在计算机单机、单机和单机之间、计算机集群之间这三个层面上都存在。
在计算机单机上,隐私计算由于运用了密码学技术,计算过程中涉及到很多加密解密的步骤,这使得计算量以几何级数增加。以全同态算法为例,在通用芯片上密文运算的速度比明文运算慢了10万倍。这意味着,做同样的运算,如果用全同态算法,在Intel最新的Icelake处理器上,跑出来的效果等同于Intel的第一代8086处理器,直接回退了数十年。这使得全同态加密在现实情况下就不具备可用性了。算力问题也是导致全同态算法一直未得到广泛应用的根本原因。
在单机之间和计算机集群之间,会涉及到单机之间和集群之间的通信效率问题。一方面,主流的隐私计算技术无论是联邦学习还是多方安全计算,都有通信问题。密文膨胀、传输次数膨胀,会导致单机之间网络传输效率成为隐私计算的瓶颈之一。另一方面,由于大多数隐私计算的场景都是跨多方的,多方要通过公网进行通信,公网的带宽与时延目前也是巨大的鸿沟。
性能的问题,会随着时间的推移越来越严重。2021年,隐私计算的落地尚处于颇为早期的阶段,主要是在一些机构内部或者是两方、三方之间应用,处理的数据量较小,这个问题还不明显。可是未来,多方数据交换需求的到来、5G和物联网的发展所带来的数据量急剧增大,最终导致的将是数据量爆发式的增长,这需要消耗大量的算力。到那时,隐私计算的性能将面临巨大的挑战。
现在在硬件的创新方面正处于体系结构的黄金时代。这是因为,移动互联网的飞速发展使得应用场景发展很快,上层的软件也发展很快,这使得在计算机底层进行支持的硬件甚至芯片都需要随之进行改变,进入了新一轮的创新周期。
而从区块链与隐私计算结合的长远发展来看,软硬件结合、多技术融合,对隐私计算来说,可以提升性能、安全性和计算效果;对区块链来说,可以促使更多机构低成本加入联盟链,扩大联盟链应用范围。
致谢
感谢以下机构为零壹智库提供的调研支持:蚂蚁链、八分量、Oasis Labs、微众银行、趣链科技、冲量在线、光之树科技、零幺宇宙、宇链科技。
参考资料
原文标题 : 生态重塑:区块链+隐私计算一线实践报告(2022)