发表时间:2020-08-26
区块链正在以公链、私链或是联盟链的形式在不同场景落地,但随着交易流程复杂化,参与方多样化,业务展开过程中如何做到既不影响性能又可确保隐私,是区块链从业者们久攻不下的难点之一。在本周的第四届区块链全球峰会上,趣链科技CEO李伟、PlatON创始人孙立林、Least Authority首席执行官Liz Steininger、微软中国云计算创新中心首席产品经理宋青见共同针对区块链与隐私保护进行了讨论,圆桌由新加坡新跃社科大学教授李国权主持。
以下为圆桌论坛全文,雷锋网AI金融评论做了不影响原意的删减:
李国权:你们对隐私保护怎么看?如何来解决隐私保护的问题?
孙立林:其实隐私保护和数据流动是完全不同的两件事情。你把黄金存在保险柜里是安全的,但金子想进到市场做流动的时候需要提供足够多的隐私保护,所以我们在做的主要是为了确保数据的流动性以及在数据流动过程中如何提供完备的隐私保护。最终的目的是给数据做基准定价,以至于能够被当成数据化的资产来衡量。
李伟:严格来讲,安全和隐私是两个角度看数据——安全就是数据不可以被窃取,隐私是数据在流通过程中不要把细节透露给不需要知道的人。前段时间,某大型连锁酒店集团疑似有上亿的数据被泄露出来了,本来不应该被大众看到的数据现在看到了。如果数据是秘文那没有问题,但如果是明文已经出来了就是隐私事件。往往安全和隐私又是一起出现的问题,所以很多时候我们会一起来解决。这是两个角度,但又是一对兄弟,我们要一起解决好。
宋青见:有关安全和隐私,就像刚才所说,是不同阶段、不同角度的技术。联盟链首先要解决必须是安全的连接到联盟链,因为联盟链不像公有链。公有链是假设没有安全情况下照样能够保证网络的运行,隐私保护在公有链上往往可以单独讨论的。但是在联盟链上因为涉及到对联盟链的访问是可控的,在可控的情况下安全是第一步,在安全访问的前提下又要提供隐私的保护。以供应链为例,核心企业可以看到所有供应链的数据,但是在供应链环节里一级供应商是背靠背的,他们不希望看到互相的数据。所有能访问的网络首先需要新解决安全的问题。
李国权:我所听到的就是,在区块链的情况下大家对去中心化没有达成很好的共识,非充分的去中心化信任没有很好的和解。
宋青见:联盟链有了一定的假设,首先是在安全访问前提下,就可以对共识算法做优化。但如果是公链的话是没有假设的,任何人都可以恶意地访问和攻击,所以公链上的共识算法成本非常高,这本身就是技术层面的取舍。
李国权:如果大家有公开公链会有侧链,侧链可能会有闪电网络,我们如何来实现安全以及隐私保护?
宋青见:如果是公链技术和联盟链结合,把联盟链作为Layer2,这样就可以有取长补短,协同提高的效应。因为我们可以用公链来做联盟链数据的存证,可以增加联盟链没有公有链可信度高的缺点,联盟链又提高了很高的吞吐量,首先有安全访问降低了隐私保护的难度。这两种技术如果结合起来就像Layer2基于Layer1分层的架构,适合做真正落地的实际应用。
李国权:如果是这样的话,在安全和隐私保护方面会不会有所妥协呢?
宋青见:实际上是通过Layer2弥补了隐私保护,在公链上能放到隐私保护,放在联盟链里反而可以提高性能,因为联盟链会降低实现隐私保护的难度。
李国权:在私有链上恶意攻击越来越少,因为是许可链,如果有人想要实行恶意的话我们就可以不给许可,他们就离开这条链了。但是,恶意行为越来越少,去中心化也越来越少了,对于黑客来说攻击的成本就增加了。如果把公有链跟私有链结合的话需要更多信任,从设计的思考出发如何增加攻击者的成本,同时保护隐私?
Liz Steininger:我觉得应该思考在不同层所在做的是什么,要架构的是什么。如果要保护数据隐私,那不可能就需要一些许可的区块链,要考虑一下是把数据存储到公链还是存储到许可链,或者思考一下在一些特定使用案例中使用许可链的可能。对我们来说,有一些所谓的威胁建模,可以分别用来解决对于数据的风险。特定案例可以用特定的技术。
李国权:你提到的这一点非常好,可以针对不同的情况保护不同的保护手段。
李伟:在数据隐私保护刚刚讲了不同的场景需要用到不同的技术,包括Layer 1和Layer 2是在性能、隐私的权衡,很难找到大一统的发展说既能满足性能的需求又能满足隐私保护的需求,这是非常困难的。但往往很多时候我们牺牲一点点可以得到更好的其他特性,这还是根据具体场景来确定的。
孙立林:从不同假设来说,算法得到的结果是不一样的。我们对世界做了抽象,好人还是坏人,信任还是不信任。密码学、隐私保护是有大量的假设和前提的,而假设和前提在工程上得到应用以后,会有很多的新情况涌现。
我们的根本出发点有些不同的想法,公司内部已经不再提公链和联盟链的区分了。我个人认为分发已经过时了,现在做的新项目是完全面向全球计算的新架构,传统矩阵元做的事情是企业级的服务,至于到底有没有token这件事情已经不重要。
有很多企业是有token需求的。从比特币、区块链原生的设计来说就是把支付、清算、结算作为基本的账本,在设计上做了取舍,为了节省环节会给出token处理掉,变相地回到了现金时代,不能说有token就不是企业级服务。你就是发行了记账单位还处理它,否则区块链会被当成数据库或者存储过程来用——这是我们对整件事情的基本看法:第一,要分前提;第二,不能简单地区分是公链还是联盟链。
李国权:你刚才说的区块链的设计界限越来越模糊了,不管是公有链还是私有链,设计的思维必须要改变,必须要看一下你希望达到多大的去中心化的程度或者攻击的点在哪里。似乎设计思维已经进入到了3.0时代,这样才能考虑到安全性和隐私的保护。
再进一步,从开放链、联盟链到许可链再到包容链,包容链包含了所有区块链基本的功能,从链上、跨链、侧链的技术再来谈谈链下。很多人都谈到了使用IoT、物联网等新算法,或者用AI做到某些共识当中,似乎区块链切中了第四次数字革命。链上的挑战包容性的区块链是关于设计的思维,链下要把区块链和物联网、AI连接在一起,这会不会成为攻击的重点?会不会帮助我们来保护隐私呢?
李伟:这些东西只能保障在链上数据的安全或者已经数字化以后在线上的价值产地。但往往如果数字世界的价值希望跟物理世界进行影射,就不简单是区块链的问题。举一个现在很热的溯源例子,我们经常讲区块链可以做溯源,但区块链真的自己能做溯源吗?其实我的答案是否定的。比如说一瓶水上面贴个二维码是从加拿大雪山上运过的,到了上海的一家超市打一个孔水抽出来自来水罐进去抹平,这个水是不是加拿大的水?
区块链只能证明二维码上是加拿大的,但能否证明瓶子里的水是加拿大吗?如果是贵的东西就需要通过辅助的IoT、生物技术、3D打印等辅助技术证明线下资产跟线上资产的对应,这才是关键。区块链本身的研究非常关键,但区块链+IoT、生物技术、3D打印等把物理世界上链的过程是非常重要的,如果这件事情做不好的话那链上的资产是否是安全的?一个要Blockchain+Something才能确保是重要的,需要把Off-Chain的事情解决了才能来说On-Chain。
李国权:我的理解是,第一层数据的来源、身份在链下必须要有第三方的信任机构来确保,区块链上的数据是正确的、是我们可以信任的数据,这应该是现有区块链技术的很大缺点。因为不管交易了什么、实现了什么、交换了什么,信息都是被获取的,是可以被追溯的是可靠的。但第一次数据被放在链上的时候需要有第三方的信任相关机构来证明放在链上的数据是正确的,很多时候在我们研究现实应用的时候这一点往往会被忽视,你如何赢得第三方信任?如何减少第三方信任的成本来确保数据是正确的,这是非常复杂的。还有没有其他的方式利用链下的技术来确保我们能够获得更高的隐私保护?
Liz Steininger:对于个人数据而言可能考量的不太一样,比如说你有一个公司对于隐私的关注是公司的商业秘密、公司的操作的专属信息,这涉及到初始设计:你能不能信任数据的原始来源。一旦你有了数据以后想要进行隐私保护、安全储存,同时你依然需要利用区块链的功能和特点。一种方法就是链下的数据存储的技术可以利用哈希、加密参考到许可链或者公有链当中,因为这可能涉及到联盟链当中的隐私保护的问题。你可以利用链下的数据存储以及隐私保护的技术再影射到公有链当中,这样也可以实现隐私保护。
李国权:比如说脸谱的识别、声音的识别以及其他链下的技术都可以被用来确保原始数据的正确性。这是链下技术的应用,确保链下数据可靠性。可能需要很多其他的智能合约、代码来确保能够和链下进行链接,我们希望智能合约有多透明呢?如何确保智能合约能给我们带来隐私的保护?当然了,可以实现非常高的透明度,但是比较复杂,又涉及到代码的错误或者Bug。
宋青见:保护隐私用智能合约是隔离了,只是在交易方之间做私有交易,在若干个节点中可以看到。还有一种是利用安全的硬件,像微软去年也研究过把隐私保护转换成访问控制的课题,所有信息在安全的硬件环境里有全量数据,但是如何访问数据就变成了可以转化成标准传统的智能合约方法。现在比较先进的密码学技术,像零知识证明和智能合约怎么结合还是在早期阶段,零知识证明主要还是用UTXO的方法来做隐私保护。有关在智能合约级别怎么支持都是我们拭目以待可以看公链技术在密码学方面怎么更好地发展。
李伟:隔离是比较简单,同时性能上又得到保障,可能只有相关方有智能合约,而其他方是不参与的,或者最后做存证。这很简单,效果也很好,但面对复杂交易的话灵活性很差。像零知识证明论文已经出来了,但还是偏早期,性能比较差,隐私和性能永远不会平衡,这是我们需要重点突破和研究的地方。还是根据不同的场景选择合适的技术来保证智能合约级别的安全。
孙立林:非常同意。现在用合约实现隐私保护,性能一定会掉下来,但是密码学团队在重新看这个问题。今天的理论密码学有一个基本点,存在大量的前提和假设,这些假设是否真的成立很多经典的论文里并没有给出解释,甚至有时候也就糊弄过去了并没有解释。
回到理论密码学的前置问题是认为安全性和效率一定是对立的,但是现在有一组人在重新看这个问题,对立有可能不完全成立,有可能会从理论上重新构造问题,并且隐私保护的算法观点是智能合约并非越多越好,加了更多隐私保护和安全的考虑以后,有可能系统会出现更严重的问题,是我们今天想不到的,只有在工程上才能实现,不是一两个Paper能够解决的。
李国权:趋势非常明显了,涉及到设计思维,要了解所面临的挑战。最后一个问题,多方计算并不需要知道各方输入的信息或者各方的数据点,如果我们可以计算加密数据而不需要了解加密数据本身的话是最好的,但我在想这些实际上都是蛮高深的,因为计算的算力还没有达到水平。对加密数据进行计算或者实现多方计算,你们的看法是什么?我们离这样的愿景还有多远?很多大学现在都在做研究,真正实现起来要多长时间?
孙立林:三方以上的算法到工程化实践,从推进角度看明年年终,或许能够把三方做出来,工程化实践至少还需要半年或一年。前端要做大量的数据预处理,要配合AI,工程化的实践从编译器到虚拟机到调算法又需要大量的应用,可能又是两年的时间。我算了五年,也许我还是太乐观了,但是这个技术的进步一定还要依赖于硬件,我们有一组人在用APG、GPU来用硬件加速处理。
MPC(安全多方计算)密码学的好处是天生是分布式、去中心化的,所以特别适合在理论架构中处理。但是SHE全同态加密太难了,今天做的计算合约化和合约计算化打成电路处理以后,会为下一步全同态的处理奠定基础,这是我们的实践体会。
李伟:非常赞成。区块链不是新问题,但是解决方案要做得完美,需要蛮长时间。现在整个计算机体系的通用结构,是否适合现在的社会?软硬一体化的趋势越来越明显,为了某种应用而定制得越来越复杂。
FPGA我们做的效果非常好,性能可以,数量级说实话现在还没有产业化,还是实验室里的东西。但趋势已经很明显,可以根据区块链的需求来定制所需要的加密芯片、加速芯片。也必然会引起很多的技术革新。像刚刚说到,很多时候假设不成立,是不是性能和安全可以有平衡?基于硬件来做,的确有些假设可以放松,甚至有些东西不用搞那么复杂,这样的话性能、安全性会有很大的提升。一切目前还是实验室阶段,需要学术圈和工程界的人一起努力。
李国权:就硬件而言必须要实现大规模的生产,谈到去中心化生产,又谈到了开源的硬件,不知道我们到底离这样的目标有多远?你对开源硬件有什么看法?
宋青见:从我做产品的角度,虽然很关注成果但判断还是在比较早期,从工程角度很难准确地估计真正能够大规模应用的时间点。反过来说真正技术的大规模应用是要靠实际需求来驱动的,目前从做产品的该度最大的愿望是首先能够推广和普及区块链的应用,哪怕是最简单的区块链技术如果能够大范围广泛应用大反过来用户应用的需求会驱动更高层次的隐私保护、加密算法的发展。当务之急还是要尽快地把区块链技术跟真正实际需求结合起来,用实际应用来驱动的方式推动真正研究的落地。