六问阿里云计算安全

admin 2 0

时值阿里云ECS第七代云服务器上线,这一代的云服务器是业内首个搭载最新第三代英特尔?至强?可扩展处理器(代号 IceLake)的计算实例,同时,可信计算与加密计算成为了标配,全方位的计算安全成为其差异化优势之一。

  就此,笔者采访了阿里云弹性计算产品负责人王志坤博士,进行了一次有关云安全技术的讨论。

  一问:是客户“逼”云厂商加码安全技术吗?

  答:客户上云的时候非常关注的一个问题就是安全和隐私。

  早期,阿里云提供的安全能力,以网络传输加密、云盘数据加密等等为主。

  如今,在与政企客户的合作过程中,我们发现一个不可回避的问题,就是如何让客户在公共云上获得安全感。

  也就是说,自证清白是刚需。客户需要,阿里云也需要。

  实际情况是我们要不停地去跟行业沟通,在这过程中,我们意识到被证明、被度量非常关键。阿里云有很多安全能力,如果不能被量化、被证明,是不能被客户接受的。以前是“亡羊补牢式”的事后安全,现在更需要的是“事先安全”。

  需要有一个类似“定心丸”的技术,告诉用户,你的整个运营环境是安全的。

  所以,我们一直试图去打造一个可被量化、可被客户感知、可被度量的一个安全体系。一旦整个安全防护体系构建起来之后,客户的信任感将会增强。可信计算技术在其中扮演着重要角色。

  实际上,业界很早有这种可信的体系,包括我国也有构建自己的可信体系,这块大概在十几年前,已经有很多的研究了,工业界的产业落地是比较缓慢。

  但是,爆发点是积累出来的。以前,TPM(可信平台模块)对个人消费者来说是非常遥远的事情,但是,从2021年微软Windows11开始,TPM成为一个必备“装备”。

  TPM这种可信的应用环境,能够防篡改。说白了,就是黑客篡改了,我们能够知道并通知用户。

  现在,整个客户场景的变化、需求的变化,对于云上安全能力来说,我觉得是一种驱动力。

  二问:云安全的加密计算,与传统的加密技术有什么不同?

  答:传输和存储加密是传统手段。这些传统手段哪怕今天你不上云,传统的IT设施里面也有。在传统的IT设备里面,这些技术都不新鲜。围绕着数据生命周期,数据的传输、存储很重要,但是,用户要把数据“用”起来,也就是对数据进行处理和加工,同样也很重要。

  即便数据落盘的时候是很安全的,当数据被使用的时候,能不能继续保障安全?这个在过去一直没有很好地解决。业界也有很多手段,比如同态加密等等,众所周知,这类计算开销是非常大的,业务系统中企业负担不起对效率的牺牲。

  可能在极少数平台,必须保证绝对安全的情况下,才会去用。而今天,第七代ECS的加密计算能力可以在合理性能开销的范围内,实现数据的“可用不可见”。这不仅是数据存储和传输阶段实现了加密,在运行时使用阶段也加密了。

  (记者说)市场上是有安全产品以降低计算消耗为卖点。

  答:对,大家都会说不断地降“计算开销”。但实际上大规模的生产,或者说“以提效降本为目的”的生产过程,不可能为了安全牺牲太多的效率。

  我们在内部也讨论过,云的生意是要普惠,在云上推动这种技术,如果使用门槛太高,使用场景就会大大受限。

  以汽车厂商造车为例,消费者买车的时候,不仅仅关注它的性能、排量等等,还有安全。而且,不光是被动安全,还追求主动安全,如防碰撞等等。联系在一起思考,阿里云构建整个安全体系的时候,也是从被动安全,走向主动安全。

  三问:走过这个阶段我们花了多少年?是一个什么样的过程?

  答:过去云产品的设计理念是什么?追求性能。为什么?因为那个时代,大家一上来就拿虚拟化为代表的云产品的性能跟物理服务器作比较,考虑会有多大性能损耗。

  今天,我们把性能这个难题攻克了,这也是阿里云推出了以神龙为代表的虚拟化技术的背景之一。

  我认为,我们的头10年主要在解决性能问题,从2010年到2020年,大约花了10年。但阿里云解决安全问题,并不是说今天才开始,一开始安全就在视线范围内。比如,汽车厂商研发车,有安全带、有气囊,我认为这只是非常基础的被动安全,就好比现在说数据落盘的加密,网络传输的加密。

  但是,仍然有局限性,这样会导致一些应用场景受限。

  2016年,开始做探索,2017年,我们做第一代神龙云服务器的时候,就推出了基于Intel SGX加密计算的产品。探索阶段,我们具备了整体的硬件形态,但当时还只是一个单品。

  2019年的杭州云栖大会上发布第三代神龙架构,我记得非常清楚,小邪(阿里云基础产品事业部蒋江伟)讲的立体的安全防护体系,实际上就是指的我们做的安全相关的能力。

  从那个时候开始我们不断去探索,比如云盘的数据可加密、网络传加密、密钥体系等。现在,安全体系都已经非常完备了,TPM、vTPM、 SGX的预研,内部的产品化能力已经具备实力。

  目前,加密计算方面,我们不仅支持Intel的SGX,还有自研的神龙虚拟化enclave。我们已经在这一块围绕计算侧做了很多技术的研发,包括产品化。我觉得这跟造车是一样的。那阿里云安全今天要追求什么?追求运行时的主动安全。

  四问:云安全技术,市场和产品的空间有多大?

  答:安全能力一升级,会带动整个基础设施的升级,带动业务创新。

  对于加密计算,早在2017年的时候,只有少量应用比如一些区块链应用开始使用我们第一代基于SGX加密计算的能力。如今,越来越多的应用关注运行态安全,比如数据库,数据库承载了企业最核心的数据资产,仅仅是数据传输和存储的加密是不够的,所以,包括我们阿里云自己和阿里云的客户,都可以基于我们SGX/vSGX的加密计算能力,保证运行态数据的安全。

  对于可信计算,TPM是有成熟的协议和规范的,我们做产品的时候,为了让客户的使用门槛更低,我们直接做了很直观化的呈现。每一个字段校验的信息和标准值,直观表现,一见了然,而且有一些标志性信息,有明显的提醒。

  如果有风险,客户可以直接看到这些细化的信息,这样客户才会踏实。客户要知道结果,也要知道原因。

  现在阶段,以被证明和被估量为代表的安全技术,到了必须和云计算结合的时候,而且要用起来。云把这个能力变得普惠,就像我们今天戴了各种手表、手环,把各种指标给呈现了,一旦你异常,会及时预警。

  安全越是靠近底层,被度量、被感知越是难做的。以前,业务出现了异常,没法验证是不是可信根被篡改了。现在,从启动开始,可信根有个度量,从头建立一整套可信链。产品化使得用户非常方便构建它上层业务的安全。

  云是做一个普惠的生意,识别到需求,研发团队攻克技术难点,我们根据它的门槛、难度、成本综合考量之后,作为整个产品的“标配”和“底座”能力。

  五问:很多企业认为,将其 IT 预算的5%用于安全就足够了。云安全技术能力的增长,会提高企业在安全方面投入的性价比吗?

  答:以前,一个企业花IT预算的时候,买多少服务器、存储、网络,这样算。如今,买的是云服务,包含了安全服务。以前,如果要构建这部分的安全防护能力,要额外做预算。如今,安全已经内置到云计算的基础能力之中。

  这个时代,已经是一个大家更关注安全、更关注隐私的时代了。阿里云把这个时代对安全、对隐私的诉求,在云上更好地解决。我们肩负的一个责任是把业界一些比较先进技术,逐步推广。传统企业可能没有这能力。

  从云安全对于企业IT预算性价比的角度,以可信计算这个特性为例,作为阿里云ECS实例原生的安全能力,为客户提供免费的IaaS层可信能力。

  阿里云负责把安全基座做好,或者可以表达为,企业对安全上的投入越有限,公共云安全服务的普惠价值越大。

  六问:以AI为代表的安全攻防黑科技这么多,虚拟化安全属于落后技术吗?

  答:虚拟化技术兴起大概在20年前,虚拟化是整个云的基石。没有虚拟化,你没有办法实现分时资源复用,也没有办法实现错峰资源复用。

  直到今天,虚拟机这样的产品形态,它仍然是很有生命力的。我们整个产品体系里面,尤其在技术体系里面,不管是TPM、可信、SGX以及加密计算的各类技术,都要和阿里云神龙虚拟化技术体系融合。阿里云的安全能力是基于神龙芯片构建起来的,一方面我们要保证它的安全性是足够的,另一方面是它又能够实现我们整个虚拟化的技术要求,所以这里面是非常有挑战的。我们的安全团队、虚拟化团队、神龙软硬一体化的团队,三个纵队,攻坚同一个技术高地。


标签: #六问阿里云计算安全 #阿里云