RSA林明峰:RSA智能驱动业务连续性管理

标签:CIO金融年会

访客:34563  发表于:2014-10-31 14:44:22

 林明峰:大家好我来自RSA公司,我们公司成立超过20年的历史,现在我们公司是一个RSA的全新子公司。我演讲之前想请大家看一段视频,这个视频是我们公司在美国的安全运营的情况,还有怎么帮客户监控云,监控我们的互联网平台,请播放一下视频。

    谢谢大家的观赏,刚才这段视频是在美国的安全运营中心帮助我们RSA公司和客户们怎么发现攻击,怎么发现中断业务的风险,怎么来解决这些问题。我们在云时代怎么用智能方式驱动业务连续性的运行。
    我们提到云时代首先我们回顾一下目前IT的环境经历了几个发展的阶段。我们可以看到在这张图上IT经历了三个主要的发展阶段。
    第一个阶段是70年代的时候,我们看到是以主机为主的IT发展,那时候只有少数的几个大型机器,上面运行重要的程序。到了90年代客户机服务器的方式出现了,客户端主要是TC为主,到了2010年我们进入第三个时代,就是现在的云时代,互联网时代,计算的时代。
    这个时代的特点是什么呢?我们的客户端的数量比原来多很多,不单单是看到的TC机和传统的终端,手机、ipad都可以联到,可以操作我们的应用。第二方面应用的数量也从数万个变成了几百万个,所以在互联网环境中大家通过相互连接的带宽很宽的平台把用户和云连接在一起,这时候云的的环境也发生了很大的变化。台下交流的时候有人说曾经在云时代我们的业务都转移到云上,云的特性决定了我们的业务可以有序的运行,云的一特性是高可用的,全世界提供服务,可以做无级的切换。实际上当我们把业务系统移到云上业务持续性问题还是我们关注的问题,并没有因为迁移到云下而发生改变或者分析更弱了,实际它所产生的风险比原来更多了。
    我们回顾一下互联网行业的一些例子,我举的例子都是跟云相关的厂家,比如印象笔记,还有我们经常看到的跟消费相关的美国的最大的超市,他们通过互联网的方式给用户提供服务,有免费的方式,有付费的方式,中间也有金融的问题。但是运行的过程中并不是没有受到攻击或者业务中断的风险,我们实际运行中云的平台有这么多年,但是业务中断的问题还是实际运营中会遇到的困扰。
    今天我的话题就是想给大家介绍一下在云的环境中我们怎么解决业务连续性,保证业务持续给客户提供服务的方式。紧迫性毋庸置疑,我们要考虑业务中断的风险现在来看不单单是我们遇到应用程序系统级的风险,更多的风险是自然灾害和供应链等复杂问题。所有的服务在云端以后都是在虚拟的云化的环境中运行,这时候一些自然灾害和危机事件可能影响到云的有序运行,第二方面云化以后并不会改变监管部门对我们的要求,相信在座也有一些做互联网云平台的友商。实际上当我们把我们的应用迁移到云上以后监管机构并没有说因为你迁移到云上,提供了更强的可用性而不对你的业务监管进行影响。我们还是有7×24小时的交流。对于金融商、服务商或者要提供P2P经营的厂商来说,业务连续性还是要考虑的问题。业务连续性提到了服务器的连续性转变到了怎么真正为客户提供服务的考虑上去了。业务连续性的事件到底离我们多远,如果只是从长商的角度考虑问题,可能把服务器导入可用就没问题。在这里解释一下业务元的概念,B的概念是商业,C是持续活动的保障,M是管理。我们有一个方面就是管理业务的持续运行,这个业务持续运行的概念反过来反映一点,业务连续性的关注点和服务器的关注点不一样,业务连续性是关注客户,客户是真正买服务的,无论在网上购物的客户,还是说我们为他提供个人消费的客户,他们并不关心我们用什么服务器,用什么技术提供服务。他们只关心在服务期间内能不能持续为他运行。
    其实在每个人的生活中对于服务都有业务持续性的概念,我可以给大家举个例子。前不久我去山东,去旅游了一趟。我坐着高铁,当我坐高铁时就发生了一个事情,我从青岛火车站出发回北京。在青岛火车站我们发现高铁的线路信号突然中断,信号中断铁路部门是有他的业务连续性计划,他们很快用了备份方案恢复列车运行。他们没有考虑到最终用户的感受和操作。于是铁路部门就说我们通知客户,说你们在列车的站口持续等待一下,业务中断以后不知道哪辆车先走,哪个后走,你们不能离开战台。就产生了业务连续性的问题,我们在站台看了一下,很多人在等着列车出发,没有人正常的通过站台。这个现象在我们日常的其他的对客户服务的业务中也存在着,比如说你的门店,你的销售的场所出现这些事情。但是我们可以跟用户解释说我有业务连续性计划,我的IT系统正常,我的列车信号很快重新驱动,但是最终的用户的感受很差,所有人等在门口,实际他们可以采用更好的方法做业务连续性。我们给他的建议是把每个站,每个列车举一个牌子,把客户聚集在牌子下面,带领进站,这不是IT的连续性,而是当IT系统后台中断怎么持续的提供服务,这是今天我们要讲的概念。我们要有一套完整的系统,不单单是覆盖云端的,还有P2P的金融平台,其他平台,而是有一套机制为客户服务,有一套支撑的平台指挥业务连续性的过程。
    在我们讲业务连续性过程中间我们要强调一个概念,我们做了很多年的数据中心和IT系统,我们对IT系统高可用非常强。大家经常听到的词有双活等等,有很多的高频需求来满足需求。但是灾备系统是什么?就是基于用户的系统提供连续性的服务。业务连续性是为客户提供服务可不可以连续下去,还涉及到了公司对外提供服务的功能。对于经营机构和保险公司来讲他们经过很长时间的服务已经形成了一套比较完整的业务中断的措施。像新兴的机构,比如P2P的金融机构还有互联网公司,对客户的服务和处理措施是考虑得还不够全面。所以我想这个不只是在中国遇到的问题,其实美国我们刚才看到很多互联网公司他们在服务中断的时候,客户想打电话也没有任何办法解决业务中断的问题。我今天讲的就是怎么建立一套业务持续性方案来支撑整个过程,不仅仅包括灾难恢复系统,也包括公司的一些系统。
    制定业务连续性计划首先要考虑业务连续性计划跟公司营销的策略和业务提供方式,然后进行业务的优先级的评估,把业务连续性的文档记录下来。我想在座很多人可能做过业务连续性计划,我们也产生了很多业务连续性的文档,并且进行记录。但是在实际的运行过程中间我们每个步骤的文档可能是列开了,我们有不同的文档,公司内部没有机制的文化把文档统一在一个平台管理,每个文档都是不同的人操作然后记录。这样就造成了文档割裂和不能连续的问题。我们希望提供一个机制把这些过程通过一个统一的平台连接在一起进行管理,这样就能够把宏观的业务的整个操作过程在一个界面上通过公司的管理可以看到。
    业务连续性的方式,我们在跟传统的纸质文档上我们也做了很多改变。比如第一我们通过平台可以把业务的责任进行有效的落实,用集成化的方式,业务连续性管理的效率。通过集成的平台我们可以让客户实际的系统操作人员和业务部门的人员都在一个平台上进行操作,来进行协作为客户提供业务连续性的的服务。另外提供可见的方法为最终的管理者呈现我们最终报告,改变了所有的业务连续性都是纸质的文件,而且没有办法一个平台去做。
    当然业务连续性平台除了底层平台的支撑还有上面的业务连续性的过程来跟它进行结合。在我们完成业务连续性平台的时候,刚才我们在台下交流的时候也有友商问我们,我们做业务连续性的时候主要涉及到定义的过程还是说支撑的过程。其实我们设计这个平台主要解决业务连续性运行过程中要解决的问题。比如运行过程中我们有测试计划,有危机管理。这之前都只是通过纸质的文档操作,或者人工方法操作。我也可以举一个例子,就是大家经常问到的问题,如果业务危机来了,领导在指挥室里面,他想知道我们的业务情况处理的进展要怎么办?很多人回答说需要一个同事在业务连续性的协调,我们经常听到我们跟很多友商和联系人说每过10分钟通知我一下处理的情况怎么样,最后算一下多长时间恢复,三五个人可以,人数更多的话,你没有办法通过一个人描述整个业务处理的流程状态。这个解决的方式就是我们需要一个统一的平台把业务连续性操作过程的方法汇总在一起,后面我们会讲到我们云化以后我们用更新的方式,用移动的方式让每个员工接入平台进行处理。
    首先做平台定义的时候第一步我们把我们可能遇到的风险跟业务影响的分析都导入到平台,这个分析包括IT相关的分析,也包括了一些非IT相关的风险。IT相关的风险就是可能存在的攻击和漏洞,有的通过监控系统发现的问题可以作为一种风险。另外一种风险就是我们常见的可能中断业务的风险,比如说疾病、病症或者自然灾害,还有政治事件可能都会对业务造成中断。就好象我们公司在不同国家都有办公室,最近由于一些事件我们香港的同事只能是在家里办公,有些业务也受到了影响,我们是有些备份措施来做的,这个就是业务风险的判断。
    第二方面就是我们要做业务持续性的计划,业务连续性的计划就是把我们面对的风险找出一个解决方法,公司不同的部门把它组合在一起来判断,做出一个最终解决问题的方式。在我们设计好这个方式以后就会进行解决。这个跟传统的方式不一样,就是我们不需要纸质的文档做,我们可以在电子平台进行自动化的操作。处理完事件以后还有一些流程,像一些危机管理,危机管理就是当我们爆发一个事件以后除了内部处理好以外,外部也有事情,就是跟第三方的媒体、机构和监管机构要进行沟通。这个沟通从流程来讲要设置专门人员,从管理平台我们要让管理层看到我们是跟哪一些人沟通,怎么沟通,这也需要专门的机制进行管理。在海外有一些公共的危机服务机制,可以向他通告,他可以提供一些大楼倒塌和救援的服务,也是在危机管理里进行的。
    最后把所有的业务连续性的运营结果集中在一个界面上向管理层和监管机构呈现。这样就提供了一个完整的过程,不单单考虑IT的问题,把业务风险也纳入其中。并且有一个集中的管理界面向管理层和相关方进行呈现。这个方式就解决了原来的挑战,虽然有很多业务连续性的计划,但是因为人员的关系,因为文档的关系没有办法让很多其他业务部门真正实施。
    最后我们针对云平台和互联网化我们也进行了我们的创新,现在我们在苹果手机的平台也开发了一个业务连续性的客户端,之前很多同事问我这个客户端有什么作用?当我们一个业务部门的同事不会在电脑前面,不在办公室的时候,如果我们发生了一个紧急事件要进行处理,他会跑回办公室拿文档找到业务连续性的要点再进行处理吗?实际恢复的时间很短,来不及。于是就把业务连续性的管理手册和界面转移到移动客户端,任何一个爆发出来可能影响业务运行的过程,都通过业务连续性的客户端直接进行操作。好处是每一步的业务连续性操作在系统里边都会有纪录。管理层只要通过一个集中的管理界面就可以看到整个业务连续性的操作过程。这个就是我们今天所要展示的,因为时间关系我就先介绍这里。

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");