所有互联网巨头都害怕的是:停电......云计算没你想的那么强悍

标签:服务器云计算FacebookDNS停电

访客:26771  发表于:2015-10-09 10:52:54

从平日办公收发电邮,到闲暇的时候进行网购,或和亲友分享假期的各种精彩照片,我们创造的“云计算”对日常工作和娱乐都提供了不少便利,甚至在医疗卫生、社会保障和政府机构职能等领域,人们都越来越倾向于利用互联网的数字传输来开展工作。

可是,我们应该警惕的一点是,随着现代人比以前更依赖于网络传输,网络的弊端会渐渐显现。传输系统往往就像一张“百家被”,各类网络服务在里面七拼八凑,而这些相互联通的网络服务又分别由形形色色的公司和行业合作机构提供。在这种互联互通的环境下,如果其中一家的网络服务出了故障,其他公司的服务就会被殃及。

所有互联网巨头都害怕的是:停电......云计算没你想的那么强悍

最近就有个现成的例子:即时通讯软件Skype宕机几乎整整一天;与此同时,Facebook也宕机了一个多小时,而且是在一周内第二次出现这种故障。这意味着,在此期间,许多依靠Facebook账户验证用户身份的网站也无法正常登陆。

对广大网民和不少网站来说,失去Facebook这个接口确实比较麻烦。而一旦那些重要的医疗和社保服务系统或能源供应管理系统受到干扰,那带来的真是不得了的麻烦,可能足以对一国经济和国民的生活质量带来真正的负面影响。

几周以前,四次雷击造成比利时电网停电,谷歌设在当地的数据中心europe-west1-b也暂时断电。事发后,尽管大部分服务器都利用备用电池和冗余电量维系短期用电,但还是给硬盘 空间造成了约0.000001%的损失。乍看起来,损失比例微乎其微,可鉴于谷歌存储数据浩如烟海,这样的比例意味着数个GB到几十GB的数据丢失。

这次事件的教训是,我们不能无条件地信任云服务供应商来存储个人数据和提供备份服务。就算有了云计算备份,你也需要另做备份。这次事件还教会我们,依赖导电金属长距离输送的供电系统很容易遭到雷击破坏——比我们想象的更容易。

所有互联网巨头都害怕的是:停电......云计算没你想的那么强悍


Facebook outages last 24 hours Facebook的宕机事故持续了24小时,最高峰时有569例故障报告。

停电了,怎么办?

前美国国防部长威廉·科恩(William Cohen)日前明确指出,美国国内电网难以抵御大规模断电的打击。他说:“恐怖分子很有可能袭击国家电网,而这种打击会导致从东海岸到西海岸的大面积混乱。这是很有可能发生的。”

我曾经当过电力工程师。对于科恩的上述警告,我认为完全可以理解。美国需要强大又安全的供电系统,而无论多强大的控制系统都有可能出故障。为重要设备设置替代或者备用电源的做法并不少见,因为随时可能因为某些供应点断电酿成意外事故。还是那句:即使有了备份也要再做备份。

无论何时,只要有部分电网断电,整体供电网络都会设法给那部分电网另外提供电源来弥补其缺失。因此,供电系统要有冗余电力储备,还要设置监控与控制系统,以在出现故障时及时应对,保障电力的均衡供应。

科恩担心的是,大范围停电可能引发社会动乱。前美国国土安全局局长詹尼特·纳波利塔诺(Janet Napolitano)表示,电网迟早会遭遇网络黑客攻击已是板上钉钉,剩下的只是时间问题。前美国国国家安全局高级分析师皮特·文森特·普瑞(Peter Vincent Pry)甚至认为,如果对美国供电网络发起攻击,可能“夺去90%美国国民的生命”。

众所周知,电磁脉冲(EMP,比如核武器在空中爆炸)会造成巨大的破坏。如今有许多人觉得,通常所说的工业控制系统——即SCADA,数据采集与监视控制系统——具有通过网络彼此联系的复杂特性,这可能成为重大风险。

2003年8月14日美国东北部地区断电就是这种潜在风险的一个例子。当时,该地区265家独立发电厂的508部发电设备因此受到影响,停电波及美 国八个州的4500万人和加拿大安大略省的1000万人。然而,这次事件仅仅源于俄亥俄州一个控制室的警报系统存在软件漏洞,未能警告操作者系统发生超 载,由此产生了系统故障的连锁效应。事后花了两天才恢复供电。

生活在网络时代,人们越来越依赖互联网,也创造了提供冗余路径以保障点对点传输的网络,但是供电故障还会让核心路由系统失灵。

控制系统是最薄弱的环节

基础设施最不显眼的环节往往最容易遭到攻击。举个例子,数据中心的空调故障可能导致温度过高,高温就会熔毁设备,特别是用于存储海量数据的磁带驱动器。这就可能影响价值几十亿美元的巨额银行交易或是一个繁华城市的交通路径,或者造成一个急救服务呼叫中心瘫痪。

人们越是依赖数据和数据处理,在它们出现故障时就越容易蒙受损失。为保证数据安全,安全关键系统一般会配备故障保护控制机制。但是,这类机制也可能遭遇攻击,任攻击者为所欲为。

人类创造了云计算,又越来越依赖它,然而它并没有我们想象的那么强悍。互联网的性质以及我们使用网络的方式仍有限制,事实上并不像我们设计时设想的 那样分散。我们依然在很大程度上依赖于一些关键的物理地址,即数据和网络节点的集结中心。因此,倘若有人图谋不轨,在某些关键点制造一些不可接受的故障, 那或许就会引起多米诺效应般的大崩溃。

DNS(域名服务)基础设施是尤为薄弱的环节。毕竟,全世界只有13个根域名服务器,它们就充当着全网地址簿的总列表。

我认为,目前各国政府对这一问题考虑还不够透彻。如果没有电力供应,互联网不能正常联通,云计算便无从谈起。而失去云计算,人类社会就会出大麻烦。(本文编译自爱丁堡龙比亚大学计算机学院Bill Buchanan教授的评论文章,若离 / 翻译)


评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");