我在"2012海量数据来袭,CIO你准备好了吗 ——对话探寻“上帝粒子”幕后的IT英雄" 的在线访谈中回答

访客:10600  发表于:2012-12-21 14:47:26

回复 @罗昱宇 :安全和可靠性是一个系统性的复杂问题,华为UDS在设计过程中从软件和硬件两方面入手:首先从硬件上,全新的硬件设计理念解决物理上的不可靠。UDS在磁盘设计上采用独特的Smartdisk架构,给每块磁盘都配上单独的CPU,内存和GE网口,以这样的Smartdisk为数据管理单位,每块磁盘上的数据互相冗余,任意一个磁盘的故障不会影响到其它磁盘和存储在上面的数据,有效避免单盘失效对整系统的影响。 另一方面,由于Smartdisk的独特设计,每块磁盘单独占据计算资源,相对于传统多块磁盘共用一个或者几个CPU的设计,极大的缩短了发生故障后的数据恢复时间,更好的应对海量数据的挑战。 在存储节点设计上,独特的无源背板设计使得在背板发生故障时不影响整系统的可靠性,电源,风扇等非核心部件采用冗余配置,有效避免单一部件的损坏影响硬件可靠性; 在整体设计上,采用去中心化架构,交换机和物理节点的分布式全交叉互联组网,每个节点之间彼此信任,任意一个单独节点的故障不影响不影响整系统的可靠性。 研究表明,认为操作失误是导致系统失效的主要方式之一。 UDS采用多重机制降低人为误操作对系统可靠性的影响。UDS海量存储系统通过完善的图形化管理系统,可以为客户提供拓扑、告警、配置、性能、日志、用户等方面的全面自动化管理,并且提供 “自动部署及升级”、“一键扩容”,整个过程无需人工干预和控制。 另一方面,整系统P2P的软件架构设计,使得节点之间互相信任,任一节点的可靠性依赖其它多个节点共同保障,任一节点的人为破坏(例如:硬盘误插拔),不影响各个节点之间的信任关系,整系统数据可用性不会因此降低。 P2P架构配合Erasure Code算法,使得单盘失效后,数据可自动恢复到其它节点,在不影响数据可用性的前提下把损坏的硬盘剔除,数据分片不受影响,不会像传统存储出现RAID组降级的现象,更不会出现由于一块盘的故障引发其它盘损坏的连锁反应。 在系统层面,UDS支持节点级,机柜级,数据中心级的数据冗余策略,实现全方位、立体式、逐层递进的数据保护。通过多站点、跨地域的数据中心设计,数据可靠性达到99.999999999%,满足跨地域的数据备份和容灾。

活动专题:http://www.cio.com.cn/event/detail/146

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");