黄庆民:存储新锐技术

标签:存储技术存储大会

访客:30642  发表于:2014-06-19 11:22:30


主持人:谢谢黄总,接下来有请HGST亚太区产品营销总监黄庆民先生为大家做演讲,黄总常住与新加坡,负责领导亚太区的客户。今天演讲的题目是存储新锐技术,有请。


黄庆民:我来自HGST,HGST公司是提供全方位的解决方案,包括SSD和HDD。我今天讲的题目是跟我们物联网相关的,我们要审视一下物联网跟我们大数据以及我们分析工具和我们多种的效应以及我们相应的数据存储之间的关系。我讲的内容是截止到明年的,明年来说可能会有超过850亿的数据,他跟我们数据中心进行连接。当然这会给我们数据中心带来很大的挑战,并且在我们的数据存储方面会有很多的演变。就像之前预测一样,我觉得肯定会有更多的闪存和我们SSD会进入到我们的数据中心。
    我们一方面要提高我们数据中心的效率,同时我们要审视一下如何来降低我们的数据中心的运营成本和我们投资成本。像我们之前一个发言嘉宾讲到了下一年,明年的时候我们会进入到Zettabyte时代,一个Zettabyte,明年有非常多的信息朝着我们物联网会发展和转移,这是非常令人激动的。希望在我们数据中心有组成制动器进行部署。这样的话我们都知道我们的汉系的自动存储可以提供很好的数据存储的能力的提升。我们存储需要很大的提升,这就会把我们存储引领到一个发展时代和新的发展本质当中,也需要一个新的技术的推动,包括我们SSM还有我们相应的其他的存储。刚才我们SSMR(音译)是新的存储技术,我们这个技术也是通过我们汉系存储进行驱动,进行我们支持的。
    之前很多人说到了明年我们会进入我们的Zettabyte(音译)和字节时代当中,主要驱动因素来自我们云的驱动,我们知道在日常生活当中有很多的邮件信息或者是有很多QQ信息来进行处理。所以对我们来说我们在思考一个问题,就是有物联网之后,物联网对我们存储会带来怎样的影响。当然每天来说的话,我们会发现这个例子Zettabyte的字节信息,从这里产生的数据量。还有就是从我们地铁监控视频当中我们捕获数据量是1.5。当然我们看一下我们艾字节在存储能力方面有怎样的能量提升,图表左边显示按不同市场细分的情况。我们不难看出在这个地方最主要的驱动因素是云,云是最主要最强大的一个驱动力量。在我们右边来说需要所有不同的设备来形成一个信息,我们知道在未来几年来说还是通过我们这几个不同的驱动盘和驱动器来存储我们所需要的大量信息。我所说的跟SSD来说不太冲突,SSD一直发展非常迅速,我们说SSD和硬盘存储来说他们是同时互相互补式的发展。当然这个地方来说是我们存储的驱动一个相应的数量和相应容量的预测。我们从浅绿色的柱状图可以看到我们容量方面减少非常迅速的一块。这个其实跟我之前提到的信息是有很大的相关性的,包括我们企业的SSD和我们企业级产品的高容量的驱动的情况,我之前也说到他们是互相补充,互补式发展是非常的迅速。就像我刚才提到的一样我们存储增长的驱动力是非常强大的,主要是依靠我们的云来进行拉动。
    我现在要谈三个新兴出现的领域,一个是物联网,第二是大数据分析工具,第三是存储的问题。对于我们物联网有非常先进的尖端的信息捕捉的工具,包括我们信息的捕捉还有我们信息的存储。之后我们得到这么多海量的原始数据之后,我们原始数据会进入到我们大数据库当中来进行大数据的分析。之后那些经常被访问的相应数据会进入到冷存储当中我们进行存储。对于我们的物联网而言,在某个方面而言是新的互联网的时代,也就是说在这个环境当中是互联互通的设备来互生的连接,有很多互动,跟环境也有很多的互动。在互动过程当中有非常非常多的数据被生成。当然我们的传统方式来说,是我们人与人之间的互动,在互动过程当中有非常多的信息被交换,包括我们的电子邮件、照片、视频。当然之后也包括我们人和机器,以及我们机器和人。最近来说我们也有机器对机器的互动,这个过程当中有非常多的信息可以产生和生成,不需要人的参与就可以来实现。对我们而言,我们互联网已经成为我们生活当中一部分了,包括我们一个设备,我们智能手机、平板电脑、可穿戴设备包括我们眼镜等等。当然在我们智能家居当中也有很多相应的设备,通过我们物联网进行控制,包括控制我们家居的安防以及我们健身设备的连接以及我们身上配套的设备都可以进行连接。不仅是在你的居家生活当中,同时你走出家门的时候,在户外的时候也有很多的设备进行互联。有很多的例子,包括我们的烟雾和火灾探测器,包括我们交通,视频、摄像机,还有智能仪表,安放设备,包括我们智能电网等等,还有包括我们其他的一些对健身器材等等都可以进行互联互通。很多人会问这么多设备进行互联互通,岂不是会生成很多的数据,我要说他肯定会生成一定量的数据,不会这么多,不会像我们这么多的数量进行计算,但是他有很多的设备联系起来的话,比如说可能会10个智能设备进行连接的话,他生成的数据总量也是海量级别的了。
    比如说举个例子,在2010年的时候,我们所有互联互通的设备跟我们全球的人口的数量的比例是2:1。到2020年来说,我们互联互通设备跟全世界人口相比的话是7:1。由于我们的互联互通设备的数量不断攀升,从物联网当中收集相应的海量信息量也是在日益攀升的。如果你要预测一下物联网当中的海量信息,他增长的速度到底有多快呢,我们可以看看这个方面的图表。当然对于我们企业级别来说以及我们商务而言,他主要是以单位来计算的。如果社交平台而言,主要是以这个单位来进行计算的。我们仔细判断而言,在所有物联网当中,他的数据的增长量每年是以75%速度在攀升,所有信息组成量而言,以单位我们是自检来进行衡量。
    当然在过去几年当中,我们想试着定一下大数据,今天我们不讲这个方面的内容,今天我们要探索发现一下,我们看看之后我们如何将物联网跟大数据进行连接,并且有此如何引领我们数据的增长呢。我们讲到大数据的时候,我们来谈这三个方面的事情。讲到数据而言,我们讲的是引入我们一个流的原始数据,进行实时快速分析。讲到我们多样性的话,我们数据来源非常多种多样,来自不同的渠道,在我们数据抓的过程当中可能会有一些数据的丢失。为了满足以上这些,需要不同层面的设备来进行部署,这样才能满足我们数据整个方面的需求和要求。就像我们之前说到的,我们通过SSD进行我们热的数据和存储。非常活跃的数据而言,我们可以采用企业级的来进行存储。那些不太常用,我们可以用存储的方式来实现。
    我们看看大数据的时候,首先我们审视是工作流程。第一个是我们的原始数据流。在这个阶段来说我们会来处理多个来数据,包括我们邮件,照片、文本信息以及我们相应的视频。在这个阶段,我们知道哪种信息是非常重要,并且哪个信息是有相关性的。所以下一个阶段看看我们的元数据在哪个方面来进行生成呢。在这个阶段我们会找到发现我们哪个信息是重要的,哪个信息是相关的。所以这个阶段来说把我们原始数据进行重新的加工,重新的格式化,重新的进行编排。非常有意思一点,就是从这个图表左边向右边移动的时候,第一阶段向第二阶段移动的时候可能会有超过十倍的海量数据被生成。下一阶段是我们要做我们预测性的分析。之后我们要看看我们相应的连接关系和乡野的趋势。最后一个阶段我们做的是描述性的分析,我们不仅仅希望了解我们的趋势是何去何从,我们要找到哪种因素会影响我们趋势的发展,并且我们如何把握住最潜在的最根本最重要的机会。
    我们看看大数据以及相应大数据的分析流程,这里有非常多的新的数据库被生成。我们在这个幻灯片当中会看看全世界的大公司如何用我们的大数据来节约成本的。我们看看,最后一个公司是我们的通用电气,我们通用电气公司把我们大数据分析理念应用到我们的天然气和石油开采当中。他们投资运营当中成本下降1%,即使是1%的下降,在长期而言,在帮助我们通用汽车公司节约900亿美金的成本。
    接下来我们现在花点时间讲讲我们冷存储的话题,这些客户主要是采用了很多大量的云的处理方式,特别是应用我们社交平台。比如说他可能要存储我们超过10亿以上的很多的功能照片来作为我们的文档。我们的数据增长速度从未停止,我们数据增长的速率是不断攀升,我们的IT预算还是非常的有限的。我们在存储而言我们要包括我们随着数据的不断增加,我们来捕捉我们数据的增加和增长率,同时我们的延迟也是非常合理的。当然我们从我们的冷存储当然可以看到,很多的数据会被生成,我们生成的数据量会超过我们的存储的量。当然从我们图表浅蓝色的曲线可以看到,我们有很多的数据是存储在我们的HDD还有其他的相应的存储设备当中。从我们棕色图可以看到非常多的数据是未被存储,很多存储设备不够便宜,不够经济,性价比不够高,很多数据都不能被存储起来。当然在我们很多数据中心,我们主要做两个方面的事情,一个是主存储,还有深的存档。当然在我冷存储当中有高容量的HDD来进行存储,可以实时进行快速的进行分析。当然在我们深存档当中,可以有一个磁盘、磁带来进行存储我们的信息,这是非常便宜,非常经济的方式,但是不能快速获取相应的数据。
    我们会创造一个新的存储的方式,来客户端来创造我们的冷存储,这个方式而言非常的经济性,并且可以随时轻松获取我们相应的信息。对我们冷存储来说会受到很多温度条件的控制,这个地方举三个例子,我们最左边是我们高价值的历史数据,这些相应的信息可能是隔几天或者是每周或者是一个月之内会进行经常的访问和经常的获取,我们这一个应用是包括了我们的分析以及相应的应用。我们的冷来说主要是指长尾数据的处理,很多包括数据的互动。一个例子,我们的结婚照片,比如说在Facebook上面有人结婚了,很多人登录会看他的照片,随着时间的推移,数据访问的频率会被下降。最后一个是我们的最后补救的一个副本,我们的信息只是写一次,但是访问频率非常的低。最左边来说我们最主要的信息是关于我们绩效的信息,主要是我们IOBS(音译)来实现。我们最右边也是我们冷存储来说,最重要就是我们的容量。
    这是我们可以提供给我们市场的解决方案,来满足我们日益增长市场的需求。左边来说可以利用我们的软件虚拟化来进行处理,未来提供相应的数据。在我们右边来说,我们提供了这个数据来说可能是温度稍高一些,包括了我们的更高级别的技术。去年来说我们引入了我们He6的技术,当然通过我们的技术,我们会提高我们的数据50%以上。当然我们可以来节约我们的电长达23%的比例。当然跟我们未来新技术的演变也是非常兼容,包括我们SMR和HAMR。大家如果对我们这个存储非常感兴趣的话,我们会议室外面有展台可以去看一下。
    一年之后我们这么一个He技术,很多数据中心都进行了部署。当然也出现在了我们的研发中心当中,主要做的是我们液浸式的冷却演示。在我们会议室外面展台我们做了一个演示,我们的一个液浸式的演示,展示不同的环境的需求,这是我们第一次做这样的工作,实现了成果,这个存储器来说可以完全的浸在我们的液体当中。这是我们的He技术不仅仅可以提高我们的存储的容量,改变我们的存储性能,同时也可以大大节约我们的能源,并且在环保方面是非常绿色的。如果我们采用是He的存储器,而不是采用传统的存储器的话,每年可以节约大概超过4万升的煤,还有包括为我们大概是超过150万户的家庭节约电,这样我们不需要来用很多的电来进行发电了。同时我们会采用SMR技术来实现,比较高的密度,整体的密度是每年增长25%,而不是15%。当然对于我们未来来说,我们还是需要依靠我们的技术不断的创新,包括我们的SMR技术来实现更高的容量。我们的SMR可以来实现很多方面存储的性能,包括我们的冷存储,我们的移动设备,以及我们的高能耗的企业和产品。
    我们要部署我们的SMR,我们要保证我们的硬件的生态系统是已经准备好了。当然我们现在跟很多的标准化组织来进行我们的协作和联系,同时也邀请更多的新设备的厂商和制造商一起加入我们的开源平台当来实现。
    我们现在讲的是我们Petabyte悖论,冷的和温度比较高的是共同存在的。我们会发现我们的存储设备增长的速度越来越快,有更多的数据会被访问,访问的频率增高的话,我们的数据也变得越来越热。当然我们的数据的量越来越大,之后来说有越来越多的数据要进行部署。很多人访问数据量的频率也会增加,所以我们的数据就变冷了。
    做一个总结,我们刚才讲到了我们物联网、大数据演变的情况,并且两者之间始终影响我们数据中心的。我们觉得在这个地方来说我们需要有一个新的数据存储的设备研发和出现。当然为了能够引领和实现我们的创新,我们要依靠我们的新技术来实现,包括我们SMR还有我们的汉系分成技术(音译)。最后来说我们HGST的定位是数据中心存储领域的领导者,可以引领和实现这些改变,非常感谢。

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");