SAPHANA实现大数据价值之道

标签:技术商业热点中国技术商业论坛及领袖峰会

访客:25043  发表于:2013-11-08 11:55:37

关于更多精彩内容,详见:中国技术商业论坛暨领袖峰会

主持人:接下来主题演讲压轴的嘉奖是SAP高级副总裁,SAP中国研究院首先运营官李瑞成博士,他要演讲的主题是SAPHANA实现大数据价值之道。IT经理人世界杂志,做了一系列关于企业研究院的报道,最那些评选了十佳研究院,表扬他们在创新领域做出的贡献,下面我们有请李博士上台演讲。

SAPHANA实现大数据价值之道

   李瑞成:我不想在这个场合花很多力气做我们HANA的宣传,如果有时间的话,我们私底下宣传。大数据,2.5PB是什么意思?大家应该知道,应该猜得出来?这应该是全球最大的一家公司沃尔玛数据库一年的容量。沃尔玛一天的交易大概是100万左右,2.5PB给沃尔玛带来多少价值?这里面有很多案例,我就给大家分享一个。沃尔玛不知道在暴风雨来临之前销售量非常高,很多货存不够。产品线,啤酒,暴风雨是不相关的,没有什么联系的,但是通过大数据分析,就可以把它的相关性找出来,给企业带来一定的价值。

7.9ZB,是什么概念呢?2015年,人类估计能产生的数据量是7.9ZB。意思就是说,从太阳到冥王星可以来回18000次。所以这个量是非常庞大的。刚才有一些同事也讲了,大数据有3个V我就不讲了。如果按照摩尔定律来讲,如果18个月翻一番的话,80年代是UM,90年代是MM,2000是10CM,到2010年是10M。

   刚才讲的,光大数据,如果没有能力把它实现价值,这个大数据是没有意义的。所以讲到这个地方,我想借用美国第三任总统的一句名言,这个名言对大数据的实现价值非常有意义。大家知道美国这位总统非常有名,是思想家,是政治家,是文学家,是天文学家,还会算卦,是非常厉害的一个人,他是独立宣言三人创立之一。他讲你占有一个东西它是知识,但是学习选择就是education,这是非常有哲理的一句话,不光是知识力量。我们那个年代讲知识是力量,他认为知识不光是力量,还是财富。一个亿万富翁有很多钱放在银行,但是他不善于用这个钱花这个钱也就是一串符号。我们拥有大数据,不善于应用挖掘就是一串数据。

怎么应用?SAP有一些想法。大数据应用就两块,第一块对历史数据的挖掘,历史数据产生了,我怎么在历史数据里面挖掘一些有价值的东西,大家对这块比较熟悉。比如说财务报表,资产负债表,损益表都是类似这样的东西,管理企业也是如此,都是往后看的。这些KPI,就是历史数据的这些东西,是向后看的,就是看后视镜,看后视镜是有价值的,大家都开车,要看后面发生什么事。但是一味的看后视镜,也会有一些误区的,我们开车也要往前看。所以挖掘历史数据是非常重要的,但是重要性,往往会导致对未来判断的迷失,所以这是SAP提的非常重要的思路。我们提倡往前看,不光往后看,也要往前看,都往前看,很多数据,包括社会数据,企业应用数据都可以抓起来往前看。

我讲一个大数据往前看的例子。这是在印度过马路的景象,经常会被轧死人的。这个人要过马路,要实时收集信息,看看能不能传过去?这些数据,一分钟,2分钟,5分钟的数据对过马路是没有用的,他要把这个数据抓起来,在脑子做一个判断,再找机会做马路,才会有生还的机会。我要瞬时抓数据,使我的企业活起来,这就是我们说的往前看。

   往前看就牵扯这么一个思路,原来做的往后看,就是看发生了什么事情,包括原始数据,报表,告诉你发生了什么事情,当时它跟未来有一定关系,但是关系不一定很大。为什么发生,什么事发生?发生之后最好的结果是什么?怎么做预测?然后采取行动。这是SAP要做的一些事情。我们给企业提供一些解决方案,怎么使大家更好的往前看?

这个图讲的是往前看带来的价值。任何事情都有一个触发时间,从触发时间到采取行动会有数据整合,交付的过程。这个时间越长,你消逝价值就越大,只有通过快速提高公司的能力才能减少消逝的价值。

   内存计算是我们创始者passo Plattner提出来的,一个使用内存计算的列式数据库整合了OLTP和OLAP。首先把它综合在一起。上面是内存,下面存储,这是软件方面的,软件方面寸纯,分区,压缩,差异。

内存机损和HANA是软件和硬件的结合。光硬件是不行的,我们可以把硬件做到80核左右,这是软件,把它结合起来。SAP从摄入,存储,处理,呈现,是一个整体的解决方案。这些方案,要做的话都有开源文件,大家都可以看的。但是一个客户要把这些东西整合起来不是那么容易的,会掉入一个陷阱,你自己开发是非常难的。把那么多开源整合在一起是不容易的事。把它整合在一起就是HANA。

   我们从2010-2011年,就做了一些基本的东西,从2012到现在,主要是OLAP到OLTP的融合,变成一个数据库,这是一个革命性的东西。为什么把行式存储变成列式存储,有一个很大的改进。SAP HANA是一个开放式的平台,不光是对SAP系统可以整合,对任何行业都可以用,它是一个数据库。

我们加一个案例。这个案例是癌症方面的治疗,这个和SAP产品有关系。这个是和日本医疗机构合作的。现在医疗治疗方面,就是一些探测,CT变化,对身体进行检测再做诊断。最重要的变化就是基因排序。他们的计算速度非常慢,SAP跟他们一起合作。用SAP HANA做计算速度,可以提高40万倍,实际应用过程中,我们提高了216万倍。计算之后放到网上进行对比,提供一些样本。

   还有一个案例做预测方面的分析,怎么帮他们调整运行方案。这是法国的企业,对客户有一个承诺,在巴黎俩小时之内货送不到要赔钱,而且赔的很多。原来准确到达率是90%多,赔的非常多。SAP HANA介入之后,可以随时观察到这个车到每个道路上会发生什么状况,有没有交通堵塞,有没有什么工程,然后反映到总部,然后总部直接派另外一个车给客户送到,这个运算速度是非常快的。这个案例帮助企业在运行过程当中,把数据抓上来,调整运行方案,从而达到运行目标。

   这是麦卡伦,SAP做了两个事。首先第一步在麦卡伦车上装了很多传感器,首先把麦卡伦脾性摸清楚,刹车情况,加油情况,都有自己的情况的。把它的性格摸清楚以后,再找一个车手,每个车手的开车习惯也不一样,两个匹配,然后最产生了最佳组合,这是第一步。第二在现场会有计算,通过HANA现场计算,我给大家透露几个数据,以后赛车,赛马行业要消失了。一般第一轮下来之后,用HANA算出来之后,80%可以知道哪个会赢,第二轮达到95%知道哪个车会赢。做了两步,所以这是非常颠覆式的应用。HANA在赛车,赛马行业会产生很多新的方法,我相信大数据的应用也会在未来三四年有一些新的行业产生,有一些新的行业消失。

这是NBA,想知道球员状况如何,投篮命中率,心情状况如何?我们跟他们合作做了一个项目。这是不同的投球点,不同的球员在什么位置投球最准,这样教练可以有目的性的把他们做最佳组合。包括他们当天的情况,身体状况都会作为参数算出来,今天这个球员应不应该出场,如果出场,哪个地方命中率最高,哪个地方最低,这样就可以做一些分析。我们最近想把中国的足球队优化一下,我们中国队也不至于那么惨了。

   最后给大家看一个游戏,这是bigbang(音译)和SAP一起做的。当他们马上要输的时候,SAP HANA告诉你买什么装备可以赢对方。马上就输了,很糟糕的感觉。它就告诉你,你现在怎么办?要活还是要死?要活买这个装备。你要不买的话没关系,它会让你再活一会儿,然后出来不买的话就死,怎么办要买吗?HANA无处不在。刚才这个人绝对不买,不买的话活一会儿,然后就来了你要买吗?不买马上就完了,这就是HANA的一些效果。

我稍微总结一下,可能大家对SAP有一个印象,SAP是做ERP的,SAP不光是ERP的公司,我们现在已经改变很多了,我们在移动应用方面,在云计算方面,在BI分析方面,数据库方面我们都有业务了。所以SAP一不小心进入了数据库。目前数据库SAP做了颠覆性的创新。我们有很多地方支持HANA的发展,包括研究院也做这个事情,如果大家有兴趣可以联系我。今天给大家分享这么多,主要讲瞬时数据抓取,然后做实时分析,给企业做关于企业生存的问题,好谢谢大家。

关于更多精彩内容,详见:中国技术商业论坛暨领袖峰会

上一篇:#数据社会#
下一篇:#数据社会#

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");