陈宇新:大数据营销的实现与挑战

标签:大数据营销中国技术商业论坛

访客:24847  发表于:2013-11-22 16:28:34

【导读】Twitter每个季度都亏损,为何还受追捧股价涨到46块?去哪儿网为何会成功上市?为何亚马逊30%的销量竟来自消费者“推荐”……在陈宇新教授的演讲里,你将找到答案。

陈宇新:大数据营销的实现与挑战

11月9日,在“2013中国技术商业论坛暨领袖峰会”大数据与营销变革专场,上海纽约大学陈宇新教授分享自己对大数据营销的实现与挑战的看法。

【大数据营销现状】

在未来,我们看到的一些光明,在隧道的尽头看到光明,看到大数据给营销带来的变革。但是我们又在相对比较混沌当中探索,我们还有很多困惑,还有很多需要研究的地方,这是目前大数据营销的现实和愿景,道路还是比较曲折,还有很多未知的东西。这是我对大数据营销目前现状的概括。

第二投的比做的多,投了之后不一定真正做大数据。我有一个朋友在一个非常大的国企工作,大家每天都使用这个企业的产品,他们在去年也成立了大数据部门,我这个朋友是大数据部门的负责人。但是过了一年以后我问他做的怎么样?他说投了很多设备还没有开始分析。这也是一种现状,投的比做的多。

第三做的比懂的多。现在已经有一些做大数据、BI的系统,分析出来一些数据。即便做了分析,我们是不是懂得后来的原理,是不是懂得分析的价值所在,懂不懂得衡量投入和回报。

第四懂的比赚的多。最后我们通过大数据的投资,通过大数据的技术,到底赚了多少钱,这笔账我们也不是很清楚。看上去有些负面,最后可能是一个相对比较正面的东西。比如说我们赚的,比想的要多。什么意思呢?将来赚的比现在想到的多。虽然现在我们投入了,可能不一定很准,也没有看到特别高的利润。但是实际上大数据的投资,大数据给我们未来带来的利润回报的潜力,可能远远超过大家现在看到,大家现在想到的。

比如说美国Twitter上市,股价到了46块,实际上并没有盈利,每个季度都在亏损。但是它为什么这么受追捧呢?从我来说,很多程度是有这么多的用户,每天有这么多的信息在上面;从未来大数据的角度,从Twitter的信息,了解消费者的偏好、未来的商业价值、潜力等,这是不可估量的。它本身的价值不是服务,而是服务本身的价值。去哪儿网前段时间上市也取得了成功。去哪儿网不在于帮你找到机票、旅馆,而是通过这个平台搜集了海量的信息,未来的商业价值也是不可估量的。

【如何在营销中实现大数据的价值】

从低到高,从浅到深,主要有四个不同层次的境界。

第一层的境界就是度量,我们要知道哪些量是我们要测量的,我们需要知道什么样的信息?这在于我们对业务的理解,不是IT人需要了解的而是CMO应该了解的。我曾经去过一个电商做过案例,做过深入的访谈。对他们来说,做大数据遇到很大的挑战是什么?怎么定义订单?这是非常的量。从CMO角度来讲,订单在购物车里面买了就是订单。但是用这个标准执行下去这个并不是很好。因为订单在购物车出现之后,放在仓库里面,一个订单可能拆到两个或者三个,拆成两三个之后生成了多个订单。最后我考虑一个订单利润的时候,你用购物车的订单考虑的话反而不是最好的方法。

但如果一个订单被拆成几个,运营配送的成本就会大大提高。最后他们在内部协调讨论,有一个最小的订单单位。此外,当然还有其他订单的复杂性。比如一个订单出现部分商品退货,怎么定义一个订单大小?这是我们做大数据第一步要考虑的,哪些量是我们关心的,哪些量是我们应该测量的。

第二层的境界,是从度量进入到统计阶段。统计核心是什么?对不确定性的理解。因为我们平时很习惯看报表、经济数据等等,都是一个数字,比如说GDP是多少。实际上数字包含着不确定性。比如说美国非农数字,没有一个经济学家预测准的,但是看历史误差,还在误差范围里面的,但是我们往往会忽略这一点。

对统计的理解,还有一个很大的误区——我们往往会觉得大数据时代不确定性在减少。实际上很多时候正好是相反的。大数据时代,我们的不确定性反而增加了。为什么呢?因为大数据时代之前,我们关心的往往是一些汇总的量,或者在一类人,或者一批人的平均值。比如说有500个用户,平均订单是多少,平均消费是多少,这是非常准确的。

但是大数据时代,要把营销做到个体上,数据虽然大,做到个体上,样本量非常小,预测的准确性并非那么高,而不确定性变得非常大。因为对于一个个体而言,就算很著名的电商,一年消费十来次,这是很好的顾客。我们在个体层面上做的统计分析带来的不确定性,比原来在传统统计层面上,带来的准确性更好。

第三层的境界,进入到预测阶段。统计还是看历史的变化分布等,最后还要进入到预测,对未来的判断。此外,在大数据实践当中,很容易遇到一个陷阱,就是我们对相关性的理解。当我们搜集越来越多的变量时,我们对历史数据的预测做的越来越好,但是我们对历史发生的事情预测的越好的时候,往往我们对未来的预测变得越低,变得会越差。学过统计或者计量经济学的人知道,这是非常著名的理论。因为你对过去掌握的太多了,相关性的变量稳定性就会降低。比如当年南非世界杯的时候,预测足球非常准,但是用它预测未来,可能就不如足球的评论员,专家预测的好。对过去预测的越准确,往往对未来预测越不精确,这属于大数预测方面的陷阱。

这里面我们要更加深刻理解“相关性”。相关性有两种,第一就是随机预测的相关性,另外一种是背后有一些理论有些常识能力支持的相关性。比如冰激凌的销量跟一个地方的火灾有相关性——冰激凌卖得越好,火灾越容易发生。这种相关性有长期的理论性,因为这里面有天气的因素。这种相关性是我们在大数据时代里面需要的相关性,而且它有相关的潜在的好处。

最高一层就是优化,因为我们做什么事情,最后都要做决定。在大数据时代我们要知道,里面有两种类型的优化,一种是优化应对,这个事实是不可改变的,比如预测事实发生,比如有台风来了,我们怎么应对台风,但是不能改变台风的事实。从这个角度来说,我们不需要了解太多因果规律,知道相关性就可以了。更多的时候优化是改变未来,而不是预测未来。

我们的决定怎样改变未来的结果?这时我们知道相关性不够,还要知道里面的因果关系。

举例说,数据科学家什么年龄结婚?他们都预测是30岁结婚。比如说这是第一类预测,不能改变这个事实,你的优化就是存钱买房,30岁有房有车。第二种就是决策改变未来,就是我现在要成为数据科学家,我是不是转行,可以早点结婚。

很多的时候,营销遇到的是第二类。这时候我们就要知道因果关系。我们怎么知道因果关系?这应该是挺难的事情。但是在大数据时代,给了我们非常有用、而且非常有效的工具。在大数据时代,我们很容易做很多的试验,在很快的情况下,在网上很快的分成很多组,进行简单的测试,哪种营销手段效果好。从这个地方可以看出因果性,通过因果性的判断,做出哪个决定是最优化的。

举例说,我和北京大学同事做的项目,即推荐的算法和有效性。比如,亚马逊号称30%的销量是推荐来的,中国电商网站一般10%的销售额是推荐来的。如果不做推荐,是否还有10%的销售?你不推荐的话是不是消费者也买同样的东西,这里并没有对比。

我们基于电商的实验,最后发现一个很有趣的现象:如果你把另外一组人推荐的人去掉,有没有销量没有显著的影响。大多数没有被推荐的人,绝大多数买东西有很多的重合。但这并不是说推荐没有用处,我们追踪他们一年时间里面,我们发现被推荐到商品的消费者,回头率增加了,长期带来的份额,长期带来的营收上升了,因为消费者感觉到购物体验提高了。虽然没有买你的东西,但是你推荐的东西都是他喜欢的。这样他觉得这个网站对货品的选择很对我的胃口,回头率增加了。

虽然大数据没有带来直接的影响,但是如果你知道因果分析,你会知道真正的好处从哪来,知道你推荐的方向和目标就改变了——主要从增加用户体验方面入手。对推荐引擎的第三方提供者,他们想的要额外收入,不光从点击转化率收费,而且是长期的效益,这样对他们来说也有利润的提升。

由此可见,有时表面没有看到直接的利润上升,但是实际上通过大数据赚到的钱,可能比我们想象的要多很多。

【挑战】

第一基于对业务的理解我们才知道看什么东西,要了解什么信息。第二经验与数据的结合,有了数据还要判断,到底对谁做营销。第三分析与优化的结合。我们的分析的目的还是要优化,不光看到数据,还要做决策上的改变和调整。

这里面有一个瓶颈,分析的人才和优化人才要求的知识结构不太一样。分析主要是计算机科学,统计等等,优化是运筹学,运营科学方面的知识。这两方面的知识,虽然都是搞定价数学的,但是不完全重合。你们在企业内部,更多的是找分析的人才,会玩数据,会做统计的,但是我也想提醒大家,还要注意优化方面的人才。这两方面的人才的知识结构不是完全重合。

第四能力与敬畏的结合。往往被大家忽略的是大数据的极限在哪里,硬件越来越便宜,计算机的能力越来越好,大数据体现的是能源,现在整个IT行业,已经消耗了全球10%的能源,而且这个速度在不断的提升。

物理有热力学第二定律,大数据从本质上来说就把无序混沌的东西变得更加的清晰化,变成有序,就要不断的加入能量,才能从无序变成有序。我们不断的做大数据,让大数据百倍千倍的增加,背后必然有能量输入进去。

最后,大数据的投入产出的成本可能就是能源的成本是最后瓶颈的限制。数据不可能是无限大,我们的历史数据到底要保留几年,数据到底细到什么程度,这是未来我们需要考虑的东西。

中国电器大的公司已经意识到这点,把数据中心迁到内蒙古,这样的话,能源成本能降下来。大企业想在这方面投入的话,这是非常重要的课题。我们人类对知识,对信息的渴望是无穷的,但是最后的极限有一个自然规律在背后,有能源的问题,这也是敬畏之心,不可能是无限的。(顾琳琳/整理)

关于更多精彩内容,详见:中国技术商业论坛暨领袖峰会

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");