【2013中国技术商业论坛精彩回顾】【电商】【阿里巴巴:大数据与电商生态再造】

标签:大数据电子商务管理数据分析价值阿里车品觉数据社会

访客:50824  发表于:2013-11-20 16:26:01

【2013中国技术商业论坛精彩回顾】【电商】【阿里巴巴:大数据与电商生态再造】

            阿里巴巴集团商业智能部副总裁及数据委员会会长 车品觉

  【大数据的困境】

   现在生活里面从早上开始,如果您有用一些智能手环的就会发现早上自己的睡眠怎么样,阿里的很多人早上起来就是看一下来往,上班看一下今天的交通怎么样,到办公室的时候看一下淘宝,产品有没有到。大数据的成立到今天为止最主要的是它已经得到一个数据化的东西,但是条件是,今天我们要意识到大数据有一些虚假知识的。数据量大不代表信息量可用,有时候信息量大也是会破坏信息的。大数据来自多种渠道,偏倚、随机的误差。

   刚才有嘉宾讲到营销的漏斗,有一个转换率,如果大家都做营销的话,提高知道今天的漏斗已经错误了,错误得很厉害,所以继续用漏斗的人要知道,今天你公司的效益量的20%以上来自无线,如果你数据的底层是无限跟PC没打通的,不用看数据了,因为你的数据已经有偏差了。很多电商公司里面的运营的数据都是基于PC世界的,不是基于无限世界的,例如我今天看了一个无线的终端,看了之后我去PC里面购买,也有很多人在PC里面看了之后在碎片的时间去无线购买。到底是无限贡献了交易量还是PC贡献了交易量?像今天中国的电商,好象美团已经说50%的交易量来自无线,它整个PC的分析方法是不对的。其中一个难题是在无线上的跟踪,两种方法的,也可以说是三种方法,一种是H5的网页,一个是APP,一个是WAPH5APP之间的数据是不通的。PC用的跟踪方法是COKE的,无限用的方法是没COKE的。所以说这三种之间的打通是很重要的。我自己一年前发现了这个问题,我们给管理层看的数据是很笨的,讲UV的时候是PCUV,讲转换率的时候有一半是无限的, 看来看去很多人还看不出来。原来无限已经影响了整个分析的框架。

   【数据价值】

   很多人谈到数据的价值,你有没有发现,投资人、CEO、中层管理和数据人是不一样,当你看到中层管理,他肯定因为这个数据要解决具体问题,但是对于CEO来讲他会我说要看明天,当投资人说的时候会说你的数据能不能盘点一下资产能赚多少钱,中层管理我说要用,数据人说我不管,反正我做数据的。讲到数据价值,这个V很多人讲不透是因为我们数据价值是给社会还是给公司?这一点是很混乱的。

   其实整个企业里面数据化运营有一个非常核心的点,如果大家今天是跟数据有打交道的应该都明白。做数据的人并不知道别人怎么用;用数据德人不知道数据怎么来;数据模型不知道数据是否稳定;用数据模型的人不知道书记模型究竟是怎样的,甚至不相信数据模型。它之所以是这样,是因为大家没沟通的。

数据价值细分化。如果我们要分析一个用户的行为,有三个维度,一个维度是你对用户的识别度有多大。今天你公司有一千万注册用户,你不知道每个用户平均有1.5个帐户,这样你每三个帐户里面就有一个是重复的,有时候会发现给红包给他的时候,你发现你给的是没有买东西的帐户,实际上只是因为公司知道了仅仅是帐户,不是人。在识别度上发生穿戴、社交、购物、银行,你没有办法连接起来。有一种数据是用来识别用户的,比如说你知不知道用户的手机、这个用户的邮件,包括送货地址;有些数据是用来关联的,比如说他在微博里面发一个什么样的内容,但购物的时候跟它有关联;有些数据是用来描述它的时间级的,在时间序里发生的变化;有些数据是用来管理,有些数据是用来预测,有些数据是用来执行。包括转换率,转换率是属于管理价值。当我们知道这种数据之后,我们开始知道数据价值没那么简单,数据价值是每个数据在整个分析里面所产生的价值到底是什么。

   从大数据来讲,ETL会成为瓶颈,只要数据越多,大数据广度越多,ETL瓶颈越大。还有无限的维度,你不断地增加维度,你没有办法满足用户,为什么?因为标签不可重取,人的行为也不可重取。在交叉的时候你户发现整个大数据最大的两大问题,一个是数据是怎么来的,一个是数据怎么用的,这里面是没有办法用以前的方法来处理。所以应用的时候非常难,也可以说大数据基本上不是小公司用,大数据起码要问的第一点是怎么备份。像阿里300TB的数据,300TB每年要多少钱?这已经是一家公司没办法承担的事情,前一段我们还要想怎么备份。当然当你这么贵的数据还要备份,300TB你要备份什么?先按存量备份、增量备份,如果说3个亿来做一个数据的话,9个亿才能满足今天的存储。

   Data Decay。大数据里面有什么先收集起来未来会有用,这句话是一场骗局,如果你一年前在一个网站,你的购物行为,路径,这种数据要留下七年的话,这个是匪夷所思的,因为连网站都已经变了,网站的结构都变,以后你既然能留下三年以前的行为数据,这种数据是没意思的,因为你也没法还原。所以我想说,没法还原的数据基本上就不要。Data Decay我们要意识到数据里面哪些有价值,那些没价值,时间过去之后是没用的。Data Broken,如果你的公司没有把数据转化成生产力,这句话没问题。因为整个数据模型里都要对数据非常依赖,但是这个数据没有了,我们行业内叫做data broken,你要有心理准备。

   所以大数据的管理是一个新的课题,包括在备份、管理、标签管理,特别是那些非结构数据的处理上。有一个例子,在北京一个人从A区搬到B区,不代表他真的搬了,有可能两边都住,所以我们会把这个判断移后一点点。过去你发现很多公司在这个时候就改掉了,真正做大数据的人会把这种决定稍微推后一点点,也许万一这个人要送货到A区的地址时候。这个时间整个系统为什么会叫醒自己,可以把这个数据回来?这种方法完全在新大的数据里面的管理,是一个很新的课题,而且还要可以恢复过来。

   【数据化管理】

   数据化管理简单来讲就是利用数据去解决问题。在过去使用数据解决问题的时候,我们积累了一些经验,我们开始去运营数据,主动地收集一些数据来创新数据或者改善一些数据。比如说我们在阿里发现,如果用一个人的身份证的性别来做一些推荐,你会发现不如你收集他的行为性别,这是肯定的。所以购物性别跟原来真实的性别是不一样的,所以改善数据,以往只有一个性别,有一种东西叫行为性别,70%时间是男的,30%是女的。当你在解决营销上的问题的时候我们会重新思考一下是不是有更好的原材料,更好地数据处理这种问题,我们叫做运营数据。

   今天你会发现数据量不断增加,我们会假定数据比较容易获取,这完全是基于数据是变化非常大的,而且没有静态数据,只有动态数据。解讲到用户细分,如果你发现用户细分里面用了我刚才讲的性别,而不用静态性别的话,整个用户的细分会变了。那个时候你就会发现,大数据来了,这种数据开始变了。

   今天为什么我们公司里,用数据的人不知道数据怎么来的,做数据的人不知道别人怎么用。整个来讲数据是一个部分,商业理解是一个部分,思考方法是一个部分,它是重新要去提炼的技能。

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");