大数据驱动产品精细化运营与营销

标签:大数据技术商业数据社会中国技术商业论坛及领袖峰会

访客:33172  发表于:2013-11-08 09:47:18

关于更多精彩内容,详见:中国技术商业论坛暨领袖峰会

大家早上好,我叫傅志华,来自于腾讯云平台部数据分析中心。今天我跟大家分享的话题是大数据驱动产品精细化运营。我相信大数据的概念可能大家都听的很多,今天也不会讲太多的概念,因为其实大数据也应该火的感觉时间很长了,再讲这个东西,可能我自己都会觉得有点烦了。所以,我更多聚焦在腾讯的经验是怎么用数据帮产品经理,帮产品运营的同学做精细化的运营。这一块是比较容易出效果的。上一位嘉宾讲的推荐我们也在用,今天也不会讲那个,因为时间太有限了,我只讲一点,就是我们是用用户生命周期管理的办法,这个是营销学里面一个比较经典的理论,去结合大数据,怎么去提升我们的产品运营的效果,可能这个应该是所有人不论是做技术的,还是不是做技术的,都可以一块探讨。

请输入标题

腾讯云数据分析中心总监傅志华

今天我的分享分三个部分,先讲第一部分,用户生命周期管理的一些概念。在腾讯里面,在帮产品运营做海量数据分析的时候可能会有这些场景,有很多场景,这里面就不都说了。我只讲一个精细化运营,我们精细化运营是怎么贯穿整个产品的整个过程中。这里面我们用到了很重要的一个方法,就是用户生命周期管理管理的办法,我是来自于社交网络事业群,社交网络事业群正在力推的一个很重要的方法论。什么叫客户生命周期管理,我刚才说是用户生命周期管理,传统的营销学讲的是客户生命周期管理,因为我们的社交群主要客户就是用户,所以我们叫用户生命周期管理,但是传统的对应的理论是客户生命周期管理,叫简称CLM。《王永庆传》里面提到一个一个米店老板怎么做生意,他会每天收集顾客用米的情况,包括家里有多少成员,然后能估计到他每天吃多少米。所以,他就能算出来,这个家庭什么时候能把米吃完,比如买10公斤的大米,估计是半个月,还是多长时间就快吃完了,他就会主动送货上门,说你是不是大米快吃完了,或者主动打电话给他,如果他需要,就可以给他送上门。所以,他用这种办法,他的经营网络很快就超过了其他的店,这是一个缩影,这是一个客户生命周期管理的一个缩影。

另外一个案例是我们看到这是一个游戏的数据,横轴是它成为这个游戏用户的使用时长,纵轴是活跃用户量,活跃用户量的占比。我们看到有一个比较值得关注的现象,第20轴到25轴用户分两波,有60%的用户活跃用户量下滑的比较明显,还有一波用户是相对保持。所以,就是说用户在使用一个产品的时候是有一个新鲜感的,过了一段时间以后,他可能感觉就会下降,有可能会流失。比如像这款游戏,在第20轴到25轴的流失风险非常高,60%处于高流失风险的状态,但是这个还算比较长。我们看到很多网页的应用,或者一些手机的APP,它的拐点会更早出现,可能在使用你这个业务一到两个月就会处于高流失风险的状态。我们通过数据怎么快速的定位和预计这些用户的流失以及帮到产品经理说它为什么会流失?你在产品运营的时候要策划什么样的活动?这个是对于产品经理来说比较有用的手段。

这是一个完整的生命周期管理的试图,整个周期里面可以分为几个大的阶段,一个是萌芽期、成长期、衰退期等等,我今天主要聚焦在两个阶段,也是我们腾讯认为最容易出效果的。因为我们工作都有KPI,我们的KPI是说我们通过数据能够帮产品经理带来收入,或者带来活跃用户量,所以这个也是非常关键的。我今天要分享就聚焦在最容易出效果的地方。所以,这里面我给大家介绍一个案例。

我刚才说到这个是一个真实的应用,当然,这个数据我都抹掉了,大家也不要管这个应用是什么?只要了解这个方法论就行了。这个应用在横轴是他加入这个应用的时间,纵轴是他人均的操作次数,就是他的活跃度。我们从这个线能看到,这些用户在购买这个业务前他肯定有很多免费的操作才能刺激到他购买这个应用。他打算购买前,活跃度突然变得比较高,然后到了他买了以后,从这个时刻开始,他的活跃度就会迅猛的增加,就会继续增加。比如说我玩一个手机上的一个游戏,我买了一个更快的车,或者一个更好的道具,一个炸弹或者怎么样,我买了以后,肯定要用一下,很爽,前一两个月可能用的比较高。但是,这里面有什么问题呢?就是有很多时候产品的价值传递不一定是非常到位的,所以我们往往是看到很多产品在第一个月和第二月的流失率都是非常高,这是流失率。因为这个时候往往作为一个新用户,你的新手教程做的不是很好,或者你的产品不是简单易用,你认为你有很多的价值点用户没有感受到,他的预期本来很高,结果达不到预期,可能就会流失,而且这个比例是非常高的。所以,我们会聚焦在帮产品经理去研究说什么样特征的用户在这个期间会流失的很快,然后我们把它定位出来,定位出来以后,我们要知道它是由于什么样的原因想离开这个应用,或者想离开这个游戏,可以做快速的预警。

所以,我今天给大家介绍的一个是这个阶段,另外一个阶段是拉新这个阶段,比如有的想快速的发展新用户,快速发展新用户,我们用什么样的数据支撑可以让它更精准的定位到用户,今天也会简要介绍一下。所以,今天我主要聚焦在拉新,一个是新应用的用户的高流失的预防这两个阶段,有很多阶段我们都在做。

这里面我们会采用机械学习的办法,当时我们给这个应用做研究的时候还是拉了不少数据量,字段上也用了500多个变量研究预测,我们有很多历史的数据可以学习,就是什么样的特征用户他有可能能成为你的新用户,这个数据我们是可以采集到的,就是它的各种可能性的特征我们都可以采集到。然后我们再用机械学习的办法,这里面主要用决策树的办法去研究什么样特征的用户能够成为你的新用户。比如说买房的用户,如果他小孩可能已经4、5岁,3、4岁的时候他还没有房,而且又有一定的经济能力,他是不是拥有很强的买房需求,有很多特征,和他购买的驱动力,购买的驱动力是非常相关的。

我们通过这500多个字段预测用户下一阶段的转化率,决策树是得到一个知识树的结构,我们找了比较重要的几个树枝去做运营,就是我们知道这几个树枝可能是转化率比较高,比如我们把这个潜在用户,划分成七类用户,每类用户的转化率都知道,就是它转化的概率跟普通用户的转化率的倍数都知道。像这个和这个,都是转化概率比较高,而且它的用户量也比较大。所以,我们知道这个特征以后,就可以定位这个用户,定位这个用户以后,把这个用户对应的ID给到产品经理,比如这里面有三群很重要的用户,比如这三群很重要的用户,这个是量比较低的,还有这个。这几群用户,量会比较高,然后转化概率又比较高,而且我们知道他喜欢什么?因为我们的决策树能识别出他的特征出来,就是他的特征和他转化的关联性。所以,我们就可以知道说你对这些用户,比如它喜欢玩虚拟空间的装扮,你这个业务又刚好是对应这个,你就说我可以策划一些活动,可以换装扮,最好拉动他冲动性的消费,他就更容易购买这个业务。

刚才我说到500多个变量,500多个字段里面,最后有用的可能也就10来个,有用的10来个里面,很重要的发现是斜率型的变量,或者增长型的变量很重要。这个是什么概念呢?比如我去买车的时候,我可能买车的前一个月突然会对汽车类的网站,或者论坛的浏览量可能比前几个月流量量要多得多,这是很正常的。这个流量量的突增其实也意味着我对这个事情有更明显的购买的意向。所以说,我们在设计变量的时候,除了常规型的、状态型统计的变量和简单的统计量我们还要考虑设计一些增长型的变量,增长型的变量其实在预测用户,在转化的过程中是更有效的,这是我们拉新的时候用到的一个方法。

这是防流失的一个办法,也是用特征识别的办法去识别具有哪些特征的用户流失的可能性有多高?比如这里面是一个决策树的案例,这个用户在使用背景音乐盒每周的操作次数少于1.5次的时候,他的流失可能性达到30%。另外,如果说他每周使用都不到1次,它的流失可能性就更高了,达到65%。所以,它是有一个规则,简单协一个SQL就能把这个用户找出来。假设这个条件,同时满足这个条件的用户能筛选出来,而且我们知道他流失的原因是什么?他是因为这个音乐盒的操作次数变少,我们是不是在这方面的活动或者是运营商会做一些文章,让它更多的去体验这个业务的一些价值点,处于高流失风险状态下,能够让他流回来。

这是一个案例,这是对应的用户ID,我们每周都可以给他打分,它这周28分,下一周39分。哪一些用户会接触它呢?一个是流失分数超过10%,就是第二周比第一周的流失风险要高于10%,第二种是绝对值大于40%的流失风险,这两个用户我们都要把他定位出来,完了以后要做相应的产品的改进,或者对他们做一些促销,或者一些产品运营的活动。这个诱因也是能知道的,因为看决策树也可以看到,哪些方面是他的主要的诱因。这是我们的效果。如果说我们这样做特征的识别以后,我们这个点击率比产品经理平常拍脑袋做的时候的点击率都有不同程度的提升,比如75%,88%等等,甚至有的达到翻倍的点击率的提升,这已经是非常好的数据。

我们做完那个还不够,刚才我说这个流失判别的规则,比如音乐盒的操作小于1.5次,每周大盘的使用情况不到一次,这些规则我们都可以通过数据挖掘算的。另外,我们定位的每一波人群固化下来,刚才我们看到七类用户,其中三类用户是比较重要的,我们就可以把他固化下来,只要他满足这个特征就可以把他归类到这类用户里面,产品经理也对他们做了有效的活动,把这个有效的活动规划下来,如果用户来到这个应用,他满足这个条件,我们后面就可以自动化的推荐这个活动,这样产品经理就不用苦于说我经常要分析我的用户流失情况是怎么样,我的用户流失怎么定位等等,它就节省了很多烦琐的非常专业性的事情,它就可以去更聚焦在他的产品的创意上,数据挖掘就更聚焦在准确度上。

最后简单介绍一下我们这些方法论其实也固化在我们给到开发者的一个工具上面,叫腾讯分析和移动分析。在这两个工具上我们做了数据的储备,包括4000多台数据的集群,包括每天新增100TB的统计数据,其实我们在用户里面已经可以达到10秒的延迟,在外部给开发商可以更高一些,因为他的数据量在内部来说相对小很多,这是我们一些开放的里程碑,这些统计工具11月7号已经发布了,包括移动分析今年7月份发布,里面有很多功能,包括拉新,运营等等,包括里面比较重要的是云标签,其中有一个重要的标签类别是我今天提到的拉新的表现。我有一些标签是通过数据挖掘的手段帮你应用定位,哪些用户是高付费解密的,或者是高付费转化音乐的等等,这些标签是有的。这是用了我们的表现以后,它的付费人数,付费渗透率等等他的提升。这个是欢迎大家使用腾讯移动分析的工具,这是我的微信,欢迎大家跟我保持联系,我们可以有更多的时间探讨,谢谢各位!

关于更多精彩内容,详见:中国技术商业论坛暨领袖峰会

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");