GrowingIO吴继业:从领英看数据分析如何驱动硅谷企业的指数级增长

标签:大数据数据分析硅谷领英吴继业

访客:63705  发表于:2015-12-07 10:37:04

2015年12月2日,以“融合 共生 共赢”为主题的2015中国产业互联网大会在北京悠唐假日酒店举办。在“企业向云和大数据的迁移之旅”论坛上,来自GrowingIO的联合创始人吴继业谈了Linukedin公司如何运用令人惊奇的数据分析技术,从而创造出企业强大的成长动力。

GrowingIO吴继业:从领英看数据分析如何驱动硅谷企业的指数级增长

以下是吴继业的演讲全文:

首先我简单介绍一下自己,我是5月份回到北京的,之前我在硅谷工作了8年,主要是在Linkedin工作了四年多的时间,之前在eBay工作,再往前在北京也工作过五年,是宝钢软件下面的软件公司,在惠普也工作过四年的时间。这十几年的时间多一直从事关于数据整合、数据清洗以及数据仓库。

现在我们在讲大数据。我也是在硅谷的时候接触到这些比较新的技术和些思想,今天有机会在这里和大家分享。我是2011年加入Linkedin的,在之前我只是普通的软件工程师,去了Linkedin以后,很偶然的机会我遇到了我现在公司的合伙人。他之前在2010年之前也是在EBay工作,他加入了数据科学家团队。Linkedin最是早设立数据官职位的公司,他的老板美国白宫向奥巴马介绍过数据分析和数据战略。曾经Linkedin数据科学家的团队都是很多精英,2011年Linkedin上市了,上市之后就面临着一个压力,首先人员增长是一个飞速的增长,2003年公司做第一个产品,2009年inkedin的用户增长已接近一百万,就是一亿的级别。在等到我加入的时候,大概就有1.2亿的级别。它上市了以后面临着要让公司挣钱。

那个时候可以看一下Linkedin的增长曲线,在2011年的时候那个红颜色的地方是我加入的时候,我们当时是两、三个人加入的Linkedin,我们开始是要去想办法拿数据来帮助Linkedin找到一些挣钱的方法。

当时Linkedin是一个什么样的情况?Linkedin的产品很初级,存在很多的问题,系统当中有很多的问题。当时客户留存也是非常低,当时大概客户的流失率是50%,有很多人来了以后用了一段时间对产品不满意或者没有提供很好服务他就流失了。当时我们也不知道用户如何使用Linkedin的产品。基本上是处于一个销售市场和运营都没有得到很多数据增值的支持。我的合伙人是一个人做市场和销售以及其他运营的部门支持。那个时候开始,Linkedin每一年在营收上面,在流水上面都有60-40%的增长,我们离开的时候客户流失率直接从50%降到了10-11%这个区间。也就是说,我们可以让我们的客户到很满意,让我们的客户觉得我们的产品很好,第二年还会续签。

如何做到这一点,我讲一些案例跟大家分享。

图上每一个上面的框架都是曾经在公司做的一些有关数据的项目,一些把它涂掉了,主要是为了保护Linkedin的知识产权。最早开始支持这个销售系统,销售人员有一个问题,遇到大客户的时候成单率很慢,沟通好几轮。首先找到这些公司反复沟通,反复确认这个产品需求,对方才可能买我们的东西。我们做了一个系统叫做ML,可以帮助销售从Linkedin的数据里面,从Linkedin的海量数据挖掘出来各种关于这个客户的信息,这些信息帮助销售快速成单。

接下来我们做了PM,就是用用户倾向性的产品。Linkedin有一个产品线,大家都知道,Linkedin是一个职业社交网络,在里面有很多的人,有时候拓展我们市场或者想认识一些我不认识的人,或者通过我的朋友圈找到一些人,我们是没有办法直接就跟它联系的,需要买一个商务级的计划。这个计划可能花了30美金一个月。这个就是Linkedin给每一个Linkedin成员设计的一个产品。这个产品它的其实销售成本是很低的,主要是靠市场获得客户。通过市场获得客户,我们当时的手段就是给用户发邮件。发邮件的过程当中我们采用了很简单的分析分发做。我们做了一些之后,我们发现我们把原来的接到邮件以后使用我们的个人计划的人数,从原来的这个KR,一下子增长的3.5倍。比如说我们做的TBR,在中国一些企业想去海外拓展它的全球战略,可能招聘一些海外的人才,当这个企业想拓展海外人才市场的时候。拿华为来说或者更大中国企业来说,他们去海外拓展需要招当地的人才,而不是把中国人才全部送过去,不招带任何当地人才。这个时候他需要做全球的人才的吸引力的全球品牌。这个时候Linkedin通过各种各样数据帮助一个企业拓展这个海外市场,包括做Linkedin的人才吸引力指数。一我们通过海量数据把人才吸引力指数做出来,可以给多每一家公司。后面我们还做了各种各样的模型,还做了一个娱情分析的模型。可以看到这是2014年的Q2上线的。这个模型当时做了就是说,我们想分享一下Linkedin的商店以及Linkedin的克复系统以及脸书、推特上面发的所有关于Linkedin的人们所说的话,留的言或者给的反馈。我们想分析一下关于Linkedin哪些主题,这些主题是积极还是消极的?这其中我们的团队也从当初的两三个人,到我们离开的时候已经发展到了90个人这样一个团队。我们这三个人都是中国人,在我们的团队当时也是吸引了各种各样的人才进来组织这个团队,你可以看到这个增长是Linkedin各个部门的业务线的业务增长。它和我之前给大家的RM增长是完全一致的。我们所做的所有的公司都得到了公司CEO以及投资人的认可,这就是引出了我们回国这样一个契机。我们当时离开Linkedin的时候我们是想回国创业,我们也想拿一些投资。当时Linkedin的CEO直接介绍了Linkedin的创始人给我们认识,跟他聊了大概15恩分钟之后他就想投我们,当时我们也是说这件事,帮助中国互联网企业获得一些支持。我们在Linkedin学到和想要的,和未来想要做的事情,做到我们的产品黎曼。我们支持了Linkedin这几大部门,一开始销售到市场到产品、到研发、到运营、到客户成功。

下面我依次再讲一些例子:

1,如何帮助销售快速成单?这跟Linkedin的书记有密切的数据。这一张表是公司人才六都的一个表。这个表的左边每一行都是一家公司,比如说这家公司是谷歌骨骼,左边这些公司绿色的部分是从别的公司加入的谷歌的人才,从别的公司里面加入谷歌有多少?红色的部门是谷歌的员工离职去其他的公司。因为Linkedin有很多美国市场和欧美市场,它的数据是对于任何一个企业来说是非常有机制的。我们给到几亿的CEO手里面,很快就拍板使用Linkedin的产品,不仅提供产品。这张图可以看多竞争对手在那里,可以九月可以分析这张图是公司级别的分析,我们从公司级别再深入复习出来,这个人员的自身程度,或者是人员总哪些行业来,还有它所管的功能和部门是什么?

我们有这样例子给到客户,客户马上想我有很多附加的信息,不仅仅Linkedin提供一个企业级的招聘软件,更多提供是一些人才市场的洞察。包括刚才所说的企业雇主品牌这个指数,也可以帮助他看到他的竞争对手在整个人才市场上和他对比差在哪里。

第二个例子,我想讲一个市场的用以。刚才我们Linkedin有个人订约的服务,就是30美金可以直接联系在我的朋友圈之外,两步以外三步以外的这些人。我们发现这是一个三角形,我们可以把Linkedin所有的用户想象成一个正方形。那么在这个正方形当中,肯定有很多用户是根本就不登陆的。把不登陆的用户去掉就是我们现在三角形。三角形的顶端是优质、高频的用户。三角形的地步是低频的用户。我们通过用户属性可以把三角形很快构建出来,根本不需要任何数据的挖掘的功能,就可以把这个做出来。第二步就是用户的行为,用户行为细化到不光光是看数据库里面找到那些用户行为,比如说用户今天它发了一封邮件,给一家公司或者是用户它订阅了一个职位等等,这些信息可能都可以从数据库里面找到,我们细化到是用户细微的动作,在个网页当中的动作。他的搜索行为,他在一个页面上看的那些公司,这些用户的细小的行为在网站上整个的行为,我们都把它这个最终下来了。

通过用户行为,我们可以再删掉一部分人,变成一个小一点的等量三角形。接下来我们是用了用户的社交的数据,因为我们有很多的数据是关于它的社交的群体地Linkedin快速增长也是依赖于它有一个非常好的算法,就是你“可能认识的人”的算法。推送这个人在工作当中有交际,或者他给你推送和你一起工作的人,或者推送到你之前读过大学,或者参加过同样培训。在美国工作生活分的比较清楚,所以它有一个脸书用来做生活化的社交,它还有一个社交圈就是Linkedin,是一个职业社交。在中国,可能是微信就取代了这个。

我们通过用户社交数据可能发现我们即使不知道这个用户倾向性,但是我们可以通过它的朋友圈推动它的倾向性,这样子什么好处,把低频次的人找到,这些低频次人根本不找网站,或者登陆非常少。整个网站行为非常少,我们是可以通过它的朋友圈推断它是不是需要这样一个个人订阅的服务,把这个形状做成一个很小的椭圆形。第二天凌晨,大概三四点钟,我们的团队接到了电话,大概是有七架或者是怎么样,因为很多人开始购买我们个人订阅产品,个人订阅产品那天早上直接增长就是350%的增长,包括之后的话这个增长也是非常的稳健。现在这个业务占到了Linkedin总体营收20%以上。这一块儿,作为公司来说这个成本是很低的。因为它不需要任何销售往外跑来承担,直接Linkedin用户在网站上用信用卡买单就可以了。

接下来讲产品的这个例子:公司反复迭代当中,我们会对版本各种各样的迭代。手机应用以及外围应用上面更新我们的产品,或者我们产品经理想的比较新颖的ID,就是它的想法。怎么样测试它的想法,它的想法怎么落实处我们需要A/B测试。一些产品经理已经开始做了这个A/B测试的数据,AP测试是什么?国内叫做灰度上线。我可能把一个新的功能给一个少部分的人,先让它的使用。它使用的衡量效果好不好?好了之后就百分比放大。该使就10%的人,这些人是我选定的一批人,让他们用,搜集他们的反馈再来判断是不是给更多的人用这个新的功能。当时我们做了这个AP测试系统也想达到同样的过,当时一个问题是什么,Linkedin大概只有很少的人,就是企业级的用户它的这个数量级的占比肯定是远远小于Linkedin的总体的用户的占比。当你对这个Linkedin的网站进行改编的时候,你既要照顾到现有的用户,会不会影响到他们的使用?不管是用户的体验也好,或者是你放了太多的广告,或者是你放了太多的关于挣钱的东西在网页的内容上面之后,会不会影响到用户的使用?当然了,从这个营销人员,从销售的角度来讲他们希望更多把一些直接让用户转化的信息,或者是广告放在网站上面。这就是产生了一个矛盾这样子矛盾怎么解决?我们通过数据来解决。做了这个A/B测试系统。

任何一个A/B测试上线会看五百个指标,拿A的群组和B的群组进行比较,这个比较下来的结果从统计学的角度来讲,我们会把这个数字标成这个颜色,蓝的就是好,红的就是不好。这个没有显示出来我们就不全部显示,用户有兴趣可以看所有的这些。我通过一个A/B测试,衡量了500多个指标,这500多个指标筛调了大概400多个指标,剩下的这些指标里面还要分级看一下,对用户的使用体验是不是有影响?接下来看每一个产品线的增长,这个具体产品有没有影响?通过一个综合考量我们才继续的让更多的用户使用这个新的功能。

接下来想讲一下,我们如何去实现50%的客户的流失率,然后把它降低到10或者11%的客户流失率。在之前做了AB测试的时候,不管是做任何的分析的时候都搜集了很多的用户的行为数据。这些行为数据能够指导我们的销售,或者说指导我们数据分析部门先做一个数据模型出来,这个数据模型把多种多样用户使用行为归结到一个指标,就是这个用户健康指标。这个用户健康指标直接给到每一个销售经理,告诉他哪些用户使用好,哪些用户流去?属于用户好,上面这个用户使用非常好,可以追加销售。如果这个用户它的健康程度非常低的话,我们会告诉销售,销售应该怎么样跟它打电话,或者是克复部门应该增强培训等等,想办法挽留住这个客户。销售每一天早上看这个图,看哪些客户需要跟,哪些客户需要卖更多的东西给他,很快可以帮他排满一谈要做的这个事情。有了这个健康指标远远不够,如何做的更加精细?想到把这个客户分群。这些不同的气泡就表示每一个客户,那么我们通过Linkedin的数据做了两个指标,一个叫做温度指标,一个叫做健康指标。健康指标就是已经是我们的客户了,使用的过程中处在健康模式还是非健康的模式,健康是他继续会在我们平台上使用,不健康就是说他可能会流失。加了一个温度,温度指标是指用户会不会购买更多的东西?用户会不会花更多的钱,他会不会转化?用户他点多了很多的需要付费的这个入口。比如说个人用户来讲,会看个人用户起始是30块钱一个月的计划,他可能想升级50块钱,他会不会点击或者查看50块钱这个计划的里面是哪些详细的内容?所有这些相关用户概括成一个用户温度表。企业级用户或者个人指标,都可以用这样一个温度指数。有了这个温度指数我们就可以对用户进行分群了。

我们看这个象限,所有人都喜欢用户是在右上角的,他是非常健康愿意付更多的钱。不喜欢的肯定是下面那个红色区域,就是说他使用的又少,然后他付费的意愿又低。这种情况下,我们需要花大力气的时间,把这个用户往上面的现象推,或者往右边推。上面那个黄色的部分,表明这个用户付费意愿比较高,但是使用的比较低。这样的用户也有可能是开始愿意花钱,但是我们没有给到很多的指导,或者是没有很多的跟进。

还有一些客户是最右下角的客户,可能是一些试用的客户。当时我们发现Linkedin有这样一个客户,单个人的PV非常高,一个帐号登陆上来,就是页面的浏览量也好操作也好都是非常多的,我们觉得这个很奇怪,我们应该跟他们的主管联络一下。聊的时候他们发现公司HR共同使用一个帐号,其实好几个人使用同一个帐号。当时我们就派一些跟那个公司内部有联系的销售们谈这个事情就是说你们能不能买一些更多帐号,这样我们才有更好服务到您,或者是怎么样的。其实我们很快发现这些用户,我们也可以帮助我们企业让客户买更多的帐号来盈利。

以上我举了一些例子,这些例子帮助了我们销售能够提高效率,帮助我们的市场能够在用很小的力量获得更多的客户。帮助我们的工程师能够举棋不定的时候,就是这个产品功能什么时候上,上多大的量,在这样的情况下能够通过数据分析的方式做一些决策。

再讲一下我去硅谷之前做什么的,其实我在硅谷之前我熟悉的技能就是这些,这些技能就是当时我早期安身立命的根本。大家可以看到,做数据处理,前面是说这个Informatica,它是美国不出口的软件,是航天局做数据分析的。分析是teradata。现在创业公司用什么?把它全部放在云里面了,所有的东西都是在云里面。我们用cloud computing,大部分的软件都是开元的。

不管是五年前的技术还是今天的技术,我们想解决的问题始终没有变。什么问题,企业里面有海量的数据,怎么样把这些海量的数据产生出价值出来?

第二,我们的业务人员好像总是需要借助别人的帮助才能够拿到这些数据,业务人员他不能够说我自己鼠标拖拽两下,自己键盘点两下就能够拿到这些数据,我们这些企业的决策者他看到了特别多的报表,这个报表如山他没有办法从这种报表里面得到,比如说直接得到一些行动,我可以马上推动这些然后去做一些事情。我们希望我们的员工从公司的角度,从领导层的角度来说,我们希望公司员工每一个人用一些数据驱动我们的工作,像销售也可以拿到很多的数据驱动他的决策。所以带着这些问题和梦想我们回到中国,我们想用产品解决这个问题。怎么解决,我们做了一个新一代网站和互联网数据平台,第一件就是数据采集。

我们早期用了很多的工具,怎么数据库连接什么的这些都非常麻烦。我们做了一个什么事情?

无埋点采集的方案。我们针对网站和移动互联网,当你有网站或者移动应用的时候,你只要加载了我们的三号代码之后进入到我们的这个云端网页里面,比如说这里有一个切除,我想知道上面那个商品被多少人看到了,被多少人购买。我只要鼠标点一下这个商品就立刻出来了,包括这个之前的数据我们都有。在移动上面也是同样的效果,当你有一个安卓的应用或者是有一个苹果的应用,你把这个苹果的应用和我们的软件只要把它做一个影射,用安卓手机摇一下就可以在屏幕上显示出来,同样鼠标一点,我们这个功能叫做一键出图,点一下就知道这个按纽,或者是这个图片它被多少人看了,被多少人点击了。你点一下保存,这个图表就生成了,实时计算这个页面的元素。

我们记录这个页面元素之后,每一个元素都可能产生一个指标,所有这些指标会给一些固定的报表,让你去分析已有的指标。我们在我们的软件当中也做了一个BR的系统,可以在几秒钟之后可以做出任何上面一张图,通过第一个事情你要加载我们代码,第二件事情可以点击一键出图保存指标,第三件事情可以看到上面做的这些报表,这些报表可以做一些全线管理,把它分发到企业各个级别人员手里,可以让他们用数据做决策。

以上是我跟大家分享的环节。

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");