【案例+交流】壳牌(中国)CIO徐斌教你大数据的正确打开方式

标签:CIO大数据

访客:91953  发表于:2015-07-23 10:52:51

嘉宾徐斌:

21年IT从业经验,2013年加入壳牌石油(Shell)中国担任零售业务首席信息官, 负责壳牌中国零售业务的信息化工作,致力于建设跨合资公司的平台战略规划,IT治理架构,以及基于云技术的共享应用服务的部署。徐总在金融业、零售业等不同行业的信息化建设有着丰富的工作经历,海外的工作的背景更丰富了他的企业信息化实践经验。此前曾相继担任英国石油(BP)中国区IT总监, Seven-Eleven 中国区IT经理,建设银行软件开发和电子商务项目经理等职务。

首先,徐斌汇总了当前传统行业和企业面临的最大挑战有哪些;然后,与大家探讨何为大数据。接下来,徐斌以实际的企业案例来阐述传统企业在大数据方面的实践和分析;最后,徐总结合自身经历和积累介绍企业如何构建适合自己的大数据能力,为企业带来更大的发展和效益。


演讲全文:

首先跟大家介绍一下壳牌,壳牌是世界比较大的公司,在过去三年,有两年是世界第一,去年是世界第二,今年规模会更上一层楼,上个月刚花了470亿英镑收购了英国一家燃气公司。它在120年前进入了中国,去年11月我们在中国举行了壳牌进入中国120周年庆典。 

讲到我们今天的主题大数据,如何帮助传统行业、传统企业提升核心竞争力。壳牌是一个典型的传统的公司,不管是上游勘探、开采,下游做化工、零售,润滑油等业务,都是非常传统的行业,传统行业,数据、大数据如何帮助他们产生价值呢?这是我们今天探讨的话题。

今天我给大家分享的内容主要是四个方面:

时下一个非常热的名词就是:互联网+。

互联网+对每个企业、每个行业都发生了重要的变化,不仅仅是概念,真的是在影响着我们每一个人,特别是我们企业IT从业人员。互联网自己的概念之前一直由互联网公司在说,比如著名的BAT公司。以前比较流行的说法是,要借助互联网颠覆传统行业。今年两会期间谈到的互联网+把概念一转,变为了:通过互联网加强传统企业的核心竞争力。这里可以看出这个概念的起点是我们传统行业、是我们自己的企业。这就需要我们把好的工具、好的思想运用到企业中,力求市场竞争中有更好的地位和竞争力。正因为中国大量企业是传统企业,所以说这个对我们具有特别重大意义。

在互联网+时代,来看看我们的世界发生了什么变化:

腾讯、淘宝、京东、小米,他们现在都是顶级的公司,估值都过了一百亿美金,大家注意到右边几个数字,他们时间最长的16年,加在一起35年,四个公司都成为超过百亿市值的公司。我们再看看下面四个公司:诺基亚、摩托罗拉、柯达、索尼,都是曾经的顶级公司。在我毕业工作的时候,这些公司我能进去那是非常自豪的。现在或者破产了,被收购了,后者处于困境之中。这四个公司加起来427年,说明在传统时代它做的非常优秀,但是在当今互联网时代,一下子失去了它的核心竞争力。这个对比对我们来说是很大的冲击,我们该怎么办?我的观点是:我们要去拥抱变革、拥抱互联网时代。 

按照我们的理解,互联网+是一虚一实。实是互联网的技术,云、大、物、移、智,云计算、大数据、物联网、移动互联网、智能控制技术。这些技术只是工具,我们更需要的是“虚”的互联网思维,把这些思维真正融入到企业运营、管理中去,才算是真正意义上的是互联网+。企业借助互联网+各种技术、思想的帮助去获得竞争的优势。

传统行业现在最急迫的是两个问题:开源节流,一方面要把成本降下来,一方面要打开我们市场的销售。

看一下大数据在这方面能够帮助我们的企业做什么。在互联网+时代一虚一实,技术是工具。那么,关键的互联网思维带来转变是哪些呢?

第一,决策模式的变化。在以流程为中心的决策模式里,核心是经验,行业里面的积累。这很依赖于人,有的CEO或核心层有很好的战略思维和经验积累,但是一旦他离开公司,公司就不行了,没有其他人能做正确的决策了。但是在新时代,以数据为中心的决策,靠的是客观的数据和信息做决策,而不是靠某个人的思维做决策。

第二,运营模式的转变。以前是产品为中心,模式讲究的是批量规模化生产,来保证成本最优化。但是现在我们客户的需求发生转变,有更多定制化的要求,我们需要不断调整产品设计去适应。这时候我们的运营模式就需要变成以用户为中心,即根据用户需求反向引导生产,但是这种模式下要使生产的成本降低不是很容易,因为不能大规模生产,那么如何降低成本带来了另一个挑战,中国有一些企业面对这一挑战做出了很好的探索,比如说红领集团。

第三,合作模式的转变。以前是以供应链为中心。在新的互联网时代,需要我们把客户需求放在核心位置,客户需求会关注日常生活中的各个环节,比如说我们公司旗下加油站,正常情况下与客户即司机交互时间也就是十分钟(加完油到便利店买完东西走,就是十分钟),在我看来,合作模式的思考是如何让我们的客户和我们产生更多联系。如果我们知道他有一些常规消费行为习惯,比如加完油去沃尔玛购物、再去4S店洗车,再去万达看电影等等,那么我就可以和沃尔玛、4S店,万达进行合作,共同推出一些客户营销和增值服务,那么这个客户也许就很容易被我们黏住,并很容易成为我们的忠诚客户。与此同时,通过这类服务还可以和其他的合作伙伴分享收益。

第四,组织模式的转变。传统时代是层级管理,新的时代讲究扁平化管理,以员工为中心。要加强一线员工的执行力和创造性,必须扁平化管理,让他们有足够的能力、足够的信息去快速决策。小米就是一个很好的例子,小米的员工层级非常短,就是3层,七个核心创始人,部门leader和员工。除了合伙人有职位外, 其他都是工程师。工程师直接和客户在网上交互,一个新产品测试版本发布之后,客户可以马上提意见,工程师马上对产品进行更改,通过这种方式增强一线员工的执行力、创造性和主动性,同时,这种方式对市场反馈势必非常快。

我们传统行业在互联网+的时代这四个方面需要进行转变。这些改变的一个非常核心的驱动力来自于IT即信息化技术的应用。

不同的行业,企业对IT的定位有所不同, 不同的定位又决定了IT可以为企业带来的价值。

最初的企业,一般把IT定位在建设一个简单的办公自动化系统,大多数时间做系统的维护。随着业务的发展,企业在市场中的地位提高,慢慢我们需要上一些大的系统,比如说ERP、MRP,这个时候IT承担更重要的作用,帮助业务实现业务价值。比如说更有效的管理库存,更有效的管理采购,这两个级别都是传统行业对IT应用比较多的地方。

但是在互联网+时代我希望企业管理者认识到,如果IT定位不能往上提升,便很难帮助到企业进行互联网+的转型,以及在市场上产生核心竞争力。左边第二个业务价值的推动者,这个是通过IT技术进行创新,可以超越我们竞争对手做一些创新的解决方案,包括客户关系的管理,O2O的线上线下的联动等。通过信息化技术产生竞争对手没有的方案、营销手段、效率提升的手段。这就是将IT融入企业决策层的作用,参与决策,促进创新,产生核心竞争力。IT在企业中定位的最高级别是成为业务模式的引领者,依靠IT帮助进行商业变革,脱离传统的竞争模式。“羊毛出在猪身上,狗来买单”,过往的产品服务,最初思想就只是如何把东西卖的更贵一点,能否提高价格的同时让客户接受。而如今,通过新技术、新商业模式将商品免费使用,通过后续服务挣钱,正是目前的新运营模式。依靠互联网+技术、各种信息化技术,行成一个生态链,而这个生态建设过程恰恰需要上下游不同企业的数据。希望咱们传统企业的各位领导者能够对IT有一个更好的定位,至少应该从业务价值推动者和业务模式引领者的角度来定位,才能帮助我们企业在市场上获得更好的竞争力。

刚才说到开源节流,节流方面可以通过大数据的分析结合比如6西格玛等流程分析优化的技术,来帮助找到没有价值的工作,进而去掉,来增强有价值的工作。我们把产品的成功率提升,减少废品率。比如说便利店里面有几千个商品,每个商品的销量不是很高,如果能控制成本,控制库存,非常重要。因为你的点很多,一个点上省一千,四十个就是四万。在供应链配送环节,通过优化陪送路径,就可以减少配送成本。石油公司的配送都属于高危配送,如果通过大数据分析,在效率提升之余,安全性也有所提高,那对我们的帮助非常大。比如危化品晚上七点以后才能配送,比如说某条路晚上封路,之前不知道,去了后发现需要调头改路,带来的成本消耗将非常大。

据美国一个研究机构称,人的行为中近93%是可以被预测的。大数据分析对企业提升销售也有很大的作用,所谓营销,营是两个“Ying”,一个是欢迎的“迎”,一个是共赢的“赢”,欢迎就是找到新客户,把他们吸引过来,共赢就是把客户留住,并且延伸它的需求。营销就是欢迎和共赢,欢迎找到了客户是谁,可以通过数据的分析。人的行为可以预测,可以通过各种社交数据,比如微博微信数据。当我们发现在谈论车的品牌时,这个人称某一个品牌车质量不好,并有很多讨论建议,可推断出他对车和生活质量是有一定的要求的,那么这个人就是可能是壳牌的潜在客户。当你来了以后我可以知道你的潜在需求是什么,再通过异业合作,将你的消费习惯和其他合作方关联,培养你成为我们忠诚客户,最理想的情况,让你一起床就能想到壳牌,去哪里都想到壳牌。但是如果让壳牌单独通过加油这项业务绝对是做不到这些的,势必要通过同其他企业合作,使客户对你产生联想和连接。

刚才谈到传统行业面临挑战,大数据可以帮助他们突破,迎接这种挑战,我们来看一下到底什么叫大数据。

大数据的名字叫Big Data,这个词最早是麦肯锡提出的,是指“无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合”。我个人的理解,大数据不是新事物,也大只是一个定义,它的核心是“数据”。大数据的应用由来已久,且其定义和应用也是持续变化的,它可以应用在我们的生活和社会的各个场景上。

在座的各位听众,有没有人信星座的?美女们都信,有没有人信命的?不少人包括嘉宾本人很信命。星座也好、算命也好都是大数据的应用,只是没有数据化。

星座把人归类为12个星座,比如说金牛座为什么会有这个特征,他是经过很多人的验证,发现都具有这类特征,且刚好出生在那个阶段,这个特征和某些动物和某些物品相关。算命也一样,八字、四柱、面相,为什么脸上这个位置长痣的人是这种性格,不知道为什么,但是发现很多这里长痣的人都有这种性格。应用的方式不一样,但是都是通过大数据的思维方式。

企业的大数据与直接的数字化信息有关,传统企业或多或少会有一些数据,比如说员工数据、供应商数据、客户数据、财务数据,这些都是我们传统数据。

新的互联网时代,我们具有微博数据、音频数据、手机定位数据等很多新型数据,交易数据和交互数据共同组成了现在的大数据。这并不是一个对立的关系,而是一个延展的关系。同时,大数据必须要有一些新的技术帮助我们分析结果,所以大数据是数据加工具。大数据如果从分类上来说,企业内部传统上都叫结构化数据,传统的放在数据库里的数据。还有电子文件、日志、文档是半结构化数据,以及一些非结构化数据比如视频、音频等。

大数据的特征,不同的人和公司做了很多的定义,比较多的说法是四个V。

数量比较大、来源比较多样、速度要求快、个体精确性不高。单个数据的价值并不高,比如说地理位置信息,单纯看每个点的信息没有价值,当你把他串联在一起的时候,你发现这一批人都往清华的舜德楼走,这时候就有价值了。

因为现在有些人考虑大数据、小数据,大家听起来好像很对立,一大一小两个不同,这是不对的。我们应该更多的讲数据,大数据更多的是为了让大家理解这个数据的重要性。 

传统数据延展到更广阔范围的时候,他们的目的不同,传统的数据目的非常精确,关注一个事情发生的原因是什么,目的是解决问题,为什么会出现这个事,得找出原因解决,这是传统数据比较擅长的地方,但是到延展拿到很多外部数据,外部数据来源非常多,数据量很大,而且外部数据很杂,和企业没有直接的因果关系,但是具有关联性,对这些数据的分析目的是关注预测,我们可以不需要知道为什么这样,但是希望知道将会发生什么。可以不知道原因,但是希望知道关联性。这个人的痣长在这儿,他应该会怎么样,为什么会这样我不知道,但是既然长在这里的人都是这样,可以帮助我做决策,目的是寻找一个解决的方案,而不是一个解决的问题。这个时候数据的使用目的就发生了变化。

看看大数据在生活中的应用,举几个生活中的小场景:

大家在亚马逊或当当网买过书,选一本书以后,左边就有相关的书推送,或者推送鼠标或者路由器,因为之前买这本书的人就买了路由器和鼠标,所以也就推送给你,当当网利用这个方法推送,销售量增长了10%。

谷歌流感预测。某一个时间,某一个区域的人都在查流感这个词,以及怎么解决,吃什么药等,谷歌通过这些搜索结果对该区域的流感发病率进行预测,结果比当局卫生部门正式发布流感信息提前7周。当然, 现在这种预测的准确性降低,原因我们后面会分析到。

淘宝购物。大家在淘宝上搜索一个物品,即使没有买。过一会儿上其他门户网站,广告条上也会出现之前搜索过的的物品。

大家过去半年在中国发生在你身边比较有热度的事情是什么?股票。至少是牛市的初期,涨了百分之几十。从今年年初到现在有哪一位股票收益超过60%。新浪有一个大数据炒股指数,其他的证券公司和他有合作,发起了股票指数,有一个i100指数,这个指数今年年初到现在收益率是59%。如果你们大家没有超过60%,不如买这个指数。为什么他的收益好?他是一百个股票选的,他没有看公司的业绩,完全不管什么公司,就从社交网络上搜索哪一百个股票讨论热度最高,他认为如果涨的股票应该是大家讨论最多的,他选最高的讨论热度的股票作为他的股票,不断调整,所以他们的收益率很高。他也不知道干什么,就看别人讨论的多,他就去买,就涨的很厉害。

大数据的大到底是什么?

我对大数据的定义是,“大”不是数量的大小,也不是来源的多少,而是大到足够为企业产生业务价值”。如果能为企业产生业务价值的数据,就是大数据。这个“大”的理解是足够产生价值的,而不是一个机械的所谓4个V。这也解决了定量的问题。过去一个U盘8个G很不错,再早期几个MB就不错。现在有了TB,因为技术发展很快,无法衡量那个纬度。

刚才讲了传统行业面临的挑战,也讲了什么是大数据,接下来跟大家分享一下在我们行业,以及其他合作伙伴、同行的大数据做了哪些事,谈一下大数据在企业中的应用。

数据有不同的使用目的,根据使用目的,可以把数据分为四个类型:

第一,描述型的数据,告诉企业管理层、员工,企业发生了什么,比如说管理报表、销售报表,显示企业在发生什么,什么状态。

第二,诊断型,分析为什么出现这个问题,比如说银行,为什么这段时间坏账率这么高,分析是什么原因。这两个都是传统的企业比较擅长的。

第三,接下来如果把数据用的更好、更多一点,就是预测型的数据,通过数据的分析,预测将来会发生什么事情。比如企业的上游业务,油田开采,钻头钻进去很重要,钻头很贵,一旦钻头出了问题,更换、调整花很多时间,以前因为在地下没有很好的方法去判断他,这个时候需要找一个很有经验的专家定期检查,看他是不是正常状态。这个成本就很高,首先,专家不多,如果钻井平台在海上就更麻烦了,专家必须实时送过去,又很贵,这个专家还可能不愿意去。但是如果通过一些数据,通过一些传感器监控它的温度、振动幅度,就能够提前发现他是否有潜在的问题,如果温度在不断的增高,和平时不一样,判断可能有一些问题,可以马上主动干预。这样就不用每个专家两到三个月跑过去看一次,而只是有问题的时候打电话让他来一趟就行了,发生故障提前知道,予以处理,减少故障发生次数。

第四,指导型,根据数据的分析,可以根据客户的行为习惯、潜在需求,帮助企业定制、开发好的产品或者服务、以及营销方案,这不是解决问题,而是提供更好方案来帮助企业得到更好的回报,就像专家、咨询师一样告诉企业应该做什么。

这是数据使用的四个目的。前两个是信息展示,第三是商务分析能力。第四是预测分析。这是不同层面上数据使用的目的。

大数据的使用价值的归纳,我认为主要是五方面的价值:

第一,优化运营。降低成本、提高能效。

第二,精准营销。对客户做更好定制化服务、定制化营销方法。

第三,商业洞察。让企业了解自己,了解客户的行为,了解市场定位。

第四,企业安全。包括信息安全和物理安全。很多企业所依赖的核心竞争力是专利,如何保护专利,是企业非常核心的需要。石油公司有很多危化品的运输,大数据分析可以帮助我们发现隐患,降低风险。

第五,生态链共赢。找到合作伙伴,帮助企业加强客户对其更多的黏性。

这些都是大数据在企业中的商业价值。

接下来我分别介绍上述五个方面的行业实际案例:

第一,优化运营效率。

壳牌公司现在应用了很多,通过地下的温度、压力、历史数据、生态数据的采集,预测这个地方钻井下去出油的概率大不大。一旦打进去如果没有出油,损失就很大,如果把成功率提高10%,就会节约非常大的成本。之前中石油在苏丹开发了一口油井,之前很多国际巨头都打过井,大家认为那个地方应该有油,包括BP、道达尔去打都没有打出来。中石油去打,每桶油成本才八美金,远低于正常的20到30美金。这个地方的油非常好。为什么中石油这么好运气就打出来了?因为中石油发现这个地方的地质情况和塔里木盆地地质情况非常类似,中石油在那里打了很多井,知道很多数据,知道什么位置上打井有油的可能性比较大,于是根据这个来在苏丹打井,就成功了。很多地方的信息有高度相关性,就可以预测在那里发生的事情,在这里也可能发生。这是一个大数据应用案例。

在加油站里, 油枪里面打出来的油都是在地下油罐里面出来的,地下油罐在地下,看不见,一旦发生泄露,很有可能影响地下水、土壤、生物,甚至有可能发生爆炸,这是非常危险的。所以每年石油公司在这上面花了很多的成本去关注它,但是很多管理是被动的,因为汽油、柴油有热胀冷缩的特征,温度高涨起来,温度低就收缩了,本身又有挥发性,管理起来非常的困难。在正常行业里面管理主要是油品的损耗低于千分之三到五,就是正常的。但是通过数据的分析技术可以帮助更精准的管理。之前的模式,为了避免油井在地下油罐泄露,需要定一个阀值,每天看损耗,如果损耗超过某一个值,即认为很有可能发生泄露。一旦超过这个阀值,马上安全和工程部门的人就会干预,如果认为可能性比较大,就要停业,去地下清罐。

后来使用了一个办法,用大数据的技术在油罐里面加了一个探头,去分析罐里面情况的变化,把数据每隔几十秒钟传到云上的分析平台上去,把油箱的数据实时接通,卖出去多少油,油管里面还剩下多少油。根据这个地方的地址、温度等条件,来设置相关性的对比油站。逻辑上如果损耗都有损耗,增加都有增加,因为这些地方条件相当,温度变化应该是对应的。

如果说发现有一个油罐突然在这段时间,或者是这个时候,别人都在往上走,他在往下走,别人都是赚的,他是亏的,高度认为他是泄露的,因为这确实是不对的。还有一种情况,他超过了之前设定的阀值,升我们也没有认为它有问题,因为周围其他的油站都有类似的情况,因为可能是温度急剧下降。最重要的是看它的趋势变化。这会准很多,而且是主动防御的办法。

大数据在帮助门店选址也有很好的应用。我们开一个店选址,主要看客流量多不多,客流愿不愿意停在那儿,这些信息对选址是非常重要的,直接影响回报率。但是在现实生活中,如果知道要选址在这个位置,或者想被别人收购,就会想各种方法夸大这个数量,多找一些车在那儿拼着开,因为如果要靠人去记录,只会看过了多少车。

而现在通过和运营商的合作,利用基站分析手机信号,来发现这个地方客流量、客流停留频率以及过去一个月的数据情况,帮助更好的选址,提高投资回报率,提升运营效率,降低成本。

第二,大数据可以帮助实施精准营销。

加油站业务,发现联动很多数据,比如来自于车联网的数据。车上有传感器,可以把车的健康状态、油耗状态、车主的驾驶习惯都记录下来,通过相互合作,找到潜在客户对应的有效信息。顾客很喜欢去方便的加油站,因为比较容易找到。通过跟车联网企业合作,车只要在油站附近十公里范围内,便可知道客户是谁,以及他驾驶的车处于何种油耗状态,具备这两个条件,便可以给他发一条信息,建议去对应的加油站加油、从哪条路走不堵,以及具有何种促销信息,甚至进一步分析油耗,推断出使用壳牌加油站的油,可以降低油耗,一年节省多少钱,把这些定制化的信息发给客户,吸引到我们的加油站去。公司非常注重安全,通过中控系统车联网的数据分析,根据顾客驾驶习惯,比如经常急刹车,或者高速转弯,风险性非常高,便可以推送一些安全驾驶的建议。

加油都有加油卡,加油卡在过去这么多年发展了很多客户,但是现在碰到一个问题,再想扩展新客户挺困难的,不知道到哪找。公司要做市场活动,却不知道去哪里做,如果在广场上做,可能根本就不是潜在客户。

后来公司跟淘宝合作,将淘宝上客单价超过一百元的人作为目标群体。淘宝上平均客单价70块钱,而我们要找客单价100块钱的,这些人的消费能力比较强,对生活要求比较高,同样买相对比较好的东西,会比平均水平的人要高一些,这些人往往是企业想触达的对象。

其次,通过和第三方公司合作,通过搜索社交媒体上经常发布与车有关的信息,来从另一位纬度定位潜在的客户。

通过这两者一碰,就可以较准确地寻找到潜在的客户群, 再通过精准信息推送和相应的营销手段,来给潜在客户传递油站有什么样的服务,有什么样的促销等信息,来吸引他们在线上注册加油卡。通过这种方式,最终有近90%的人进行了会员注册,成为了卡的用户。其中有50%的人进行了充值,充值意味着一定要在这里消费,这就成为了真正的客户,转化率非常高,而付出的代价非常小,这种营销方式针对每两个人有一个人是你的客户,这个触达率非常高。过往做市场活动,五个人里面有一个人成为客户就不错了,而这样两个中就有一个成为客户。这便是大数据精准营销的经典案例。

第三,商业洞察。要知道这个企业到底在市场上什么地位,客户到底在哪里,自身客户和竞争对手用户到底有什么不同,到底是怎么分布的,这需要更明确、更清晰的视野。

通过大数据的分析,更好的了解我们的企业和我们的客户。通过一些支付信息的分析,发现在不同的品牌或者不同竞争对手之间,市场份额到底是怎么样,以前是年底看看销售额,甚至不知道对手销售额准确率多少,但是结合大数据可以实时分析,当前情况下到底我们的销售份额是多少。

第二,对客户的消费趋势也有更清楚的认识,随着时间的变化,到底有什么样消费趋势,竞争对手的客户趋势怎么样,自身客户趋势怎么样,如果说自身客户消费者趋势金额在慢慢下降,是大问题,这可以让企业更精准的了解自身客户发展变化以及企业制定应对措施。

第三,潜力客户的挖掘,新客户在哪里,你是我的客户之后,如果没有收益共赢,客户会离开,如何把客户留下来,是最核心的诉求。

其中有2%的客户是忠诚客户,是我们的优质客户,另外的4%在我们这里消费,也去别人那里消费,说明他不是我的忠诚客户,但是是我的客户,或者曾经是我的客户。他为什么要成为你的忠诚客户?如果你知道原因,你是不是就可以解决问题,把6%变成忠诚客户,意味着销售额增加一倍。这里主要讲的是思路, 数字并不是真实的。

如果要触达这4%的人,要跟他做沟通,为什么上次来过之后,这一次没有来,是因为位置不够好,还是服务不够好。问清楚之后,你应该采取对应措施,让他变成你的忠诚客户,可以从2%提升到5%到6%。这个可以提高我们的洞察能力,让我们找到、留住我们的客户。

第四,信息安全。我之前工作的跨国公司,最核心的竞争力之一就是专利,那家企业的配方非常重要。配方怎么保护?很多竞争对手或者有一些黑客一直在找,以前没有很好的方法,现在通过大数据的基础可以对整个日志和整个系统的操作行为做分析,看是否有潜在的风险。

比如说这个用户的ID,之前一直是每天使用一个小时,或者是以浏览为主。但是当发现从上周开始这个客户平均每天用三个小时,而且是以下载为主,这意味着很可能在盗用,这是一个高风险的区域,还可以采取一些措施保障企业的安全。这是以前传统的数据库的方法处理不了的。

第五,生态链共赢。企业到底和谁合作可以最大化的产生效益,提高收益。

通过相关性的分析,可以看到奥特莱斯有38%的相关度,如果和奥特莱斯共同做一个营销活动,效果将会非常好,因为双方客户非常重叠。沃尔玛为36%,京东为33%,这些都是异业合作的伙伴,和他们一起做共同的营销活动,就可以把我们整个客户之间交互的场景从单个变成一个生活中的各种案例,将产生大量延伸的消费。也将出现“羊毛出在猪身上,狗来买单”的状况。

上述一些案例在行业里通过大数据从对内的效益提升、营销、洞察、安全、共赢这几个方面跟大家分享,最后一部分是关于如何建设这些能力,以及路径是怎样的。

首先,必须有数据文化的建设,有了数据,而不作为一个决策的依据,也是没有用的。

第二,要有明确的数据战略,准备怎么样规划企业的数据,数据架构怎么设置。

第三,组织能力,建立什么样的团队来帮助实现企业的数据战略。

第四,技术能力,实现什么样的技术平台、什么样的系统来实现大数据或者数据的分析能力。

这四个方面的能力建设才能真正给企业带来数据分析的能力。

真正在企业里面建立数据能力, 有两个方向的建设。

一个自上而下,管理层要认识到数据文化的重要性,推广数据文化,建立队伍的组织,要做适当的投资,进行平台和技术的建设。同时,自下而上,每一个从业者都要积极的学会技能,来很好地利用和使用数据,在这个基础上要有一个前瞻性的规划,能够不断适应企业持续发展的要求,同时,设立比较清晰的绩效管理,什么样的数据交付是有效的,怎么评估,最后以开放的态度,要不断的学习,互联网时代变化太快了,要不断的学习。这是企业里面两个方向同步建设,才能真正的建设一个大数据能力。

数据文化建设上,我总结如下六个方面:

核心是数据驱动决策,决策依赖于数据,比如说投资管理,企业投资一个项目,必须有非常清晰的指标、回报率这种相关联的参数,要进行客观的分析,形成一个结果,才能做决策,是否应该做这个投资。比如开一个店,就必须要看人流量变化、停留时间,消费能力、消费偏好等。综合之后,认为在这里开店回报率是什么。包括效率提升,通过数据的分析,综合拥有成本的分析,数字化说明到底销售量会不会增加。通过数据的分析明确的把这些其他因素排除掉,比如说我们做一个营销,中间刚好有其他事件同时在进行,要把那个因素剥离掉,才能知道要做的市场活动有没有效。安全管理也是一样,员工绩效管理,设立KPI,必须以数字为衡量,这样才可以跟踪、管理和衡量,否则都是简单非量化地描述,泛泛要求把东西做好,按时完成等,最后无法评估,员工也无法正确地管理绩效。

数据战略主要包括三个方面:

首先,数据管理,主要是数据的治理。数据所有者和数据操作者,数据所有者要保证数据的质量。数据合规的安全管理,谁可以使用这个数据,什么时候可以删除数据,数据什么时候可以传到网上去。通过数据质量管理,确保都是准确的数据,不要是一些垃圾的数据。数据生命周期管理是对整个数据从产生,变化到最后的结束销毁等的整个生命周期进行管理。

还有一个数据服务,我们想用什么样的数据平台、数据架构,什么样的数据集成方式,企业里好几个信息系统,中间也不关联,同样一个商品在两个系统里面名称也不一样,库存也不一样,造成了大量的浪费。如果是集团公司,下面有很多分公司和子公司,同样一个库存的商品,如果在不同公司里面,系统用的不同的代码,不同的名称,往往会虚大库存的数量。假如说其中一个公司要去做采购,很可能另外一个公司很多库存是卖不掉的。之前的一个公司,两个人说,他说他这个公司买的东西,他没有了,但是在另外一个公司,他有很多的库存,根本卖不掉。所以数据的集成很重要,要有一个单一的数据源,总数据管理,所有的东西标准化、统一化。同样的商品在集团下所有的公司都是一个数据。

数据的模型,主要包括怎么定义数据、分类数据,各个数据接口如何进行交互等。

数据组织能力,如果有条件,可以建立一个CDO,首席数据官制度,有一个牵头人专门去负责数据管理,而且这个岗位希望能够汇报给企业的决策者。因为数据如此重要,所以需要有一个人战略性的规划它和管理它。同时我们需要集中式的数据管理和运营中心,要解决数据孤岛的问题,就需要集中化管理,包括数据的管理,它的目的还是以商业价值为衡量标准,不是你本身能产生多少数据。同时要提升一线人员的业务能力和数据决策权,及时反馈客户需求,快速交互客户来设计和交付客户需要的产品和服务。

一般企业里面做数据管理的时候,一般有几个步骤:

数据的清理,你要搜集到数据,对数据进行存储和分析,分析和业务相关联,把信息和方案展示出来,交给企业做决策。这个过程里面,不同的团队做不同的事情,数据采集和清理是数据管理的群体负责,数据的分析,一般是数据科学家,他要做建模,从数据里面找出数据的逻辑性出来。通过业务分析师把数据分析的结果和业务做了连接,到底对业务意味着什么,从而形成一个比较好的解决方案出来,进而企业数据官和企业决策层进行的合作,形成商业决策。最下面的基础技术团队提供各种技术支持,最后的结果是价值交付,归根到底给企业带来价值。

下面讲大数据企业生态架构。左边是:企业,社交媒体、物联网、云服务。右边是结果,客户满意度提高,竞争力提升、风险控制提升,产生一些新的商业模式,从而帮助企业脱离红海进入到蓝海。

公司已有的系统和数据应该怎么办?


第一,建立现有数据分析能力。第二,打通各个数据之间的障碍,消除数据孤岛,建立数据治理架构,对于规章制度,谁去负责个数据的质量等等,在这上面做制度建设。第三,建设数据应用的体系架构和集成架构,为了迎接后续更多的数据进来。第四,引入新的大数据平台、大数据技术,来做更广泛、更深入的数据分析。企业怎么引用大数据技术,这种方案很多,在你的企业足够大的情况下,你可以选比较好的一站式的解决方案,但是如果你的企业本身团队能力不是很强,你可以从一个小的做起,现在有很多免费的平台方案,可以应用他做POC,一些概念验证,看到底怎么做有效,在这个过程中不断建设你的团队,最后再分析我是否要上一个更好的系统,还是说我可以从免费系统自我升级、自我迭代,产生我最适用的东西。在用好目前数据的情况下,开展一些比较低成本的概念验证,慢慢进入数据领域。大数据的使用目前在整个社会层面上看只是一个幼儿园大班阶段,大家也不要觉得我没有怎么用大数据,觉得我很落后,其实不是。绝大部分企业都刚刚开始。现在包括大数据产业联合会都在推广,希望帮助大家,帮助企业家、大众有这样一个概念,我们的数据是有用的,我们慢慢建立这些能力。第五,交付数据的服务,可以做各种各样的分析,帮助他做一些决策,形成数据的产品,最后产生业务价值,企业的核心竞争力提高。

大数据使用的问题,大数据是万能的吗?不是,它越大越好吗?也不是。因为越大成本越高。既然做商业决策,要跟成本和环境有一个比较,所以是适度最好。

大小之间的关系是对立的吗?不是,传统数据的延展都属于大数据,大小并不是核心,而是看有没有商业价值。

大数据使用有限制吗?有限制。

首先,相关性有适用范围。比如说四柱算命,那是东方人总结的结果,未必适用西方人。大数据不是百分之百,不是涉及到所有人的数据,它并不是一个放之四海而皆准的东西。

观测影响结果,比如股票市场的大数据指数。i100是一个方式,还有一些炒股的高手,开一个群,他说这个股票明天要涨,大家发现明天真的涨了,他是股神。为什么涨呢?我们回头一看有问题,他说涨之后,他的粉丝就买了,粉丝信他,涨是因为粉丝都买了。因为给了一个概念,这个概念反过来影响了结果,形成了相关性, 但这种相关性是虚假的,不是客观数据的相关性。

过度相信数据,忽略常识,常识是很有效的,美国几十年前一个选战,当时盖洛普做数据分析的时候,抽样了几千个人,当时有一个全国性机构抽样了几十万人,几十万人预测的结果和戴乐普相反,但是盖洛普是对的。原因是因为那几十万人属于类似的中产群体,没有覆盖到全部人群。这个时候, 只要到大街上进行一些简单询问, 就可以快速验证分析的结果。

我们都依赖大数据做选择,有一个潜在的风险是同质化。你也拿新浪的数,我也拿新浪的数,分析结果都一样,你对同样的客户做同样的营销,就是同质化了,没有办法产生竞争力。一旦过度的依赖数据,你的决策不需要你的大脑,你就失去了你的创造性,你变成了一个机器了,而往往重大突破的事情是创造性的突破。这都是我们认为潜在的风险。

我自己的理解大数据的使用最佳的场合是没有明确逻辑关系的环境里面,需要尽可能多的数据来帮助去做预测,这个场景下大数据使用是最有效、最有意义的。

最后的总结:第一,大数据是文化和技术的结合。这个时代非常好,IT人员有机会进入公司的决策层,利用IT产生价值可以帮助公司产生核心竞争力,甚至让公司成为市场的领先者。所以现在是一个IT驱动业务的绝佳机会,这也是互联网+时代带给我们IT从业人员的责任和使命。

第二,我们使用大数据的前提是必须要有数据驱动决策的文化,否则再好的数据不用没有任何意义。

第三,大数据的价值不在于数据本身,而在于如何通过数据来分析和预测, 进而产生业务价值。

这是今天的演讲。谢谢大家!


提问环节:

提问1:刚才说到小米,定制的东西是千奇百怪的,当他打电话问客户对小米有什么看法,大家会从这几个问题,比如说一百个工程师针对这个问题有类似于问题归纳,然后再进行修改对吗?

徐斌:你说的很对,小米的用户很多,不可能每一个用户说一点,我就马上改。他会实时的搜集用户的需求,他同时收到二十个需求,他再进行梳理,他认为提的问题比较多的再进行改进,他一天可能会有一到两个版本的发布。

提问3:我是律师,我在律师事务所,我们有两个律师事务所,一个律师事务所100人去年5千万,另外一个10个人8千万。在律师事务所里第一个做IT的超过了律师的数量,开始我们不理解,后来我们发现真的特别不一样。他通过对这两个客户大数据的分析之后,来谈业务的时候,其中一个是500万,另外一个是100万。我觉得这个价值不可估量。

徐斌:谢谢你的分享。现在有一个说法,未来所有的公司都是IT公司,因为所有的信息变成企业的血脉,你和客户的沟通、你和合作伙伴的沟通,都靠技术帮助你实现。我希望大家能够把IT在你们公司定位高一点,相信你们公司的IT人员一定能够给你很好的回报。

提问4:刚才你讲的免费的平台在哪里可以找到?

徐斌:现在有很多基于Apache开源技术平台的saas服务提供着,你可以免费下载。还有很多大数据联盟,很多中小大数据厂商,你可以让他帮助你做一个展示,让你试用,你发现试用了有效果,你可以进一步选择付费的增强服务。

提问6:还有一个管理思维是设计思维,他解决的是创新问题,一个一个设计师各种浮想联翩,他也有他的方式和方法,也许把这些需要创造性的东西,最后以某种量化的方式来支持他,阴和阳就统一到数据上。

徐斌:关于这一点,很多外国的企业做的好一些,他讲方法论,他把所有的流程标准化,不管谁按照这个方法来做事,结果八九不离十,不太依赖于某一个个人,这是企业做到一定大规模的时候,需要这样一个组织能力,而不是依赖于某一个个人。但创造性往往需要发散思维,所以在提供方法论的前提下,创造出开放的空间,就是一个挑战。通过理性的数据来支持感性的创造性,这是一个完美的状态和平衡。

提问7:刚才也讲到了流程的驱动,流程管理的企业已经开始不太适应时代了,现在变成了数据驱动,他们两个之间到底有什么关系?流程没有它的价值了吗?

徐斌:首先,大数据的使用现在还是小学或者是幼儿园阶段。我们这个是不断探索,没有说现在已经到了一个完美的阶段。第二,流程驱动也好,数据驱动也好,不是一分到一百分的关系,是一个平衡的关系,数据比较少的时候,你依赖于流程,数据比较多的时候,你把数据的因素加进来做验证,如果你的数据足够多、质量足够好,流程要求少,更依赖于数据,这是一个相辅相成的关系。如果现在没有太多的数据,根本谈不上数据的时候,数据推动决策的因素本身就不存在。

提问9:您刚才讲到生态链,企业的用户跟京东、奥特莱斯有一些重叠的用户,这种分析,您的数据是放在自己的私有云还是公有云上?如果放在公有云上,这些数据是怎么交互的?

徐斌:数据所有权问题,现在没有明确的法规。比如说社交媒体的数据,我们到底怎么用数据,应该用数据做其他的营销活动,到底需不需要得到客户的允许,这没有一个明确的说法,这个有潜在的风险。我相信国家、行业都在研究这个问题。

第二,数据共享的问题,如果我们去共享,一般是对等共享,共享价值。 分享的方法有几种。第一种,你要把东西拿出来,一般的方式是脱敏,把关键信息拿走,只留下行为信息,来减少用户隐私的风险,同时,可以更开放的做共享。第二种,通过第三方公司,比如说百度、腾讯、阿里,他本身就有一些分析过的数据,他不会告诉你是谁,他会告诉你行为习惯和相关性。第三种,政府也做数据共享,比如说贵阳现在在成立大数据产权交易中心,他开放政务信息,他作为一个平台把政务信息、医疗信息放在一个大平台上互相交换。

提问11:在企业中,数据源怎么解决?你对数据源的理解是怎样的?我们分析一个商业行为,往往需要多个纬度,但是我们十个纬度往往少了两三个,会影响我们分析的质量。

徐斌:这是数据采集的问题,如果是企业内部管理的决策,很多时候我们是利用内部交易数据,比如客户数据,一个是现有客户,我们只有一部分数据,他在我这里做消费的时候才有,其他的时候是没有的。还有一部分是潜在客户,还没有跟我接触过,往往我们觉得数据不够是在于对我们客户进行分析和预测的时候。现在的互联网时代,好处在于,我们现在可以拿到外部数据、社交媒体数据,找咨询公司或者调研公司,现场采访,通过这种方式搜集信息。现在比较好的是有微博、微信,更多的掌握到你的行为、想法。这样可以帮助增加分析的纬度。纬度总是越多越好,因为不知道到底多少纬度就足够。但需要考虑成本和收益的平衡问题。从外部数据采集来说,可以从外部企业, 比如阿里,淘宝上来收集客户的消费习惯怎么样,也包括百度等都有一些数据产品帮助你分析,在搜索上客户的消费行为习惯,以及各种门户网站聊天的信息,市场上有提供了一些数据服务和产品。

提问14:我是做大交通行业的,通过信息和通讯的技术让交通变得便利一些。结合我们行业,我也想在企业里面推动大数据的应用。现在处于小学的阶段,我们对于数据提取的方法,分析的工具,甚至软件,现在是一个什么样的阶段,比如说我已经有一个成熟的模块去可以拿来使用的。如果我在企业里面要把大数据深度的应用,肯定首先要建一个团队,我本身对这些数据分析代表着背后业务领域的专家肯定需要有。后台保证里面,统计学的专家,软件构架的专家,后面这个平台需要怎么去建?

交通这个领域,比如说我把国贸所有地下的停车场全部买断,免费提供给停车的人,但是我要求他提前24小时预定,我就能预测到未来24个小时的车流量,他预定到一定程度的时候,他每一次来这里干吗的,我都可以对他进行分析,我可以把这些信息分析完了以后卖给政府,卖给交警队,我可以向国贸商圈推送定制化的信息,给提前预定车位的人提供服务、提供商品。

徐斌:举个例子,比如说高铁,全国高铁里面可能会有成千上万个通讯设备,如果能给他提供通讯的解决方案,给他进行全国的通讯设备的运维,运维的价值就大了,如果持续给他运维一到两年、三年,数据实时的会传到后台。我就会产生非常大的价值,因为我要去运行和维护他,他的动态我是很清楚的。

据我的知识来说,我不知道市场上是否有成熟的解决方案,但是轨道交通这一块我们之前分析过,好象还没有一个特别完善的解决方案。谈到交通管理,停车场的管理,我知道有创业公司在做,我今天没有能力给你这个答案。

第二点,如果从大数据的技术上来说,现在有很多公司、很多人有这个能力,但是现在最缺的是数据科学家,他能够把数据通过合适的建模建成一个真正与你的业务相关的分析结果,这个我们现在是比较欠缺的。

大数据不是万能的,之前有一次百度预测《黄金时代》的票房最低可以达到2亿,但是最后只有四千多万的票房,这说明了单纯的大数据使用不是万能的。交通行业用的比较多的是配送路径的管理,这个我们用的很多。哪种配送最有效,包括配送中的安全管理,非常普遍的就是司机偷油,我们通过GPS停留判断,判断异常的情况。

韩亦舜:刚才讲到《黄金时代》,补充一下大家在利用大数据的时候特别要注意,我们国家排片院线都是排片经理来排,排片经理说他预测的不准,因为片都是他排的,春节期间没有一个经理愿意排两个小时以上,因为时间短运转的快一些。说明了大数据你可能有一堆不同的数据基,但是这些数据集对你这件事价值利用不一样。唯独少了这么一个纬度就不准了,《纸牌屋》他们弄的东西是线上,他的因素不一样,有时候线上准,线下未必准。我是清华数据科学研究院的,我叫韩亦舜,我想问大家一个问题,在座的纯学生的举一下手。做2C行业的举一下手。自认为自己处于2B或者是传统行业的举手,自认为自己手上有数据的举手,你们对自己手上数据满意的举手。真正大家手上有没有数据,有什么数据,你们手深的数据用了没有,用了多少,还有哪些纬度增加了以后可能对你有帮助,还有哪些纬度对你有帮助,但是帮助不大。这些问题都是我们策划这个CIO论坛主要要讨论。

为什么中国2B上的比较慢,2C上的比较快。尽管每个人都有对数据敏感上面的思考,如果是小年轻,你问他,他一定对数据隐私很在意,但是他天天在上面暴露他的各种隐私,所以搜集2C的数据要比2B的数据容易得多。因为多,所以他从不同的角度给一个人的画像相对容易一些。相反传统产业,有一次我去南车,他说我的客户就是那几个。他的行为不一样。我们也可以提供一些尝试合作的机会,如果你们愿意把数据拿出来我们一起讨论,我们利用清华学生的分析资源,不妨帮助你们把数据跑一跑,看一看。而且清华有150名大数据辅修的学生,他们已经在开始从不同的纬度关心大数据了,大家有这个意愿,我们除了在这儿跟CIO交流以外,我们还愿意启动一些资源。我们可以把这些东西真正让大家感受一下。一定要让大家从分析数据、挖掘数据里面获益,才会有更多人愿意把更多的数据拿出来,不然,都是愿意来听,始终自己手上的数据怎么用没有很好的抓手。以后争取把这个风格持续下来,小组会,不妨每个人提出自己最棘手、最想解决的问题,大家找到一个资源你帮助你推进、改进一下。欢迎大家过来交流。


评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");