百度大数据:感知,决策与洞见未来

标签:大数据百度热点

访客:32374  发表于:2014-09-05 10:43:58

[导读]伴随科技发展,近年来,大数据已经从过去一个被炒得火热的概念,已经悄悄落地。近年来,百度在大数据工程或研究或应用方面进行了哪些探索?又取得哪些进展或成绩?

百度大数据:感知,决策与洞见未来

9月3日,“百度世界2014之大数据论坛”在北京中国大饭店举办,百度分享了自己在大数据据领域的一些探索及成绩。在笔者看来,作为全球大数据巨头公司,百度的这些探索行为及产品,既代表着其对搜索大数据价值的挖掘,也从某种程度上揭示了大数据产业渐渐现身的产品应用和发展趋势。

而对大数据及其价值的挖掘与各种应用,笔者弱弱地感觉到,或将成为当前各行各业或转型或升级或迭代的引爆点。

接下来,让我们一起看看百度公司大数据部高级总监朱永忠关于“百度大数据引擎助力行业升级”的演讲内容吧。朱永忠先生不仅简要诠释了百度大数据引擎的概念及其带给行业的价值,还将带你一览百度几款“得意之作”。

百度大数据引擎是什么?

百度大数据引擎推出至今,不到5个月时间。目前整体进展怎样?

自今年4月百度大数据引擎发布以来,百度依托自己和合作伙伴的数据,通过三级开放平台,来推动行业的升级和应用的整体结构。

目前,百度拥有全中国最大规模的,以及最高效率的数据中心的基础设施。在这个基础上,百度由于需要检索网页信息,就需要大量的日志结果,需要做非常多的运算,所以我们在基础设施以上这一层的通用软件,储存和计算的平台也是在国内毫无疑问是最为领先的。百度将所有的这些能力都集成在一起,开放给大家。

第一层是百度开放云。9月3日上午,百度开放云平台正式发布,大家以后可以用非常低的成本体会一下百度强大的基础设施带给大家IT业务,或者对于一个开发者,对于自己的网站运营的好处。

第二层是数据工厂。由于百度需要大量的计算资源,在过去十几年的运营中,我们技术经过多少次的迭代,在整个数据处理的能力都是最好的。

不同维度的数据可以对于不同行业,不同应用的用户来讲意味和价值都有所不同。但是凡是对这个领域有所了解的同行们都应该知道,这些数据背后体现的是百度什么样的超级基础构架管理能力。

形成这样的能力,百度花了十几年的时间。但是借助百度的开放平台,您的公司,您的网站也可以很快获得类似这样的能力。

第三层是百度大脑。它有三个不同的组成部分。最左边是感知这个世界,以前我们是索引各种各样的信息,接着是信息和人连接,做各种各样的人机交互,自然语言的识别和处理,我们也开始用各种各样的智能设备探知身边的物理世界。

百度大脑经过大量的高性能计算和处理,采用模拟人脑这样的方式在处理感知到的所有信息。我们现在取得的成果应用在搜索广告的预测上,取得了非常好的成就。

未来的机器人,未来还有无人驾驶自行车、飞机等等,这些百度大脑都能给他们更好的支持。在未来,还有更多知识的发现,3D打印等各种各样的应用场景等待我们大脑探究。

能给行业带来什么样的价值?

我们把它总结归纳为三点。第一感知,第二思考,第三是决策、行动和创造。

一,关于感知这个世界。

我们过去靠的是人工输入,在过去十多年人工输入是人器交互最主要的方式,随着技术的进步,特别是到了手机阶段,我们认为现在人机之间的交互有非常大的不同。

那么PC互联网时代,第一代网民全世界流行的最有名的一句话,你不知道电脑的对面是一个人还是一条狗。

随着手机互联网、移动互联网的到来,毫无疑问,我们知道你是一个人。那么随着你每一个搜索引擎,随着你每一个行为,我们都在逐渐了解你。我们很快有手机了,可以了解大家的位置信息。

在感知认知里面,百度拥有全球首家基于深度神经网络的语音和图象的识别能力,识别物品的种类达到十多万种,不断的在扩充中。对于一些复杂场景的识别,我们相对于原来的图象搜索也有突飞猛进的提高。

比如今天上午百度推出的BaiduEye。它是把图象识别、语音识别和手势识别,包括位置信息等等一系列信息整合在一起,让我们能够提供更加接近自然的交互方式,在第一人称视角上对周围世界的感知。

再比如今年4月1日,百度发布了百度快搜,当时被当成愚人节的玩笑。今天上午的介绍里面大家看到这个产品经过几个月的时间变成现实,当然功能非常简单,但是随着我们不断的投入和迭代,相信它能做的事情越来越多。

我们已经从对世界的感知能力从视觉、听觉、位置等等进一步向味觉、触觉这样的方向推进。

二,获得感知后,这对于我们商业会有什么样的帮助?

基于我们对用户的理解,随着移动互联网的到来,随着搜索引擎越来越完善,我们很早以来就已经知道电脑对面是一个人,而且逐渐地并知道他是一个什么样的人。

那么最早我可能通过他经常输入的一些关键词,判断他是男还是女,是年轻人还是老人,随着他经常去哪里,经常在哪里吃饭、消费、看电影等等,随着这些数据不断补充进来,我们对一个人的了解和画像越来越清晰。

随着我们强大的大数据处理的能力,大家看到了我们做到了。比如在今年的世界杯,我们和全世界其他几个公司同台竞技,预测世界杯。在五家公司里,百度排名第一,预测准确度最高。

我们有一个帮助大家管理你的用户,管理你的用户行为这样一个基于大数据的研究工具。

我们针对不同行业,给不同的公司在做很多的大数据方面的研究,然后它可以在这个基础上更了解它的用户,它的客户是谁,他怎么样更有针对性的面向他们进行推广,面向他们进行服务。

百度拥有几十万台服务器,每台服务器里面有十几块硬盘,我们管理几百万块硬盘,每块硬盘都有非常多的数据。大家也知道,我们过去基于都是分布式的储藏的,一个硬盘坏了,要快速切入到其他的硬盘上。

但是当我们到了这样一定规模的时候,一天坏掉的硬盘数量非常大,涉及数据量非常大,修复的代价,比如网络的代价,机器的代价非常大。

我们花了两三年的时间,对于硬盘的参数做了非常多分析,然后结合我们深度神经网络,现在我们可以预测硬盘会在什么时候出现故障,这个故障是全局性的还是局部的问题。

我们可以快速的把这部分数据提前移走。这样我们在去年一年就在硬盘修复这一项上为公司节省成本高达上亿元。

这样的应用成本在中国只有BAT的公司才有可能,但是大家把它延伸下来往下想一想:如果不是硬盘,我们把它放到其他的地方,它也有非常多的应用场景。

比如我们现在和一家做风电的厂家进行沟通地它分布在全世界的几万个风机放在我们这个系统里,他要坏的时候我们能够预测,对他的运营是有非常大的帮助。

中国过去几年积累了非常多的老旧的产能,他们是用非常高的能耗在运行。实际在运行中,我们也在尝试结合我们的大数据的应用,结合我们这样的能力对运营参数的调整,持续监控和优化能力,帮他们进行一些能耗上的提升。

目前,95%的网民都是百度的用户,百度还有超过十万家的企业客户,分布在几十个行业里面,分布在几乎中国所有的省市里面。

用户和商户之间的互动,以及用户不断在不同领域的搜索请求,都可以让我们及时发现整个消费趋势,我们这些企业需求。

基于这样大数据分析平台,工信部牵头,我们一起联合了一些科研院所,一起推出了针对经济运行的一些指数。比方说我们有一个宏观经济指数,包含多项具体指标,这样是可以先于统计的结果来发现国民经济运行的一个正常的情况。

同时,还有中小企业的景气指数。中小企业一直都是在整个国家统计范围之外,非常难发现到底生存情况什么样。但是我们50万家商户基本上都是中小企业,网民在他们那里消费情况,可以非常好地解决这个难题。

大数据和你一起感知世界,决策商业,洞见未来

企业如何借助百度大数据,获得成长,并在移动互联网和大数据的浪潮中抢得先机呢?

我们现在在各行各业已经有非常多的合作伙伴,我们一起在探讨大数据帮助传统企业上面,怎么样给客户带来价值,怎么样形成全新的商业形态和结构。

百度大数据引擎在这三个组件上都有明显地进展。开放云,我刚刚提到了,数据工厂有专门的研发团队最高负责人给大家介绍,怎么利用百度的开放大数据处理能力帮助处理企业大数据方面的需求。

百度大脑,我们会有预测开放平台,百度预测世界杯、预测疾病,还预测高考的作文题目等。可能有的人想预测别的,比如明天哪条路会堵车,也可以预测明年高考状元是姓陈还是姓刘,只要你有足够的数据积累,在这个平台上都可以获得非常好的成果。

还有推荐开放平台。大家知道互联网的企业会做各种各样的推荐引擎,我们结合大数据的推荐开放平台,让你和客户推送信息的时候更吻合客户的想法,个性化性更强,客户的体验性更好,打扰更少,同时推荐出来的东西商业价值更高。

最后,当然百度在这上面的探索还处于初期。毕竟从推出这个战略到今天不过四五个月的时间,未来我们还有非常多的应用场景。

(本文系经理+原创,作者:顾琳琳,转载请注明出处和作者名)

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");