大数据or大忽悠,是个有争议的问题?

标签:大数据热点达沃斯

访客:33763  发表于:2013-09-11 23:53:25

大数据or大忽悠,是个有争议的问题?

大数据有多热?

看看时下大大小小的论坛就能知道。即便是达沃斯,也不能“免俗”。不过,这个话题即便已经说过千遍,当下再来聊聊仍然相当有意义。

9月11日,世界经济论坛2013年新领军者年会(又称“夏季达沃斯论坛”)的分会场,“大数据还是大忽悠”现场的气氛很火热。

这是一场观点针锋相对的辩论。正方的观点是,大数据的机遇被过分炒作。反方则认为,大数据的机会被严重的低估了。

西装革履的嘉宾,在辩论环节,为了说服台下的听众,或者说为了“拉选票”,甚至手舞足蹈地移步到台前陈述自己的观点。

Jeremy Howard是“大数据的机遇被过分炒作”的拥趸,尽管他所属的Kaggle公司,本届达沃斯的技术先锋公司之一,正是一家基于大数据分析的创业公司,Howard是这家公司的总裁兼首席科学家。这家位于美国旧金山的初创企业,创建了一个拥有近11万名数据科学家的在线社区,是一个大数据分析的众包平台,他们的业务模式是在数据问题和数据解决方案架起了一座桥梁。

Howard陈述的观点,让知道这个公司业务的人多少有些意外:

“世界上有太多的数据。我不关心数据有多大,而是关心用数据来干什么。Kaggle平台解决了300多个以前没有被解决的问题。那么,数据是越大越好吗?其实我们需要了解的关系并没有我们想象得那么复杂。”

在Howard看来,什么数据都需要,其实是大忽悠,是厂商、硬盘商、软件商为了生意的需要而做的说辞。

Bright Simons与Howard是同一阵营的,他来自加纳,是MPedigree网络公司总裁,是数据开发领域的专家。在他看来,数据并不是越大越好、越庞杂越有价值,不能把所有垃圾的数据也视为有意义的,“大数据能为我们做什么事情?我们需要洞察大数据能给我们解决什么问题”。

与他们不同,来自中国的苏萌,和来自日本的Yamamoto,则力挺“大数据的应用远未达到我们所需要的”。

Yamamoto以日本新近成功申奥来举例,他说日本能够成功申奥,得到了大数据的支持。“利用facebook、推特等社交网络来宣传申奥,原本只有50%多的日本人支持申奥,后来支持的人群超过80%”,在Yamamoto看来,大数据是申奥成功的重要平台。

其实,类似事情上,奥巴马大选的例子更为经典。奥巴马连任的背后,不仅是奥巴马团队与时俱进地利用各种新兴社交平台与选民互动,还通过大数据分析拉来更多选民。事实上美国奥巴马政府已经把“大数据”上升到了国家战略的层面。今年3月,奥巴马政府宣布投资2亿美元启动“大数据研究和发展计划”,希望增强收集海量数据、分析萃取信息的能力。

在Yamamoto看来,对于大数据应用的下一步发展来说,“每天产生海量的数据我们需要一种机制、发明、流程,来处理这些海量的数据,进而让它们变得对我们的生活有用处”。

“大数据的机会被严重的低估了。大数据的应用远未达到我们所需要的。大数据的应用将从各个行业进入,现在仅仅是在电商等领域被应用,这只是大数据的冰山一角。”苏萌更是观点鲜明地力挺大数据“机会说”。苏萌是北京大学副教授、北大光华管理学院新媒体营销研究中心副主任,他也是中国国内大数据分析公司百分点的创始人。

在苏萌看来,“大数据的应用远未达到我们所需要的”,归结于以下几点:

✔ 没有看到数据真正流动起来,没有流动性就没有价值。现在各个企业、机构之间的数据都是孤岛状的数据。

✔ 没有看到整个大数据的生态产业链。从数据的采集整理挖掘应用,整套生态链并没有看到。

✔ 现在还很缺乏这方面的人才。他说,即便是北京大学这样的著名高校,还都没有数据科学的专业,换句话说,还需要有越来越多的数据科学人才的培养机会。

辩论会现场的火热,不仅是台上嘉宾的唇枪舌战、你来我往,还有台下听众接二连三地“发难”台上嘉宾。让我们听听这些提问吧:

提问Howard:按照您的观点,我们现在还未解决、需要解决的问题,是得用小数据来解决?还是大数据没有足够好的工具来解决问题?

Howard:最成功的建模,并不是把所有的数据都组织到一起,而是适合数量的数据的集合。

提问苏萌:在这个世界上有多少时间你是在收集数据,有多少时间你是在分析数据?

苏萌:不同行业情况不同。比如电商,现在需要更多的时间来分析数据,而不仅仅是数据的采集上。

提问者:“足够的时间”本身就是个问题。

联合国世界粮食计划署成员提问Simons:我们从世界各地收到的反馈,大数据挽救了很多人的生命。

Simons:但是我们需要的是正确的数据。

提问Howard:大数据还是会存在的。据您的预测,未来五年中,能够通过大数据来解决问题的比例是?

Howard:我相信数据,但我不相信我们的电脑里能存储太多的数据,或者无限制地存储数据。我们现在有很先进的算法,能够更灵敏地来搜集数据。事实上,随着时间的推移、我们的技术越来越进步,我们需要的数据就越少。

提问Yamamoto:政府和国家的互联网络,集中化的数据,有个很大的威胁,被黑客攻击,这就是数据脆弱的一面,您如何看待大数据在这方面的漏洞?

Yamamoto:网络恐怖威胁,对大数据而言是挑战。要对这些风险做出准备。对于政府机构的数据受到网络黑客的威胁、病毒的威胁,我们需要做的是保护数据。

究竟是大数据还是大忽悠?一场1个小时的辩论会是难以断得清的。辩论现场主持人,以略带游戏的方式来结束了这场“争论”。在辩论会开始之前,他请现场的观众投票,正方以微弱优势领先反方。辩论临近尾声时,现场观众再次投票,这次则是“大数据的机会被严重的低估了”以微弱优势领先。

苏萌的话,很适合作为这场辩论的结束语:

大数据在教育、医疗、能源、金融、传统零售等领域的潜力都还没有看到。所有新事物的发展,都会有泡沫成分。泡沫过后,价值会被沉淀。现在来看,十四五年后,互联网泡沫论被证伪,现在电商泡沫论正在被证伪,未来大数据泡沫论也是一样。


评论(4)

您可以在评论框内@您的好友一起参与讨论!

    1. 贺文 我倾向于kaggle代表的观点,数据有价值,大数据有价值,但是数据并非越大越好。他还从建模的角度来分享,好的模型,并非来自于越多的数据。

      回复[0] 2013/09/12 13:45

    1. 王志鹏 不是大数据本身是大忽悠,而是搭顺风车的许多厂商,将它变成了大忽悠

      回复[0] 2013/09/12 10:43

    1. 邹震 大数据还是有大用场的

      回复[0] 2013/09/12 09:36

    1. 林文学 大数据的机遇被过分炒作,大数据过分放宽了相关性的联系,但相关性有这么紧密吗?大数据带来的机会,究竟有多大?不要总是扮出一付救世主的样子

      回复[0] 2013/09/12 09:13

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");