什么是“大数据”的真正含义?

标签:大数据技术前沿

访客:30102  发表于:2012-05-18 11:09:59

   

       大数据是时下流行语,但它真正的意思是什么呢?是当数据成为大吗?

    最近在波士顿举行的一个大数据和高性能计算峰会上,亚马逊网络服务(AWS)、大数据科学家JohnRauser提到一个简单的定义:任何超过了一台计算机处理能力的庞大数据量。

     有人说这个定义过于简单化,有人认为一语道破大数据天机。

     "大数据是最大的宣传技术、是最时髦的技术,当这种现象出现时,定义就变得很混乱。"一研究小组的发言人谈到。

     "这一不成熟的市场,缺乏一个标准的定义"IDC研究公司业务分析部门的副总裁DanVesset说。但是,他也不是很赞同AWS的定义,"我想看得到的是真正的谈到数据,而不是用基础设备来处理数据。"他说。

     其他人同意AWS的定义

      "它可能不包含所有的信息,但我觉得大部分是正确的。"一个大数据分析师JeffKelly说。对大数据的一部分认知在于,它是如此之大,分析它需要多个工作负载,这是AWS的定义。"当你的技术达到极限时,也就是数据的极限。"Kelly说。

     最常见定义大数据使用的三个术语都含有字母"V":volume,velocity和variety.许多数据公司、分析公司都会为围绕这个定义展开,如IBM、IDC。数量意味着生成和组织大量收集的数据;速度是指音频、视频、网络日志亦或更多的数据文本要进行收集和分析。

     但也有一些人怀疑这一定义,Breen加了第四个"V":vendor。

    如AWS和IBM的公司,他们对大数据的定义很大程度上是为了支持他们公司自身的产品。Breen说。

     亚马逊发言人TeraRandall写道:"云提供即时的可扩展性和弹性服务,让您专注于分析,而不是基础设施建设。它增强你通过快速获取数据来处理和分析数据的能力。"Randall对数据的描述不见得是AWS的定义,但却是企业管理中经常会遇到的数据处理问题。

     "大数据分析在云应用中是一个新兴的市场。"Kelly说。谷歌最近也发布了基于云的数据分析工具BigQuery。IBM则表示信息是"21世纪的石油"它推动业务决策跨不同行业而向前发展。

     IDC称,大数据是一个很大的市场。IBM称,IDC预计到2015年企业将投资超过1200亿美元在基于数据业务分析的硬件、软件以及服务领域。IDC还表示:在整个IT和通信业务中,大数据的市场将增长7倍之多。

     但是,IDC的研究人员Vesset说,大数据不是关于如何定义,最重要的是如何使用。最大的挑战在于哪些技术能更好的使用数据以及大数据的应用情况如何。这与传统的数据库相比,开源的大数据分析工具的如Hadoop的崛起,这些非结构化的数据服务的价值在哪里。

    如何定义大数据到目前为止仍然没有具体的标准形态,也许,kelly的定义是最贴切的。

评论(2)

您可以在评论框内@您的好友一起参与讨论!

    1. 邹震 岳老师说得对,概念一被滥用,就一定会出现这种状况,被厂商利用了。

      回复[0] 2012/05/18 11:27

    1. 岳占仁 大数据的定义一直是三个"V": volume,velocity和variety,还应该有第四个"V":vendor——厂商根据需要,想怎么定义就怎么定义吧。哈哈

      回复[0] 2012/05/18 11:16

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");