【张卡尔面对大数据 - 17】12 个顶级大数据分析的玩家(1)

标签:大数据数据仓库

访客:40521  发表于:2013-04-14 02:00:25

全球各地的各行业的组织已经明白了那些最智慧的业务决定是建立在事实之上,而不是只凭感觉。这也意味着他们立足于数据的分析之上,而且这远远地不是只针对保持在内部交易系统中的历史信息。互联网的点击流、传感器数据、日志文件、具有丰富地理空间信息的移动数据、社会网络的评论,这些是只是如今推动信息存放进入超过10TB的大数据阵营的许多形式的数据的一部分。
问题是,传统的数据仓库实施既不能够规模拓展到压榨TB尺度的数据,也不能支持高端的在数据库内的分析。过去的十年,大规模并行处理(MPP)平台和列存数据库已经开始了数据分析中的一个革命。但是技术不断地游移。我们开始看到那些正在模糊已知架构的边界的更新。更近一步,围绕着着手半结构和无结构信息的NoSQL(不仅SQL)平台,一个整个的运动正在兴起。

这个持续文章主要建立在InformationWeek期刊的行政编辑Doug Henschen的同名文章之上。那里,他介绍了12种顶级大数据玩家。文章老旧了一点,2011年的文章。但是我觉得还是很有价值。这些玩家包括:EMC的绿李子电器、Hadoop和MapReduce、惠普最近收购了的Vertica平台、IBM的基于DB2的智能分析系统和Netezza邀约、以及微软的并行数据仓库。规模比较小、但是却颇有特点的数据库玩家包括了Infobright、Kognitio和ParAccel。Teradata在市场的尖端,搜罗那些行业巨头甲骨文的高端叛逃者。SAP的Sybase部门继续在演化其原有的列存数据库。简短地说,对于每一种尺度拓展层次和分析关注点,都可以找到一个合适的平台。我这里主要是计划按图索骥,浏览一下这些玩家的深度情况。

评论(1)

您可以在评论框内@您的好友一起参与讨论!

    1. 张嘉奕 感谢张总分享,话题已推送至e行网“热点精华”页面

      回复[0] 2013/04/14 23:03

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");