没有云平台分析承载 大数据难逃变垃圾堆的厄运

标签:大数据新闻云计算

访客:23335  发表于:2012-04-28 11:02:41

     分析这个词,是在大数据或是云计算里面,必须要提到一个战略高度来认识的词。如果你的云计算平台没有考虑如何对存储下来的一些数据进行分析的话,那你存的又是什么?如果你没有办法把这里面的价值挖掘出来的话,你怎么区分一个是金矿,一个是垃圾堆?我存了大量的垃圾能够有用吗?当然,没有用处的。

    大数据面临的问题之一就是如何对数据进行快速地采集。数据的采集是非常困难的事情,对比现在的数据库水平和数据增长的趋势,可以看出,数据增长速度比我们现在数据库的处理能力要大得多。

    这里,大家可以看到一些耳熟能详的关健词,像Hadoop、MapReduce,像Sybase IQ代表的列式数据库,还有Sybase Event Stream Processor事件流处理器,怎么样对流数据进行实时的加工,都是企业现在需要掌握的一些技术。

    大数据的分析还有一些周边的、外延的工具,比如说像Matlab、SAS、SPSS或者现在非常火的Revolution R。开源的里边有Hive、SciPy,Mahout、AMPL等等这些技术,在不同的领域里面都有很多人在研究、在分析着。

    信息价值的挖掘有很多方法论和手段,比如说怎么样去做社交媒体的分析,怎么样去做行为分析、情绪分析。还有就是业务场景上个性化的服务、个性化的分析、个性化的推荐等等。

    现在的数据库市场在面临这么大的数据,这么复杂的数据类型,以及这么快的变化面前,已经不再是一统天下的格局,没有一个数据库产品,或者没有一种数据库产品可以完全地解决大数据的问题。未来的格局可能是什么呢?

    在一个企业或者是像一个IDC这样的架构里边,必须要面临一个工具箱的状态,这个工具箱里面有各种各样的工具,每个工具的体验点都是不一样的,互相之间几乎是不可取代的。现在的数据库市场也面临这样一个格局,很多时候做OLTP,要用行式数据库,做大量的数据分析时要用列式数据库,因为它可以带来十倍、百倍的速度提高。

    那么对大数据实时的处理,我们要用做数据流的分析数据库、内存数据库;在手机上或者说一些移动设备上要想做一些小的应用,我们需要一些嵌入式的数据库;还有面向对象数据库等等。在大数据的处理格局下,大家必须要接受这样的一个观点,就是专项的数据库用于解决专项的问题。

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");