大数据竞赛:我们是否显得太急迫?

标签:大数据技术前沿

访客:30432  发表于:2012-05-29 09:29:29

在云计算之后,IT界又开始迎来了新一轮的信息变革。大数据的到来让企业CIO又开始将注意力从IT架构转回到对于数据本身的思考。

传统的数据库和数据仓库已经发展了40年左右的时间,无论是从发展时间和发展成熟度上都达到了一定的稳定阶段,而市场份额也已经基本划定。根据Gartner的统计资料显示,在传统数据库领域,oracle数据库由于其强大稳定灵活的功能,占到了市场营收的44.3%,而IBM的DB2一21%的市场营收占到了市场份额的第二位,而SQL sever也也占到了市场份额的18.5%。

这个时候几乎所有大型的拥有数据库产品的IT公司都在开始提到大数据概念。Garter数据显示,全球信息量正在以59%以上的年增长率增长;而IDC也称未来十年全球大数据将增50倍,SNS、移动应用、物联网、感知技术的应用,数据将面临爆发式的增长。

在这样一种宣传状态之下,企业的CIO已经自然而然的陷入了一种大数据来临前的恐慌当中,而在企业之间和IT公司之间,大数据仿佛都变成了一场竞赛,但是我们现在应该要思考的是:我们是否要参加这次竞赛,以及这场竞赛是否为时过早?

当然,在积极的方面,互联网、物联网的的确确不仅仅改变着我们的生活方式,也改变着整合商业的运作方式。在营销渠道方面,线上线下已经形成了分庭抗礼之势,甚至在有些行业线上的规模远远超过了线下的规模。

在这种互联网为主的营销渠道之下,市场的反应变得更加快速,市场的需求也变得多样化,对于企业来说只有在最短的时间掌握最全面的信息,同时对这些信息进行分析并且进行及时反应。

从这个层面上来说,大数据的来临是势不可挡的。而我们今天所要重点探讨的是,我们是否就已经到了应该全面进攻大数据的时代了?

大数据挑战:我们是否需要新技术?

如果光从字面上去理解“大数据”,我们通常会认为大数据就是数据的大爆发,侧重于强调数据的量.但是如果你去总结IBM、ORACLE、EMC对于大数据的定义话,它的外延还包括了数据的多样性已经分析的实时性。

大数据的其中两个特性是数据量大跟实时性,这是企业目前处理大数据所面临的最主要的两个挑战。我们可以看到数据的这两个属性,是传统关系型数据库也一直在处理的问题。如果说传统关系型数据库目前尚不能够满足企业的业务需求,那么技术的研究方向也应该是按照关系型数据库这种技术架构进行进行下去。要知道,传统关系型数据库跟目前针对大数据的非结构化数据库的架构类型是完全不一样的。关系型数据库已经存在了40多年,对于数据处理也已经显得非常成熟,如果企业要用新兴的非结构化数据去取代它,那么会不会面临“捡了芝麻,丢了西瓜”的结局我们也不得而知。

那再让我们来看大数据的第三个特性:“数据的多样性”。这里的“多样性”意味着非结构化数据变得越来越多。

事实上,全球产生的数据中85%以上的确是非结构化的数据。但企业主要处理的还是结构化的数据。大多数厂商的非结构化数据分析工具也是转换成结构化数据之后再进行处理。那么大数据的真正之“大”在于如何将非结构化数据处于成结构化数据,以及之后的对于大量结构化数据的并行处理能力。这跟许多厂商的强调的“非结构化”数据本身并无太大关联。

退一步来论证,如果数据这些非结构化的数据确实需要新的技术架构来实现,那么大数据是否就是我们马上需要去攻克的方向?

一些非常资深的数据库专家认为:能把最简单的业务,简单的数据形态挖掘深入才能体现功底,电商这类复杂业务挖掘出一点成果容易,深入难,许多企业不去强调对于数据的挖掘,而在强调工具和技术。这些专家也在提醒,结构化数据相对小,但是富矿,非结构化数据大,但是贫矿,如果富矿还没开始采就转攻大贫矿,后果可想而知。

关于大数据的成本风险

只要不是钱多得烧不完的企业,其IT部门始终要面临这样一个问题:用尽可能少的钱去创造尽可能多的价值。

数据库建设无疑是企业IT预算的大头。一个项目建设花费掉上千万在中国许多企业是非常正常的事情。然而我们看得到的是大数据的建设其花费肯定将不会低于原来传统关系型数据库的花费。

现在很多厂商正在给与我们这样的案例,许多企业依靠大数据的能够,发现了以前根本无法发现的机遇,拓展了自己的市场。那我们就必须要讨论一下大数据的有效性,到底企业利用大数据给企业带来了多少额外增加的价值?这种增加的价值是否能够企业的投入有一个非常好的比例。而且更为重要的一点是,是否只要使用大数据就一定能够给企业带来以前不可能实现的价值?

当然,任何一种新技术的出现都要面临许许多多的挑战,大数据也是一样。只有那种能够给企业带来实际价值的技术才有真正的生命力。任何企业绝对不会为了采用新技术而应用新技术,技术最终的落脚点一定是实现业务价值。

大数据还处于成长当中,许多IT厂商也认为目前大数据需要和传统关系型数据仓库共存。如果企业的确希望利用新兴技术实现业务的突破,那么也应该必须慎重。作为企业IT的决策者,一定要考虑清楚:这种创新技术是否能够实现期许所期望的价值,实现的周期是多久,企业是否能够承受这种IT可能会出现的问题甚至于失败。

评论(1)

您可以在评论框内@您的好友一起参与讨论!

    1. 徐蕊 在一种猛烈的宣传状态之下,企业的CIO已经自然而然的陷入了一种大数据来临前的恐慌当中,而在企业之间和IT公司之间,大数据仿佛都变成了一场竞赛,但是我们现在应该要思考的是:我们是否要参加这次竞赛,以及这场竞赛是否为时过早?

      回复[0] 2012/05/29 09:30

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");