CIO新任务:能否让大数据变得像电影一样可视化?

标签:CIO大数据数据可视化

访客:55810  发表于:2014-10-16 14:26:05

虽然可视化在数据分析领域算不上最具技术挑战性的部分,但是它绝对可以说是最重要的一个方面。当然,存储、数据库的查询处理以及算法都是非常的重要——可视化离开它们也无法实现——但是在一个数据驱动的世界里,它们只是处在基本层的位置。CIO们在就如何收集、存储、分析和展示大数据开展工作的同时,还被赋予了应对更加困难的挑战——运用数据作为驱动业务决策的手段的重任。IT组织可以如何利用大数据?经过一年左右与专家和CIO们的试探后,我开始认为这一努力需要CIO们进入一个以往很少有人触及的领域:电影。

CIO新任务:能否让大数据变得像电影一样可视化?

三维方法:数据展示的“未来之路”

最近汤姆·达文波特在即将出版的关于分析的书中清晰地阐述了CIO和商业智能(BI)组织的工作不是简单的展示数据,而是要以一种能够影响业务决策的方式进行展 示。在他的关于展示数据最佳方式问卷调查中,达文波特印象最深的一组把“一个非常简单的财务报告应用”做成了一个视频。这很可能是未来之路,他说,如果你看看我们是如何说服做其他事情,购买产品,自娱自乐——想想最近大家在YouTube上观看的所有聪明猫的视频——除非我们愿意通过视频来沟通分析的结果,否则它不可能每个都保持长久。

这个案例对于展示大数据特别有说服力。一个简单的图可以用一个事情绘制另一个——就像我从代数课上学 到的。添加颜色也许就能在一个图中获得三个变量。但是大数据,正如从PayPal到金融街的首席科学家们所说,可能包含上百种变量,并且这些变量正随着时 间和空间而改变。万能的猫视频!什么样的数据展示才能弄明白这个。

当然,如果你已经知道自己在寻找什么,感谢你那有准备的头脑,除了留下与少数变量相关的信息,你只是过滤掉了其他的所有信息。但是如果你不知道自己在寻找什么,如果你已经有了上PB的数据,你希望从中能发现新的关系而不是 简单的为旧观点提供支撑或反驳的证据,那会怎么样?如果你想看到不带偏见处理数据的方式——正如我所知道的,那真是大数据分析的最高目标(the holy grail)——除了逐字逐句的看,根本没有什么其他选择。但是,怎样做呢?

我想,这就是为什么要有电影,为什么财务业绩通过视频可以给象达文波特这样老练的分析家留下如此深刻的印象。电影呈现出三维空间;它让我们看见时间的流逝。颜色、纹理甚至声音的应用为我们描绘出了更多的变数。我们所熟知的世界就是三维的,有声电影会被人们当作真实的经历。

现在的CIO们必须让大数据看起来像那个真实的世界,是否所有可用来表现工具都已存在了?当然不是。达文波特的观点是他们还相当不成熟,但是每个我们见到的计算机制作出的动画都向我们展示了一条前进的道路。詹姆斯·卡梅隆在《阿凡达》中使用的软件工具,象Autodesk Maya和Zbrush,都可以找到一种方式进入到CIO的组件中。灯光、摄像、开始!拿我来说,我就期待在电影中的大数据。据我推测企业也是一样在期待。正如另一位哲人所说,观察能让你学会很多。


数据到底意味着什么?(6家创业公司数据可视化分析)

1.Ayasdi

Ayasdi来自印第安语,是“寻找”的意思。斯坦福大学的Gurjeet Singh, Gunnar Carlsson和Harlan Sexton一直在致力于将拓扑学的研究方法应用于数据分析。在2008年,他们联合成立了Ayasdi公司。Ayasdi成立以后,就获得了 DARPA(美国国防部高级研究项目组)350万美元的资助。

CIO新任务:能否让大数据变得像电影一样可视化?

Ayasdi的底层使用的是HBase数据存储,然后再利用拓扑数据分析技术和上百种机器学习的算法来处理复杂的数据集,最终确定数据节点之间的相似度。而对终端用户而言,这看起来更像是一个数据集的拓扑图,只是强调了集群中有关联的数据点。

Ayasdi 的技术有一个重要的特点,它不像别的系统需要类似搜索查询式语句,Ayasdi可以自动从数据中发现隐藏的模式。Ayasdi的一个应用就是在医学研究领域,Mount Sinai医学院基因与多尺度生物学系的主任Eric Schadt就带领一个团队,利用Ayasdi的技术进行一些疾病的遗传倾向的研究,而且利用Ayasdi的数据分析技术,帮助发现了乳腺癌的14个变种。

2.BeyondCORE

实际上BeyondCore运作的基本前提和Ayasdi是相同的——只是展示给用户显著相关的联系,而无需考虑这个结果是如何发现的——虽然 BeyondCore使用的是标准化图表,但是事实上还提供了另一种选择:在发现软件发现关联性结果时,会让化身(见图片)通知用户。

CIO新任务:能否让大数据变得像电影一样可视化?

3.ClearStory

ClearStory拥有一个独一无二的产品,即使该产品的很多细节并没有公布。也许只有在产品正式发布之后,我们才能“一睹真容”。 ClearStory将与存储在数据库、网络和其他来源的数据连接,在数据源变化时进行动态的更新,并加入虚拟的数据挖掘组件,使用户分析数据并理解信息。在今年3月份,ClearStory获得了来自谷歌风投、安德里森·霍洛维茨、Khosla Ventures等多家风投的青睐,融资金额不详。

CIO新任务:能否让大数据变得像电影一样可视化?

4.Datahero

Datahero是由来自Aster Data的大数据分析业务骨干Chris Neumann、宝马的高级工程师Jeff Zabel联合创立,该公司尚在起步阶段就获得了100万美元的融资。他们打着“你的数据你做主”的口号,试图弥合大数据与普通用户之间的鸿沟,不仅帮助用户分析密切相关的数据,而且通过可视化的形式,让用户更好地理解这些数据。

CIO新任务:能否让大数据变得像电影一样可视化?

据外媒报道,Datahero是基于浏览器的一个平台,数据的输出、整理以及解释都会在一个单独的窗口完成,而不是通常意义上的借助不同的应用。通过浏览器,用户可以将多种网络服务的信息输入到Datahero,也可以从公共的数据库下载报告,还可以直接在本地把电子表格及文件上传到Datahero。 Datahero会根据它的算法自动为这些信息归类,并给他们加上标签。

5.Platfora

Platfora在Hadpoop的基础上进行数据的操作,并为用户提供一个简单易用的操作平台。因为Hadpoop有很多不同的发行版,所以 Platfora的重点之一就是确保它能在所有的发行版上运行,这样大大降低了Hadpoop的使用门槛,让更多的人能够体验Hadpoop的技术优势,实现真正意义上的“平民化”。

CIO新任务:能否让大数据变得像电影一样可视化?

6.Zoomdata

初创公司ZoomData是为数不多的支持移动设备的数据分析公司,它们的数据可视化系统能够将实施的大数据流转化为触屏友好的、艺术感十足的三维数据。苹果iPad和Android平板电脑用户可以用手指缩放数据可视化界面,随着界面缩放的级别不同,数据将实时进行更新。ZoomData的数据可视化技术支持多种数据源,包括社交媒体、企业应用系统以及Hadoop HDFS数据。

CIO新任务:能否让大数据变得像电影一样可视化?

评论(1)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");