Qlik:哪有非结构化数据,只有待结构化数据

访客:13432  发表于:2016-09-28 13:57:25

数据分析这件事儿可以被简化到什么程度?

(Qlik公司CEO Lars Björk表示:“在Qlik的概念中,没有非结构化数据,只有待结构化数据。所有的数据都是能够被结构化的,我们会一直简化这个过程。

以社交网络数据为代表的非结构化数据一直是大数据分析中的难以征服的珠穆朗玛。在采访中,我曾多次听到CTO和BI专家提到,“传统企业沉淀下来数据库,因为将范围封闭在自己的产业链中,体量再庞大也是小数据。”

“大数据”之“大”,指的不只是体量,还有多样性和复杂性。比如现在红海中的手机企业,如果要启用大数据分析用户需求,光靠机型销量和售后服务是远远不够的,理想状态是在相关论坛、电商评论、甚至社交网络中的评论。

这些评论不仅能让手机厂商了解用户的真实评价,如果把网撒得更大一点,由于信息来自互联网公开资料,厂商完全能够获知每个品牌每一部手机的用户评价,和每个用户群对手机的真实需求。

但大数据分析师们要面对两个难题:一个是水军、一个是非结构化数据。结构化数据即可以用二维表结构来逻辑表达实现的数据,也就是我们在各种表格中所见的数据。

而不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、标准通用标记语言下的子集XML、HTML、各类报表、图像和音频/视频信息等等。不明觉厉的Hadoop等语言就是把它们先梳理成能进入数据库的语言,但这并不容易,成为大数据分析的第一道壁垒。

在今年5月初的可视化数据分析领头者Qlik一年一度的Qonnections大会上,Qlik曾公布了一项新技能——就是自动将文本梳理成数据库。半年过去了,这项新技能有没有成为大杀器?

CEO Lars Björk告诉记者:“在Qlik的概念中,没有非结构化数据,只有待结构化数据。所有的数据都是能够被结构化的,我们会一直简化这个过程。”

简化是Qlik Sense这款产品的精髓和目标。诸如联想等大企业选择Qlik的重要原因是经典的QlikView,这款厚重的产品赢在出色的性能,而且对于用惯了传统BI工具的分析人员来说也很容易上手。

但致力于将数据分析普及化的Lars Björk显然更偏爱Qlik Sense,后者的上手感觉有点类似于iOS,这款应用也确实可以在iPad终端使用,也就是说导入数据资料后,用手指头点一点,一个漂亮的数据分析图像就出来了。

新推出的Qlik Branch就类似于app store。Qlik在全球有超过1700个合作伙伴,开放与合作一直是它们的传统和优势,尤其是在数据分析专家比现在还稀有的年代,在本地有合作伙伴是很多用户选择Qlik的重要原因。

在云时代,这个优势就更容易提升了——开放接口、打造开发者社区、上线自由市场。

开发者和数据玩家可以将自己研发的分析模版、相关应用等等放在这个平台上,甚至一些公开的数据分析成品,在这里都可以以或免费或收费的方式共享给全球的用户。

自此,数据分析的上层玩家们不再是Qlik和它的合作伙伴网络,而成为一个开放的大社群。这也符合大数据的精神。合作伙伴的网络再大,就如企业的产业链数据库一样,是个封闭的体系,只有将它开放到消除了边界,才能够获得多维的资源。

在Lars Björk看来,数据分析不需要教育市场,因为数据驱动的价值观已经获得了广泛的认可,关键在于如何将易用的工具送到每个人的手中。所以之后Qlik的使命非常明晰——更开放、更多扩展、更易用。


后记:采访的契机是,势头大好的Qlik宣布同意私人股权投资公司Thoma Bravo对其以30亿美元的价格收购。Thoma Bravo是一个低调又强势的资本,本月初,路透社引述消息人士指,Thoma Bravo对惠普企业 (HPE)的软件业务开出了80-100亿美元的价码。但在资本层面之外,Qlik并不会出现什么变化,无论是战略还是产品都与过去的理想一以贯之。



评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");