数据质量总动员:Finding DQ 数据质量总动员(上)

标签:CIO数据管理数据质量数据治理数据剖析

访客:21011  发表于:2012-11-07 14:39:08

你有没有过那种强烈的感觉,就是你不想去寻找数据质量问题,数据质量问题却会自己找上门来?

还记得早些年迪士尼出品的Finding Nemo》(《海底总动员》)今天我们要写的是《Finding Data Quality》(数据质量总动员)。因此今天这篇博文,不仅仅要向《Finding Nemo》致敬,也要向那些在数据质量海洋中为企业信息活动不断努力的“角色”致敬——们是:商务智能,主数据管理,数据分析,数据清洗,数据集成,数据迁移,数据治理。

希望你能喜欢本文,不过我更希望你能记住:“Data are friends, not food.

数据竖井

这是数据竖井的咒语——不过这也是对成功的企业数据管理的诅咒。很多企业都固执地依赖着他们的垂直数据仓储,这种模式中,每个业务单元都是自己那部分数据的管理者,所以,只关心属于自己的事实业务和数据。

组织获得井喷式业务扩张的同时,往往因其业务的成功而变成受害者。值得注意的是,这种损害在组织因业务扩张而大力延伸信息框架的时候尤为明显。

组织早期的系统不是特别多,数据也比较好管理。此时,日常业务决策需要数据质量的管理以及关键信息的快速发布,在技术能够满足业务需求(尤其是业务和需求都比较小)的时候,一切看起来都很得心应手。不过,随着组织扩张,逐渐出现了效益与效率间和短期战术与长期战略间的博弈。此时由于看到了数据仓储的作用,却没有意识到信息共享的威力,组织大都让各个业务单元在企业范围内自主协作——我们知道,没有这种称作协作的关系,企业数据管理根本就是无稽之谈。

数据剖析

虽不至于迷雾重重,不过要想让数据有用武之地,并提高其质量,一定要理解数据的含义——要做到这些,除了数据剖析,别无选择。

数据剖析能够检验你对数据质量的各种主观臆想与猜测是否是真的。数据剖析工具能够帮你自动完成一些虽繁琐但却是分析数据所必须的工作。

记住,数据分析并不会自动完成你想要的数据质量,你要把你的分析转变成有特定含义的报告和问题,这样才能促进有效的沟通,并建立切实的业务语境。

我始终坚信,数据剖析的目标不是找到答案,而是找到正确的问题。

要找到正确的问题,那就去找数据最亲密的朋友——数据管理员、分析员和相关专家。和他们的交流,能够得到很多关于数据作用数据标准和业务相关衡量标准的关键信息,这对数据质量的衡量与提高都很重要。一定谨记,优秀的数据剖析,需要高度交互和环环相扣的流程。

缺陷避免

谁如果说问题能够在发生前一个不落的都被排除掉,这是骗人。不过积极的缺陷预防还是值得推广的做法,因为在数据源头加上越多控制,企业数据的总体质量就会越好。

虽说缺陷预防和业务优化与技术流程的提升有很大关系,不过在确定了数据缺陷的根本原因之后,我觉得你会采用一些数据质量行为的原则。

换句话说,只有理解了潜伏在数据缺陷背后的复杂人类动力学,才能发展一套有效的战术和战略,这些战略战术能够让可观的数据质量优化能够取得成功。

未完待续……

评论(3)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");