地方政府从大数据获益之前得先过两关

标签:大数据综合数据地方政府

访客:45600  发表于:2015-07-27 10:06:56


一、概念普及

最近几年,一些新技术用语在媒体和人们的日常用语中涌现出来。我们今天来用日常用语来谈谈其中一个:大数据(Big Data)。

人类社会发展产生了浩如烟海的数据,但绝大部分被忽视了。原因是,一,人们没有意识到信息数据的重要性。二,缺乏有效储存、加工、分享的工具。人类在文字语言出现前就知道用某种手段收集数据。比如,在一根绳子上打结,结的大小代表着不同的事,或者结的数量代表着日期。这就是所谓的结绳记事。后来有了文字,数据便可以被比较有效地储存起来。我们将时针快拨到20世纪40年代,现代意义的计算机出现,使人们可以对数据进行快速加工。但那时对数据的加工,结果还仅仅局限于数据所显示的“过去”。如果说数据能够告诉人们一些有关将来的事,那也仅仅是从统计意义上讲的“温故知新”。

有了计算机,数据分享仍然是一个问题。即便后来局域网(VAN)出现,但信息分享还是在组织机构内部上进行的。大数据这个概念的出现需要社会范围的数据分享。互联网技术的出现,各类数据从内网和百姓家中涌向互联网这个公共平台,人们才开始认识到互联网上的数据具有未卜先知之神力。这就是大数据出现的技术和社会背景。

我第一次听到“大数据”是在2010年的一次CIO年会上。那次会议的Keynote Speaker 是一个搞IT战略分析家。他提到他利用Google 搜索引擎(RE: Google Adward加上Google Trend)预测地区性流感的发生。结果他的预测比美国CDCCenters for Disease Control and Prevention)的预报还要准确及时。

那么什么是大数据呢?顾名思义,大数据是指超大规模、包罗万象的数据库。但我认为,大数据更重要的一个属性是它提供的,就超大型数据进行分析并进行预测的能力,而这种能力能够大大改善组织的决策质量。数据本身总是反映过去,但同时数据也能让我们看到将来。美国的CIA花了十二年的时间,利用大数据追踪本拉登,最终将其击毙,报了“9/11”一箭之仇。在十几年对本拉登追踪行动中,CIA的那个小组可能比本拉登本人对自己的了解还要透彻。私营企业看重的就是大数据的预测功能。

中国在海外有巨额投资,包括像伊拉克、缅甸那样的国家。一般人都知道,那些国家是投资的高风险国家。那我们在投资前是否进行过投资风险分析呢?有相关的数据吗?2014年中国与俄罗斯签订了巨额的天然气交易。这项交易涉及近期和远期的风险,我想中国政府的智囊一定进行过类似的分析和预测。今天有了大数据,使类似的预测更加容易和准确。

在地方政府这个层次,大数据起作用的地方更是不胜枚举。大数据可以为政府决策在许多方面提供预测,比如食品安全、一个特定地区内的治安情况、传染病,等等。利用大数据,地方政府还能够了解居民最近关心的是什么。

对于一个普通网民来说,虽然不知道大数据这个概念,但当他在网上查寻某一商品时,就已经浸泡在大数据中了。

二、地方政府与大数据

政府的数据有一个重要的特点:由于政府在社会运作和发展中的特殊地位,政府是最具有权威性的数据源。政府在运作中产生的数据涉及面非常广,从有关居民的数据到道路建筑、维修的数据;从每户的房产信息到使用救护车的记录;从欠费的记录到申请住房改造的许可证记录,等等。因为中国政府功能覆盖面非常广,这个特点尤为突出。政府掌握的数据已经构成了一个小规模的大数据。

1. 大数据与分享

大数据形成条件之一是就大量纷乱无章的数据进行的高度分享。“纷乱无章”是指数据在公共共享平台上的无组织状态。这也就是百度和谷歌那样的搜索引擎起作用的基础。这些搜索引擎将杂乱无序的数据按照人们的需求在网上找,并按照某种规则(价钱的高低、重要性等)展现出来。

换言之,大数据的功能就是替人们到比宇宙还要大的数据海洋里,从那些独立的,但又在公共平台上分享的数据中找出所需要的答案。分享和公共平台在下面有关政府的讨论中非常重要。在工商企业的世界里,让消费者最大程度上知晓自己的经营状况,发展方向,商品种类、质量、价格是市场营销的关键。所以,对于私营工商企业来说,分享便成为生死攸关的一个环节;不但分享,而且利用技术“强迫分享”,将商业信息推到公众眼前,形成大量的垃圾广告。

2. 目前政府数据管理的状态

在政府的运作领域中,我们看到的却是一幅不同的图画:政府机构基本上不分享自己手中的信息!从两个方面看这个问题。第一,中国政府机构的最大特点之一是组织机构中的条条块块。这里说的“条条块块”是指一个政府部门有纵向和横向两个上级机关。比如,某直辖市的市财政局既是那个市人民政府的组成部分,同时在与中央财政部有业务的上下级关系。在这样的组织结构中,各个功能部门之间的信息分享几乎不存在,在IT领域中被称为信息孤岛 (Data Silos)的数据管理方式。虽然服务的对象是相同的,但相同数据会被反复采集重复储存。比如,在诸多的政府部门中,公安局掌握着最大量的有关居民的数据。同时,消防队、规划部门、房管部门、发证部门也在从不同的角度采集储存有关居民的数据。

以公安、消防、医疗急救这三大公共安全运作的核心部门为例。绝大多数美国地方政府中的这三大运作的数据是综合使用的,统一归属信息部负责管理。而中国的情况呢,公安属于地方政府和公安部,消防系统为武警,医疗急救属于卫生局。三方之间没有分享数据的机制。

第二,即便是同一个运作程序中的两个部门之间也没有分享信息。比如,一家新开业的电器商店周末在门前举办大型促销活动(充气拱门,舞台演唱),这类沿街占用公共走道的活动需要有许可证。但由于综合执法人员不能接触许可证系统,他们在巡查时并不了解眼前的活动主办方是否申请并得到了许可证。许可证颁发机构与综合执法机构信息脱节为综合执法运作带来极大的困难。在公安局的运作中,交警没有接触犯罪记录档案的权限。当他们在马路执勤将一个违章车辆截住时,对驾驶员毫无了解。

3. 缺乏对综合数据管理的认识

条条块块的政府机构设置并不是近20年才有的。但随着计算机技术的高速发展,政府机构的设置并没有随着新技术的发展而改变。尤其当互联网技术被工商业采纳并颠覆了其基本运作方式的同时,我们并没有看到政府提供服务的基本模式有革命性改变。

政府似乎也看到了一些提高服务质量的机会。许多城市的政府修建并设置了综合服务中心,将原来手续繁杂,需要多个公章的办证的职能集中到一个办公地点,极大地方便了群众。但是,如此便民的措施恰恰反映出对信息技术缺乏理解。在计算机技术,特别是互联网技术出现之前,如果设置如此的服务中心的确是一个好办法。但在今天的技术环境下,将所有相关的机构聚集到一起综合办公已无必要。今天的技术可以将所有的政府运作程序搬到网上,由系统按照事先设计好的程序步骤将事情办好。网上的虚拟中心,高效、节省资金。信息技术拆掉了各个政府部门之间的墙,将政府各个部门的数据统一管理起来。数据的统一管理是数据分享的必要条件。

最近,中国的李克强总理对中国证件管理混乱和手续繁杂的现象提出了严厉的批评。这就是“证明我妈是我妈”的问题。随着总理的批评,各个政府部们提出各种办法解决总理提到的问题。但没有任何一位部门领导提到问题的关键:中国政府数据的分享。

在美国,在很多情况下人们需要证明“我妈是我妈”,比如继承遗产、丧假、健康保险,等等。问题关键是政府如何提供相关的证明。以“无犯罪记录”证明为例。在美国,一个人可以凭自己驾照到全美任何一个警察局,要求出具无犯罪记录的证明。警员就可以帮你按指纹,然后到联邦的数据库里查证,提供相关的证明。我们那里的警察局为这项服务只收5美元手续费。这样的服务要求地方警察局能够接触联邦的罪犯数据库。

三、地方政府从大数据获益之前得先过两关

由一般的数据库发展到利用大数据是一个长期的包括许多步骤的过程。就政府运作而言,大数据是一比较新颖的概念。而且在政府机构能够利用大数据改善决策质量之前必须先过两关:第一关,真正重视信息技术的作用,设置信息管理部和CIO (信息主管)一职并赋予这个部门实际综合管理权。第二关,拆掉各个部门之间的墙。

1. 真正重视信息技术的作用

根据我的观察,中国地方政府整体上在计算机技术应用水平比美国地方政府大约相差20年。比如,美国绝大部分地方政府都做到无纸办公,而且全方位的数据分享已不是问题。美国地方政府大约在20年前就已经认识到信息技术以及数据分享的重要性,将信息技术的管理提到战略发展的高度,设置信息部和CIO一职,并赋予这个部门真正的管理权力。特别当美国经济下滑地方政府遭遇财政危机的时候,信息技术的作用凸显。

而中国的现状是,市县级地方政府仅设有信息办公室,负责本机关的计算机购买、安装、平时的技术支持。这个信息办的负责人的职位远远低于其他运作部门,决策权则更少。很可惜,当私营工商企业中都设有信息部门和CIO或者CTO(信息技术主管)一职时,政府机构却没有看到其重要性。政府CIO可以使各项信息技术的项目——包括数据整合和将来大数据的应用——成为一个长期的,具有战略性的任务,而不运动式的临时项目。政府组织需要职业的信息技术的领头人。

政府CIO必须具备的职业质量以及知识深度和广度非常特殊,需要我们另撰文讨论,在此不多谈。

2. 拆墙与综合数据

我们说要拆掉各个部门之间的墙,并不是要重组政府机构,而是从政策层面消灭信息孤岛,使得各部门之间的数据可以按需全方位流动。

让数据在各个部门之间流动会遇到几个方面的阻力。第一是各个部门不愿意分享自己手中信息,借口有多种,诸如机构条条块块之间的不同政策、数据的保密性,等等。第二是在信息孤岛长期存在的情况下,各两类数据之间的对接问题。第三是人员接触各类信息的权限以及数据安全问题。第一个是意识问题,最难解决。第二、第三是技术问题,好解决。

在数据综合这个问题上,仅仅靠某个市政府CIO的努力是不够的,必须在中央政府层面开始做工作。综合数据对于政府的运作来说至关重要,在各个部门之间(包括公安、消防、医疗急救三大政府运作)进行数据的分享使用需要有中央政府的支持。今年早些时候,广东省就出台了《2015年广东大数据行动计划》。数据整合是高效政府管理和服务的要求,只有当政府数据被综合起来,才能形成大数据。

*    *    *   *    *    *   *    *    *   *    *    *

数据整合仅仅是走向大数据的第一步。成功地将数据整合起来统一管理使用并不是大数据,而仅仅是一个大的数据库。前文提到的广东省搞的大数据计划,从计划本身看它更像是一个数据整合的计划,或说是一个本文讨论过的“拆墙”计划。这里似乎有一个对大数据认识上的差距。

另外,政府搞大数据还带出来一个的问题:如何与社会分享自己手中的大型数据库。政府运作产生的数据是公共信息。如果政府能将手中的数据在公共平台上与社会分享,那将大大推动社会对大数据的利用。与公民分享公共信息是政府的责任。

 

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");