中科院黎建辉:发展科学大数据要有开放性共识

标签:大数据黎建辉中科院

访客:25905  发表于:2015-09-06 10:24:16

科学数据已不是一个陌生的话题,大数据时代的来临,正在深刻变革着人们的生产与生活。大数据呈现何种趋势?如何探索大数据服务的大众创业?面临的困难又有哪 些?近日,中科院计算机网络信息中心科学数据中心主任黎建辉接受记者采访时表示,萌芽状态的科学大数据,最迫切需要建立方法论做指导,而发展科学数据,则 要有开放性共识。

中科院黎建辉:发展科学大数据 要有开放性共识

黎建辉说,大数据产生本身是一件自然的事情。如今,获取数据的方法和手段有很多,比如在自然科学研究里,调查、采样、分析、实验、仪器设备产生的数据, 还有互联网、移动互联网、物联网等手段获取。在科学研究方面,科研的大数据较其他大数据不一样的地方在于数据的来源,这是科学家在科学数据去设计实验、观 测来的。

实际上,另一个趋势在科研的过程里,大家在用新的方法处理数据,在用大数据的方法来做科学研究。中国科学院院士徐宗本曾总结过大数据带的几个方面,自然科学的研究会有新的科研方法和模式,社会科学会逐步走向量化,从而带来产业的发展和技术的发展。

“回到科学大数据的层面来讲,我们需要用大数据基本的方法论来指导我们怎么去面对海量大规模的数据,快速的发现科学的知识,得到一些科学的发现。”黎建 辉称,逐步从大数据向数据科学的角度考虑,科学本身是要以数据说话的,以前的数据是先做假设,然后选择需要的数据再得出一个结论。

现在,我们不一定一开始就有一个假设,我们从一些数据中寻找启发点再去做实验,把很多相关的数据利用到一起,分析后得到一些新的发现。所以,有一个观点 是,科学研究进入到大数据时代,是一个科学大数据的现象、科研方法和模式,逐步的已经开始在呈现,这是一个革命性的东西,可能会改变我们对科学研究的范 式。

“截至目前,在数据下的研究可能是一种新的方式,这是个方向,是个趋势,但到底有什么样的特点、什么样的理论和指导,还在具体探索中。”

面对“互联网+”万众创新的时代号召,我们应如何积极探索大数据服务的大众创业?黎建辉认为,科学数据的共享性不是完全开阔的。而在所有的数据里面开放 性最好的就是互联网,所以说用这些数据,再去加工成知识的产品,是一种很好的传播方式。首先,对科学界来讲,我认为大家要有这种开放共识,不要把科学数据 仅仅局限于做科研,要用一种好的方式逐步开放出来,让更多的人去获取它。其次,政府要用相关的政策保护、鼓励科学家开放数据。第三,现如今在在创新创业的 氛围中,大家更多关注的是互联网,所以现在从事大数据领域的相对较少。但因为本身要求的起点比较高,只要是抓住了某个点,一旦做起来,别人想模仿也比较 难。

目前要推大数据,从数据、科学与丝绸之路经济带来看,有数据有科学,丝绸之路经济带就是为国家科学战略做服务。创新创业、“互联网+”怎么去做服务?落实到行动方面,在科学界尽到自己的责任开放数据后,国家有什么好的政策去引导企业做示范性的工作,这一点,很重要。

从技术科学研究来讲,作为大数据基本的理论方法,会对原来的计算方法、数学、统计学会带来新的认识。

在真正的技术层面,现在也有一些架构和处理方法。最困难的是:首先,从科研的角度来考虑,对科学家的要求越来越高,对未来科学家的素质有新的挑战,未来 的科学家要逐步朝着数据科学家发展,有很好的数学、计算机的素养,加上专业知识,才能更好的做研究,这是一个理想的状态。其次,如果这方面很难实现,那可 以科学领域之间进行交叉合作,但这也是一个很大的难题。第三,科学大数据现如今没有一个方法论去做指导,还需要不断的尝试。第四,科学家的工具,因为这方 面工具应用比较窄,没有专门的工具去支持科学家做研究。

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");