李未:大数据的四面体模型

标签:大数据软件李未

访客:22523  发表于:2014-04-20 13:43:34

【院士简介】

李未,中国科学院院士,计算机专家。从事并发程序语言的结构操作语义方法、翻译理论和实现技术研究。解决了实用并发语言的复杂语法结构的语义问题,在建立并发语言的翻译和比较研究理论方面取得了开创性研究成果。

李未:大数据的四面体模型

关于大数据

对于大数据,李未院士认为软件产业经历了三次浪潮,第一是结构化数据+算法,其主要基础软件是操作系统如Windows与数据库;第二是半结构化数据+搜索,形成了诸多搜索引擎如百度、Google如亚马逊;第三是非结构化数据服务+即时服务,代表是非结构化数据管理系统和集成的各种服务。李未院士指出未来90%的数据将是非结构化数据,而且增长迅猛,针对非结构化数据建立新型数据模型是非结构化数据管理系统的关键,增加了智能化处理、关联化检索以及知识挖掘等数据模型要实现深度提取和共享,需要新的改变。

李未院士提出四面体模型(即基本属性刻面、语义特征刻面、底层特征刻面、原始数据刻面),以统一数据模型为突破口,结合文本图象,图形、音频、视频的特性实现新型非结构化数据的管理系统。四面体模型具有完备、关联、集成、可扩展等特性,易于实现对超量的非结构化数据创建、维护与管理,可以成为非结构化数据模型的标准,必须使用群体软件工程的理念和技术来生成、管理和维护非结构化数据。

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");