我在"2012海量数据来袭,CIO你准备好了吗 ——对话探寻“上帝粒子”幕后的IT英雄" 的在线访谈中提问

访客:18577  发表于:2012-12-19 15:26:23

我又来提问了:不好意思,我不是混奖品的,实在是我们在大数据的运用中有太多的问题是高喊大数据概念厂商无法解决的。 正文:(数据存储问题)在大数据应用中我们采集了很多与业务并不直接相关,但又有很强关联性、指向性的数据,这些数据会包括:微博的热度、转发情况、百度关键词搜素率、相关联关键词的匹配情况、同时还有某区域项目的车流量变化、客流量变化、以及消费客群的消费状况变化数据,当我们集合这些数据时发现,这些数据既有结构型的也有非结构性的,既有开放型的也有非开放型的。而对于这些不规则数据如何进行数据结构优化,进行数据结构化、数据目录化存储,提高数据分析的效率是一大问题。请诸位专家可否从数据结构优化,数据存储架构,以及存储索引等方面谈谈可以借鉴的经验。

活动专题:http://www.cio.com.cn/event/detail/146

评论(1)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");