韩凯:微软的大数据思考

标签:大数据微软中国技术商业论坛

访客:29824  发表于:2013-11-21 19:42:16

【导读】我有大数据吗?我能有大数据吗?当你看完微软技术中心技术架构师韩凯在“2013中国技术商业论坛”上对这两个问题的分享,或将找到属于自己的答案。

韩凯:微软的大数据思路

我们谈到大数据的时候,通常会讲到怎么定义大数据?

通常的说法是,大数据应该有“3个V”——volume,velocity,variety,即数据量大、反应速度快和多样性。技术部门在管控时面临的挑战是第二个,反应速度快。

最初我们数量比较小,反应速度也比较快,后来发展到一定程度,数据量非常大,再后来是开源社区,数据量不仅变得很大,而结构非常复杂。那么,大数据是如何产生的呢?

【大数据之源】

在微软技术中心技术架构师韩凯看来,第一是车载数据。比如在美国福特车载里面,除了娱乐系统,实际上本身车辆载的传感器,实时跟踪车辆的健康状态,出厂时,预定了振动模式留下来,和它进行比对。如果振动模式发生改变,就可以分析这辆车在车主是否需要进行维护。

大家经常短信、发E-mail和微信,每个人都会遇到时间、地点等问题。你拿手机拍照,本身照片有时间,如果手机有GPS,照片也可以有定位信息系统,网站则可以把这张照片放到你拍照的地方。

RFID(射频识别技术)已经存在很长一段时间了,SMARTGRID即智能电网,国内已经开始试用。它能实时监控你家里的用电量,分析哪些与你生活习惯相关,并推荐给你一些用电方式。比如说用电高峰时,有的地方实施动态电价,你可能不知道。再比如,大家下班煮饭时,这时候电最贵。如果你在下班前把家里的空调打开的话,那时价钱则比较便宜。

每个传感器单独存在没有意义,只有把所有传感器合在一起进行分析,才会产生价值。咱们通常说的物联网,准确翻译应该是人联网加物联网。Telemetry是远程监控,更高层应用是在你的应用上内嵌跟踪。微软Xbox360现作为第一大游戏平台,它是怎么实现的?其背后有大数据的支持。大家玩游戏的时候,都会寻求最高的体验,让你忘了时间,如何达到这一点?不能让游戏玩家在玩的时候感觉太难,也不能觉得太容易。怎么办?跟踪用户的使用,在他觉得太难时就降低难度,觉得太容易时就增加难度。

数据跟踪,要分析数据产生洞察力才能有价值。有些常见的应用,比如查找和你现有的东西相关或者相类似的东西,在国外很多学院已经实施了这套系统。每个学生写的论文,提交给老师之前已经经过系统过滤,会自动查找是不是有重复或者抄袭。

还有一种应用比如说推荐,这非常常见。在电商网站上,这非常重要,即找到跟你有类似特性的群体,然后根据不同的群体,进行针对性的促销。另外一个应用就是健康,在健康领域,可以通过DNA片段,可能产生某种疾病的共同特性。

最后是社交网络。从国外来看,社交网络是内部的知识传播,比竖状结构传播能力更有效。第二对外市场推广或者进行市场推销,这是国内应用比较多的。

【微软的大数据思路】

我有大数据吗?你肯定有大数据。从刚才3V来说,有一个V是适合你的。比如说数据量,对每个人来说,你的处理能力处理不了这个数据,对你来讲就是大数据。微软的平台从3V角度提供支撑。背后传统数据仓库架构,你有你的生产环境,抽取到数据仓库建模进行分析。

在大数据环境下,你要加入过去没有收集的数据,收集到比较便宜的数据存储或者平台上进行后面的分析。

以大家都会用到的Excel为例。今日Excel和以前不可同日而语。它要处理大量的数据,还要在它上面做视觉化的分析,可以把时间和地点放在一起,为微软虚拟云做3D化的分析。

目前微软从收集数据到数据分析再到最后的数据展示和数据分析,均已形成一连贯的平台。(顾琳琳/整理)

关于更多精彩内容,详见:中国技术商业论坛暨领袖峰会

评论(1)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");