大数据说教:如何把大数据做“厚”?

标签:大数据厚数据

访客:75274  发表于:2014-06-11 14:52:48

(本文发自大数据圈,更多精彩内容,请加入大数据圈http://www.cio.com.cn/group/home/23

在大数据时代,营销者面对的课题是如何在网络上识别一群有共同属性的目标人群,同时还要描述出特定人群中某个人的特征和行为。这个巨大的挑战源于不知道谁在电脑的那一端,在不知道名姓、联系方式的情况下,通过行为识别所构建的数据模型来判断一个人的性别、兴趣、年龄、爱好和需求,以此实现精准营销。那么数据是如何在行为识别中发挥作用的呢?

大数据说教:如何把大数据做“厚”?

有一个有趣的例子可以说明大数据在实际应用中之“混沌”。在阿里巴巴的数据后台,尽管大部分用户在注册时几乎都填写了自己的“性别”,但在实际操作分类和定向营销中,阿里巴巴设定了18个“性别”标签。这样的分类是基于用户在不同场景中的不同表现做出的。比如:虽然你是一位女性,但你也可能在给你的男朋友或者父亲买东西。或者通常女性更喜欢看服装饰品,可你更喜欢常被设定在男性消费品类别下的数码产品或者游戏消费。

所以,你在注册信息中填写的“性别”是一种固定信息,也就是传统的“小”数据,这些数据是结构化的数据。这个数据虽然很重要,但却是静态数据,不能完整地描述你的搜索和购物行为。要把数据激活,就需要把静态数据变成动态数据,这需要借助场景来验证。阿里巴巴副总裁车品觉说:“同样的人在搜索商品时可能会表现出不一样的行为特点,而这些不一样的行为就是场景,结合场景应用数据就是‘活’数据。”

在人文学科看来,大数据其实是一个“薄”数据的总集合。“薄”数据是对我们日常的行为描述。例如,我们每天旅游的线路、我们在互联网上的搜索痕迹、我们的睡眠时长、我们与朋友的交流、我们钟爱的音乐,等等……这些数据都在你的浏览器上留有痕迹,在你的手机定位系统中留有踪迹,在你手腕的智能腕带上留有行迹。

当大数据技术不断发展完善之后,人们发现那些留在网上的数字足迹,也就是常说的cookie可以勾勒出一定的行为特征和个人喜好,而给这些特征和喜好分类的就是“数据标签”。于是一些公司通过收集数据来找到对公司产品和服务有特定兴趣的人群。寻找消费者和提供个性化体验需要对人们随机的网上行为加以分类,给这些行为一个标签。一个人的标签越多,对他的行为描述也会越精细。

毫无疑问,人们日常的行为至关重要,但这并不意味着大数据的全部。为了更深刻地理解人们的日常行为,我们必须要得到学者眼中的“厚”数据,即运用日常的生活“经验”去理解人类行为。“厚”数据不单单关注事件与行为本身,还要去关注事件发生的背景与原因。

大数据不必精确,首先要接受它的“混杂性”

在传统的小数据时代,企业要做出决策,需要在数据的规模化搜集与整理上下很大功夫。首先要选取准确的样本源,其次随机抽取,再尽可能详细地记录抽取样本的一切细节,进而做出判断。然而,样本的抽取本身存在着大量的缺陷和隐患。首先采样的随机性非常困难,而且分析过程中的偏见也无法避免,结果会相去甚远。

在大数据时代,我们首先要打破的就是对“精确性”的执着。现在,用户姓甚名谁已经不再重要,重要的是发现他们的行为轨迹。比如,过去我们对数据分类的关注点会放在:家庭地址、基本人口、年龄、婚姻状况、子女、居住地、工作单位这些信息上。这些都是“静态数据”。

而大数据搜集的是消费者的“动态数据”。首先是购买产品的信息、何时购买、在哪些地点购买。其次是寻购数据,指用户有潜在需求但还没有购买的产品。这些可以通过大量动态标签的识别,在用户上网浏览网页的过程中捕捉到,这些信息都将对企业产生价值。第三是体验数据。客户购买之后的评价会影响品牌的忠诚度。体验数据涉及语义分析。比如想了解用户对公司品牌正面还是负面反馈,可以通过太糟糕、太贵这一类负面词语中的“太”、“糟糕”等。

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");