大数据时代,电商O2O用户数据挖掘

标签:大数据数据分析O2O数据挖掘电商

访客:39960  发表于:2014-09-25 15:01:28

目前 O2O电商与社交网络和移动终端紧密结合,从而爆发式增长的 O2O 电商数据与数据的社会化在很大程度上模糊了 O2O 电商企业数据的边界,这些由用户创造的海量数据远远超越了目前人力所能处理的范畴。庞大的数据量使得数据过载、数据冗余、数据捕获成本快速增长、数据价值不易获得成为O2O电子商务面临的新问题。在大数据时代,电商O2O用户的数据挖掘非常重要。



 大数据时代O2O电商用户数据特征分析

  相比传统的电子商务数据,O2O 用户数据并不仅仅局限于平台数据,即用户在 O2O 的交易数据,还包括了社交网络、用户移动终端的地理位置等数据。

  ( 1) 体量大。 不少的O2O电商企业每日所产生的用户数据已经达到TB级。 在融入了社交网络和移动互联网的O2O电子商务中,O2O用户数据已不仅仅是用户交易数据,它拥有更加广泛的数据源,其数据规模会从TB级跃升到PB甚至是EB级。未来企业会将更多的TB级数据应用于商务智能和商务分析。

  ( 2) 类型多。 O2O 用户数据类型复杂。 它并不仅限于 O2O 用户基本资料、用户消费记录、电商企业内部业务信息等海量的结构化和半结构化数据,还包括用户评论等反馈数据、用户 O2O 平台行为记录、移动终端数据和社交媒体等非结构数据。

  ( 3) 速率快。 O2O 模式对用户数据实时处理有着极高的要求: 用户数据伴随用户行为产生,这些数据往往是高速实时数据流,例如用户在线下商家的消费情况、用户的地理位置和移动方向等,而且O2O 业务周期短,这需要实时的分析用户数据并根据分析结果对用户进行个性化服务,通过传统的数据库查询方式得到的“当前结果”很可能已经没有价值。

  ( 4) 价值高。 O2O 用户数据有着巨大的商业价值。用户是 O2O 业务的核心,对用户进行预测分析与深度复杂分析,对 O2O 电商企业无疑有着重大的价值,但庞大而繁杂的不相关用户数据,这也决定了其价值密度低的特性。


 大数据时代 O2O 电商用户数据挖掘流程与方法


流程

 O2O 电商用户数据挖掘着重解决这样一个问题: 在大数据中,分析各用户群体的特点,进而分析用户个人特点,获得有价值的知识,从而获取商业价值。数据挖掘流程包括: 数据收集、数据准备、数据转化、数据抽取、数据挖掘、挖掘应用。

 (1) 数据收集。 O2O 用户数据源包括 O2O 平台的用户数据等。 用户数据以“流”的形式创造,由于3个数据源之间有交互,且其数据内容往往交叉,所以按照交易、互动及观测数据进行分类,然后通过Needlebase 等工具在用户消费的过程或其它行为中收集。

 (2) 数据预处理。 数据预处理包括了数据准备、数据转化及数据抽取。 数据预处理决定了挖掘结果的质量,从某种程度上来看,数据预处理往往左右着数据挖掘的成败。

 (3) 数据挖掘及其应用。 在数据挖掘过程中,根据不同的应用需求选择不同的挖掘模型,对数据进行深度挖掘。 其中主要模型有: 关联规则分析、分类分析、聚类分析等。  

方法


  O2O 电商用户数据挖掘的方法主要有关联规则分析、分类与聚类分析、社会网络分析、变化与偏差分析。

     (1) 关联规则分析。 关联可分为简单关联、时序关联、因果关联。 在 O2O 模式中,通过对用户数据进行挖掘,可以从大量的记录中发现其关联关系,找出影响用户行为的关键因素,为用户需求、用户细分、风险评估和诈骗预测等决策支持提供参考依据。

  (2) 分类与聚类分析。 分类是找出数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据项映射到某个给定的类别。它可以应用到 O2O 用户的分类、用户属性和特征分析、用户满意度分析、用户购买趋势预测等。在 O2O 用户数据挖掘中,聚类分析是细分市场的有效工具,被用来发现不同的客户群,研究消费者行为,并且通过购买模式刻画不同的客户群体特征。 它可以应用到 O2O 用户个体归类、用户背景与兴趣分析、用户购买趋势预测等。

  (3) 社会网络分析。 主要分析不同社会单位( 个体、群体或社会) 所构成的关系结构及其属性。 它关注 O2O 用户之间的关系而非用户的属性,通过研究用户之间的关系借以描述和测量通过这些关系流动的各种有形或无形的东西,如信息、资源等。

  (4) 变化和偏差分析。 变化和偏差分析包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。 它可以应用到 O2O用户异常信息的发现、分析、识别、评价和用户流失预警等方面。




评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");