【张卡尔面对大数据 - 12】西尔斯的大数据(2)

标签:大数据服务器电子商务数据仓库

访客:36626  发表于:2013-04-02 01:37:51

2011年,西尔斯开始了一个名为《你的购物方式》的会员制计划。这是一个一共有5个部分的战略的一部分,试图让这件公司回到正常的轨道上来。这个机会的幕后是一个前沿的驱动大数据趋势的高度规模化和开源的Apache Hadoop实施的数据处理平台。尽管西尔斯作为零售商店名声并不是很前沿,这间公司在使用大数据方面可是一个创新者。

西尔斯在大型主机、Teradata和SAS服务器上面用于分析其忠诚俱乐部会员的市场攻势的过程曾经需要6周才能计算完成。在Hadoop上面运行的新过程可以每周完成。对于某些在线和移动商务的场景,西尔斯目前已经可以每天都进行分析。更近一步,现在的目标可以更加细粒度。有些情况下,可以细致到个体用户。旧的模型只是使用了可以获得的数据的10%,新模型使用了100%的数据。

一向以来,数据仓库的圣杯是把所有的数据汇集到一处,使得你可以使用大的数据集来运行大模型。但是,无论是经济上,还是技术能力上,这都不那么可行。西尔斯以前一般保留90天到2年那么多的历史数据。使用Hadoop之后,西尔斯可以保留所有的数据。这个非常至关重要。西尔斯不再需要把有意义的数据归档或者删除。

目前,举个来说,西尔斯仍然是美国最大的家用电器的零售商和服务商,这使得西尔斯具有一个强有力的地位来理解顾客的需要、服务的趋势、保修的问题、等等。但是,在使用可以得到的数据方面,西尔斯一直只是在抓挠表面。

Hadoop来了。这是一个开源的数据处理平台。这个平台的被采用是基于两个有力的承诺:与常规关系数据库相对比的超高的规模化和低成本。按照西尔斯的说法,一个200TB的Hadoop系统的成本只是一个200TB的关系平台的1/3。而且,当规模扩展到PB尺度的时候,这种成本差别还将相对增加。利用Hadoop的大规模并行处理能力,对于西尔斯来说,处理1亿条记录与处理20亿条记录,只不过是多几分钟运算时间的差别。

Hadoop的不足之处在于这是一个许多IT部门仍然为之困惑的不成熟的平台,并且,Hadoop的人才稀缺。西尔斯学习Hadoop时相当艰难,主要通过尝试和错误。当西尔斯在2010年早期拥抱这个平台的时候,几乎没有什么可以获得的外部专家来指导其工作。

如今的西尔斯由于它的在美国和印度的员工具有大数据经验而被人羡慕。事实上,Shelley博士目前正在领导一个西尔斯的子公司,MetaScale。这个公司正在鼓吹提供服务来帮助零售行业以外的公司们使用Hadoop。MetaScale将借助于西尔斯在芝加哥和底特律的数据中心,就好象亚马逊的Web服务商利用了亚马逊自己的大规模电子商务计算能力。

为了让读者更加理解西尔斯的大数据工作,我也计划在这个系列文章里面介绍一下一下西尔斯的历史和及其零售业务。

历史上,这间公司以目录邮购出名。西尔斯的第一本邮购目录出版于1888年。到了1894年,西尔斯的邮购目录已经有322页,包括缝纫机、自行车、运动商品、汽车以及其它的一些新品种。然后,洋娃娃、火炉和杂货也刊登在目录上面。左边的这个图片,就是当时西尔斯的名为《每个女人都欣赏的广告》的邮购目录一页。

很快的,西尔斯有了一个产品品质和顾客满意度的好名声。1895年,该公司的邮购目录增长到532页。1893年,销售额达到40万美元,2年后,更达到了75万美元。如果折换成当今的美元,这个是相当可观的金额。

1906年,西尔斯开设了自己的邮购目录工厂,并且建造了当年占地约17万平方米的西尔斯楼群,包括著名的西尔斯商业大厦塔楼和西尔斯的管理大楼。右图是西尔斯商业大厦塔楼。这个塔楼目前是美国的国家历史建筑。

同时,西尔斯的邮购目录被同行们视为消费者的圣经。1933年,西尔斯在其年度的圣诞目录之外,又出版了著名的名为《西尔斯愿望之书》的圣诞节目录的第一本,主要是提供玩具和礼品。西尔斯的目录当年也被人们当作厕所手纸的同义词,特别是对那些乡村贫民。可以想象,当时的物质生活水平下,大规模免费寄送的大厚本的西尔斯邮购目录,在被人们阅读之后,也被当作手纸应急。

我记得我自己就曾经去索取过西尔斯的邮购目录。当时已经不是大规模派送了。西尔斯已经到处都有实体店面。但是我还是喜欢浏览西尔斯目录上面的那些有趣的商品。就像现在的国际航班上提供的商品目录里面,经常可以发现意外的巧妙玩意儿。

当年的西尔斯,通过邮购这种革命性的零售方式,让每个各地的人群,在邮购购物上,同样方便实惠。那时的西尔斯,曾经就是如今的亚马逊那么新潮俊俏。看看下面的图片: 精美丝绸。注意,那原价1美元39美分折扣价90美分的价格,只是销售服装,并不包括那些经典美女。据我所知,西尔斯似乎从来没有从事过邮购新娘的业务。


评论(1)

您可以在评论框内@您的好友一起参与讨论!

    1. 徐蕊 2011年,也就是说美国零售业开始利用大数据也是近几年的事情?而且您提到他们会删除数据,但我想中国零售业没有删数据,只是说他们收集的数据都不标准,杂乱无章,丝毫不能从中提取信息。您说这怎办那?

      回复[7] 2013/04/02 09:14

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");