大数据:应用创造价值

标签:电商技术商业热点数据社会大数据电商中国技术商业论坛及领袖峰会

访客:24939  发表于:2013-11-09 17:05:14

关于更多精彩内容,详见:中国技术商业论坛暨领袖峰会

 大数据:应用创造价值

           北京百分点信息科技有限公司运营副总裁 韩志勇


韩志勇:大家好,很高兴今天有机会作为最后一个嘉宾跟大家分享一些我们的感悟和想法。题目是推荐,不仅仅是算法。为什么作这个题目,是因为去年见很多客户的时候,要解释什么叫推荐,给他们讲为什么要推荐,什么是推荐,做概念的普及。今年我觉得靠一点,大多数的电商客户都知道有推荐,都知道推荐是跟搜索一样,成为电商网站不可或缺的部分。但是上来就会问我问题,你们的推荐是用什么算法,你们的算法是用什么方法算出来的。我想说推荐不是靠算法出来的,或者说算法不能解决所有的问题。

   百分点推荐引擎的三次演进。2011年我们退出第一个版本的时候就是算法,我们就是用一套技术算法实现推荐的逻辑。但当我们的服务的客户越来越多,应用的场景月落,我们发现单纯的算法在实践上面临很大挑战,所以在2012年的3、4月份,我们做了一个大的版本的演进,出了第二个版本。这个版本里面加了很多人工原因,到2012年下半年,去年年底的时候我们做了第三次大的版本演进,我们把整个架构重新再造,因为我们发现算法在一个推荐系统里面,只是其中的一个环节。

   算法是什么?算法是一种技术,但是算法并不是一个产品本身。我们认为推荐系统,它最终是要实现目的,是实现商业目的。推荐系统本身只是一种工具,就跟搜索一样,它只是一个工具,虽还是要实现商业的。算法是一个技术手段,而不是全部。合理利用规则或配置干预算法和推荐列表,是实现商业目的的必不可少的手段。

   讲一下我们看到的一些问题,如果是纯算法的推荐系统面临的挑战。这是我截了一封邮件,这个是专门做推荐系统的小组的内部邮件,比如说这里边提到了他们买一个男士的电脑背包的时候,不管踏勘什么样的背包,旁边都出现杜蕾斯,推荐系统里都会出现杜蕾斯,买婴儿奶粉的时候下面推荐的是男士的性感内裤,类似等等这种不靠谱的推荐,在电商的网站上,其实都会出现。那么从算法的角度来说,真的是一定不靠谱吗?未必。有很多种算法是可能算出这个结果的,避暑你说看电脑包的时候,正好在这个数据库里边,他他你温和到某一类人群的时候,这类人群在看电脑包的时候,恰恰看的最多的可能是杜蕾斯,所以在你的推荐里就会出现这样一个结果。因为我没有看过它的原代码,我没法判断它的算法是不是用错了,但是算法是有可能出现这样一得结果的。

   另外还有一个,其实我们最常见的可能性是什么?当你看笔记本电脑的时候,我应该给你推荐什么?有两个都是有可能的,一个是散热器,一个是电脑包,相对来说你看完笔记本电脑,再推荐笔记本电脑包是一个最合理的推荐结果,但是商家要求不允许推荐电脑包,为什么?电脑包是热销商品,不需要增加曝光,我恰恰需要推荐的是散热器,要增加常用商品的销量,这个是商家运营的战略要求,跟客户的体验不相关。从客户体验来说,我们最关心的是推荐热销商品。在这里面商家是希望能够曝光更多的长尾商品,算法得出的结果一定是电脑包在前面,有可能会出现散热器。

   我们怎么解决?我们进入了一个规则引擎。在算法引擎之上,我们加了一个规则引擎,用规则引擎限制算法引擎的结果。从两个方面发生,一个是输入端,限定算法覆盖的内容范围。适用于先验性规则或特定需要增加或减少曝光的商品。如:增加信频/活动商品曝光,禁止成人用品在其他频道出现。一个是输出端,调整内内容输出的优先顺序,适用于鲜艳性规则或特定需要增加/减少曝光的商品,如同品牌/品类优先,长尾/促销商品优先。

   我们看到第二个问题,推荐的算法,它总是会酸楚一定的结果,但这个结果跟消费者意图之间能否有效的匹配。我给大家举的这个例子,这个例子是7月份的时候很火的,叫棺材门事件。一个网友因为得知在淘宝上买骨灰盒都是包邮的,他点了点骨灰盒,然后在接下来的一个月里面,新浪微博一直给他推荐骨灰盒、棺材的信息,这是一种算法,关联的算法。但是它跟用户的需求不相关,因为他没有判断这个用户今天来的目的是什么,这个用户就是闲的。

   所以我们的解决方案,是在我们的算法上又加了一个环节,叫场景引擎。场景引擎是干吗?是实时判断用户及时的购物意图是什么。我们经常花很多时间去追踪我们识别的一个用户,他在所有网站的访问记录,他从进入一个网站到最终形成购买,整个过程。我们发现真正的消费者在网络消费行为的时候,他有可能一开始聚焦,我今天就想找一类商品。但是当把这个商品房到购物车之后他又开始发散,看看我能不能买其他的商品,在不断的转化过程中,我们应该用什么样的方式给他推荐?当这个用户在聚焦过程中,我应该捕获他及时的需求,我要告诉他这是你最好的选择,要不然告诉他你还有个更好的选择。当客户在发散的过程中的时候,在不确定目标、寻找目标的时候,我会告诉他你可能需要什么东西,告诉他你在里面挑一样吧,这是推荐的逻辑。

   其实除了发散和聚焦之外,我们把用户的购物场景分为这么六个部分,逛,毫无目的的逛;找,找某的品类、某个品牌;比;买;晒;享。在不同用户的场景下,它应该匹配不同的推荐。我们的目的是不一样的,举几个简单的例子。比如说这位女士她在逛,我们通过数据分析会分析出来这个用户她比较关注护肤品,曾经买过一些补水的商品,她在逛的情况下怎么办?到一个电商网站的时候,我们就会给她一些护肤品的推荐,其中会突出一些补水的用品,因为我是根据她的需求能够把一些商品找出来。如果他已经到比价的阶段,她就是想看玉兰油,玉兰油的补水商品,这个时候我如果判断出来她是在比价的过程中,我会给她推荐不同的组合、不同的套装,不同的规格,都是同样的商品,只是包装不同或者规格不同,应该促使客户做正确的选择,这是在不同的购物场景下,怎么样去影响客户,让用户最终能够形成一个决定。

   第三个挑战,不管推荐结果好还是不好,最终都要是打动用户的心。在你打动用户的心之前,首先你要获取用户的眼球,你如何能够得到用户的关注,并且让用户形成实际的点击去关注这个商品,这个是展示的问题。我们发现很多网站的推荐结果非常靠谱,没有什么问题,但是点击率很差,并不能带来有效的点击流量,商品的曝光,为什么?展示的问题。我举个极端的例子,这都是我们在旅游网站里面能够看到的推荐位,左边这个是非常传统的推荐位的样式,上面是图片下面是文字,右边比较少见一点,这是旅游网站里非常典型的推荐栏。我们传统的这叫墓碑状的推荐,当用户如果没有确定目的地的时候,左边这个推荐栏是有效的,因为大家会去通过图片吸引我去选择哪个目的地,但是如果用户已经确定目的地的情况下,右边这个推荐是有效的,为什么?因为当我确定目的地的时候,左边这个图片对我的影响已经很小了,再好的图片对我影响不大,我更想看到的是行程的安排、九鼎、价格,几天,是否双飞等等,这个是价值点。如果一个用户在聚焦的过程中你再给他看这么多的图片,其实浪费你的网页的图片,没有传递有效的信息。

   所以我们又引入了一个展示的引擎,最终展现的时候引入一个展示引擎,它会根据用户场景、关注的焦点,选择合适的展示方式,这里面我们会选择合适的展示模板、恰当的展示焦点、恰当的展示位置等等。

   这就是一个完整的百分点现在已经在运行的一个完整的个性化推荐的架构。当然在这个架构上,我们能够提供的已经不仅仅是在推荐,其实百分点在做推荐的基础上什么?我们打通了一个用户在所有的合作伙伴网站上的用户行为,不管它是A客户还是B客户在网站上有浏览行为,我会做整体的计算,我打通所有的用户行为,这是第一。第二,我根据这个用户在所有的网站上的用户行为去判断他的消费偏好是什么,我会给任何一个用户判断他的偏好度,他喜欢还是不喜欢,喜欢的程度是怎样的,我们自己建的内幕是13000多个叶子内幕,覆盖中国99%的商品,我们会每个商品都去判断这个用户他对这个商品本身的偏好度,所以在每个用户背后,我们现在覆盖了中国差不多3个亿的网购用户,每个用户背后至少有100个标签。

   基于消费者偏好,形成一个消费者用户画像,这个画像是可以帮助商家更好理解消费者喜欢什么。另外因为有了这套个性的画像,我们就可以个性化的推送相关内容和资讯,这是我们做的个性化邮件的模板,当然我们也可以支持程序购买的广告。我们现在已经和一些商家在一起合作,帮他们对接DSP,提高他们在RD广告商头的精准度,这都是通过推荐架构本身可以延伸出来的服务。

   今天的分享就到这里,谢谢大家。

关于更多精彩内容,详见:中国技术商业论坛暨领袖峰会

上一篇:#数据社会#
下一篇:#数据社会#

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");