从天猫“数据门”看互联网的假数据

标签:天猫数据门

访客:15825  发表于:2014-10-14 15:06:57

【导读】双十一在即。在我印象中,每年双十一都会有大量的媒体被邀请到杭州观看漂亮绚丽的曲线图,今年双十一销售额会突破多少亿?悬念未解,但我只有一个期望,那就是,数据是接近真实的,工程师别再犯错。

从天猫“数据门”看互联网的假数据

锤子手机再掀波澜,从富士康到Zealer再到天猫,神一样存在的锤子总是一次又一次给小伙伴带来麻烦,这次轮到了宇宙第一大电商公司阿里巴巴旗下的天猫。锤子4G手机在天猫页面的真实预约数被乘以3,发现这个规律的是毕业自蓝翔的机械从业者“左岸的小熊”。

不是临时工,是工程师干的

天猫随后官方澄清这一失误是工程师所为。明眼人一看都知道,这官方澄清就是一个卖萌的笑话,如果给技术部门审核人家可能会不答应。与百度比肩的中国最强大的大数据公司却无法处理好生产环境的在线预约数这样的关键数据,错误调用一个接口就会让生产数据清零,测试呢?部署呢?容错呢?备灾呢?注意,是生产环境!这让阿里各大技术部门脸往哪里搁?看到这里,我小心翼翼点开我那为数不多的放到余额宝的积蓄,看看是否被错误调用接口清零了。

更贻笑大方的是,如果工程师犯错之后要擅自恢复数据将预约数乘以3,显然也不能解决清零的问题。乘以3的行为不会追平某个数据恢复正常,而是会不断拉大真实预约数与展示预约数的差距。显然,继临时工之后,互联网行业“工程师”取而代之。因为对于普通用户来说,扯到数据接口、紧急修复、数据清零、程序BUG这些“专业名词”大都会不明觉厉,无法继续思考下去,一切似乎都可以遮掩过去。

数据注水已成互联网潜规则

越来越多的“蓝翔哥”站出来在知乎揭露了“预约下单页面”的预约人数“操作”。据知乎网友反馈,就在天猫电器城,诺基亚、金立等手机预约下单页面也有类似的数据操作迹象。实际上,阿里大可不必着急,因为更多网友是用自己在不同电商公司的亲身经历来披露运营为了实现目标对数据进行操作已是潜规则,工程师只有配合的份,这再次印证在电商公司技术就是支撑而非核心,电子商务严格意义上并不算互联网公司的真理。

近年来电商预约玩法越来越多,平台和厂商乐此不彼。与团购、闪购等玩法类似,预约均是在某个指定时间段类吸引注意力来实现一种特别的营销效果。用户交钱的预售,比如小米数据还相对真实可靠;不需交钱的预约则离谱许多,譬如一个天气App旗下的空气检测设备预约数超过百万,但实际销量可能不及百分之一。但不论是哪种形式的“预”,数据注水已是潜规则,为的是烘托一种供不应求的氛围,就像线下无良商家制造万人哄抢的场面一样,只不过线下用托,线上用技术几行代码搞定,这又体现了互联网的先进性。

我们跳出预约会发现,互联网的数据已经是真假难辨。在电商网站、应用市场、知乎、微博微信,一切有人的地方都有假数据的存在,绝大部分都是被人有意为之。有的是平台自己在做,有的是第三方实施平台打击,还有的是平台默许纵容与第三方形成默契。“刷”和“水”就是伴随着这一个现象产生的名词,刷单、刷榜、刷钻、刷流量、刷评论、刷点赞……水军、水贴、水评、僵尸粉……互联网在成就所谓的大数据,但实际上这些数据却有不少垃圾数据、甚至是人工制造来影响人们决策的脏数据。正是因为此,近年来反作弊、反僵尸、反刷榜技术和公司与水军公司、刷榜公司、刷钻公司之间的战斗愈演愈烈。

理论上来说,平台的职责应是尽量保护数据的干净进而保护用户的利益以及平台的长期价值。对操作数据、影响用户判断让其利益受损的行为应该是零容忍。但实际上在执行过程中,平台不同团队、甚至一个团队不同成员之间为了实现运营目标,均会不断地放下原则,对第三方数据造假行为管制的口子可大可小。倘若平台自身将数据注水当做理所当然,还是让人十分吃惊的。

第三方监管还是企业自律?

企业自律显然已经不大可能,因为企业都是逐利的,KPI驱动的企业下属执行团队在操作过程中必然会出现更关注短期目标的短视行为。在缺乏有效监管的情况之下,上下合谋、跨部门协作或者互成默契进行数据的“美化修饰”是极有可能发生的事情。不过,企业的数据要有价值的前提是用户信任你,如果经常出现做假数据被公之于众的情况,恐怕用户以后也心知肚明,你数据夸得再大也没人当真了,大家都知道就这么回事。

看上去预约数、抢购数、团购数造假并没有伤害用户的利益。但本质上用户还是在虚假数据的引导之下做出了消费决策,还是算得上利益受损。但“蓝翔哥”不会常有,直接将作假数据实现放在前段页面的“猪一样的队友”也不会常在。因此,未来要减少企业数据造假恐怕还是得靠第三方力量,就像会计师事务所审核企业财务数据一样,未来或许会有第三方认证机构来对各大平台的对外数据进行认证。

政府介入也是有可能的。目前北京工商局就通过行政建议书等形式公布第三方商家售假信息,在各电商平台之间建立起针对第三方商家的资质和信用管理体系。因为平台的信用认证体系可能并不牢靠,尤其是一家独大的平台,第三方尤其是有政府背书的权威第三方的认证才更有可能保持独立真实。未来是否会有销售相关数据的真实性监控呢?

双十一在即。在我印象中,每年双十一都会有大量的媒体被邀请到杭州观看漂亮绚丽的曲线图,今年双十一销售额会突破多少亿?悬念未解,但我只有一个期望,那就是,数据是接近真实的,工程师别再犯错。(via 百度百家 作者:罗超,作者微博@互联网阿超 ,微信SuperSofter)

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");