大数据应用的“傲慢与偏见”

标签:大数据

访客:4891  发表于:2016-10-17 09:02:15

美国有一个著名的数学博客叫MATHBABE.ORG(数学宝贝),其博主是数学达人CATHY ONEIL(凯茜·奥尼尔),她是心怀理想的人,办博客的目的就是想回答好一个问题:“一个学术界以外的数学家怎样能使世界更美好?”2016年9月,奥尼尔在Crown出版社出版了新著Weapons of Math Destruction:How Big Data Increases Inequality and Threatens Democracy(《数学杀伤武器:大数据如何加剧了不平等和威胁着民主制》)。Weapons of Math Destruction是大规模杀伤武器的意思,她把该词组中的Mass改为发音很接近的Math ,就成为“数学杀伤武器”的意思了,这是很巧妙的文字游戏。

她于1999年在哈佛大学获得数学博士学位,后来在麻省理工学院和巴纳德学院从事过计算代数几何的研究,在金融界工作过四年,包括在D.E. Shaw对冲基金当了两年的定量分析师,发表过不少论著,如2013年发表的著作Doing Data Science: Straight Talk from the Frontline(《做数据科学:来自第一线的平实谈话》),还有同一年发表的电子书On Being a Data Skeptic(《论如何做一名数据怀疑论者》)。在金融界工作几年后,她对于对冲基金模型彻底失望了,对于大数据分析的不当应用十分反感,还积极投身于“占领华尔街”运动。

可以说,美国人生活在算法时代。人们能上哪个学校、能否获得购车贷款、健康保险的缴费标准是多少等各种决策,越来越多地由数学模型决定,而不是由人决定。从道理上说,这应该导致更公平的结果,因为一切都按规则来处理,似乎就消除了偏见。遗憾的是,奥尼尔在书中指出,数学模型带来的是更多的不公平。现在使用的很多数学模型是不透明的,未受到规制的,明明有错却容不得质疑的。

她在新书中描述了广泛应用的一些数学模型是如何惩罚穷人、犒赏富人的,因为这些模型就是基于“成见、误解与偏见”的。她将最具伤害性的这类模型称为“数学杀伤武器”,社会弱势群体在求学、求职、借款、遭遇牢狱之灾的时候,都会收到这种武器的可怕伤害。例如,一些雇主利用信用评分来评价潜在的雇佣对象,认为若是其信用评分不高,今后的工作表现也好不到哪儿去。其实,二者之间并不存在这样的稳定联系。又如,以盈利为目标的大学会利用信用评分数据来发现那些易于被俘获的群体,引诱他们入学,最终往往使他们债台高筑。再如,一些汽车保险公司在审查申请入险者资料的时候,不是看他们的驾驶记录,而是看他们的消费模式。有的年轻人由于住在穷人区,就申请不到贷款,从而上不起大学——某算法主要根据申请人家庭住址的邮政编码,就作出了“贷款给他们有较大风险”的判断。还有,一些所谓的犯罪预测软件的实际效果,是引导警员们去贫困街区关注一些轻微滋事案件。她说,当片警动不动就把少数族裔的穷孩子当街拦住,推推搡搡,再警告一番,大数据的害处就明显不过了。与此同时,这些数学模型总是将社会中的富足阶层置于各种营销筒仓内,使他们的生活“更智能化,更便捷”。她令人信服地论证说,我们必须更负责任地应用数学模型,美国联邦政府必须对大数据应用加以规制。

当然,她写作此书的目的并非反对大数据应用,而是呼唤人们头脑清醒,在利用大数据“兴利”的同时一定要注意“除弊”。该书获得很好的反响,出版不过一个月有余,已经获得“2016年国家图书奖(非虚构作品类)”的提名。

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");