注册 投稿
经济金融网 中国经济学教育科研网 中国经济学年会 EFN通讯社

走进大数据的阴暗面

\

大数据和人工智能是目前最火的两个概念,其背后所依赖的就是算法,AlphaGo对弈棋王们的胜利让我们对算法赞叹的同时也对算法产生了恐惧,如未来简史中所担忧的当人类的一切都可以被算法化的话,那么除了极少数的神人以外的大多数都会变成无用阶层。如果这些让我们听起来有些杞人忧天的话,那么这本《Weapons of Math Destruction》所带来的却是实实在在正在发生的那些算法背后的阴暗面。 

书的作者从小就是一位热爱数学的女孩子,读书读到了PhD,最终成为了一名大学教授。怀揣着数学可以对社会做一些改变的梦想,她先后转型在对冲基金公司做宽客,加入数据分析公司,电子商务初创公司,但这些从业经历让其对现状及其失望,她创造了WMD(Weapons of Math Destruction)的概念,以各种形式来传播大数据时代所增加的社会不平等和对民主的威胁。 

什么是WMD呢,作者认为满足了Opactiy,Scale,Damage三种要素的数学模型或者算法都可以称为WMD,即工作方式黑箱,影响很多人且造成很大伤害。这里先补充下作者对于模型的看法,通常来说模型包括了各种变量或者选项的收集,模型的训练,盲点的处理从而对于某流程进行抽象化,但忽略了模型其实更是一种嵌入在数学里面的观点(Models are opinions embedded in mathematics),基于此每次我们面对一次大数据的案例时不仅要问是谁设计了这个模型还要知道这个人或者这个公司到底想达成什么目标,而就是这个目标导向产生了WMD的可能。

“The technology already exists. It’s only the will we’re lacking.”  

 这本书最大的特点来自于其丰富的案例,而这些案例都是跟大家的生活日常相关的,很多套路的揭露还是细思恐极的。这里摘录几个: 

1.USNews&World Report搞的大学排名榜。怎么评价educational excellence,由于没有直接的判断标准,就用了类似毕业率,校友捐款,SAT成绩,学生教师比等代理指标来进行关联。这些指标看上去很透明,但这样的评价体系一下子变成了全国统一的标准,也就是达到了WMD中的Scale元素,各个高校都以提高自己排名而无所不用其技,Texas Christian University在2009年开始花钱针对性提升,从08年的113位提升到2015年的76位。后来在这个排名走向世界的时候,沙特阿拉伯的一所学校直接进去就是全球第7,紧跟哈佛之后,为什么呢,因为他们利用了这些指标算法。高校变成了军备竞赛。目前美国的做法是在其教育部网站上公布了所有学校的各项指标,这样由各个入学者来去评价那一所更适合自己。透明,用户控制,个性化这就是反WMD的方式。 

2.在当今数据为王的社会,个人的信用报告将对个人的定位产生很大的影响,除了央行的这种征信报告以外,在各个互联网公司其实还有一份e-scores,这里的算法是不公开的。这种数据有一个大问题就是,本来他们要解决的是你在过往的表现如何(how have you behaved in the past),但结果变成了像你的那群人过往的表现如何(how have people like you behaved in the past),为什么呢,因为数据打分的结果就是把你分类,意味着就可能把你分错类,仔细琢磨下,这种间接伤害带来的可能是万劫不复的结果,因为你无法改变这样的分类。还有就是现在提到的智能车险,这也是跟escore来挂钩的,但后面有些逻辑反而是你如何对待信用卡比你怎么开车更影响你保额,是不是有点滑稽。Price me by how I drive,not by who you think I am,这句之前的一句推特口号就表达了这种不满。 

3.美国的一些营利性大学和学历工厂,正在利用大数据来精准定位哪些目标客户,看看他们的目标客户定义:孕妇,刚离婚的,低收入,刚经历亲人离世,受过虐待,毒品复吸等等,这些客户的寻找就来自广告商,因为包括谷歌和Facebook在内的公司都为广告商提供了详细的用户细分功能,亚马逊利用这些数据进行商品推荐,这些学校用这些信息进行诱惑性广告的投递.其中一家营利性大学雇佣了30人的营销团队,年花费120M,从而生成和购买2.4M的各项线索,吸引到60K的新学生,创造了600M的年收入。目前美国是专门出台了一些联邦法律,针对用户的健康和信用数据的使用进行了限制。

美国有一个称为Out of Many,One的国徽格言,中文翻译为合众为一,而WMD走的却是该理念相反的路子,它们黑箱操作,从一到众。还有一句话很重要:Big data processess codify the past, They do not invent the future。这也是目前那些大数据支撑的人工智能推送给我们那些啼笑皆非的推荐时背后的原因。我们在大力发展大数据产业的同时,也要提前设定好类似希波克拉底氏誓言一样的Data Oath,在对数据利用管制上应该向欧盟学习,不但对于数据采集要经用户同意,同时还要禁止数据为做它用的再使用(有没有朋友习惯性的在各种证照的复印件上特意注上仅做XXX使用呢)。

大数据固然好,但我们更要想清楚我们的目标,因为真的目标导向会害死人的。  

Weapons of Math Destruction

 RE170201

\

作者: Cathy O'Neil
出版社: Crown
副标题: How Big Data Increases Inequality and Threatens Democracy
出版年: 2016-9-6
页数: 272
定价: USD 26.00
装帧: Hardcover
ISBN: 9780553418811

文章评论
关注我们

快速入口
回到顶部
深圳网站建设