发表于2025-05-06
算法霸权 pdf epub mobi txt 电子书 下载
凯西•奥尼尔(Cathy O'Neil)
数据科学家,mathbabe.org的博主。博士毕业于哈佛大学,主修数学专业。她曾在巴纳德学院任教,之后为私营企业服务,例如避险基金。她还在各类新型公司担任数据科学家,预测消费者购买与点击趋势。每周她都会出现在“财富记账”的播客上。
数据科学家凯西•奥尼尔认为,我们应该警惕不断渗透和深入我们生活的数学模型——它们的存在,很有可能威胁到我们的社会结构。
我们生活在一个依赖“算法”的时代,它对我们生活的影响越来越大,我们去哪里上学,我是不是应该贷款买车,我们应该花多少钱来买健康保险,这些都不是由人来决定的,而是由大数据模型来决定的。从理论上来说,这一模型应该让社会更加公平,每一个人的衡量标准都是一样的,偏见是不存在的。
但是,正如凯西•奥尼尔书里所揭示的那样,事实并非如此。我们今天所使用的这些数学模型是不透明的、未经调节的、极富争议的,有的甚至还是错误的。最糟糕的是,数学模型和大数据算法加剧了偏见与不公。例如,一个贫困学生想申请贷款交付学费,但是银行大数据算法根据他居住地的邮政编码判断将钱带给他存在风险,因此,拒绝给他提供贷款。他因此失去了受教育的机会,而这个机会可能帮助他摆脱贫困。大数据算法做的常常只是锦上添花的事儿,有时甚至是落井下石。
通过个案追踪,凯西•奥尼尔揭示了大数据是如何影响我们将来的,它不仅影响着个人,也影响着整个社会。这些数据评价着我们的老师、学生,筛选着我们的简历,审核着我们的贷款资格,衡量着员工的工作态度,监视着投票者,监控着我们的健康。
凯西•奥尼尔呼吁数据模型的创造者们要对算法负责,政策的制定者及执行者们在使用这一威力极大的“武器”前应该更加慎重。最后,作者指出,大数据几乎掌控着我们的生活,我们应该增加对它的了解。这本书相当的重要,它让我们有能力去问一些十分尖锐的问题,帮助我们了解事实的真相,提出需要改变的地方,探索更好的生活。
【编辑推荐】
案例丰富,内容兼具深度与话题性
未来20年,算法和大数据将席卷世界,接管我们的生活、社会和经济。我们生活中的很多方面都将落入自动化的数据分析之下。确保算法和大数据的公平性将是一项重大的任务,数据伦理的价值和意义将不断凸显出来。在作者看来,大数据犹如一个黑盒,规模、伤害和隐秘共存,她在书中引用了大量发生在美国当下的、基于大数据和算法的、改变个人生活的案例,并对影响这些城市生活经验的算法做了特别的观察和研究。作者认为,数据和算法的关系就像枪械和军火,数据没有价值观,是中立的,但来自人类行为的输入,难免隐含偏向,而算法创造的数据又对人类行为产生反作用,从而导致更多的不公。凯西在书中指出:算法模型一旦运转,执法行为就会增多,产生的新数据又会进一步证明加强执法的必要性。形象地说,就是哪里“前科”越多,哪里就越受算法“关照”,最终形成一个失真,甚至有害的回馈环路。这个观点也正是近来Facebook干预美国大选,国内很多专家学者热议“今日头条”推送模式的核心所在。
权威作者的深刻洞见
本书作者是哈佛大学的数学博士,研究方向是数论和代数几何,毕业之后在麻省理工学院执教,并在互联网公司做过很长时间的数据科学家,如今致力于教育和媒体行业的数据知识普及工作,因此,这并不是一本传统意义上唱衰大数据的书,相反,作者希望让更多的人通过了解大数据、了解算法,反思模型,以及通过政府和相关机构的合理监管,不断改善各类设计评价体系,让更多的人受益,维护社会的公平与民主。
【英文版获奖情况】
《纽约时报》(New York Times)年度书籍
《波士顿环球报》年度最佳图书
《连线》杂志年度必读书目之一
《财富》年度最受欢迎的书之一
《柯克斯评论》年度最佳作品
芝加哥公共图书馆年度最佳图书
《自然》网站年度最佳图书
《麻省理工科技评论》年度最佳科技图书
##从来没有这么坚决地给一本畅销书评出五颗星,这真的是一本数字化生存时代的急救手册,让我们明白自己身处的已知但无法改变以及更多未知却每时每刻都在经历的数据歧视和数字凌霸。该怎么办,书中给出了一些颇具说服力的建议,但对于更多的人来说,第一步应该是觉知,然后自觉地去传播他们的觉知,这也许就是技术时代的新启蒙运动。
评分##把算法的缺点放大到极致,影响到教育、理财、就业、社会管理,几乎是生活的各个领域,本质上是效率和公平的问题,个体、阶层、地域的差异很可能会被算法一刀切带过。算法可以解放人类劳动,但并不意味着可以一劳永逸地把决定权交给机器,所以需要及时反馈和改进模型。具有偏见的和陷阱性的替代变量,加上信息使用和算法的不透明则使得算法具有欺骗性,因此适当的自律和监管是有益的。
评分##作者在华尔街对冲基金德绍集团担任过金融工程师,后来去银行做过风险分析,再后来去做旅游网站的用户分析。后来辞职专门揭露美国社会生活背后的各种算法的阴暗面。 书中提到的算法的技术缺陷,我归纳为两点:第一个比较致命:不准确。不准确有两种体现,首先是算法先天的问题,...
评分##1、按李航《统计学习方法》的第一章,统计学习方法包含了三个要素:模型、策略和算法。个人感觉这本书其实讨论最少的其实就是算法:例如以学生成绩来评价老师的案例,根本错误就出在选取最优模型的策略上,这样算法几乎没有正确的可能。不止这本书的标题翻译问题,算法就是个大筐,什么都能往里装。 2、书本身就是面向大众的科普通俗读物,不过“选民扩音器”(voter megaphone)的案例从今天看这个真的太重要了。 3、我甚至有一丝感觉,好模型和坏模型的界限其实不模糊,不涉及社会的才有可能是好模型,只要是涉及社会的模型都难免有不可预知的外部性。我们所能做的就是公开化和审查监督。
评分 评分##举了很多例子,说了一个道理。 感谢 recall 这本书的不知名同学,谢谢你逼得我用4个小时读完。 作者创造了“数学杀伤性武器”(Weapons of Math Destruction, WMD)这个词指代统计模型,探讨现实生活中统计模型的大规模应用对社会的影响。 正面例子是棒球、篮球比赛的分析,可以即时调整战术(参考[《点球成...
评分 评分 评分##今天看了《黑镜》第三季第一集,恰巧又读完本书,我想说我喜欢、支持,并且认为社会需要作者这种末世感和技术悲观主义。书很好读。
算法霸权 pdf epub mobi txt 电子书 下载