亚博排列5Chm博客亚博排列5CHM生活

挖掘比数据更多

通过艾米丽帕森斯| 2021年6月15日

AI的隐藏成本

坐在客厅桌子上的数字助手可以告诉你很多信息——今天是否可能下雨,下次预约什么时候,或者如何做巧克力蛋糕——但它能告诉你它的生活故事吗?在它到达你的家门口之前,它的部件是从地里开采出来的,然后由工人们进行熔炼、组装、包装和运输。当你拥有它时,它会从你那里收集数据,这些数据可以用来训练人工智能系统。在你处理掉它之后,这个设备会转移到像加纳或巴基斯坦这样的地方的电子垃圾倾倒场。

通过“AI的解剖学”项目,USC Annenberg教授Kate Crawford发现了单一的亚马逊回声在整个寿命中如何利用大多数消费者看不见的方式。该项目点燃了对人工智能的广泛影响的兴趣。克劳福德说,虽然它似乎是神奇的,但是,AI似乎很大依赖于材料和人物。她争辩说,采取行业。

在2021年5月27日的C亚博排列5HM Live虚拟活动中,克劳福德从她的新书中分享了关于人工智能在本地和全球的影响的见解,AI的阿特拉斯,纽约时报科技记者克什米尔·希尔。

人工智能不是人工的

像Amazon Echo这样的设备被设计成干净、清新的样子,让用户完全不知道它们的生态代价。但人工智能依赖于矿物层和能量层。

例如,稀土金属锂对于从iPhone到特斯拉汽车的电力,对可充电电池来说至关重要。我们假设矿产资源可以不断推动行星计算,但我们正在达到一个关键的终点。在锂的情况下,我们已经面临了可用性危机。如果我们不改变我们的消费习惯,警告克劳福德,我们就可以早2040年耗尽锂电片。

尽管现实令人担忧,但市场营销还是让人们认为人工智能是一种神奇的、超凡脱俗的技术。与此同时,我们也期望人工智能能够做出具有非常真实后果的重要决定,影响刑事司法、教育、招聘和其他领域。克劳福德和学者亚历克斯·坎波罗称这种辩证法为“魔法决定论”。

凯特·克劳福德定义了“魔法决定论”。

fauxtomation.

克劳福德说,关于AI下的工作未来的辩论,侧重于机器人所取代的人们所取代的想法,但没有足够的焦点,以便人们像机器人一样对待。

越来越多地,雇主使用AI观察和跟踪工人,以便从它们中提取最大的价值。AI系统可以通过书面的电子邮件数量或拍摄的会议数量,在工作场所摄像机上录制面孔,甚至跟踪健康统计,以使员工健康的推定进行记录的工作效率。

在其他情况下,工人实际上就是人工智能。事实证明,一些“自动化”系统根本不是真正的自动化——成百上千的低薪人类工人在众包平台上执行微任务,让系统看起来像是人工智能的。例如,x.ai制作的“人工智能”个人助理实际上是很多人为了几美分的任务而做着繁重的劳动。作家阿斯特拉·泰勒(Astra Taylor)将这种现象称为“假自动化”。

Kashmir Hill描述了她对app Invisible Girlfriend的调查。

为什么科技公司如此努力地维持自动化的假象?纯粹自主系统的想法可以吸引投资者和消费者的注意,但人工智能并不像许多人认为的那样先进。克劳福德说,人工智能不像人类那样智能,我们今天所认为的“人工智能”大多是建立在重复的人类行为之上的。

偏见:冰山一角?

一种降低女性信用价值的算法;系统无法识别肤色较深的人;语音识别系统对女性声音没有反应。这些只是偏见如何在AI系统中产生负面结果的一些例子。然而,这比个别研究人员或工程师的偏见更深刻。首先是他们用来训练人工智能系统的数据集。

训练数据集由成千上万、数百万甚至数十亿的照片或文本等数据组成,成为人工智能系统的“地面真相”。工程师们很可能认为数据集是工具箱中的工具,在应用它们时不需要查看内部或确切知道它们包含什么类型的数据。通过这种方式,他们可以无意中将有缺陷的数据放在系统的核心。

Kate Crawford解释了偏见如何构建为AI系统。

培训集数据可以以问题方式收集。例如,由国家标准和技术研究所(NIST)创建的数据集包含被捕的人的Mugshots,无法同意拍摄他们的照片,更不用说在培训集中使用。如果您在互联网上有照片,那么您也是您的机会,也是AI培训数据集的一部分,而无需您的知识或许可。ClearView AI创建了世界上最大的面部训练数据集,已经抓住了至少30亿只互联网的人物。

在她与特雷弗Paglen的“挖掘AI”项目中,Crawford花了两年的训练数据集。在Imagenet中,机器学习历史上最有影响力的训练集之一,Crawford发现了种族主义者,令人厌恶,冒犯,甚至不合逻辑的人的分类。该数据已被用于培训十年后的技术系统。

自那以后,ImageNet已经删除了66万张图片,包括克劳福德批评过的许多“人物”类别。尽管移除这些类别有助于在未来创建更公平的人工智能,但在这些类别上受过训练的人工智能系统仍在世界上运行,并可能继续造成问题后果。当原始数据不再可见时,我们如何调查这些结果的原因?

Kate Crawford描述了当AI训练数据集被删除或编辑时会发生什么。

我们需要很多地图册

1966年,麻省理工学院(MIT)的“夏季视觉项目”(Summer Vision Project)开始为图像贴上标签,以便识别世界上的任何物体。这项工作需要的时间远不止一个夏天——事实上,这个挑战还没有解决。

克劳福德承认AI的阿特拉斯是不全面的,并指出,“我们需要很多地图册。”书籍可以让我们从不同的尺度来看待事物,从整个大陆到特定的城镇,可以帮助我们更好地理解人工智能的规模,从它的全球影响到它对个人和社区的局部影响。

关于作者

Emily Parsons是计算机历史博物馆指数中心的研究员和内容开发人员。她对企业家,风险资本家和硅谷创新生态系统的其他关键数据的研究有助于为各种指数中心举措的教育内容的发展有助于发展教育内容。

加入讨论

分享

Facebook 推特 复制链接