人工智能发现了 40000 名被维基百科忽视的杰出科学家
人工智能经常因其延续社会偏见的倾向而受到批评,但它同样有能力与它们作斗争。机器学习目前被用于扫描科学研究和新闻报道,以识别未出现在维基百科上的杰出科学家。这些科学家中有许多是女性,在世界上最受欢迎的百科全书中,她们的遗漏尤其重要,其中82%的传记都是关于男性的。
该研究由一家名为 Primer 的人工智能初创公司进行,以展示该公司在自然语言处理 (NLP) 方面的专业知识。这是人工智能的一个具有挑战性但充满活力的子领域,它的全部内容都是关于理解和生成数字文本。维基百科经常被用作训练这类程序的来源,但 Primer 想要回馈该网站。
在一篇博文中,Primer 的科学主管 John Bohannon 解释了该公司如何开发一种名为 Quicksilver 的工具(以科幻作家 Neal Stephenson 书中的技术命名,“因为我们是书呆子”)来阅读大约 5 亿份源文件,筛选出被引用次数最多的数字,然后写一篇关于他们及其工作的基本草稿。
例如,这是一篇关于特蕾莎·伍德拉夫(Teresa Woodruff)的 AI 文章,这位科学家没有维基百科条目,但在 2013 年被《时代》杂志评为“最具影响力人物”之一。她的工作包括为老鼠设计 3D 打印的卵巢。
Primer 说,这是一篇基本的文章,但它有说服力且来源明确,这是 Wikipedia 编辑创建一篇关于 Woodruff 的文章的完美起点。
迄今为止,这家初创公司已经确定了 40,000 名“失踪”的科学家,他们的覆盖范围与拥有Wikipedia 文章的个人相似,并发布了 100 篇AI 生成的摘要。它还参与了三个维基百科编辑马拉松,旨在提高女性在科学界的在线代表性。(Editathons 是专家互相教授创建和编辑 Wikipedia 文章的活动,通常是为了加强其学科领域的覆盖面。)正如 Bohannon 所指出的,至少有一个人被 Primer 的技术发现,因此已经获得了一篇 Wikipedia 文章——加拿大机器人专家乔尔·皮诺。
伦敦帝国理工学院的物理学家杰西卡·韦德(Jessica Wade)撰写了皮诺的新条目,她向《连线》杂志介绍了该系统的好处。“维基百科存在令人难以置信的偏见,女性在科学领域的代表性不足尤其糟糕,”韦德说。“使用 Quicksilver,您无需四处寻找缺失的姓名,而且您可以非常快速地获得大量来源良好的信息。”
Primer 表示,它的技术建立在谷歌和其他研究人员过去的工作基础上,包括今年 1 月发表的一项研究,该研究也使用机器学习来生成基本的维基百科文章。然而,该公司表示其目标比这更实际。它不想将维基百科用作实验的测试平台,而是希望创建对在线信息生态系统有明显好处的工具。
为此,Quicksilver 不仅会发现被忽视的个人并生成文章草稿。它还可用于维护 Wikipedia 条目并识别它们何时没有更新。该公司表示,数据科学家 Aleksandr Kogan 的维基百科条目就是一个很好的例子。Kogan 在Cambridge Analytica 丑闻的核心开发了这个应用程序,他在今年 3 月创建了一个关于他的 Wikipedia 页面。Primer 指出,对 Kogan 条目的编辑在 4 月中旬停止(这意味着有关 Kogan 的更新,例如他还访问了 Twitter 数据的事实,尚未添加)。
当然,即使是这样的工具也容易受到偏见的影响。如果 Primer 的广告基于他们在新闻报道中的包含而忽略了科学家,那么它最终可能会反映科学媒体的兴趣。但 Bohannon 坚持认为,该公司的工具仍然可以作为人类主导流程的助手。
- 标签:人工智能百科全书
- 编辑:刘卓
- 相关文章
-
人工智能发现了 40000 名被维基百科忽视的杰出科学家
人工智能经常因其延续社会偏见的倾向而受到批评,但它同样有能力与它们作斗争
-
浅谈人工智能目前所应用的五大领域
IDC公司人工智能计划副总裁Ritu Jyoti指出:“越来越多的组织将采用人工智能,而且必须这样做…
- 【全网最全】10款AI智能软件深度学习、视觉和自然语言全覆盖!
- 中国象棋人工智能软件合集2022 中国象棋人工智能软件排行榜
- 好书试读 图解人工智能大全(2)AI 的进化与应用范围的扩大
- 人工智能的应用领域包括哪些
- 社会智能——人工智能的下一个前沿