您的位置首页  科技生活  人工智能

人工智能发现了 40000 名被维基百科忽视的杰出科学家

人工智能发现了 40000 名被维基百科忽视的杰出科学家

  人工智能经常因其延续社会偏见的倾向而受到批评,但它同样有能力与它们作斗争。机器学习目前被用于扫描科学研究和新闻报道,以识别未出现在维基百科上的杰出科学家。这些科学家中有许多是女性,在世界上最受欢迎的百科全书中,她们的遗漏尤其重要,其中82%的传记都是关于男性的。

  该研究由一家名为 Primer 的人工智能初创公司进行,以展示该公司在自然语言处理 (NLP) 方面的专业知识。这是人工智能的一个具有挑战性但充满活力的子领域,它的全部内容都是关于理解和生成数字文本。维基百科经常被用作训练这类程序的来源,但 Primer 想要回馈该网站。

  在一篇博文中,Primer 的科学主管 John Bohannon 解释了该公司如何开发一种名为 Quicksilver 的工具(以科幻作家 Neal Stephenson 书中的技术命名,“因为我们是书呆子”)来阅读大约 5 亿份源文件,筛选出被引用次数最多的数字,然后写一篇关于他们及其工作的基本草稿。

  例如,这是一篇关于特蕾莎·伍德拉夫(Teresa Woodruff)的 AI 文章,这位科学家没有维基百科条目,但在 2013 年被《时代》杂志评为“最具影响力人物”之一。她的工作包括为老鼠设计 3D 打印的卵巢。

  Primer 说,这是一篇基本的文章,但它有说服力且来源明确,这是 Wikipedia 编辑创建一篇关于 Woodruff 的文章的完美起点。

  迄今为止,这家初创公司已经确定了 40,000 名“失踪”的科学家,他们的覆盖范围与拥有Wikipedia 文章的个人相似,并发布了 100 篇AI 生成的摘要。它还参与了三个维基百科编辑马拉松,旨在提高女性在科学界的在线代表性。(Editathons 是专家互相教授创建和编辑 Wikipedia 文章的活动,通常是为了加强其学科领域的覆盖面。)正如 Bohannon 所指出的,至少有一个人被 Primer 的技术发现,因此已经获得了一篇 Wikipedia 文章——加拿大机器人专家乔尔·皮诺。

  伦敦帝国理工学院的物理学家杰西卡·韦德(Jessica Wade)撰写了皮诺的新条目,她向《连线》杂志介绍了该系统的好处。“维基百科存在令人难以置信的偏见,女性在科学领域的代表性不足尤其糟糕,”韦德说。“使用 Quicksilver,您无需四处寻找缺失的姓名,而且您可以非常快速地获得大量来源良好的信息。”

  Primer 表示,它的技术建立在谷歌和其他研究人员过去的工作基础上,包括今年 1 月发表的一项研究,该研究也使用机器学习来生成基本的维基百科文章。然而,该公司表示其目标比这更实际。它不想将维基百科用作实验的测试平台,而是希望创建对在线信息生态系统有明显好处的工具。

  为此,Quicksilver 不仅会发现被忽视的个人并生成文章草稿。它还可用于维护 Wikipedia 条目并识别它们何时没有更新。该公司表示,数据科学家 Aleksandr Kogan 的维基百科条目就是一个很好的例子。Kogan 在Cambridge Analytica 丑闻的核心开发了这个应用程序,他在今年 3 月创建了一个关于他的 Wikipedia 页面。Primer 指出,对 Kogan 条目的编辑在 4 月中旬停止(这意味着有关 Kogan 的更新,例如他还访问了 Twitter 数据的事实,尚未添加)。

  当然,即使是这样的工具也容易受到偏见的影响。如果 Primer 的广告基于他们在新闻报道中的包含而忽略了科学家,那么它最终可能会反映科学媒体的兴趣。但 Bohannon 坚持认为,该公司的工具仍然可以作为人类主导流程的助手。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186
TAGS标签更多>>