<Facebook在AI程序中植入294种语言 将影响19亿人,  5月3日消息,对于使用英语工作的计算机程序员来说,构建一个可以分类处理垃圾电子邮件的程序非常简单,特别是在使用人工智能(AI)力量的情况下科技资讯网
您的位置首页  科技生活  人工智能

Facebook在AI程序中植入294种语言 将影响19亿人

  5月3日消息,对于使用英语工作的计算机程序员来说,构建一个可以分类处理垃圾电子邮件的程序非常简单,特别是在使用人工智能(AI)力量的情况下。但如果使用塞内加尔口语沃洛夫语,这项工作就会变得像重新发明轮子那样困难,因为这个程序根本无法使用这种语言,其使用者仅有420万人。这种情况几乎适应全球近300种最常见的语言,它们被近19亿人使用。

  但在周二,Facebook刚刚发布了名为“stText”的开源机器学习项目,它有可能解决这个问题。去年8月底,这个由部分语言库和部分机器学习算法构成的项目,已经可以使用90种语言,更新后的版本使支持语言的数量达到294种。随着公司的扩张,Facebook在纽约的AI研究团队已经对这种方法进行了优化,使其能够在极其小的操作系统上运行,比如智能手机。

  这促使该项目对近19亿人产生影响,尽管这些人的母语尚未得到支持。Facebook AI研究团队的科学家阿蒙德朱林(Armand Joulin)说:“我们希望这能帮助人们轻松地学习和玩转机器学习,这个项目有助于我们在FAIR实现机器学习化。”

  通常情况下,如果你用一种不常用的语言来写作,比如英语或汉语,建立机器学习算法来预测你想要使用的标签,或者对邮箱中的垃圾邮件自动分类,都需要大量的工作。你必须建立一个单词库来训练,并创建一种方法来识别单词的意思,以确定整个信息排序中重要的元素。

  所以许多程序在主要语言中运行通常都很好,但是像沃洛夫这样的语言却不被支持。像stText这样的程序可通过提供一个单词库来训练你的算法在特定的语言中工作,使最初的步骤变得容易得多。除此之外,它还使用了一种对单词进行分类的方法,这种方法可以在一分钟内整理出50万个句子。

  为了做到这一点,该方法使用了一种叫做“bag-of words”的方法,它只计算一份工作在文档中出现的次数。此外,它还会计算出在文档中出现的简单短语的次数,这两种情况都会很快完成。然后,程序会学会使用特定的单词或短语来排序或预测你想要做的事情,比如在电子邮件中计算“伟哥”的次数,那意味着它可能是垃圾邮件。

  关键是,这个程序运行得非常快,它还可以学习大量的语言,以便在很短的时间范围内投入应用。朱林说:“越复杂的模型,比如神经网络,往往过于缓慢,无法在如此规模的范围内接受训练。”

  使用语言的速度和语言的数量使得那些没有语言资源的研究人员可以使用stText,而这些语言资源都是用英语编写的。还要减少这种方法需要运行的内存,以便于研究人员不需要超级计算机也能帮助平衡比赛场地。朱林说:“我们发布了可表达294种不同语言的程序,让世界各地无论讲何种语言的人们都能给他们的应用程序提供动力。”

  来源:X(非中文科技资讯)的作品均转载自其它,转载请尊重版权保留出处,一切法律责任自负。

  文章内容仅供阅读,不构成投资,请谨慎对待。投资者据此操作,风险自担。

  中文科技资讯尊重与知识产权。如发现本站文章存在版权问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至,我们将及时沟通与处理。

  可穿戴市场近年来表现差强人意,先是联想延迟MOTO360智能手表迭代产品的发布到今年的CES取消可穿戴设备专门展区,让可穿戴设备有了“鸡肋”之称。

  王安、王嘉廉和杨致远是华人在硅谷缔造传奇的代表人物,但他们基本都退出了一线舞台。现在硅谷最受瞩目的华人企业家是54岁的黄仁勋,他将NVIDIA打造成世界第一的GPU厂商,竞争对手甚至难以望其项背。

  据外媒报道,几个世纪以来,人们对死亡的问题一直争论不休。但是,那些有过濒死经历的人可以毫无疑问地告诉你他们经历了什么。

  OpenAI和DeepMind的研究人员希望利用一种能从人工反馈中学习的新算法,使人工智能更安全。昱烨

  6月13日消息,据国外报道,为了提高iPhone在印度市场的销量,苹果公司正在考虑允许印度的第三方零售商降价销售。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186
友荐云推荐