Unity 发布合成数据集,可大幅削减人工智能训练时间和成本
实时 3D 内容创作和运营平台 Unity 今日宣布发布 Unity 计算机视觉数据集。该数据集将有效降低计算机视觉应用的开发成本,加快为制造业、零售业和安防行业训练人工智能的速度。计算机视觉方案提供商现在可以为其 AI 训练需求购买定制化的数据集,同时保证符合严格的隐私和监管标准。
由 Unity 引擎合成的逼真图像可以描绘自动驾驶场景中可能发生的各种低概率事件,从而改善自动驾驶系统的训练效果
对于人工智能训练来说合成数据非常重要,因为往往现实世界所收集的真实数据无法满足特定的条件或需求。比如隐私规定限制了真实数据的可用性,或规定了数据只能以何种方式被使用。合成数据的一种常见用途是用于预发布的产品测试,此时现实数据可能不存在或无法被测试人员获取。此外,机器学习需要大量的数据用于训练算法,这也有赖于合成数据。因为在现实生活中,尤其是在自动驾驶汽车行业,生成能够用于算法训练的数据非常昂贵。如今 Unity 已经推出了计算机视觉数据集,未来在获取用于人工智能和机器学习训练的高质量合成数据集上,成本将不再是障碍。
Unity 人工智能和机器学习高级副总裁 Danny Lange 博士表示:“通过提供符合隐私规定且如实反映真实世界的合成数据,我们能够让这些具有开创性的数据集为更多创新者所用。根本上来说,这些数据集能帮助企业规划和模拟尚未出现过的场景,甚至能够模拟真实世界的用户增长来不断调整训练数据。因此,随着客户应用领域的扩展,我们将能看到更智能的室内环境,比如全自助无人零售店等等。”
Unity 使用 “域随机化”(domain randomization)技术来创建各种计算机视觉数据集,以此来提高数据质量并控制实际应用中的偏差值。在合成数据的过程中,该技术将对目标物体的位置和朝向进行各种排列组合,还有光照和摄像机角度的变化,以及可能实现的 Unity 环境的无数变量配置等。而且,Unity 的合成数据集还可以避免真实数据获取过程中可能存在的隐私违规或不可控的人工偏差。比如有些包含真实的人或地点的图像是直接从互联网上非法抓取的,或是花费大量人力从真实世界中拍摄获得。
各类带标签的合成图像数据
对于真实世界的数据,标注的价格随着标注类型的复杂性而增加。Unity 则提供了一个适用于任何标签类型的较低价格,客户无论是为简单还是复杂的行业标准都将支付相同的标签价格,如 2D 和 3D 边界框、类细分或实例细分。合成数据集是按等级定价模型收费的,客户所需合成的图像数量越多,每幅图像的价格越低。
Lange 博士补充道:“合成数据正在彻底改变机器学习模型的训练方式,它弥补了人工收集和标记真实世界数据的许多不足之处。我们正在探索一切可能性,帮助创作者们获取他们决策所需、并且负担的起的数据,推动 Unity 技术在各个领域的应用。这也是为什么我们推出这些数据集,并竭力帮助客户满足他们的需求。”
- 标签:深圳英文seo
- 编辑:刘卓
- 相关文章
-
滴滴出行递交 IPO 招股书:全球年活跃用户 4.93 亿
6 月 11 日,滴滴正式向 SEC 递交了 IPO 招股书,股票代码为 “DIDI”,高盛、摩根士丹利、摩根大通…
-
苹果聘请前宝马高管来推动其电动车项目
前宝马高管、最近离任的电动汽车初创公司 Canoo 首席执行官兼联合创始人 Ulrich Kranz 已被苹…
- 动点汽车:加码智能网联生态,实时引擎 Unity 正成为智能汽车行业的新驱动
- Grab 与 SPAC 公司的合并将推迟至今年第四季度完成
- 亚马逊广告全流域品牌打造方案,助力中国卖家打造全球品牌
- 知识产权平台权大师获 1.1 亿元 B 轮融资,布局行业全链条服务智能化
- 车好多完成 3 亿美元融资,推动加速汽车交易电商进程