您的位置首页  科技生活  人工智能

一文告诉你AR跟人工智能有什么关联

一文告诉你AR跟人工智能有什么关联

  常作为孪生兄弟被相提并论,被普遍认为为应用层新技术或者说是“智能可穿戴设备”,相比人工智能相对的“算法”标签,显得不够有深度有内涵高大上,那AR和人工智能之间到底是什么关系?AR属不属于当下我们认知中的人工智能?

  2018年3月,上海市经济和信息化委员会公示了2018年第一批本市人工智能创新发展专项拟支持项目。“一共有19家创新企业入围,亮风台作为AR公司也入围此次支持项目”亮风台工作人员告诉记者,这不是AR企业第一次被划归到人工智能,但这种归类方式也并不常见。据了解此专项由经信委与市财政局联合开展,拟支持金额超过1亿。

  AR(Augmented Reality),是在现实世界中叠加虚拟信息,也即给现实做“增强”,这种增强可以是来自视觉、听觉乃至触觉,主要的目的均是在感官上让现实的世界和虚拟的世界融合在一起。

  其中,对现实世界的认知主要体现在视觉上,这需要通过摄像机来帮助获取信息,以图像和视频的形式反馈。通过视频分析,实现对三维世界环境的感知理解,比如场景的3D结构,里面有什么物体,在空间中的什么地方。而3D交互理解的目的是告知系统要“增强”的内容。

  首先是3D环境理解。要理解看到的东西,主要依靠物体/场景的识别和定位技术。识别主要是用来触发AR响应,而定位则是知道在什么地方叠加AR内容。定位根据精度的不同也可以分为粗定位和细定位,粗定位就是给出一个大致的方位,比如区域和趋势。而细定位可能需要精确到点,比如3D坐标系下的XYZ坐标、物体的角度。根据应用环境的不同,两种维度的定位在AR中都有应用需求。在AR领域,常见的检测和识别任务有人脸检测、行人检测、车辆检测、手势识别、生物识别、情感识别、自然场景识别等。

  在感知现实3D世界并和虚拟内容融合后,需要以一定方式将这种虚实融合信息呈现出来,这里面需要的就是AR中的第二个关键技术:显示技术, 目前大多数的AR系统采用透视式头盔显示器,这其中又分为视频透视和光学透视,其他的代表有光场技术(主要因Magic Leap而显名)、全息投影(在科幻影视剧作品中常出现)等。

  AR中的第三个关键技术在于人机交互,用以让人和叠加后的虚拟信息互动,AR追求在触摸按键之外自然的人机交互方式,比如语音、手势、姿态、人脸等,用的比较多的语音跟手势。

  在人工智能领域有几个概念常被提及,如深度学习(DL)、机器学习(ML),在学术领域包括人工智能(AI)在内几大领域均有自己的研究界限,而在普遍意义上,我们常说的是泛意的人工智能,涵括所有“让机器像人一样”的技术的应用方向。

  从这张图也可以简单一窥三者的关系,深度学习是实现机器学习的一种技术方式,而机器学习是为了让机器变得智能,去达到人工智能。可以说人工智能是最终目标,而机器学习是为了实现这个目标延伸出的一个技术方向。在这其中,还有另一个重要概念为计算机视觉(CV),主要来研究如何让机器像人去“看”,是目前人工智能概念中的一个重要分支,这也是因为人类获取信息最主要的方式之一就是视觉,目前计算机视觉已经在商业市场发挥价值,比如人脸识别自动驾驶中读取交通信号和注意行人以导航;工业机器人用来检测问题控制过程;三维环境的重建图像的处理等等。这些概念既有区分也有一定范围的重叠。

  其中,2006年开始,Hinton引发的深度学习热潮开始蔓延,在一定程度上带动了AI的又一次崛起,十年中,在包括语音识别、计算机视觉、自然语言处理在内的多个领域取得重大突破,并向应用领域延伸,正发展的如火如荼。

  在AR的核心技术中,3D环境理解、3D交互理解和计算机视觉、深度学习都有着紧密的联系。3D环境理解在学术界里主要对应的是计算机视觉领域,而近年来深度学习在计算机视觉中得到广泛应用。交互方面,更趋自然的交互方式如手势和语音在硬件终端的使用,得益于近几年深度学习在相关领域的突破。也可以说,深度学习在AR中应用主要在视觉关键技术。

  目前,AR最常见的形式是2D图片扫描识别,如腾讯QQ-AR火炬活动、支付宝五福等多数AR营销中所见,用手机扫描识别图出现叠加的内容,但主要的研发方向还在3D物体识别和3D场景建模。

  现实的物体是以3D形态存在的,有不同的角度和空间方位。所以一个自然的扩展就是从2D图片识别到3D物体识别,识别物体的类别和姿态,深度学习可以用在这里。以水果识别为例,识别不同类别的水果,并且给出定位区域,即集成了物体识别与检测的功能。

  3D场景建模,从识别3D物体扩大到更大更复杂的3D区域。比如识别场景里面有哪些东西、它们的空间位置和相互关系等等,这就是3D场景建模,是AR比较核心的技术。这其中涉及目前热门的SLAM(实时定位与地图构建)。通过扫描某个场景,然后在上面叠加虚拟战场等三维虚拟内容。如果只是基于普通2D图像识别就需要有特定的图片,而在图片不可见时会识别失败。而在SLAM技术里面,即使特定平面不存在,但是空间定位依然非常精确,就是因为有周围3D环境的帮助。

  这里想探讨下深度学习和SLAM技术的融合,计算机视觉大体上可以分两个流派,一种基于学习的思路,例如特征提取-特征分析-分类,目前深度学习技术在这一路线上取得了主导性的地位。另外一种路线是基于几何的视觉,从线D形状推出物体的空间结构信息,代表性的技术就是SFM/SLAM。基于学习的方向上深度学习基本上一统天下,但是在基于几何视觉的领域,目前相关的进展还很少。从学术界而言,深度学习技术的研究进展可以说日新月异,而SLAM技术最新十年的进展相对较少。在国际视觉会议ICCV 2015年度组织的SLAM技术专题讨论会上,基于近年深度学习在视觉领域的快速发展,有与会专家曾提出SLAM中采用深度学习的可能性,但是目前还没有成熟的思路。总体而言,短期内将深度学习和SLAM融合是一个值得研究的方向,长远来看联合语义和几何信息是一个非常有价值的趋势。因此,SLAM+DL值得期待。

  在交互方式方面,主要的包括语音识别和手势识别,语音识别在目前已经取得了较大进展,国内如百度、科大讯飞、云知声等都是其中的佼佼者,AR公司更想突破的是手势识别的成熟商业化。

  “亮风台展示过的一款基于深度学习的手势识别系统,主要定义了上下左右、顺时针、逆时针六种手势”亮风台工作人员告诉记者,先实现人手的检测和定位,然后通过识别相应的手势轨迹来实现对人手势的识别。虽然人脸识别等其他人工智能热门领域在AR中也有使用,但不是AR公司重要的研发方向。

  以上不难看出,AR的底层技术或者说基础部分是计算机视觉以及关联领域的融合,而当下热门的深度学习和AR的结合,也是算法工程师们的努力方向。这也是AR为计算机视觉与人机交互的交叉学科,AR的基础是人工智能和计算机视觉等说法的依据。

  在去年今日头条发布的《人工智能影响力报告》中也简单统计了人工智能科学家的分布情况,这其中包括人脸识别、语音识别、机器人、AR、芯片等领域的公司与大型研发机构,高端研发人员的分布也说明了AI领域的细分方向。

  对AR从业者来说,理想的状态是用更智能的AR终端去取代智能手机,所以对于用户来说接触使用AR首先受影响的是内容,其次是终端,AR产业链可以粗略划分为技术提供商、智能终端研发公司,以及AR内容提供商。在这其中,AR设备提供商不可避免关注硬件技术,如底层的芯片、电池、光学镜片等,以及硬件本身的性能优化,而内容提供商更倾向于在现有技术基础上优化内容及表现。所以我们可以说AR技术提供商,或者说在底层算法研发上有一定成绩的AR公司是人工智能公司。

  对公司来说,特别是创企会把底层技术转化为成熟的产品或服务,这可能是如无人机、AR智能终端、机器人等,也可能是行业解决方案,以达到商业目的,并且这已经成为在沸腾声音之后,媒体、企业以及大众对AI企业的期待和要求。近期,人工智能产业发展联盟(AIIA)出版的图书《人工智能浪潮:科技改变生活的100个前沿AI应用》将对外发布,以及涵括了目前巨头公司以及创企在商业化上的前沿成果,也直接反映了AI目前的主要商业化方向。

  作为技术驱动的商业领域,无论是AR还是人工智能的其他多数方向,技术距离完全成熟还有很长的路程要走,在整个产业链逐渐繁荣,关注商业化实现的同时,也需要有更多公司机构去不断拓展技术边界,建立核心竞争力,让行业爆发更大的价值与潜力,如此,AI时代中国弯道超车当可期。

  声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容图片侵权或者其他问题,请联系本站作侵删。侵权投诉

  些基础知识UPS - Uninterrupted Power System利用电池化学能作为后备能量,在市电断电等电网故障时,不间断地为用户设备提供(交流)电能

  的概念元素资料下载的电子资料下载,更有其他相关的电路图、源代码、课件教程、中文资料、英文资料、参考设计、用户指南、解决方案等资料,希望可以帮助到广大的电子工程师们。

  我们天气,并推动自动驾驶汽车的发展。正是这项技术使机器能够从经验中学习并执行类似于人类的任务。

  的三大核心,是深度学习算法、数据和算力。在这三大要素中,大数据的获取和处理难度在下降,算法也在深度学习模型的基础上不断优化,而统

  样的,不同是的人类是通过眼睛去发现缺陷问题,而机器视觉是通过计算机感知系统做到查找缺陷,相比人眼来说更具有效率,毕竟

  社会是什么样子的?20年前的人想象不到今天的生活现状,想象不到我们的4G网络以及马上就要普及的5G网络,想象不到全息投影技术以及现在的物联网以及互联网领域的发展,如今人们已经进入到了

  就是让计算机模拟人类的视觉、听觉、触觉等感知能力,尝试去看、听、读,理解图像、文字、语音等,在此基础上,再让

  个神经网络,它模仿人脑中的神经元,使它能够自我教学、自我更新和自我进化。正因为如此,真正的

  的基础,它决定了机器学习和深度学习模型的质量。今天的数据呈现指数级的爆发,比如仅在2018年,就产生了超过30 ZB的数据。而在在任何

  ,就连街上的老大爷都能顺口说上两句,什么机器人,ALphaGo之类的,大家肯定也都很熟悉。可是,

  互联产品已经在家庭、办公室和工厂中不断普及,用户可以实时监测产品的状态和运行,对产品进行远程控制,并利用实时数据优化产品的性能表现。在

  融入到我们生活的方方面面,网络变得越来越具有威胁性,而“Deep attacks”可以通过利用

  早已经是各自领域炙手可热的研究话题。在许多复杂的科学问题上,比如癌症检测、预测地震余震、极端天气,探索新系外行星等等,我们已经可以看见机器学习逐渐显露的优势。

  可以瞬间抓捕癌细胞,就像安防的摄像头,它只需要把片子输进去,自己就会读,当它辨别这是肿瘤细胞的时候,就会

  (AI)是全球数字现实市场创新的关键驱动因素,其中包括沉浸式技术,如虚拟现实(VR),增强现实(

  哪些关键技术?谭建荣概括了8个方面:深度学习算法、模式识别算法、数据搜索方法、自然语言理解、增强学习算法、机械视觉算法、知识工程方法和类脑交互决策。

  已经深刻、广泛地影响着人类生活的各个领域。不仅每个人的日常生活,而且各个国家的发展前途,甚至整个世界的相互

  已经深刻、广泛地影响着人类生活的各个领域。不仅每个人的日常生活,而且各个国家的发展前途,甚至整个世界的相互

  金融科技风起云涌,大量民营银行也根据自身的发展战略,以金融科技为支点,打造在大数据风控、云计算、

  词最初是在1956 年Dartmouth学会上提出的。从那以后,研究者们发展了众多理论和原理,

  (Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的

  在材料、化学、物理等领域的研究上展现出巨大优势,正在引领基础科研的“后现代化”。在AI2.0时代,把握

  随着芯片不断微缩,或是应用于诸如AI或机器学习系统的传感器等新器件。材料已经成为整个半导体供应链的

  技术与家庭电视进行连接。通过完善的技术逻辑与大数据运营,让电视具有语言识别、图像识别、自然语言处理和专家系统等。通过语音指令让电视自动推荐、选择电视产品;同时还能学习用户使用及搜索习惯,以实现更精准的语音操控及互动。

  当很多人还没明白什么是区块链时,已经有专家提出了区块链3.0的概念,让很多小白更是云里雾里,搞不清东西南北。区块链传奇以20年互联网亲身经历和10多年的P2P分布式软件开发经验为基础,尝试用

  什么是区块链3.0,是否能令大家满意,请大家点评,如水平有限,不能令人满意,还望多多包涵。

  个怎样的未来?双方协同还是竞争?面对这些问题Quaclomm 执行副总裁 Matt Grob 分享了自己的观点。

  会看到,现在的电视机已经成为高清的天下,4K已经非常普遍,8K正在上量,可以预见未来的视频内容会以更快的速度向高清迈进。不仅观影视频内容在向高清发展,如今视频监控内容也在逐步走向高清,可以提高公安人员查案率,避免犯罪分子因为视频模糊而漏网。

  机器人和法官相结合所完成的简易案件速裁; 其二是案件预测全覆盖,辅助当事人参与诉讼,或者帮助诉讼参与人作出理性的预

  定不陌生,那就是 科大讯飞 。然而在创立初期,科大讯飞也经历了让公司绝望的日子,今天,小编就详细给你讲

  个非常保守的报告称,在2030年,中国会带来7万亿美金的国家价值。在全球有20多万亿的价值,仅仅这个价值就值得我们朝这个方向去努力。

  (Artificial Intelligence),英文缩写为AI,是研究、开发用于模拟、延伸和扩展人的

  颗芯片相当小且薄,如果不在外施加保护,会被轻易的刮伤损坏。此外,因为芯片的尺寸微小,如果不用

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186
  • 标签:vr属于人工智能吗
  • 编辑:刘卓
  • 相关文章
TAGS标签更多>>