您的位置首页  科技生活  人工智能

2022爱分析・人工智能应用实践报告

2022爱分析・人工智能应用实践报告

  自2019年起,人工智能的发展进入与产业加速融合的阶段。经过近几年的发展,人工智能已经广泛渗透进金融、零售、工业、能源、医疗、城市管理等多个行业和领域,并且一些行业头部企业已经全面拥抱了智能化转型。

  由于可获取和参考的建设经验有限,加上企业所处行业、发展阶段的不同,自身需求以及拥有的资源禀赋各异等因素,人工智能在产业中落地充满挑战。在本报告中,爱分析基于大量调研和过往研究积累,从战略、数据、场景规划、应用解决方案开发、技术基础设施、组织和人才六个维度梳理出了目前人工智能在产业中落地面临的20个主要挑战。

  智能化转型没有统一的路径和方法,不同企业在不同阶段面临的问题通常也各不相同。因此,企业在实施智能化转型之前需要对自身的AI应用成熟度状况进行评估,明确在不同成熟度阶段需要重点提升的能力,从而制定下一步实施计划,高效的推进智能化转型。

  在本报告中,爱分析将AI应用成熟度从低到高依次分为早期实验、初步投入、布局、深度应用、全面融合五个阶段,并从多个维度列举了每个成熟度阶段企业具备的主要能力特征。此外,爱分析也将目前国内主要行业企业AI应用成熟度各阶段数量占比情况做了展示。

  在本章,爱分析从战略、数据、场景规划、应用解决方案开发、技术基础设施、组织与人才六个维度论述企业在应对智能化转型的多种挑战时,可以采取的方法和措施,并从本次调研的案例中选取相关实践经验为企业提供参考说明。同时,本章还对处于不同成熟度阶段的企业在上述六个维度中需要阶段性提升的重点能力分别了给出建议。

  同时,爱分析对本次调研的企业智能化转型和AI应用实践案例做了详细梳理,并将案例内容呈现在本章中,其中以字母命名的案例为针对某个特定问题案例,具体包括:

  爱分析认为,所有的企业未来想要在市场中保持竞争力,一定都需要全面拥抱智能化。预计在接下来的3至5年,国内大量的企业对AI的应用将从单点的AI建设走向全面的智能化转型,企业因此需要针对智能化转型规划完善的路径和方法,同时结合自身AI应用的成熟度,制定符合自身状况的行动计划。

  相信随着企业智能化进程的推进,AI在产业中落地仍然会面临许多新产生的问题,爱分析将对这个领域保持持续跟踪研究,对前沿的案例保持关注,为企业智能化转型提供更多的决策参考

  在国家政策、产业需求、数据和技术体系趋于完备三重因素的推动下,人工智能的发展自2019年起进入与产业加快融合的阶段。经过近几年的发展,人工智能已经广泛渗透进金融、零售、工业、能源、医疗、城市管理等多个行业和领域,各种创新性的应用场景层出不穷。尤其在金融、智能制造等领域,一些头部企业已经在各个业务和职能部门中引入了大量的人工智能应用,并且已经构建起了较完善的面向智能化运营的技术能力、组织架构和创新机制。

  行业大势叠加头部企业的示范效应,吸引了众多企业纷纷跟进智能化转型。然而,智能化转型仍是一片虽已有众多人涉足,但鲜有人真正实现深耕的新,企业可获取和参考的建设经验有限,加上企业所处行业、发展阶段的不同,自身需求以及拥有的资源禀赋各异,需要针对性地开展人工智能的规划和建设等因素,导致了人工智能在产业中落地充满挑战。

  爱分析基于多个国内领先企业的智能化转型和人工智能应用实践案例的深度调研分析,以及过往对产业数字化与智能化的持续跟踪研究,梳理出了当下人工智能在产业落地中会面临的20个主要挑战,这些挑战涉及战略、数据、场景规划、应用解决方案开发、技术基础设施、组织与人才六个维度,具体如下表:

  智能化转型没有统一的路径和方法,不同企业在不同阶段可能面临的问题通常也各不相同。因此,企业在实施智能化转型之前需要首先建立一套企业智能化转型的能力框架,对框架内的多个能力维度进行评估,确认企业自身的AI应用成熟度状况。在此基础上,企业可以明确智能化转型的关键能力要素,以及各维度的能力在不同成熟度阶段需要重点提升的方向,从而制定下一步实施计划,高效的推进智能化转型和AI落地。

  基于本次调研和过往研究积累,爱分析将AI应用成熟度从低到高依次分为早期实验、初步投入、布局、深度应用、全面融合五个阶段,并且从战略、数据、场景规划、应用解决方案开发、技术基础设施、组织与人才六个维度列举出了每个成熟度阶段主要的能力特征,具体如下表:

  同时,爱分析综合IDC、红杉的相关数据以及本次调研结果发现,国内金融、零售、工业、医疗等主要行业开展过智能化建设的企业中,约30%处于早期实验阶段,约40%处于初步投入阶段,约20%处于布局阶段,约9%处于深度应用阶段,处于全面融合阶段企业不足1%,仅有少数行业超头部公司达到这一水平。

  考虑到处于早期实验阶段的企业内部对AI规划与建设尚无实质性的进展,该阶段的企业要推进智能化转型可以参照初步投入阶段的方法和实践经验;同时,处于全面融合阶段的企业一方面国内的样本量非常少,另一方面该阶段的企业已基本完成智能化转型,需要更多地关注和解决智能化运营方面的问题。因此,本报告将只对处于初步投入、布局和深度应用三个阶段的企业如何开展智能化转型进行详细讨论,并分别提供建议。

  在本章,爱分析将从战略、数据、场景规划、应用解决方案开发、技术基础设施、组织与人才六个维度论述企业在应对智能化转型的多种挑战时,可以采取的方法和措施,并从本次调研的案例中选取相关实践经验为企业提供参考说明。同时,本章还会对处于不同成熟度阶段的企业在上述六个维度中需要阶段性提升的重点能力分别给出建议。

  全面的智能化转型需要从顶层开始设计,避免因依靠局部业务需求驱动的AI能力和应用散点建设造成后期难以统一管理和资源浪费。因此,企业应该首先明确智能化转型的关键目标,以及明确为了达到相关目标的建设思路和路径,针对这些问题对智能化转型进行具备前瞻性和系统性的规划。同时,企业需要在组织、治理结构和制度流程等方面达成统一,才能高效地推动智能化建设,达成相应目标。

  例如在案例A中,某大型保险集团制定了平台、应用、技术“三个领先”战略,并成立专门大数据和人工智能部门,从项目管理机制、前沿技术研究、国产化方案替代、应用成果孵化等方面开展建设,从而推动智能化转型。

  AI应用本质上具有实验性和创新性,因此也天然地会伴随着一定的不确定性和失败风险。为了实现AI应用的落地,企业需要首先建立鼓励创新,容忍失败的工作氛围,其次,建立业务创新机制,在内部密切关注AI技术的发展趋势,及时识别将AI技术用于业务创新的机会,以及不断强化组织内的AI开发能力,并推动应用的落地。

  布局阶段:企业在该阶段应首先在组织内广泛地鼓励创新,明确智能化转型短期的目标和路径。同时需要对中长期的目标有所考虑和规划。

  深度应用阶段:企业在该阶段应建立完善的智能化转型中长期目标和规划,在组织内就智能化转型的方法、流程、创新机制达成了统一,并给予全方位支持。

  某大型保险集团于2019年成立了集团科技中心大数据和人工智能部,由此开启了人工智能技术发展之路。该保险集团拟在人工智能建设方面实现“三个领先”的战略目标。一是领先的平台:持续打造涵盖NLP、语音、OCR、人脸识别、大数据应用子平台的集团统一人工智能技术平台,各项技术指标居于行业领先水平。二是领先的应用:聚焦客服、管理、销售三类机器人突破,机器人研究和应用水平居于行业领先水平。三是领先的技术:核心算法全部自研,关键技术和硬件具备国产化替代方案。

  1)制定长期规划,营造创新氛围。集团制定了长期人工智能发展规划,和适合科技创新的项目管理机制,营造鼓励创新、容忍失败的工作氛围。

  2)钻研前沿技术,加快技术落地。密切跟踪人工智能技术的演进趋势,并适当开展前沿技术的研究,缩短前沿技术落地的周期;重点加强多模态AI应用落地的能力,加强大数据和AI深度协同的能力,加强研发人员对业务的理解。

  3)探索国产化替代方案,实现技术的提前储备和自主可控。探索PaddlePaddle等国产深度学习基础框架,验证国产GPU的实际性能,形成备用方案,确保极端情况下仍然可以开展人工智能的应用和研究。

  4)加快机器人突破工程成果孵化,探索研发通用机器人。利用机器人研发成果,进行销售和管理机器人嵌入式研发,重点突破人机混合运营下的机器学习;依托各类私域流量和公域流量,实现纯线上化的销售模式和销售管理模式;由小规模、人机协作向全覆盖、无人化演进,并探索研发通用机器人。

  良好的数据基础是支撑智能化转型的前提,针对数据孤岛、数据质量低、数据广度与深度不足、数据架构老旧等企业数据基础中的问题,企业需要重视数据治理与数据平台建设工作。

  在数据治理方面,企业应该组织专门的数据治理工作,制定数据标准和数据治理体系,提高数据质量。如在案例1中,中新天津生态城在利用内部外数据,构建智慧城市产业大脑之前,首先成立专门的数据治理小组,开展相关工作以提高数据的质量。

  在数据平台建设方面,企业需要构建统一的大数据平台或数据智能平台,打通各部门、各系统的数据,丰富数据的来源,提高数据的广度和深度。同时,设计面向AI应用的数据架构,方便AI应用开发和运营中对数据的调用。例如在案例7中,某银行为了构建智能消费者保护中台,其首先建设了全口径的投诉管理大数据平台,整合行内10多类异构多模态数据,以打破多业务部门、各区域、各系统数据壁垒。关于数据平台的详细构建方法可参考爱分析于2021年11月发布的《2021爱分析・数据智能平台实践报告》。

  为了高效地给AI开发提供匹配的数据,支撑AI应用的规模化落地,企业内部需要建立一套面向AI开发的自动化的数据采集、数据处理和数据管理的方法与能力。具体而言,可以在数据采集端如摄像头、传感器内置相应算法自动采集所需数据;采集的数据上传至云端或本地后,设置相应条件,自动触发数据标注任务,交由业务专家标注数据,在某些情况下还需要自动将新标注的数据与原先的数据集进行合并;当平台监测到新的数据版本后,再自动对模型进行训练,并对新的模型进行评估和上线中,上汽安吉物流在研发其视觉智能管理系统时,采用了这套标准化和自动化的从数据采集,到数据标注,到模型训练的流程和方法,支撑了平台功能高效和批量化地迭代更新。

  初步投入阶段:企业在该阶段应首先解决的数据基础较差的问题,因此需要积极开展数据治理工作,提高数据治理;并建立统一的数据平台,打破数据孤岛,丰富数据来源。布局阶段:企业在该阶段应已经解决了数据基础较差的问题,同时对于AI开发和运营对数据的要求较明确,初步建立面向AI开发的数据采集、数据处理相关的标准化方法,并考虑如何提高整个流程的自动化能力。

  深度应用阶段:企业在该阶段应建立起完善的数据治理机制,并常态化的执行,建立能够支撑AI应用的数据智能平台;同时,企业还应建立起面向AI开发的数据采集、数据处理和数据管理等方面的标准化方法和高度自动化的能力。

  中新天津生态城(以下简称“生态城”)是中国与新加坡两国政府战略性合作开发的生态城市,于2008年9月开工建设,总规划面积为150平方公里,旨在打造产城融合、绿色发展、智慧城市、国际合作的示范区。为了构建智慧城市产业,生态城当前重点发展5G创新应用、大数据交易生态、传统产业融合创新应用三大交互应用产业,希望打造从数字生产资料挖掘、到智能产业研发孵化、再到龙头企业牵引的产业链。然而,生态城在产业发展中,其产业规划、招商引资、企业服务工作都面临着一些痛点问题,这些问题包括:

  招商引资方式粗放、单薄。生态城在确定产业招商方向后,由于没有产业链信息,导致招商缺乏针对性的标的;或者有明确的招商标的,但对待招商企业进行评估时缺乏支撑数据和智能评估方法。

  产业扶持与企业服务缺乏主动能力。生态城在服务园区内的企业时,无法为企业准确匹配合适的扶持政策,也无法主动为企业提供全面、个性化服务。

  从根本上而言,上述问题都在于生态城在开展产业发展工作的过程中,缺乏以数据为支撑的产业分析工具。事实上,生态城经过多年发展,已经积累了大量的智慧城市公共数据,包括了区域经济运行、内部工商、财税、政策扶持等数据。与此同时,大量公开的数据,如企业工商、业务、专利、招投标、投融资、舆情、风险等数据也能够为生态城的产业发展规划所用。

  因此,生态城要解决产业规划、招商引资、企业服务工作中面临的问题,就需要首先借助一系列的工具和方法,从海量的结构化和非结构化数据中挖掘出有用的信息,并以体系化的形式呈现出来,为生态的产业规划和发展提供数据支撑和科学的指导。

  针对上述挑战,中新天津生态城希望通过引入大数据和人工智能技术来构建解决方案。在对厂商的产品、技术和服务能力进行综合评估后,生态城选择与爱数合作共建解决方案。爱数成立于2006年,是一家大数据基础设施提供商,提供结构化数据、非结构化数据、机器数据、知识图谱数据等全域数据能力,为政府、公共事业及企业的数字化转型赋能,帮助各行各业的客户释放数据价值,实现即时、随时、实时的数据服务。

  爱数为中新天津生态城提供的智慧城市产业大脑解决方案,包含了一个产业知识网络、三个能力平台、N个应用模块的“1+3+N“架构,为智慧城市产业发展中的“产业-招商-服务”全环节提供数据服务。

  如前文所述,整个解决方案的核心在于如何从海量数据中提取出有用信息,并构建以产业链、企业图谱为中心的大规模知识网络。为了解决这一问题,爱数项目团队重点开展了如下工作:

  1)数据治理。生态城内外部大量数据的数据质量状况较低,因此爱数为该项目成立了数据治理小组,制定数据标准和数据治理体系,提高数据质量。

  2)知识抽取。在构建知识网络前,需要对数据尤其是大量非结构化数据中的知识进行抽取。对此,爱数使用其AnyDATA产品内置的语言模型,同时也为生态城定制了一些自然语言处理模型,比如产业政策、企业基础画像、招投标、投融资等模型,从数据中精准地抽取关键要素或属性。在此基础上,为这些属性设立匹配规则,从而构建知识间的关系。

  3)构建知识网络。爱数基于AnyDATA产品内置的知识图谱、决策树等技术为生态城构建产业知识网络。同时,提供AnyDATA意图理解、规则、推理、图计算等引擎,可以实现精准的知识搜索、关联分析和辅助决策。

  企业图谱:基于工商、知识产权等公开数据,构建企业集团关系链、市场布局、产品业务链,实现企业链的精准定位和分析;

  政策图谱与规则知识库:省市区多级政策要素自动抽取,形成分类、分级的政策要素与政策适用规则库,以便政策的自动精准匹配推荐;

  产业及经济运行预测分析:基于产业链、企业链及其他产业要素动态事件的可视化推理及关联分析预测;

  投融资雷达:基于投融资事件知识与企业链、产业链的匹配,实现焦点招商、以商招商(园区关联企业的投融资线索)。

  智慧城市产业大脑在中新天津生态城的招商引资、产业经济、企业服务中产生显著的应用价值和效果。

  1)招商引资更加精准。产业大脑汇聚了生态内外部的工商、产业等数据,结合知识图谱技术,深度研究行业、企业业务,基于产品标签集相似度,可以寻找到同类企业,然后利用企业画像工具对企业实力进行评估,寻找行业隐形冠军,从而更加精准地进行招商引资。

  2)产业与经济运行状况了解更及时。产业大脑根据企业产业标签管理,了解生态城产业结构,生态城因此能够紧跟国家发展战略目标;同时,通过度分析,生态城可以了解各产业发展情况,掌握产业增长与下降趋势,以及影响产业发展走势的主要企业;并收集宏观经济与区域经济数据,并进行对比,掌握经济发展差距,为宏观调控提供支持。

  3)企业服务更主动。借助产业大脑,生态城可以从从企业入驻起对企业进行全生命周期管理。对标同行上市企业画像,判断企业发展方向、可能遇到的问题,进行主动培育服务。同时,基于政策试算器,向政策管理用户提供政策匹配企业列表、企业兑现情况清单。

  对于企业和政府部门而言,其在业务发展过程中会积累大量的文档和内容数据,这些数据中存在着大量有价值的信息,通过构建知识网络整合这些数据,能够为企业和政府部门的管理、业务发展提供有效的决策支撑。而从数据中挖掘价值,需要借助一系列方法和人工智能技术:首先要收集好各类型的内外部数据,并做好数据治理工作;然后借助NLP技术从数据中精准地抽取知识,建立知识间的关系,并且在此过程中,需要适当根据具体业务需求定制开发NLP模型。最后在此基础上构建知识网络,并利用规则、推理、图计算等引擎从知识网络中获取有效信息。

  安吉智能是上汽安吉物流旗下专注于智能物流解决方案的服务商,服务于上汽安吉物流内部的同时,也向汽车制造、机械电子、医药、冷链、日化、服装等行业企业提供相关技术服务。物流行业向来注重安全管理工作。以上汽安吉物流为例,其业务范围涵盖汽车零部件、整车、港口、快运四个物流业务板块,包括上汽、特斯拉等主要汽车公司的整车仓储与进出口业务,其在全国范围内管理10个港口、300多个网点、5万多名员工。为了保障如此庞大的物流系统能够安全有序地运转,上汽安吉物流每年花费上亿元用于雇佣安保人员。但随着业务规模的增长,过度依赖人力的传统安全管理模式已经无法满足其发展需求。

  针对物流行业安全管理中的痛点问题,安吉智能自主研发了“安眸智能视觉管理系统”,利用计算机视觉技术对港口、园区、仓库等物流业务场景中的核心元素“人员、货物、设备”进行识别和分析,并对出现的违反安全管理规范的问题及时提醒和采取相应措施,主动化解潜在危险。以仓库场景为例,安眸系统能够对仓库内的叉车超速、禁区出现人员、员工危险动作、着装不规范等行为作出精准识别,并进行管理。

  由于计算机视觉模型通常只能对预先训练过的场景和物体进行识别,为了满足上汽安吉物流管理的10个港口、300多个网点,以及其对外服务的200多个客户不断提出的各异的功能需求,在安眸系统中不断上线新的识别功能,安吉智能的研发团队就需要不断获取新的样本数据,并在不改变边缘算力的前提下,对AI模型进行不断的更新和运维。

  因此,安吉智能需要解决AI模型频繁迭代过程中的多个工程化难题。例如,针对迁移学习时模型会产生旧数据遗忘的问题,安吉智能已经通过自研知识蒸馏、混合学习等技术让模型在学习新的数据特征后获得新的识别能力的同时,也保留原先的识别能力。但安吉智能仍然需要应对以下两点主要的问题:

  1)缺少能对非结构化数据进行精细管理的工具。安吉智能有大的图像数据集,但每个网点或客户提出新的功能需求时,其提供的图像数据的采集时间、采集目标、标注类别等信息都不一致,安吉智能需要将这些数据增补进原先的数据集中,记录数据集的层次结构,并形成不同的数据版本,从而用于模型误差分析和模型反复迭代。然而之前基于文件夹的手动管理方式,不仅很难追踪过去版本的模型和数据集的对应关系,在上百甚至更多个网点和客户都提出需求时,其数据版本就很难以文件夹的形式进行管理。

  2)算法团队需要深度介入数据处理工作,手动执行效率较低。由于模型开发中数据的收集、标注,以及模型训练等流程存在大量需要算法团队介入的数据处理工作,安吉智能需要依靠算法开发人员对数据处理工作进行层层把控,手动执行各种操作。当模型的迭代更新变得非常频繁时,算法和数据团队的深度绑定会使得模型迭代流程非常耗时耗力,甚至无法完成。

  面对模型频繁迭代,以及由此带来的大幅增长的数据管理需求,安吉智能选择与格物钛智能科技进行合作,将格物钛的AI数据管理平台作为安眸系统研发中的AI基础设施组件之一,以解决其痛点需求。格物钛智能科技是一家人工智能基础设施提供商,其核心产品非结构化数据管理平台向各类创新企业及团队提供AI数据管理解决方案,以数据引擎为核心技术,解决非结构化数据的发现、管理、利用等难题,实现对海量复杂数据的灵活存取用,从而推动企业的数据资产化和AI工程化落地。

  第一,在云端对数据进行统一托管。安吉智能各个网点的数据都存储在云端,格物钛的数据平台全面托管了安吉智能的原始数据、标注数据和元信息。在平台的权限管理功能保障数据访问安全的前提下,安吉智能的团队可以在平台上方便地访问数据和进行团队协作。

  第二,数据版本可追溯。安吉智能每月或每周会在数据集内新增图片和物品类数据,通过格物钛数据平台,安吉智能在新增的数据上做标注,然后合并进原有数据集,并打上标签,从而形成新的标准化的数据集版本。算法工程师只需要根据标签就能找到需要的数据集版本,并比较各个数据集之间的差异。

  第三,数据集分布特征可视化。格物钛数据平台的可视化组件能让算法工程师从宏观层面查看数据集的特征分布,以及从微观层面查看单个文件和标注数据。安吉智能的算法工程师因此能够在模型训练前直接查看数据标注信息,也可以在模型训练后将预测结果作为一个数据版本,与人工标注的数据版本进行比较,从而判断模型效果和数据标注质量。

  针对算法和数据团队的深度绑定,手动执行数据处理工作效率低的问题,安吉智能通过使用格物钛数据平台的Action功能,并结合了一些自研算法,对数据收集、数据标注、模型训练等关键流程设置任务自动触发机制,并让整个流程实现自动化。在数据收集阶段,安吉智能通过自研图像相似度和质量分析的算法,当发现符合要求的图像后自动在摄像头中进行抽帧并将图像上传至云端;在数据标注阶段,通过使用格物钛数据平台,当符合需要的图片数据达到一定量级后,平台自动触发数据标注任务,然后通过签约的数据标注公司在平台上对数据进行标注,再与原先的数据集进行合并。在模型训练阶段,当平台监测到数据标注完成形成新的数据版本后,会自动先进行模型训练,然后对更新后的模型的预测结果进行评估,识别预测效果不好的图片,并在平台上对数据标注实时地进行调整。

  首先,格物钛非结构化数据平台为安吉智能实现了模型开发中的高质量数据供给。借助平台的云端托管、版本管理、数据集分布可视化等功能,安吉智能解决了模型迭代中的多种数据痛点,减少了数据收集、数据准备和模型评估中大量手工操作,让算法工程师可以专注于用AI模型去解决业务问题,模型精度能因此能提高30%以上。

  其次,平台的自动化能力大幅缩短了安吉智能模型迭代的周期,节约单模型训练的人工成本。安吉智能预期因此可以实现每周对模型进行一次迭代更新,从而上线新的识别功能,最终全年能上线个识别功能,并且单次模型训练能节约25%的成本。

  以AI应用的复杂性,其在产业中落地的一大瓶颈通常在于数据的质量和匹配度。对于大部分传统企业而言,其数据量有限,研发能力也相对不足,如果把AI应用开发的重心放在改进算法上,效果往往并不如意。因此,传统企业在AI应用开发中应该把重点放在获得质量更好、匹配度更高的数据上,帮助提高模型效果,让AI应用更好地落地。

  企业在AI模型开发或迭代频次较低时,其数据管理可以通过文件夹形式手动管理,但随着AI应用的加速落地,企业每年需要开发几十甚至更多个模型的时候,手动管理的方式将难以为继。此时企业应该选择标准化的工具对模型开发中需要的数据进行高效地管理,从而保障模型的持续迭代和更新。同时考虑在流程中引入自动化能力,进一步缩短模型迭代周期。

  通常,企业在确定和规划AI应用的落地场景时有业务需求导向和资金投入导向两种方式。对于需要快速推进智能化转型,追求AI落地的时间和成本效益的企业,可以考虑业务需求导向的方式。具体而言,企业可以首先由专门的协调管理部门或技术部门联合各业务部门确认业务需求较强的应用场景,而业务需求强的判断标准包括了人员投入大、重复性劳动多、人工操作效率不高或效果不理想等;其次,需要考虑开发该应用所需的数据是否容易获取,如果内部数据不充分,可以考虑是否能从外部厂商引入相应的数据;最后,需要业内已经有针对该应用场景的较成熟的解决方案,降低开发新应用的时间和资金成本。

  在上述判断的基础上,企业可以将强业务需求、所需数据能够获取、有较成熟解决方案的场景规划为需要实现AI落地的场景。例如案例3中的美宜佳和案例8中的海信集团都采用该种方式规划和落地AI应用的场景,其中,美宜佳前期根据业务需求确认了门店选址、门店运营和营销优化三类应用场景,并从外部引入了实现这些AI应用所需的时空数据,以及这些领域成熟的AI模型和应用解决方案。

  对于需要持续做深智能化转型,且资金和研发实力较强的企业,可以考虑资金投入导向的方式。具体而言,企业可以由专门的协调管理部门或技术部门协同业务部门或相关管理部门确认费用支持较大的业务场景:其次,需要考虑开发该应用所需的数据是否充分和是否容易获取;最后,需要判断在该业务场景中是否能用算法找到数据中的规律,或者是否能用相关AI技术解决解决这一问题。

  在上述判断的基础上,企业可以将费用支出大、所需数据能够获取、且能用算法或相关AI技术解决的业务问题规划为需要实现AI落地的场景。例如案例C中,某全球头部日用消费品公司在华公司由其数据科学与人工智能团队对品牌建设、销售管理中费用支出较高的业务场景进行筛选,结合数据和算法能力,最终在媒体规划、广告定位、会员活动设计、促销优化、供应链管理等场景中落地了多个AI应用。

  对于任何类型的企业而言,其在实施智能化转型时都需要考虑AI应用场景落地的先后顺序,集中资源在高价值度场景中优先构建AI应用,因此需要对应用场景的价值度做排序,并对单个AI场景的ROI做事前预估和事后评估。关于应用场景的价值度,一般从高到低可以分为三类。第一类是能够对业务模式或业务流程进行创新,从而为客户提供创新性的产品或服务的应用场景,这类应用场景价值度通常最高。例如在案例B中,江南农商银行将虚拟数字人嵌入多个业务系统中,从而能够在无人场景中为客户提供多种业务咨询和业务办理;在案例6中,在先进的AI算法的支撑下,安克创新利用AR虚拟试戴解决方案,为其用户提供真实度非常高的线上眼镜试戴功能,不仅为用户提供了创新性的体验方式,也大幅提升了购买转化率;第二类是能够为企业大幅提高运营效率和降低成本的应用场景,通常该应用可以为企业带来数倍甚至更多地运营效率的提升或成本的降低。例如在案例4中,某餐饮连锁企业用计算机视觉对饺子品质做检测,完全代替了原先用大量人工去抽查的方式,为企业大幅提高了运营效率和节约了成本;第三类是能够一定程度提升运营效率和降低成本的应用场景,通常其对运营效率的升和成本的降低在100%以内,这类应用场景可以在企业资源充足的情况下去考虑智能化。

  关于ROI的评估,企业主要需要关注在特定业务场景中,投入某项AI应用前后,在该场景中企业的费用成本是否有降低,以及降低的比例。除了在事后评估ROI,事先也可以借助可参考的案例对ROI做预估,确定场景的价值度。例如,在供应链管理中,企业可以评估引入AI应用前后,供应链相关成本是否有得到优化。

  初步投入阶段:该阶段的企业应主要参考高价值度应用场景定位的方法,优先选取价值度最高,且较容易落地的场景去落地。

  布局阶段:该阶段的企业应先在多个主要的业务部门落地价值度较高的场景,同时要探索并初步建立场景落地的流程和方法。

  深度应用阶段:该阶段的企业应建立并常态化执行场景落地的流程和方法,并且做好计划,每年在各主要部门批量化落地一定数量的场景。

  美宜佳控股有限公司是国内第二大连锁便利店集团。自成立以来,美宜佳以广东为中心,并逐步在全国范围进行业务布局。目前,集团拥有美宜佳品牌门店两万多家,每日门店总客流量达2500多万。线下零售的核心逻辑是以“场”为中心去对接“人”和“货”, 而“人货场”各自的特征要素以及它们之间的关系都在不同程度上影响着门店经营策略和结果。对于正加快在华东、华北等地区扩张门店的美宜佳而言,经过早期信息化建设,其已建有ERP、PIM、BI等业务系统,在内部积累了较丰富的“人货场”数据。现阶段,美宜佳希望用智能化的方法对人、货、场的特征要素及其关联进行分析和优化,支撑门店的稳步扩张和精细化运营。

  结合业务需求、智能化可行性等因素,美宜佳决定在门店选址、门店运营、营销优化三类重要场景中引入智能化解决方案。在门店选址方面,美宜佳需要用智能化的方法在城市中确定合适的拓店区域、该区域消费者习惯以及自身定位等情况;在门店运营方面,具体包含门店评估、品店匹配、销量预测、竞品分析等应用场景,帮助美宜佳更好的制定经营策略、提高门店业绩;在营销优化方面,则需要结合人群定向,对广告投放策略做优化。

  为了在上述场景中实现智能化决策,美宜佳决定打造商业智能决策管理平台。但美宜佳在相关数据的完备性、以及AI算法能力上存在不足,具体如下:

  1)数据层面,美宜佳仅掌握店内经营数据和自有供应链体系的后端数据,但缺乏外部的地理位置、周边人群、周边竞品相关的数据。同时,在与外部厂商共同探索解决方案时,美宜佳需要分享内部数据时保证其数据的隐私和安全。

  2)AI算法层面,选址、选品、消费者画像、营销的智能化分析需要大量AI模型支撑来实现,美宜佳需要外部厂商提供相关的AI模型,并用模型解决业务问题。此外,不同地区的数据分布会有较大区别,通用的模型很多时候不能直接适用,需要根据区域、环境等因素对模型做调整和迁移。

  在对厂商的数据、AI算法、应用解决方案等方面的能力进行评估后,美宜佳选择与维智科技合作,建设商业智能决策管理平台。维智科技是一家时空人工智能平台提供商,专注于线下场景的数字化和线上线下的时空融合,通过时空AI技术打造数字孪生体,为城市、交通、金融、地产、零售和品牌等提供精细化场景服务和智能解决方案。

  基于维智Phy-gital飞吉特时空智能平台,美宜佳构建了商业智能决策管理平台,其架构上分三层:底层是联合数据仓库,包含维智科技提供的时空数据和美宜佳提供的门店数据;中间是技术服务层,包括AI模型、时空知识图谱、业务计算逻辑等;上层是各类分析应用,包括门店选址评分、门店绩效评级、归因分析、人群画像、销量预测、价格预测、竞品分析等。

  针对数据层面的问题,平台通过联合数仓的形式整合了维智科技的营销智能基础数据与美宜佳的门店数据。维智科技的营销智能基础数据包含客流、画像、人群流动偏好、周边生态、交通情况、商业环境、竞合关系等类别的数据,具体包括了路网、交通、AOI(区块),POI(点位)等静态数据,以及测绘相关的人流、画像、场景、企业、经济等动态数据。在此基础上,通过梳理“人、货、场”之间的特征管理,形成时空知识图谱。为了保护美宜佳的数据隐私,维智科技将其时空数据、模型服务与美宜佳的内部数据结合,以一体机的形式部署在美宜佳的受限环境中,模型的构建、训练、管理和发布均在一体机完成,确保美宜佳的数据不出库。

  针对AI算法层面的问题,平台基于分类、排序、聚类、异常发现、回归预测、溯因推理分析等技术模型,结合特征工程、自动特征计算等服务,形成画像、选址、选品、营销等方面的预测分析模型。同时,对于通用模型需要针对区域数据特征有变化进行适配的问题,维智科技通过匹配可适配的用例或特征来做模型迁移,并通过数据增强或者小样本学习来解决数据量少和样本稀疏的问题。

  1)门店选址方面,平台为美宜佳在广东、以及华东地区选址拓店,提供了数据支持和智能化的决策依据。具体而言,通过分析当前地区用户的习惯、常驻和流动人员的习惯、场本身的特性(是周边是医院、社区、商业中心等)、周边竞争态势(供需饱和度)、交通便利性等数据,判断某个地点是否适合开店,并给出关于在该地店的评分,以及影响评分的因子。这比传统的依靠调研和专家经验的方式大幅提高了决策效率和准确率,可以支持美宜佳每年3000家门店的开店合关店决策。

  2)门店运营方面,该平台有效帮助美宜佳品牌门店和加盟门店总计4w+门店,进行数字化智能化运营。在门店评级、销售预测、归因分析、运营优化和营销优化等方面,提供线下大数据和智能预测结果辅助决策,有效指导门店运营优化。

  第一,线下零售业涉及的数据量大、维度多、动态更新也相对频繁,在选址选品、供应链配货以及营销等业务中需要依据这些数据做出相对实时的决策,因此复杂度和难度很大。但零售数据核心上还是围绕人货场及其关联,面对复杂的数据场景,可以考虑运用知识图谱技术,将各维度数据按人、货、场梳理,再形成场与场、人与场、货与场的关联;同时考虑运用AI模型来刻画复杂的变化规律、分析思路和决策经验。

  第二,只有店内数据无法在线下零售场景中实现智能化,因此还需要引入店外的时空数据,将地理位置、周边人群、周边竞品等外部数据与内部数据结合,才能实现1+12的效果。并且,在将内外部数据进行结合时,需要考虑通过相应的技术或产品设计方式保障数据的隐私安全。

  在银行业积极探索更丰富、更精细化的客户服务方式,消费者对银行服务的效率和便捷性也有了更明确的需求,以及疫情常态化对银行远程服务能力要求更高等因素的推动下,江南农商银行于2021年12月与京东科技合作推出的国内首个业务办理类数字人“言犀VTM数字员工”。区别于以往咨询问答式机器人,VTM数字员工的创新之处在于,其采用拟人化的形象与用户进行对话交互,为用户提供了良好的沉浸式体验;同时,VTM数字员工与江南农商行的业务系统深度耦合,从而支持VTM数字员工从业务系统中调用数据支撑用户问答与交互,并代替业务人员在各类交易场景中帮用户闭环完成咨询、查询、导览,以及取款、开户、密码重置等业务。而支撑虚拟数字人与银行的业务交易场景打通,为银行实现创新性业务模式的是京东科技在NLP、TTS、ASR、虚拟形象、图像识别等多种自研AI技术上深厚的积累,通过将这些AI技术有机结合,VTM数字员工具备了音唇精准同步、表情丰富逼真、交互流畅自然等高度拟人化的特征,以及高准确率的语音语义识别能力,并能精准识别数字连读和方言,也为适老化能力的建设和乡村金融服务的街乡级渗透提供新路径。

  VTM数字员工的投入使用,不仅大幅提升了江南农商银行远程银行的接待能力与服务效率,降低了运营成本,还勾勒出银行服务的未来发展的新形态:即通过运用人工智能等先进科技,银行可以构建无人场景下的服务能力,重塑服务模式与体验,为客户提供更便捷的服务。这将成为未来银行业甚至整个服务产业的发展趋势,具备大规模推广的潜力。

  某全球头部日用消费品公司在华公司为保持其市场领先地位,需要在品牌建设、销售管理优化等方面实现全面的智能化。因此,其数据科学与人工智能团队采用了资金投入导向的方式对AI应用进行了规划。具体而言,该团队筛选应用场景的标准有三个:第一,优先考虑费用支持较大的场景;第二,重点考虑数据层面的问题,包括数据的充足度、数据获取的难易程度、数据的有效度;第三,能够用算法从数据中找到规律,从而解决该业务问题。基于上述方法,该公司如下五类方向落地了多个AI应用,显著降低了公司的费用支出。

  第一,媒体规划,即将媒体预算以最优的方式分配投入给不同的媒体形式,如视频、站内、电视、户外广告等。

  对于处于早期投入阶段,尚无AI应用构建能力和经验的企业而言,企业构建AI应用应该主要考虑外采。对于处于布局或者成熟度更高阶段的企业,其已经具备了一定技术能力、专业人员和AI应用开发经验,此时企业构建AI应用应该以自研为主。但是当企业在构建AI应用时,面临以下一个或多个问题时,需要考虑和外部厂商合作联合开发或者完全外采解决方案。这些问题包括:(1)应用解决方案复杂度较高,需要多种底层AI技术的支撑,自研难度大、成本高、时间长;(2)企业内部缺乏应用开发所需的数据;(3)企业自身不具备特定应用场景的业务知识或AI应用开发实践经验。

  例如在案例9中,某集团科技公司由于在搭建供应链管理相关的AI应用时面临智能调度、仓配算法开发难度大,搭建智能营销应用时缺乏市场客户数据,搭建园区安全时缺乏实践经验,便选择与京东云合作在这些领域联合开发AI应用。

  AI应用最终需要解决的是业务的问题,而精通技术的算法工程师或数据科学家往往对业务问题缺少了解,因此在AI应用开发中,AI开发团队需要寻求业务专家的帮助和指导。在开发应用解决方案之前,要协调内部资源,对精通业务的人员进行深入调研,针对具体场景梳理业务流程,理清每个环节的业务需求。如在案例5中,中宏保险在搭建营销员智能助理解决方案之前,首先对保险营销员的需求进行了充分调研,了解营销员需要询问哪些保险知识,对知识的呈现有哪些要求,在问法上有哪些独到的习惯等问题。

  在开发应用解决方案过程中,企业需要业务专家协助,确定业务的标准。具体而言,包括了在计算机视觉相关的应用开发中,由业务专家帮助确定图像的分类、图像是否符合要求的标准;在自然语言处理相关的应用开发中,由业务专家对词性、词语分割、情感等进行标注,提高语义理解的准确度。例如在案例4中,某餐饮连锁企业为了在饺子质检应用中确定饺子是否合格的标准,便由其业务专家与开发人员一起确定了饺子“白鼓”、“偏皮”等维度判断标准,并在图片中做相应的标记用于模型训练。

  企业在探索性的AI应用开发中经常会受困于如何将业务问题转化为算法可解决的问题,通常这类问题的只能借助精通技术的同时能对业务也非常了解的数据科学家或算法工程师来解决。比如,需要经验丰富的数据科学家或算法工程师能够判断某个业务问题是属于分类问题,还是回归问题;特征工程的特征和目标是否有因果关系等。在此基础上,企业在具体执行中,还可以进一步参考案例4中明略科技在帮某餐饮连锁企业开发饺子质检解决方案时的做法,即通过多种可能的业务标准标注多个数据集,再对照多个算法不断测试,最终得出效果较好的模型。

  传统企业在开发AI应用时,通常会面临样本数据量较小的问题,比如,制造企业想开发针对某个零部件的智能质检应用,其样本数据可能不足100个,或者医疗机构想要构建一个罕见病的疾病预测模型,其样本数据可能只有几十个。此时,企业一种方式是可以考虑采用较前沿的小样本学习技术开发此类AI应用,另一种方式是提高样本数据的数据质量,不仅是前期做数据采集时要考虑通过用一些定制化的方法让采集到的样本数据与需求尽量高度匹配,同时也要借助业务专家提高数据标注的准确度,从而能够以较小的样本数据集开发出AI模型。

  为了让AI应用能早日上线发挥价值,企业可以在开发AI模型或AI系统时先用最少的数据量去训练模型或系统使其达到初步可用的状态即在业务中部署,后续在运营过程中再针对新收集的数据,对模型进行增量学习,或对系统进行更新,从而使AI应用更加聪明,功能更完善。例如在案例5中宏保险智能助理案例中,由于保险行业知识体系庞杂,为了让智能助理能够早日上线发挥价值,中宏保险采取了在知识库中先加入营销员最关心的问题,后续再利用平台的AI自学习能力从新的数据中学习新的知识,并逐渐丰富知识库的策略。

  针对在业务系统中部署AI应用会面临各种场景化适配的问题,如果应用解决方案对计算实时性、数据安全的要求都不高,数据量相对有限,以及追求更低的计算成本,可以主要考虑在边缘端通过算法控制采集所需数据,在云端部署解决方案的方式。例如在案例4某餐饮连锁企业的饺子质检解决方案中,其在摄像头中内置过线检测算法采集到每一盘经过出餐口的水饺图片数据,这些图片数据的数据量相对有限,对带宽、存储和计算要求都不高,然后将图片数据上传至云端,通过定制的质检算法判断饺子的品质。而如果解决方案需要实时生效,且数据量大,上传云端对带宽、存储和计算资源要求都很高时,企业需要考虑将解决方案部署在边缘或设备端,同时要对算法和SDK包体积的大小以及边缘或设备端的算力资源进行优化,以保证算法能够在边缘或设备端有效运行,并产生实时的计算结果。例如在案例6中,火山引擎在其AR虚拟试穿试戴解决方案中内置了3D关键点识别、惯性检测、人脸属性等多种AI算法,以保障用户的试戴体验的真实性,而为了让这些算法能够在移动终端运行和实时生效,火山引擎在保证模型精度不降低的前提下,对模型大小进行了压缩,对移动终端的算力资源也做了相应优化。

  初步投入阶段:由于企业自身研发实力暂时有限,建议主要考虑跟有成熟解决方案的厂商合作,构建相关应用。同时,企业需要对上述问题,如协调业务人员参与、开发部署中的重点问题有知晓,在过程中给予应用开发项目组资源支持。布局阶段:明确企业自身的能力和资源,对应用是否自研、合作开发、外采,设立明确的标准;重视内部业务专家对应用开发的作用,建立业务和技术人员的协作机制;参照上述方法,加快应用开发到部署的效率。

  深度应用阶段:建立较完善的自研能力,尤其重视技术人才队伍和技术基础设施的建设;在应用开发团队中常态化地引入业务专家资源,由统一的部门进行协调管理;建立标准的解决方案开发、部署和后续运营的方法和流程。

  某餐饮连锁企业是国内知名的水饺餐饮连锁公司,总部管理机构设于辽宁大连。目前,该餐饮企业在全国40多个城市拥有700多家连锁门店,员工8000多人。发展至今,该餐饮企业所有门店都为直营,为的是能够控制水饺出品的品质。而当该餐饮企业在往南方扩展后,由于南方鲜有吃饺子的饮食习惯,出现了南方门店的饺子品质和北方门店有较明显差距的状况。为了严格统一不同地域门店出品的水饺的质量,该餐饮企业最初采取了神秘访客的方式对门店进行抽查。但由于其门店众多,该餐饮企业只能不断加大神秘访客的抽查密度,最终付出了高昂的时间和人力成本,但收效并未达到预期。

  在此背景下,该餐饮企业决定引入数字化技术对水饺品质进行管理。具体而言,该餐饮企业希望对每一份经过出餐口的饺子都进行拍照,并利用计算机视觉技术对饺子图像进行分析,判断和管理水饺的品质。然而,不同于常规的工业质检,“饺子质检”是一个创新性的应用场景,业内尚无成熟的解决方案。要产生实际的效果,就需要重点解决以下问题:

  1)稳定地获取高质量的饺子图像。通常,饺子在被服务员端到顾客餐桌之前,会被统一放置在出餐口下停留1秒左右。因此,摄像头需要在1秒钟内完成高清装盘饺子照片的抓拍,同时要克服出餐口下方空间狭小、光线不足,以及饺子热气蒸腾模糊镜头等困难。

  2)将业务问题转换成算法可以执行的客观任务。视觉检测通常用到的是目标检测算法,包括了位置检测以及对检测内容的分类。饺子质检场景中要对检测内容进行分类,就需要首先确定饺子好坏的客观标准,通过数据标注,让算法能依据这个标准去学习对饺子的分类。然而饺子好坏的标准包含了很多行业知识,且其描述通常非常主观和抽象,难以统一。

  3)样本数据要覆盖尽量全面的情形,并兼顾控制冷启动成本。在该饺子质检场景中,由于场景很固定,训练模型所需的数据量未必要很大,但样本数据要覆盖尽量全面的情形,以保证模型能够识别各种特殊情况。同时,初期要用少量的数据让模型可用,尽快上线,后续再对模型进行优化。

  基于对明略科技数字化技术和服务能力的认可,该餐饮企业选择与明略科技合作,为其定制开发“饺子质检”解决方案。明略科技是一家企业级数据分析和组织智能服务提供商,为政府、金融、零售、工业等行业企业提供基于大数据和人工智能技术的产品与解决方案。经过和该餐饮企业的深度沟通,明略科技智能硬件和深度学习算法团队为其定制了一套端云协同的综合解决方案,在出餐口下安装定制相机,通过这一边缘设备获取饺子的实时图片数据,上传至云端对图片进行深度学习算法的识别分析,对每盘出餐的饺子给出优秀、合格、不合格的评级,最后在品质管理系统中生成统计分析报告,供管理者及时全面地掌握出品情况。

  为了稳定地获取高质量的饺子图像,明略科技项目组为该解决方案定制了摄像头。镜头、补光灯等都做了个性化的定制,从硬件上解决出餐口下方空间狭小、光线不足,以及热气蒸腾模糊镜头等问题。同时,摄像头内置了过线检测算法,当区域内有物体移动,且移动区域超过一定界限,摄像头会快速抓拍物体,从而获得清晰的饺子图像。

  为了确定判断饺子好坏的客观标准,明略科技项目组与该餐饮企业的业务专家合作,分批引入了外观上的白鼓、偏皮、饱管,以及摆放上的是否顺等判断饺子品质好坏的维度。而其中每一个维度的判断标准,例如白鼓,项目组排除了图像的角度、光线、饺子馅等干扰因素,筛选出了多个相对客观的白鼓标准,让不同的人标注同一批数据,结果能够统一,并依次用不同算法测试这些标准是否能区分饺子好坏,最终确定了分类方法和所用的模型。

  针对样本数据量以及冷启动成本的问题。项目组在前期主要考虑了样本数据能够覆盖更多的情形。比如,样本数据尽可能包含多几种出餐口拍的饺子,光线也有更多变化等。而由于该场景比较固定,样本数据量选择在上百左右,这样可以用最少量的数据标注就能让模型达到可用状态,上线达到初步效果后,再用一定时间收集长尾情况的数据并优化模型,从而降低了冷启动的成本。

  第一,通过饺子质检解决方案,该餐饮企业的管理人员能够在管理系统中查看实时生成的饺子品质统计分析报告,了解每家店每天甚至每个时间段的饺子的品质情况,具体到合格与不合格的饺子的数量,从而提高了该餐饮企业对饺子品质管理的效率。第二,该方案目前已在该餐饮企业大部分门店推广使用,有效识别了水饺饱满、摆盘等问题,识别准确率在90%以上,其门店的菜品优秀率因此提高了20%。

  用计算机视觉技术感知现实世界中各种情形,并将其数字化,为企业解决各种业务问题提供了有效的技术手段。随着人工智能在产业中的加速落地,计算机视觉也将被应用在更广泛的场景中,甚至无所不在。而在用计算机视觉技术解决具体的业务问题时,企业要重点考虑数据、算法和冷启动成本三方面的问题:1)数据方面的问题主要涉及数据采集和数据标注。在数据采集阶段,由于视觉场景通常差别很大,因此图像数据的采集往往需要针对特定场景定制相应的相机以确保图像数据采集的效果,并且要保证采集的数据包含尽量全面的情形。而在数据标注阶段,企业首先借助业务专家的经验,确认统一的标准,确保不同的人标注结果能够一致,并且算法能够识别和区分这些标准。

  2)对于算法的选择,企业可以结合标注数据的各种标准,选择不同算法多做测试,根据测试结果选择有效的标准的同时,也确认效果更优的算法。

  3)初期为了降低冷启动成本,企业可以用少量数据让模型达到可用状态即上线,后续再收集更多长尾情况的数据,对模型进行更新和优化。

  中宏人寿保险有限公司(以下简称“中宏保险”)是国内首家中外合资人寿保险公司,由加拿大宏利旗下的宏利人寿保险(国际)有限公司和中国中化核心成员——中化集团财务有限责任公司合资组建于1996年11月,现已拥有逾2000名员工和17000名营销员,为240万客户提供金融保险服务。保险产品作为专业的金融产品,客户对其通常缺乏了解,这导致在选购保险产品时,客户需要考虑很多需求和因素,整个决策周期也很长。因此,保险行业为了提高业绩,就需要保险营销员能够向客户持续输出产品、条款规则、政策等专业知识,基于复杂信息,以最快的方式有效处理客户的实际问题,展示出专业性和解决问题的能力,才能将潜在客户最终转变成为现实客户。

  多年来,中宏保险一直注重对营销员的咨询支持和培训管理工作,然而随着其业务范围的扩展,营销员的咨询支持和培训管理工作变得越来越来繁重,消耗了大量内部资源,并且实际效果也不够理想。一方面,中宏保险营销员原先主要依赖向主管领导和营业网点服务台的工作人员咨询关于保险产品的问题,然而这些问题有约50%都是较常见的问题,对常见问题重复的询问不仅消耗了主管大量的时间,也占用了营业网点宝贵的客户服务资源。另一方面,保险业的营销员人员更替较频繁,新的营销员入职后也需要对一些常见问题进行询问和学习,人员不停地轮转也进一步增加了内部培训的压力。

  基于上述原因,中宏保险希望利用自然语言处理、知识库、对话机器人等技术,打造一个线上的保险营销员智能助理,用于解答营销员的常见问题,并具备对新员工的培训能力。中宏保险对于营销员智能助理解决方案有如下两点最重要的要求:

  1)保险行业涵盖的知识体系很庞杂,不同的专业知识有11大类,因此在构建智能助理的知识库时,需要尽量全面地覆盖营销员会咨询和学习的知识类型,并且知识库上线后也要方便持续地维护更新;

  2)准确理解营销员的问题是给出正确答案的前提,因此需要对话机器人内置丰富的AI能力模块,使其具备出色的自然语义理解能力,能够与营销员进行流畅对话。同时,需要底层的机器学习平台具备良好的扩展能力,让普通业务人员也能以可视化的方式对特定业务场景进行算法模型的调优调参,以达到更高的语义理解准确度。

  在对多家厂商的语音语义、知识管理产品,以及建设和运维方案做了较长时间的评估后,中宏保险选择与竹间智能合作来搭建营销员智能助理解决方案。竹间智能成立于2015年,公司以自然语言处理、深度学习、知识工程、文本处理、情感计算等人工智能技术为基础,将AI能力整合到企业业务中,为金融、制造、政务、智能终端等行业提供端到端解决方案。基于对中宏保险需求的理解,竹间智能为其提供了营销员智能助理解决方案。从用户使用方式的角度,智能助理内置在中宏保险的内部营销工具中,营销员咨询产品或进行业务培训都可以点击进入智能助理界面,通过文字或语音输入问题,从而获取所需信息。从解决方案架构的角度来看,其底层包含了机器人建设、运营工具、机器学习平台等解决方案的开发和运营工具,构成对话机器人的多个AI模块,以及丰富的自然语言处理基础技术,最上层则是与营销员进行直接交互的界面。

  中宏保险与竹间智能联合搭建的智能知识库涵盖了丰富的信息,包括:运营规则(包括新单投保、保单服务、保单理赔等)、营销员基本法、保险热销产品、营销员荣誉竞赛、客户活动与增值服务、数字化工具使用等信息类型。而为了使知识库覆盖尽量全面的知识类型,保障后续的迭代更新,双方组建起项目组,在中宏保险的领导下,重点开展了如下工作:

  1)在项目前期充分调研营销员需求。了解一线营销员需要了解哪些知识,对知识的呈现有哪些要求,在问法上有哪些独到的习惯等问题。

  2)高度自动化的知识图谱构建。基于竹间智能的Gemini知识工程平台,项目组从中宏保险的保险条款、产品文档等非结构化数据中自动解析和抽取保险产品名称、以及与之相关联的犹豫期、等待期、保险责任等产品属性。在此基础上,在Gemini平台上将抽取的知识进行自动关联,形成保险产品的知识图谱,从而实现知识推理、产品检索等功能。比如将知识推理用于回答产品的保障内容、产品的比较、符合要求的产品有哪些等问题。

  3)利用自动化的自然语言学习技术,在智能助理上线前后进行高频问题识别和更新。通过竹间智能Bot Factory A+H人机协同平台的自监督学习能力,项目组一方面在智能助理上线前对中宏保险的客服录音和聊天记录做聚类分析,自动识别出已知的客户高频问题及其对应语料,视需要由人工核对,从而为营销员应对高频的产品和业务问题提供标准答案。另一方面,在智能助理上线后,通过自监督学习从营销员新提问的众多未得到回复的问题中识别出高频问题,中宏保险的业务专家随后对这些问题给出标准答案,自动加入知识库,从而实现对知识库的持续更新。平台的AI自学习能力使之能够以较低的运营成本不断提升机器人的模型与会话能力。

  为了让智能助理能够准确地理解语义,实现与营销员的流畅对话。竹间智能在对话机器人中内置了多个AI功能模块,包括语析、FAQ、多轮对话、意图识别、情感识别、知识推理、智能话术等。例如,多轮对话引擎通过向营销员连续反向提问获得确认具体问题所需的全面信息;意图识别引擎内置50多类、3000多种开箱即用的意图模型,用于识别营销员的询问意图;情感识别引擎能识别25种情绪,从而使对话更有同理心和温度。同时,平台内置了一个对话管理框架,当营销员向智能助理提出问题时,对话管理框架会结合业务场景,对不同AI模块的优先级、权重、分流策略进行调整,从而在其中选择最匹配的模块对营销员的问题进行准确应答。

  为了让中宏保险能够对智能助理进行二次开发,使智能助理具备针对特定业务场景的扩展能力,竹间智能在对话机器人底层提供了自动机器学习平台,平台内置了多种前沿算法,当上层的AI模型对特定场景的语义识别不够准确时,开发人员可以在自动机器学习平台上以可视化的方式对算法模型进行自动化测试、自动调参、算法融合,让语义理解准确度在复合式算法、仅需要少量数据的条件下,自动迭代学习。

  第一,在对营销员的咨询支持方面。首先,智能助理能够7x24小时不间断且秒级响应营销咨询需求,对营销员常用问题实时给出正确回复,高解决率有效减轻了主管和营业网点服务台客服的咨询服务压力。自智能助理上线以来,平均回复准确率保持在95%以上,得到了一线销售人员普遍认可。其次,智能助理上线后也作为运营平台,可直观了解未知问题和营销员关心的热门问题,帮助丰富智能助理知识库和填补营销员业务未知领域,未来结合智能化的培训练习,帮助营销员提升技能,增长业绩。

  第二,在对新营销员的培训方面。实时智能助理能帮助新营销员快速且全方位地掌握产品、服务、规则、政策等全量信息与内容,缩短了新人成长过程中知识储备的周期,让新人能快速开展业务。

  第一,在金融、制造等专业知识密集的行业,保障知识的高效学习与传承是提高其生产和服务质量的关键。而如果只能依靠行业“老师傅”去传授企业在长期业务发展过程中沉淀的大量专业知识,不仅耗费大量时间精力,也很难保证质量。因此,金融、制造等行业的企业可以考虑应用人工智能技术解决专业知识管理与共享的问题。

  第二,在用AI对知识进行管理并以问答形式对外输出的过程中,企业需要重点考虑构建智能知识库以及具备高度语义理解能力的对话机器人。对知识库的构建需要采用自动化的知识解析和知识图谱构建工具,以及用无监督学习从海量语料中自动学习新知识,从而提高知识库构建和后续运营维护的效率;对于对话机器人则需要其内置丰富的AI功能模块,完善的对话管理框架,以及方便二次开发的自动机器学习平台,使机器人能准确理解语义,实现与用户的流畅对线:AI算法支撑下,AR虚拟试戴让安克创新用户获得更优的线上互动体验

  安克创新科技股份有限公司(以下称“安克创新”) 是一家全球化的消费电子品牌企业,主要从事智能配件和智能硬件的设计、研发和销售,为消费者提供充电、无线音频和智能创新等品类的消费电子产品。安克创新的销售渠道覆盖国内外各大主要的电商平台和一些线下合作伙伴,在Amazon、Ebay等境外电商平台上占据行业领先的市场份额。

  安克创新旗下的音频品牌Soundcore声阔,于2021年末推出了新产品“声阔智能眼镜”,并计划重点在欧美市场对该产品做市场营销和线上产品推广,但安克创新此时需要应对较复杂的市场环境。一方面,在购物线上化和海外疫情常态化的大环境下,品牌商在线上推广产品普遍会面临营销手段单一,业绩增长乏力的问题。另一方面,年轻群体是消费电子的主力用户人群,为了吸引这类用户群体,品牌商需要通过不断的业务和场景创新提升消费体验,让消费者感受到品牌的活力和创新力。

  在此背景下,安克创新决定引入AR虚拟试戴解决方案来推广其智能眼镜产品,让用户能足不出户进行眼镜试戴,模拟真实穿戴智能眼镜的效果。对于AR虚拟试戴解决方案的要求,安克创新有如下具体考量:

  在对比了国内外多家厂商的AR试戴解决方案的技术水平、使用效果和落地方案后,安克创新选择与火山引擎合作,为其提供能满足上述要求的AR眼镜试戴解决方案。火山引擎是字节跳动旗下的企业级技术服务平台,将字节跳动快速发展过程中积累的增长方法、技术工具和能力开放给外部企业,提供云、AI、大数据技术等系列产品和服务,帮助企业在数字化升级中实现持续增长。

  基于自研技术,火山引擎为眼镜、美妆、鞋帽、手表、首饰、等行业客户提供AR虚拟体验场景建设,可应用于品牌营销、新零售、电商购物等场景。在线上,其解决方案可提供SDK/API,快速进行商城(Web)、APP、小程序等第三方集成上线,为消费者实现从浏览商品-线上试穿/试戴-购买的线上购物体验闭环。在线下,可将虚拟体验产品应用于实体店,通过创新的互动手段吸引消费者进店,提升消费者的购物体验,进而促进消费行为的发生。通过线上线验和流程的打通,辅助客户解决传统零售行业面临的高库存、高销售成本、低转化等诸多棘手问题。

  火山引擎基于其自研的3D引擎为安克创新定制了10款声阔智能眼镜和8款预热款眼镜的3D素材,在对原始素材做基础建模后,对材质的诸多细节如高光、反光、半透明等做进一步优化。例如,对于镜片透明度的处理,传统的素材处理只考虑透明度效果,而火山引擎进一步针对镜片在半透的情况下与欧美不同人群的肤色相融合的效果做了优化,使效果更自然和真实。

  为了让眼镜在用户试戴过程中能紧贴面部轮廓,获得很高的跟随度。火山引擎在解决方案中采用了自研的人脸关键点识别算法对人脸的3D关键点进行识别,精细化定位五官和面部轮廓,并用3D拟合算法实时生脸的3D模型,从而使眼镜模型能够很好地跟随和贴合人的面部。同时,解决方案中还采用了运动补偿和运动估计等惯性检测算法,保证在连续运动和极端角度下试戴效果的稳定性。

  火山引擎的3D引擎具备实时渲染的能力,并且对图形渲染的性能做了优化,保障了为安克创新定制的细节度很高的3D素材也能够实时生效。

  针对安克创新需要同时支持移动端和Web端的需求,火山引擎通过对算法和算力进行优化,实现解决方案多端运行的稳定性和效果一致性。在移动端,火山引擎根据手机硬件性能做了算法适配和硬件加速,保证在多算法并行的情况下的真实效果和超低延迟。在Web端,火山引擎也通过相应的优化能够应对浏览器资源调用、算力需求诸多限制。同时,火山引擎对算法本身进行优化,使得达到同样的模型精度,其模型大小比业内平均水平低几十倍,从而降低了包体大小方便多端适配,也更节省了算力。

  针对完整的解决方案的交付能力要求,火山引擎提供了包括体验设计、技术解决方案建立、项目管理、数据检测、市场进入的端到端解决方案,让AR眼镜试戴解决方案能够在安克创新快速落地和有效应用。

  在金融产品与服务体系日益丰富且复杂的背景下,我国政府与金融监管部门愈发重视金融消费者合法权益的保护,陆续出台了《中国人民银行金融消费者权益保护实施办法》等各类监管文件,要求各大银行建设或加强消保全流程管控机制,从产品开发设计、定价管理、合同协议、营销宣传、纠纷解决等各方面保护金融消费者合法权益。

  此前,M行已使用传统的IT系统实现消保审查和投诉处理线上化,例如消保审查系统是由业务部门提交申请、各级消保专职部门审批,完成各项消保审查;投诉管理系统是包含客服接听电话-记录-分类-转办-处理等环节的工作流系统。但此类系统由分行或业务部门各自建设和使用,且没有覆盖全渠道投诉、反馈和跟踪情况。总行没有统一的投诉处理风险反馈机制,导致投诉风险主要依靠各层级消保部门进行人工分析,信息流转过慢,管理层无法对消保工作进行全过程的监控和管理。

  针对海量非结构化数据处理问题,运用OCR、NLP等智能技术从文本中提炼出具有概括性和精确性的字段,再根据字段的意义和内容,结合标签体系生成信息挖掘结果。标签体系包含客户特征、投诉原因、投诉诉求、投诉渠道等近20个维度3000个标签,在消保审查、投诉处理等需要分析大量文本的场景中,能够有效提高工作效率;并且,平台可以进一步对标签化分析结果进行统计,为消保工作常态化监管提供数据支撑。

  针对风险智能排查需求,一方面,拓尔思基于情感分析、机构识别、语义识别、标签提取、观点抽取、行为分析等核心算法,根据M行消保业务需求封装了行业区域分析引擎、动态追踪引擎、产品分析引擎、聚类分析引擎、归因分析引擎、投诉用户画像引擎等度分析模型,支撑投诉预警、监测等前端应用;另一方面,运用知识图谱技术进行关联分析,辅助消保全过程的监督审查工作。以消保审查中的营销内容审查为例,平台将经过整合的产品图谱、服务图谱和相关投诉数据可视化展示,为营销内容审查提供更全面的参考信息,提高审查质效。

  第三,充分挖掘消保数据价值,采用六大客服分析因子,覆盖超3000个标签,消保数据处理分析效率较过去提升20倍,每年节约500万人力成本。基于自然语言理解技术,消保专家知识库积累超5000个知识点,适配超两万个意见模板,提升20倍审查效率。实现潜在投诉风险的智能化自动排查,有效提高工作质效,降低因投诉、诉讼或舆情事件造成的声誉损失,也让消费者权益保护更加及时有效。

  随着人工智能在产业中的深入,企业内部出现了大量需要对分文、专业知识进行深度分析以解决业务问题的AI应用场景,而这类应用场景只靠计算机视觉、智能语音等感知智能技术已无法解决,此时就需要引入认知智能技术,让业务系统具体思考能力。而要实现认知智能需要重点解决多个方面的问题:首先,数据,尤其是相关非结构化数据要足够丰富,并且整合完备;其次,认知智能的实现要结合多种技术手段,包括OCR、智能语音对信息的提取,NLP对文本的解析、知识图谱对知识的挖掘和分析、机器学习对数据的分析等;此外,在不同的专业领域需要引入标签体系以便对信息进行高效的分类和调用。

  为了弥合老旧的业务和IT系统架构与AI开发和部署之间的缺口,企业需要构建新的技术体系以支撑智能化的实施。具体而言,企业需要在业务和IT系统中引入智能应用编排、业务指标监控、数据存储和处理系统、创新实验系统、各类中间件或产品等,为企业智能化应用提供基础技术能力。同时,企业需要考虑在IT系统中引入基于云的微服务架构,实现更加敏捷和灵活的应用构建方式,最大限度地利用智能技术。

  大中型企业的AI开发需求较广泛,如果仅依赖数据科学家和算法工程师等专业人员开发应用,不仅成本高,且很多业务部门发起的需求不能得到很好的满足,因此企业需要引入低门槛的AI开发平台赋能企业内的业务和普通IT人员,使其具备一定AI开发能力。具体而言,对于专业能力较弱的业务人员,需要开发平台具备自动化的数据准备、模型训练等功能,业务用户只需选择场景和相应的数据集即可对模型进行自动训练;对于具备一定专业能力的业务和IT人员,需要平台能够将算法模型封装成算子,用图形化的方式将算子组合成工作流,从而完成模型训练过程。并且,这种方式也让企业内部人员可以更方便地复用其他人员在开发过程中沉淀的模型和经验,从而进一步降低AI开发的门槛。在案例8和案例9中,海信集团和某集团科技子公司都引入了低门槛的AI开发平台让企业内的业务和IT人员具备了一定的AI开发能力。

  第一,在构建AI开发平台时,尽量选择与在自己的业务领域有大量成熟AI模型和应用实践积累的厂商合作,在AI平台中内置相关只需适当配置即可使用的AI模型,加速AI落地,减少自研成本。例如在案例9中,某集团科技子公司需要快速推进智能化转型,在考虑到有外部厂商在工业质检、园区安全、供应链管理等领域有成熟AI模型后,便选择与该厂商合作,引入其智能中台产品。

  第二,在构建AI开发平台时,尽量在平台中引入算子和“白盒”的模式,将模型的工作流沉淀下来,使得开发人员后续能够针对相似场景对模型做适当修改,实现模型的泛化能力,企业因此能将模型快速迁移至相似场景,避免从头重新开发,从而降低了模型的开发成本。例如在案例8中,海信集团在AI平台中引入该模式,成功将原先只能识别大尺寸冰箱四条成剪刀形的打包带的质检模型,通过增加类似场景的标注数据,对原模型的算子做了适当修改,成功让模型扩展到3条类似产线. 建立统一的模型开发和模型管理能力,提高AI资源的利用率

  大型企业在智能化建设早期,各个部门通常会独立地建设AI能力,这会造成AI开发工具、AI模型的重复建设和不能复用,这种“烟囱式”开发的状况到了企业智能化建设的深入阶段会造成大量的资源浪费,并阻碍智能化的推进。因此,企业需要引入统一的模型开发和模型管理工具供相关人员共同使用,尤其要重视对AI模型和服务的统一管理,提供如模型版本维护、模型更新、模型发布服务、对模型服务调用情况查看等能力,通过平台实现AI能力的复用,提高资源利用率。

  例如在案例9中,某集团科技子公司通过智能中台构建了统一的模型开发和模型管理能力,使得集团的管理人员可以对平台上的所有模型进行统一管控,简化运维工作,提高管理效率。业务和IT等人员也可以通过平台查看集团现有的模型资产和AI能力,并根据需要直接调用。

  当AI建模进入需要大规模生产和交付的阶段,其运营和用例扩展对于大部分公司来说都是一个巨大挑战。此时,企业可以考虑在机器学习和AI系统中,借鉴软件工程领域DevOps相关框架、工具链和流程,以及持续集成、持续交付、持续部署的理念,为机器学习和AI开发提供MLOps体系和相关工具,即提供系统化的协作工具将AI开发和部署中的业务、数据、算法、运维等角色连接起来,建立一个标准化的数据准备、模型开发、部署与运维流程,解决机器学习模型生命周期各环节的工程化问题,从而实现其核心目标:缩短模型开发部署的迭代周期,并持续地保障模型质量。MLOps的主要功能和优势包括:统一发布、自动测试、敏捷迭代、自动化的模型和数据集管理、降低建模门槛、流水线式管理、资源集成监测、组织高效协作。

  例如在案例D中,某大型国有商业银行AI应用实践中构建了MLOps体系,一方面,通过一站式的AI开发平台降低开发门槛,另一方面,建立了“信息统一管理、实体统一流转、管理信息与实体流转保持一致”的AI全生命周期管理机制,从而实现了敏捷的模型迭代,高效的模型交付。

  初步投入阶段:该阶段的企业当前仅有少数几个AI应用落地,因此需要重点解决如何将AI应用在现有IT系统中的部署和运营的问题。

  布局阶段:该阶段的企业需首先构建适应智能化要求的IT系统架构;其次,建立统一的AI开发平台,让组织初步构建独立自主的AI开发能力,并对AI开发能力进行统一管理。

  深度应用阶段:持续完善面向智能化运营的IT系统,并在AI开发平台中建立一站式的从数据准备、数据标注,到模型训练、部署和运营的能力,并降低AI开发的门槛。同时,需要考虑构建覆盖模型全生命周期MLOps管理体系,缩短模型迭代周期,并持续地保障模型质量。

  海信集团是知名的大型电子信息产业集团,旗下有海信、东芝电视、科龙、容声、ASKO、Vidda等品牌,业务涵盖多媒体、家电、IT智能信息系统和现代服务业等多个领域,并且在全球拥有13个厂区。

  近年来,在面对国内人口红利锐减以及国际上欧美国家挤压的双重挑战下,海信集团实施了数字化转型战略,希望实现降本增效,并重塑海信在全球制造业领域竞争优势。具体而言,海信集团自2019年全面建设了5G网络和工业互联网平台,涉及云、边、端协同,并集成了现有的IT系统、OT系统、大数据平台等系统,平台建成后产生和汇聚了海量的工业数据。

  而为了充分挖掘和发挥这些工业数据的潜在价值,海信集团需要进一步实施智能化升级战略,推动人工智能在集团业务中的广泛应用,从而提升运营效率、创新业务模式。由此,海信集团需要从应用场景、技术平台、组织AI素养三个层面构建人工智能能力:

  1)在应用场景层面。首先,海信集团希望在智能制造、营销、研发、财务等多个业务领域集成智能化应用,但集团内部尚未建立AI应用场景落地的评估机制。其次,海信集团需要首先选取几个高价值度的场景落地AI应用,解决业务问题的同时,探索并验证集团内AI应用落地的方法和能力。2)在技术平台层面。海信集团此前只有少数外部采购的AI应用解决方案,几乎没有自主的AI建模能力,因此需要搭建统一的AI技术平台,并且平台需要满足易于使用、功能完备、方便协作等要求,使集团内部人员可以在该平台上自主搭建AI应用。

  3)在组织AI素养层面。海信集团的业务和IT人员之前的AI能力较薄弱,不具备开发复杂的计算机视觉、机器学习模型的能力,因此需要针对性地提高其AI能力素养。

  在经过前期充分的调研论证后,海信集团选择与九章云极DataCanvas进行合作,为其提供人工智能相关产品和服务。九章云极DataCanvas是一家人工智能基础技术服务公司,其核心产品自动化数据科学平台,能够帮助业务分析师和数据科学家快速协同开发,实现自动化模型创建、管理和应用支持,为政府和企业智能化升级提供配套服务。

  基于海信集团在智能化升级中的需求,九章云极DataCanvas为海信提供的解决方案包括了应用场景规划、三个应用场景的模型定制开发、信智AI平台建设以及平台的推广和培训。

  针对应用场景层面的问题,海信集团在九章云极DataCanvas的协助下建立了一套AI应用场景筛选的评估标准,并定制了三个较复杂的AI应用。

  1)基于九章云极DataCanvas在客户服务过程中总结的最佳实践方,以及海信集团的实际情况,双方建立的应用场景筛选的评估标准包括以下三点:

  2)在考虑海信集团的业务需求、应用代表性等因素后,海信集团合和九章云极DataCanvas合作定制开发了如下三个AI应用场景:

  为了构建自主的AI开发能力,海信集团在九章云极DataCanvas的协助下搭建了信智AI平台。信智AI平台是以九章云极DataCanvas自动机器学习平台APS为基础,结合了海信集团定制的一些功能和算子,而构建的AI技术平台。该平台满足了海信集团对AI平台的易用、功能完备、方便协作等要求,具体如下:

  1)平台将模型开发全流程的功能都封装成算子,并支持用图形化、拖拉拽的形式将算子组合成工作流,从而降低了建模门槛。而平台上包含的算子有200多个九章云极DataCanvas的标准化算子,以及数十个根据海信集团的需求定制的数据处理、NLP算子。同时,平台采用“白盒”模式,所有内置以及后续场景开发中(包括三个定制场景)沉淀的算子,其代码都可以被查看和修改,以便组织内成员学习、复用,或做一定修改后迁移至场景。

  2)针对模型上线过程复杂的问题,九章云极DataCanvas将数据预处理、深度学习模型、以及模型后处理都打包成Pipeline,并提供在生产环境中调用的接口,从而简化了海信集团的模型推理工作。

  3)为了满足海信集团的应用开发协作需求,平台支持业务人员、算法工程师、数据科学家等人员登陆平台并各自完成自动建模、数据处理、算子调整、搭建工作流、模型上线等工作。同时,根据海信集团的需。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186
  • 标签:人工智能的应用论文
  • 编辑:刘卓
  • 相关文章
TAGS标签更多>>