人工智能历经60年仍未普及 运算效能成重要挑战


    人工智能(Artificial Intelligence, AI)无疑是科技圈近来最火爆的话题,不过对于AI这个提出已经超过60年的概念,能否在第三波浪潮中解决算法、计算效率、数据等问题实现普及成为了业界关注的焦点。为加速人工智能的落地与普及,我们看到谷歌、英伟达、英特尔、高通等巨头纷纷从处理器入手,解决重要的计算效率问题。当然,为解决计算效率问题也给芯片IP授权商带来了机会与挑战。那么,IP授权商如何加速人工智能的普及?
    历经60多年 人工智能为何仍未普及?
    人工智能在经历两次浪潮后最终归于沉寂,并且人们的态度也一直在两极反转,有人称其为人类文明耀眼未来的预言,也有人把其当作技术疯子的狂想。对此,CEVA分部营销总监Yair Siegel在接受《华强电子》记者采访时表示:“就AI的梦想而言,它们距离模仿人脑功能仍然非常遥远。”
    即便距离AI梦想还遥远,2012年之前关于人工智能的两极化观点也还同时存在,但2015年之后,人工智能又迎来了第三次浪潮。Cadence亚太区IP业务销售总监陈会馨女士接受采访时表示:“人工智能的实现需要处理器有很强的运算能力,但人工智能提出的时候芯片行业刚刚起步,集成电路也还未到大规模的状态,硬件的运算能力远远不能满足人工智能的需求。这几年人工智能再次受到关注,其中重要的原因就是硬件载体的运算能力有了飞速的提升。”Yair Siegel补充到:“业界研究人工智能和机器学习已有多年时间,最近数年中,在称为神经网络的学术算法研究领域取得了重大突破。这些用于神经网络的全新算法可以更好地模仿人脑学习和取得结论的能力。2016年谷歌的DeepMind AlphaGo深度神经网络项目在中国围棋比赛中打败了人类围棋冠军李世石,也可能是这项技术一个很好的转折点。同时,我们也看到了许多其它的神经网络和深度学习技术能够实现目标识别、语音识别和语言理解等人工智能功能。”
    人工智能普及三大核心要素 运算效能等成IP授权商重要挑战
    “人工智能虽然没有达到普及的程度,但现在正在对世界科技格局产生重要影响。影响人工智能发展的核心要素有三个,一、深度学习算法的提出;二、移动互联网产生足够的大数据;三、计算能力的大幅度提高。随着算法、计算能力和大数据这三大人工智能要素的发展,人工智能范式迁移已现端倪,技术和产业两个维度的‘奇点时刻’正在临近。” Arm战略联盟业务发展总监金勇斌如此总结人工智能普及的三大核心要素。
    金勇斌进一步表示,影响人工智能普及的三大核心要素相互影响,相互促进。具体来说,计算效率方面,人工智能的普及需要将智能推进到边缘和终端设备中,与云计算不同,边缘和终端设备芯片对功耗特别敏感。数据方面,无处不在的智能节点采集的数据是分散的多样的,形成的大数据是无标签的,需要边缘智能物联网设备处理标签数据,处理标签后的数据才能进行分析、学习。现有的处理器基本框架结构不是为人工智能所设计的,应用受到很多限制,所以越来越多的厂商认为需要新的处理器来满足深度学习技术进而实现人工智能。
    陈会馨就表示:“深度学习的芯片是一个全新的设计架构,和以往的网络或AP等技术不一样,如何在深度学习的芯片中给IC设计的厂商一些特殊接口的IP实际上既是机遇也是挑战。具体来说,为了让深度学习的设备达到一个很好的能效比,处理器中需要引入新的IP。另外,以往的处理器中的内存接口就是关注的焦点,对于深度学习的芯片来说,大家希望有更高带宽的内存接口来支撑整个芯片计算的吞吐,因此内存接口的瓶颈在深度学习的芯片中会更加突出。”
    金勇斌认为,面对人工智能IP授权商面临三大挑战,首先从计算效能看,需要增加更多计算能力到系统级芯片(SoC)上,并考虑如何在复杂运算环境下降低成本与功耗,使得在边缘和终端的智能设备拥有高效的人工智能任务处理能力,同时具备灵活性和低功耗的特点。其次从安全性角度看,数以亿万计的设备联网需要从IP与标准的角度就考虑确保数据从传感器到服务器的安全。最后从通用性角度看,人工智能的节点计算能力提高之后,无处不在的智能设备使得人工智能场景变得碎片化,智能节点收集的数据结构化和标准化之后,才能供机器学习,进一步处理分析使用。
    Yair Siegel也强调高效能和灵活性方面的挑战。他表示,今天深度学习算法需要结合大量计算和大量数据使用,为了实现大众市场使用,这项技术必需具有高能效,以便用于电池供电设备中。此外,深度学习技术仍然在快速演进和改进,任何IP解决方法必须足够灵活,以便在产品生命周期内进行技术的更新,并且需要实现灵活的编程和易于使用的工具,缩短从研发到生产的过程。而且,它必须具有应对业界不断发展的新标准、新特性和新功能的能力。
    面对效能与运算效率等挑战 IP授权商各有应对之道
    至此,我们不难发现高效能、安全性、灵活性、通用性等都是IP厂商推应对深度学习处理器或者说人工智能商机需要解决的挑战。作为全球重要的IP授商,它们如何应对?陈会馨介绍:“Cadence针对深度学习芯片已经有了四年的研发和储备,今年五月份推出了一款独立完整的神经网络DSP —Cadence Tensilica Vision C5,面向对神经网络计算能力有极高要求的智能视觉设备。针对自动驾驶、监控安防、无人机、机器人和移动/可穿戴设备应用,Vision C5 DSP 1TMAC/s的计算能力完全能够胜任目前终端设备的CNN的计算任务,这款产品的推出对神经网络处理器市场格局来说将产生很大的变化,后续我们也将根据市场的反馈来提供满足深度学习芯片带宽需求的产品。”
    同样推出DSP IP的还有CEVA,Yair Siegel表示:“第一波人工智能算法研究主要使用GPU是因为它们是现成的而且已经广泛用于离线进行的训练部分。然而进入开发和生产消费类产品需要更高能效和更高性能的解决方案。多年来CEVA一直开发用于计算机视觉、语音和深度学习的DSP IP ,CEVA-XM 系列视觉DSP内核连同CEVA深度神经网络(CDNN)工具套件,不仅能够实现低功耗和高效的性价比,满足大众市场设备的要求,还能让产品快速的从研发走向生产。CDNN套件可以应对嵌入式挑战,比如降低数据带宽和处理存储器传送,并以软件更新来灵活的应对技术创新,实现各种产品的可扩展性。”
    Arm则是在今年专为人工智能推出全新的DynamIQ技术。金勇斌介绍,DynamIQ技术将为今后所有新的Cortex-A系列处理器带来全新的特性和功能,包括:1、针对机器学习(ML)和人工智能的全新处理器指令集,第一代采用DynamIQ技术的Cortex-A系列处理器在优化应用后,可实现比基于Cortex-A73的设备高50倍的人工智能性能,并最多可提升10倍CPU与SoC上指定硬件加速器之间的反应速度。2、增强的多核灵活性,SoC设计者可以在单个群集中最多部署8个核,每一个核都可以有各自不同的性能特性。这些先进的能力会为机器学习和人工智能应用带来更快的响应速度。全新设计的内存子系统也将实现更快的数据读取和全新的节能特性。3、在严苛的热限制下实现更高的性能,通过对每一个处理器进行独立的频率控制,高效地在不同任务间切换最合适的处理器。4、更安全的自动控制系统,DynamIQ技术为ADAS解决方案带来更快的响应速度,并能增强安全性,确保合作伙伴能够设计ASIL-D合规系统,即使在故障情况下仍然能够安全运行。