打造软件版AI加速器,CoCoPIE将普惠AI做成了生意

作者:潇冷 来源:原创 2021-11-10

  你知道实现L4级别自动驾驶所需的硬件成本是多少吗?

  主流观点认为,运行L4级别自动驾驶软件,需要依赖大量的计算资源,这需要很大的硬件设备成本。其中,仅一个能够满足L4级别自动驾驶需求的AI控制平台便要花费上万美金。然而,CoCoPIE并不赞同这些“主流观点”,并用其最新研究告诉我们截然不同的答案——业界可以在1000美金级别的主流单片设备上,实现L4级别的自动驾驶。 

打造软件版AI加速器,CoCoPIE将普惠AI做成了生意
 (L4 级自动驾驶汽车工作流程的高级结构)

  这家人工智能技术公司证实了,在满足所有延迟要求的同时,只需单个低于1000美元的现成设备(NVIDIA Jetson AGX Xavier) ,即可运行6个工业级L4级自动驾驶应用程序。这是什么概念?要知道一个自动驾驶汽车(L2级别)的实验模型尚且需要30万美元的成本,搭载执行自动驾驶软件的硬件是其中最昂贵的组件。

  优化算法模型

  另辟蹊径助推自动驾驶普及

  “L4级别的自动驾驶对软件性能要求较高,需要大量的深度神经网络来对道路情况进行捕捉、识别、计算,并做出适时地反应,如此海量的数据和高性能的计算要求,很难让L4级别的自动驾驶软件运行在低端的硬件上。”CoCoPIE公司CTO慎熙鹏在采访中表示。而相对高端的搭载自动驾驶软件的硬件系统往往动辄上万美元,代价相对高昂。 

打造软件版AI加速器,CoCoPIE将普惠AI做成了生意
 (论文)

  为此,以在IoT以及移动端普及实时人工智能为使命的CoCoPIE开始新的思考:全自动驾驶真的需要那么多计算资源吗?目前低端设备在全自动驾驶应用中性能不足的原因是什么?L4级自动驾驶是否有可能在一张现成的卡上以低至1000美元的价格实现实时性能?这一次,CoCoPIE将“在不额外增加人工智能专用硬件的情况下让现有处理器实时地处理人工智能应用”的思路用在了自动驾驶领域。

  于是CoCoPIE在单个现成的AI芯片产品上对L4级别的自动驾驶软件进行深入优化,并取得初步成功。“之所以CoCoPIE能够让L4级别的自动驾驶在更低端的设备上运行,是因为CoCoPIE对AI算法模型进行了全栈的、协同的优化,从模型本身优化到代码,再到运行时的资源调度,CoCoPIE充分考虑了各个部分之间的关系、影响。”

  采访中,慎熙鹏还重点分享了主流自动驾驶技术的缺陷,及CoCoPIE提出的解决方案。慎熙鹏表示:“当预先调度方案调度单个低端设备上的自动驾驶程序时,计算资源严重不足,这时,CoCoPIE提出即时优先级调整的方案,通过即时调整任务的关联和优先级来解决。”

  另外,针对“由于硬件模型设计和实现的某些原因,某些加速器未被完全利用”的情况,CoCoPIE采用一种硬件感知模型定制(hardware-aware model customization)的方法,通过弥合DNN模型与多种类型的加速器之间的差距,显着提高了加速器的利用率。而面对“自动驾驶调度算法无法处理可以使用多种类型加速器的混合工作负载”的问题,“我们提出了基于 DAG 实例化的调度(instantiation based scheduling),一种通过基于加速器的 DAG 实例化扩展自动驾驶调度以满足需求的方法。”慎熙鹏表示。 

打造软件版AI加速器,CoCoPIE将普惠AI做成了生意
 【来自 Autoware 自动驾驶应用程序(ADApp)中的详细任务。感测(蓝色),感知(红色),定位(灰色),跟踪(紫色),预测(绿色),规划(黄色)和最终控制输出(橙色)。】

  事实上,该研究颠覆了业界对L4级别自动驾驶所需计算资源的普遍认识,为行业降低成本指出了一条可行道路,并提出了一些重新思考自动驾驶的软件架构、设计和优化的研究机会,对解决当下汽车行业芯片荒问题亦有帮