汽车AI未来适应性之战:从BEVDepth算法看NPU架构革新
04/28/2025, 01:00 PM UTC
人工智能最新进展凸显汽车AI需具备未来适应性Recent AI Advances Underline Need to Futureproof Automotive AI
➀ 汽车AI需在15年生命周期内适应快速算法演进,传统NPU架构面临性能挑战;
➁ BEVDepth等3D感知算法中体素池化操作占60%计算成本,依赖CUDA实现;
➂ Quadric Chimera NPU通过统一计算架构实现NVIDIA RTX 3090两倍性能,支持C++直接编程。
➀ Automotive AI faces challenges in adapting to rapid algorithm evolution while ensuring 15-year vehicle lifecycles;
➁ BEVDepth's 3D perception advancements highlight NPU architecture limitations, with voxel pooling consuming 60% of compute costs;
➂ Quadric's Chimera NPU demonstrates 2x faster performance than NVIDIA RTX 3090 in CUDA-based algorithms through unified matrix/vector/scalar processing.
在自动驾驶技术快速迭代的背景下,汽车制造商正面临严峻挑战:如何让车载AI系统在长达15年的生命周期内持续升级?近期BEVDepth等先进算法的出现,将这一矛盾推向新高度。这种基于Transformer的3D鸟瞰图算法,通过融合摄像头与激光雷达数据实现精准环境感知,但其核心组件——体素池化(Voxel Pooling)操作却消耗了60%的计算资源。
传统NPU架构的局限性在此暴露无遗:当算法在矩阵运算(MAC)、向量处理(DSP)和标量计算(CPU)间频繁切换时,数据搬运带来的延迟严重制约性能。Quadric的Chimera NPU采用革命性架构,每个处理单元集成MAC、ALU和寄存器,实现真正的异构计算融合。实测显示,其QC-Ultra芯片在相同频率下,BEVDepth的体素池化性能达到NVIDIA RTX 3090的2倍以上,功耗却大幅降低。
更关键的是,Quadric支持标准C++编程,车企无需依赖芯片厂商即可自主优化算法。这种架构特性使得OEM能够灵活应对未来未知的AI模型演进需求,如将200行CUDA代码转换为C++仅需两周。随着BEV技术从泊车辅助向L3+自动驾驶延伸,可编程性与计算效率的结合正成为汽车AI芯片的新战场。
---
本文由大语言模型(LLM)生成,旨在为读者提供半导体新闻内容的知识扩展(Beta)。