• 关注我们

博客

自然

过去几年,智能驾驶行业的竞争焦点经历了显著演变。起初,竞争集中在硬件层面,包括是否配备激光雷达、安装多少摄像头以及算力达到多少TOPS。随后进入大模型时代,竞争转向端到端、VLA(视觉-语言-动作)以及World Model(世界模型)等技术路线。

如今,越来越多的公司意识到,仅仅拥有更大的模型已不足以构建代际优势。真正决定技术上限的,开始转变为模型、数据、算力和芯片之间能否形成一个持续迭代的闭环。

这也是为何越来越多的汽车制造商选择自主研发。特斯拉几乎涵盖了从数据采集、训练基础设施、FSD模型到Dojo以及自研芯片的全部环节。在国内,小鹏、蔚来以及理想等品牌也在不断向更底层技术延伸。

在今年发布的L8和L9车型上,理想汽车已搭载了自主研发的马赫M100芯片。这款采用数据流架构的芯片被理想视为AI领域的一项重要技术方向。基于马赫M100,理想还运行了自主研发的马赫VLA模型。

然而,对于整个行业而言,更值得关注的问题并非“是否进行自主研发”,而是这些投入究竟能够解决哪些具体问题。

带着这个疑问,我们与理想汽车自动驾驶负责人詹锟及芯片负责人谢炎进行了深入交流。他们分享了理想对下一代自动驾驶技术路线的判断,并阐释了自研芯片、数据体系以及AI基础设施背后的设计理念。以下是部分访谈内容的整理和编辑:

问:在第四季度达到特斯拉FSD V14的水平,理想汽车还需要在哪些方面进行努力?

詹锟: 我认为要追赶FSD,需要从两个层面入手。

首先是基础体验,具体体现在安全感、效率和舒适度能否达到FSD的同等水平。FSD在安全感、效率和舒适度方面表现出色,这是其基本功。即使不处理极端复杂的路况,也能在这些基础体验上达到其水平。

其次是能力层面,这方面追赶的难度也很大。例如,特斯拉能够识别并礼让特殊车辆,其在极窄通行场景下的感知精度极高,并且能够识别交警的指挥手势,这些能力都非常强大。

在能力层面,存在架构升级的机会。为什么某些能力只有特斯拉拥有?这可能与过去的范式限制有关,也可能源于架构或数据方面的原因。我们在这些方面进行了大量的探索。

问:我理解马赫VLA是一套技术体系,而非单个模型。例如,Mind-Edge是用于智能座舱的端侧模型。那么,目前智能驾驶模型中是否还包含“L”(Language语言)的部分?

詹锟: 当前自动驾驶的架构普遍呈现出将VLA(视觉-语言-动作模型)与World Model(世界模型)整合的趋势。

从长远来看,所有技术路线都将朝着这个方向发展。无论是VLA还是World Model,其中的Prompt(提示)都需要用到Language。因此,Language必然是其中的一部分,关键在于如何运用它。

我认为,对于机器智能而言,基于视觉(Vision Based)的理解方式更为合理,它能更好地实现对空间、三维空间以及环境的感知和利用。Language的作用同样不可或缺,它在理解环境、交通规则、指令以及进行复杂决策时具有重要价值。

从长远来看,基于Vision和Language的原生基础模型,可能是未来的发展趋势。

谢炎: 如果要实现L3、L4级别的自动驾驶,并解决更泛化的问题,模型需要具备类似人类的思考能力。此时,语言的重要性将日益凸显,这也是未来需要巨大算力的原因之一。

如果模型仅具备Vision和Action(视觉和动作)能力,即使拥有大量数据,在遇到分布之外的情况时也会束手无策。就像动物即使学会了所有常见情况,遇到从未见过的情形也会不知所措,无法做出正确的选择。

我们认为,越是向L3、L4级别迈进,需要解决的问题就越接近那90%、95%、98%之后的问题——那些前所未见的情况,需要模型具备类似人类的思考能力。而实现这种推理和思考能力的关键在于语言模型。例如,交警正在打手势,你需要理解他的意图是让你通行还是停止,这并非仅仅通过收集或生成数据就能解决的问题。

问:随着理想汽车车队规模的不断扩大,从内部来看,数据的边际效应是否出现了衰减?贵公司是如何定义有价值数据的?

詹锟: 首先,数据的数量必须足够庞大,核心目标是收集更多的Corner Case(长尾场景)。目前,业界有多种方法可以在车端部署先进的Neural Trigger(神经网络触发器),以判断场景的难易程度,并将关键数据回传。这也是特斯拉在这一领域表现出色的重要原因之一。

其次,数据的质量至关重要,主要体现在行为质量上。如今,业界逐渐趋向于端到端的范式,无论是VLA(视觉-语言-动作模型)、World Model(世界模型)还是Vision-Action(视觉-动作模型),都可以实现,但关键在于准确理解Action的行为。因此,行为的质量,包括其清晰度和一致性,变得尤为重要。

至于数据规模增长后边际效应是否衰减,首先,只要模型不断提升,并且我们持续追求满分表现,其增长曲线必然是“对数曲线”,呈现出逐渐衰减的趋势,绝不可能线性增长。任何一家公司在AI领域的发展都是如此。尽管后期数据收敛的速度确实会放缓,但我们希望通过规模化来加速这一进程。

问:马赫M100芯片能够支持多种AI场景的运行。展望五年或更远的未来,理想汽车车内的算力中心是否有可能完全采用自主研发的马赫芯片?

谢炎: 尽管业内存在“舱驾一体”的说法,但我们认为,舱驾一体的核心在于AI算力部分,而其他部分的集成度则不那么关键。因为座舱系统和AI智能驾驶系统可以完全独立运行,但AI算力可以集中处理,从而显著提高分配效率。

我们的路线图设想的最终形态是,车内拥有一个集中的AI计算中心,所有AI任务都可以在此进行计算。这类似于在笔记本电脑上运行OpenClaw,AI计算并非在笔记本本地进行,而是通过Token Provider Server(Token供应服务器)完成。车内也类似,将设立一个Token Server(Token服务器)。

这个Token Server的优势在于:第一,效率极高。第二,能够实现不同任务的隔离,互不干扰。例如,智能驾驶任务的确定性——无论是内存还是带宽,都能得到保障,不受其他任务的干扰,这是软硬件协同设计才能实现的结果。

问:是否因为M100采用了数据流架构的AI推理芯片,所以相比其他厂商的自动驾驶芯片,它对带宽的需求较低,但对片上存储的需求更高?

谢炎: 我们对带宽的要求确实较低,但这并非设计SRAM容量(非显存)的直接原因。目前HBM(高带宽内存)技术备受关注,许多人认为带宽越高越好。然而,计算、带宽、SRAM等都需要晶体管成本来实现,最终的设计选择是基于成本、综合性能等多方面因素权衡的结果。

仅凭一两个指标来简单对比不同架构的设计是不合理且不专业的。这就像拳击比赛,身高和体重都有各自的优势,但胜负并非由单一指标决定,最终比拼的是这项运动的综合表现。

问:为何当前大算力芯片方案,例如英伟达、小鹏以及理想自研的芯片,均未实现芯片级的舱驾融合,而高通却在低算力芯片上进行了尝试?这其中的原因是什么?

谢炎: 从本质上讲,座舱和驾驶是两个独立的系统。特别是对于向L3、L4级别发展的高端智能驾驶,需要一个更高确定性的系统,其内存和计算资源是专属的,此时融合的意义就大大降低了。因为资源无法实现实时切换,而实时切换会降低系统的确定性。如果系统朝着越来越专用的方向发展,融合的价值就不大了——即便将两个芯片集成在一起,其晶体管数量可能不变,仅仅节省了封装成本。对于中低端芯片而言,这部分成本可以节省,但节省幅度有限。

我们认为,随着智能驾驶技术的发展,尤其是在向更高端的L3、L4级别迈进时,舱驾融合的意义可能并不大。如果能将这些芯片做得更靠近,在同一块板上实现高度集成的小型化方案,这是可行的,不必局限于单一芯片,也可以采用多芯片组合的形式。

问:自研芯片需要哪些前提条件,例如销量、营收和研发投入?当前自动驾驶迭代速度很快,芯片要实现持续迭代,又需要具备哪些条件?

谢炎: 芯片的初期投入确实不菲,可能每年需要数亿元。

第一个条件是达到一定的营收规模。对于车企而言,年营收达到1000亿元以上,研发投入至少占10%,即可拥有数十亿到上百亿的资金,足以支撑每年的芯片研发投入。第二个条件是,所研发的芯片所解决的问题,必须能显著提升产品的能力。

许多人认为芯片需要巨大的出货量才能实现成本摊薄。实际上,芯片的成本与面积直接相关。一辆车上的智能驾驶芯片,例如理想汽车的L7/L8/L9搭载的2颗马赫M100,总面积约为800平方毫米。而一款高端手机芯片的面积大约为100平方毫米,因此一辆车的智能驾驶芯片面积相当于8部高端手机芯片的总和。

如此计算,几十万辆车的所需晶圆面积非常可观,足以有效摊薄成本。因此,不能仅以单颗芯片的数量来衡量成本。

问:动态数据流编译器的技术难点在哪里?攻克这一技术花费了多长时间?

谢炎: 在芯片流片之前,甚至在设计阶段,我们就已经着手进行编译器的工作。在芯片流片前,我们已经成功运行了许多模型。

数据流架构是一种完全不同的设计理念,它所要解决的问题与超级计算机或大规模计算机集群所面临的问题非常相似——当规模扩展到数十万台计算机、上百万个核心时,它们之间的通信和协作需要一种全新的模式。传统的冯·诺依曼架构调度方式在这种规模下已不可行,这本质上是一个超大规模并行调度问题。

2条评论

乐竞体育
乐竞体育以聚合最新的球队动态与专家观点为核心,带来高效便捷的体验。
2015年1月15日 晚上10:30

想了解更多打造一站式体育信息聚合平台相关内容,尽在乐竞体育。

乐竞体育
乐竞体育围绕乐竞体育官网不断创新,回应用户的真实需求。
2015年1月15日 晚上10:30

精选乐竞体育真人内容,乐竞体育与你一同发现更多精彩。

乐竞体育
乐竞体育专注乐竞体育APP,为用户提供专业可靠的体验。
2015年1月15日 晚上10:30

乐竞体育专注乐竞体育APP,为用户提供专业可靠的体验。

围绕乐竞体育平台,乐竞体育持续打磨更优质的服务。

乐竞体育深耕覆盖全球热门体育赛事直播与回放领域,用心服务每一位用户。