90后AI天才造卡车,靠端到端进自动驾驶第一梯队
一凡 来源: 量子位“自动驾驶落地的最大短板,是车本身”
自动驾驶,并不是 黄泽铧 再创业计划里的首要任务。
作为全球无人车第一股图森未来的联合创始人,他完整参与了一次 决策式AI驱动的自动驾驶从0到1 ,缔造了全球自动驾驶第一股,而且作为计算机名校CMU的高材生,再出发没有首选软件方向,出乎不少人意料之外。
是的, 黄泽铧再创业的零一汽车 ,从新能源重卡出发,最开始甚至精确到短途。
但这似乎又只是一个 “烟雾弹” ,因为就在今年 AI顶会CVPR的国际自动驾驶挑战赛 上,创办才2年的造车公司零一低调参赛,然后 名列第二,成绩仅次于巨头英伟达 ,而且还是最前沿的 端到端赛道。
不鸣则已,一鸣惊人。 模型能力首次验证,就是全球第一梯队。
加上零一在造车上的快速量产交付、智能化重卡生态联盟上的效应……“没有首选自动驾驶”的黄泽铧,似乎又在另一个 更大的层面实践着自动驾驶的终极落地。
他自己也承认,零一汽车的前景都在明面上——
实际上,自动驾驶始终是90后AI大牛黄泽铧造车里的必要一环,但对于全球高手华山论剑里的成绩,他一方面觉得体现出了模型能力,另一方面也感慨: 幸运女神眷顾,刚好生逢其时。
这个 时 ,无他—— 大模型改写一切,端到端重塑自动驾驶范式。
端到端,把桌子掀翻了
全球第二的成绩,并不完全在意料之内。
黄泽铧说,这次参赛其实只是 一次很简单的尝试。
但在2022年年底,零一汽车就已经开始投入端到端相关的研发,所以到了今年CVPR挑战赛,基本就是拿着已经内部相对研发成熟的系统做了应用,而且仅用了视觉的信号,就取得了非常好的成绩,这着实令团队上下倍感鼓舞。
黄泽铧透露,零一汽车在端到端的投入上, 团队不大,效果却被证明很好 ,体现了团队在基础模型、系统研发上的能力。
同时也是 技术范式变革之力 的展现。
他举例,OpenAI的GPT-4o的语音对话能力,很轻松就超过了Siri,可是OpenAI投入的可能也就只有 小几十个人 ,远远不像Siri,可能有 上千个工程师 在做研发。
所以在技术范式变革的时期, 对的人和好用的模型,远比人数和数据参数规模重要。
当然,更早洞察了生成式AI带来的技术变革,更早拥抱端到端,同样在零一汽车的CVPR成绩中发挥了“天时”作用。
黄泽铧软件背景多一些,在CMU学的是机器人,这是全球自动驾驶的头号黄埔军校,毕业后又直接加入图森未来开启了创业,完整走过了自动驾驶从技术到工程、从一辆车到一个车队的历程。
于是当ChatGPT横空出世,他很快意识到对于整个AI和自动驾驶技术范式意味着什么,这也是零一低调开启自动驾驶研发的机缘。
运气也站在了零一这一边。黄泽铧有自动驾驶的经验和经历,但却因为生逢其时, 可以用端到端的方式另起炉灶,没有包袱,不用转型,可以小步快跑。
黄泽铧透露,零一汽车的创业,从一开始的出发点就是因为他看到了 自动驾驶的最大短板在于车本身 ,所以明确应该专注于把车造好,并且明确不做自动驾驶的上层系统,避免有限的资源投入 重复造轮子 的泥潭中。
然而就在ChatGPT之后,他发现自动驾驶技术范式,发生了根本性变化,可以把过去的自动驾驶能力,实现十倍到百倍的提升,于是内部深思熟虑一个月之后,决定打破最初的坚持——开启自动驾驶研发,完全端到端方式推进,是起点也是终点。
一切是时候了。
端到端自动驾驶的火爆和热议,是伴随2023年CVPR最佳论文开始的。
不过在黄泽铧看来, 端到端在自动驾驶范式里,不是原因,而是结果。
因为早在上世纪90年代,就有过设想讨论,2016年英伟达也发过知名影响力的论文。
核心系统也很直接: 把摄像头作为输入,然后把车的轨迹作为一个映射。
然而在当时的技术范式下,实现端到端,非常容易过拟合,或者说会陷入局部最小值。那时候AI系统对于世界和数据的理解能力非常有限,小demo可以work,规模一大可能就失效了。
所以黄泽铧看来,端到端自动驾驶之所以现在是时候了,是 因为大语言模型让AI有了常识系统,AI有了理解世界的能力。
看到红灯就停,识别到了水坑该怎么开……AI有了对人类世界的理解,还会进一步做相关的推理。
这种质变,也是 世界模型开始被推动建立的关键。
黄泽铧甚至认为,世界模型已经建立起来了。有了大语言模型和大视觉模型为基础,整个世界就能被投射到自动驾驶当中,有了端到端落地的基础。
而大道至简,端到端也摆脱了过去人为的模块化定义及其相应的信息减损,不必再写具体而复杂的规则,自动驾驶大规模落地的瓶颈也被相应解决了。
“不用再写规则告诉AI系统遇到红灯该停下来,AI有了常识理解能力,现在只需要一张图,它就知道需要停下来了。”
过去复杂的模型被大大简化,而简化,就意味着工程上的巨大改变。
黄泽铧类比: 桌子被掀翻了。
首先是人才和组织管理层面。
AI人才更加稀缺 ,懂模型训练、数据中台系统相关的人才更加紧俏。
同时放到3~5年的尺度看,端到端本质在简化自动驾驶,也就会简化之前很多堆栈里的工程师,不论是定位、地图,还是预测规划。自动驾驶的研发组织,面临一场重组革命。甚至人力密集的标注产业,也会因之发生很大的变化。端到端会让更多驾驶数据的标注自动化。而懂模型,或者能够用好开源基础模型的架构师,价值会得到进一步凸显。
其次是自动驾驶上层系统的变化。
已经看得见的就是从CPU向GPU的算力体系转移,从多个小模型向单一大模型的转移。还有正在被探索的传感器方案,或许也会因为端到端迎来统一。
第三是Corner Case——长尾场景的解决应对 ,端到端能力明显。这就会让自动驾驶普及落地的进程大大加快。量产乘用车推进的脱脚、脱手、脱眼的功能性模式会被加快,同时行泊也会被真正打通,不再需要两个不同的系统。
业内传播所用的“无图也能开、全国都能开、有路就能开”,就是端到端带来的底气。
而这种端到端在场景迁移和泛化上的上限拉升,会带来更加核心的变化——
L4可能会不存在了。
黄泽铧认为,端到端在可行的情况下其实只会有两个系统, L2 和L5。
曾经按照限定情况和限定工况的完全无人驾驶来定义出的L4,本身就是人类规则内置的体现,而端到端,干掉了规则,可能就摧毁了L4的基石。
最后,自动驾驶的商业化也会迎来真正的曙光。
端到端之前,自动驾驶基于模块化系统,并没有展现出软件系统该有的边际效应商业模型。
因为自动驾驶涉及与真实世界的交互,过去的边际成本极高,从一个场景迁移到另一个场景,需要投入的研发、人力资源等成本,不符合软件系统的商业模型。
但端到端之后,完全数据驱动,场景不再会被切割,AI系统不再有迁移成本,软件的边际效应威力就会展现,自动驾驶的商业化也将会迎来质变。
黄泽铧认为,端到端掀翻了旧制度,然后正在重组新秩序。
唯一重要又需要检验的问题只剩下一个: 端到端的下限在哪儿?
本质上,端到端是一个深度学习系统,可以视为一个 概率模型。
而端到端更是信息流到信息流的映射,如何从概率上保证输出结果的安全性,在自动驾驶上比其他AI应用领域更加重要。
不过黄泽铧对此相对乐观,他觉得随着行业内更多力量的加入,这个问题不会是大问题。多年前黄泽铧参与过人脸识别的研发,很难想象现如今是金融级的寻常应用。
AI确实还存在很多复杂问题和挑战,但开车驾驶本身,其实并不是特别复杂。
黄泽铧也不认同,一定需要完全可解释、完全打开黑箱,才是自动驾驶的终局。 端到端确实是一个偏向黑盒的系统,但黑盒和不安全是不能画等号的。
“我们敢坐飞机不是因为飞机原理完全可解释了,而是它已经证明了足够安全。”
实际上,即便没有端到端,黄泽铧对自动驾驶的信念也从未有过动摇。
他说之所以再创业选择造车,就是希望解决卡车自动驾驶落地最大的短板——车。
自动驾驶再创业,从造车开始
“其实对于自动驾驶来说,最大的问题还是缺车。”
在已经成功完成图森无人车的从0到1后,黄泽铧给出了上述再出发时的初心依据。
他说过去做了10年的自动驾驶,一直围绕着卡车展开,但最后发现限制卡车自动驾驶推进的依然是车本身。相比轰轰烈烈的乘用车市场, 卡车缺乏新能源变革的过程,很多底层技术没有经过改造。
以终为始来看,自动驾驶卡车落地之难,在于缺乏一辆好用的卡车,缺乏一个好用的卡车平台。
这种缺乏是 痛点 、是 稀缺 ,也是真正希望实现自动驾驶落地的黄泽铧,看到的 创业机遇 。
在他的认知里,自动驾驶就是两个层次的系统: 一个是上层系统,软件为核心;一个是底层系统,车辆硬件为基础。
“需要把车作为自动驾驶的一部分。”
黄泽铧认为,上一波自动驾驶从业者,实践中有这样的感触,但站在更大尺度上看自动驾驶,依然还不是多数人共识。
马斯克依然是引领者,在卡车领域,特斯拉已经量产落地了Semi卡车,但Semi更多还是卡车的新能源历程,还没有走向智能化历程。
于是黄泽铧认为,既然技术路径方向已经大致明确,那造车就算再难也需要势在必行,至少需要从造车方向上前进。
命运的齿轮,也在此刻转动。
就在计算机软件底色的黄泽铧坚定向硬件向造车而行时,与另一位资深的硬件大牛、卡车大咖 张红松 ,一拍即合。
张红松和黄泽铧不是同龄人,相比黄泽铧的AI少年天才,张红松代表着造车领域的传统与厚重,他已经 在重卡领域战斗了30多年 ,曾是北京福田戴姆勒和三一重卡的副总裁,以及 完成了三一重卡从立项到上市的全过程 ,深谙硬件研发、供应链和制造。
他俩最早在黄泽铧的图森任职时有过接触交流,但不够深入。待黄泽铧回国后,机缘巧合下开始不断交流,他向松哥分享他的感悟,求教解决车辆在自动驾驶中的短板现状。
而张红松也惊人发现,他从车企的角度,也在思考方向一致的问题。
更重要的是,这种对撞交流中,两人发现底层逻辑价值观、思考问题的方式、性格相互吸引……
所以既然思考相同的问题,为什么不通过创业的方式解决它?
张红松和黄泽铧,“一老一少”组建零一汽车,正式开启造车创业。
而且因为二人独一无二的经验和履历,对创业方向和项目发展想得清楚、划分得细致,进展也比预期顺利。
战略上的准确性,让他们 用时不到2年、耗费1.5亿左右 ,就完成了第一个平台两款车型的研发、制造和交付。
黄泽铧也透露, 乘用车造车,门槛公认的是50-100亿 ,但卡车之所以不同,是因为卡车的行业供应链可复用程度高,定制化开发少、专门的集成度也没那么多,可以把最合理的资源用到最需要的地方。
他也坦承,2年零一造车的过程,也并非事事顺利,犯错误买单在所难免,但因为零一汽车有着方向上的大致正确、团队不断解决问题的心态和执行力,保证了至今超预期的交付。
对于零一汽车,黄泽铧有着自己的 “三级火箭”——
第一级,先把车造好,上牌桌 。然后把车卖好,获得头部市占率,完成造车从研发到商业上的闭环,实现企业发展的飞轮循环。第一级做完,基本就获得了下一赛段入场券。
第二级:打造自动驾驶基座和平台 ,整车系统深度自研以及深入针对一些场景,深入做好无人化落地。这将是为新能源而生的全新重卡整车平台,为无人驾驶而生的智能整车平台。
接着就是 第三级,自动驾驶量产、规模化商用 ,无人驾驶与整车智能化完全整合,实现最大范围和场景的自动驾驶目标。
以马斯克的SpaceX类比,黄泽铧的三级火箭里,第一级造车负责摆脱地心引力,进入太空;第二级第三级自动驾驶,则是能够进入火星轨道并且最终落地火星。
而现在,随着量产车制造交付以及源源不断的销量订单反馈,零一汽车的第一级火箭,正在不断入轨。
当然,面向星辰大海,沿途也能开花结果。
除了造车,零一汽车也把新能源和智能化相关的能力,做了开放合作,以 零动智卡联盟 的方式赋能卡车行业。
黄泽铧之前也谈论过,卡车区别于乘用车供应链,专属定制的没那么多,共享复用的很多。
而零一汽车恰好能给这个更传统的汽车细分市场,既带来新能源的共享,也能带来自动驾驶相关的复用。
对于零一汽车,这种赋能利他,最后也是在创造共赢,因为卡车或者商用车面向的细分场景太多,如果能有更多的玩家,直接通过零一汽车的能力——电气化架构和自动驾驶方案,一定能够共赢创造更大的价值,以及实现自动驾驶的无处不在。
黄泽铧也被问到这个联盟模式下的远景问题,他说目前还不敢想太多,但模糊可见的是零一汽车输出技术,然后重卡车企完成生产制造和后续服务。
实际上,这个模式在乘用车市场,已经被华为完成了验证,而 零动智卡联盟看起来就像是要打造商用车领域的鸿蒙智行。
这种评价,不在黄泽铧的意料之内,或者准确说零动智卡联盟也不在他最开始再创业的第一性假设中,回顾再创业之路,黄泽铧反复强调的只有一句话一件事:
卡车依然是自动驾驶的最大短板。
让他对比图森未来和零一汽车两段创业的不同,他倾向于认同拟人化的这个类比——
图森要做IOI金牌选手 ,用计算机尝试解决世界上最难的技术问题,长板够长就行,哪怕只有一个长板。
但 零一汽车 的挑战,在于造车、自动驾驶、商业化、运营和品牌等方面都是长板,不能有短板。更像是 高考状元 。
而当前,零一汽车已经在“摸底考”中, 在造车和自动驾驶两大主科中,名列前茅,第一梯队 。
2年的创业成绩让黄泽铧激动,但更激动的是距离愿景—— 全球最好的运输机器人公司 ,又更近了一步。
黄泽铧说,这是一个中国卡车从来没有实现过的梦想。
现在,以零一汽车之名,通过创业的方式,召集最优秀的人,一步步实现它。
版权所有,未经授权不得以任何形式转载及使用,违者必究。