谁能想到,困扰整个汽车行业多年的"老车主被背刺"难题,竟然被蔚来用一套"AI Infra"给解了。
6 月 18 日这天,蔚来干了件挺牛的事儿——同时向三代平台车型(NT2.0、NT2.5、NT3.0,足足 18 款车)推送了同一套世界模型智驾系统。简单说就是:不管你开的是三年前买的老款,还是刚提的旗舰,都能用上最新的智驾功能。
这事儿放在以前?门儿都没有。
一、被硬件绑架的智驾,到底有多尴尬?
老司机都知道,以前买智能汽车就像开盲盒——你花三十万买的车,厂家出个新款,加几个激光雷达、换个芯片,老款立马就"过时"了。什么 OTA 升级?对不起,您的硬件跑不动。
蔚来智能驾驶研发负责人任少卿管这叫"软件被硬件绑架"。而这个困扰全行业的难题,蔚来在 2020 年就开始琢磨怎么解了。
二、蔚来的解法:自建一套"AI Infra"
任少卿的思路很清晰:硬件肯定还会不断迭代,所以必须在"软硬之间"搭一座桥。
这座桥叫做 AI Infra(AI 基础设施)。蔚来只保留了最底层的硬件接口(比如英伟达的 CUDA),上面所有的推理引擎、部署框架,全部自研。
听起来简单,做起来是真烧钱。当时行业里大家都还在用英伟达现成的工具部署上层应用,蔚来偏要自己搞。这就好比大家都用现成的毛坯房,蔚来非要自己烧砖——费力,但天花板更高。
结果呢?
- 编译器自研:把原本需要 1-2 周的算子优化部署,压缩到 1-2 天;
- 推理性能:端侧性能直接提升 20%以上;
- AI Agent 自动化:把原来工程师需要长时间手动盯盘的活儿,交给 AI 干,模型上车部署时间从一整天甚至几天,极速压缩到 2 小时以内。
等到 2024 年蔚来自研芯片流片、2025 年 3 月量产后,这套已经磨合了 5 年的 AI Infra 立刻派上用场——新芯片一回来,跨平台兼容立马就能跑起来。
这就是为什么蔚来能"率先"在多平台落地——不是因为芯片牛,是因为底座早就铺好了。
三、数据的本质是"算力"
任少卿有个很有意思的观点:"数据的本质是算力,是'模型+算力'运行产生的结果。"
他给出了一组让人细思极恐的换算关系——在大模型时代,性能想提升 3 个点,数据量要翻 10 倍;如果想提升 18 个点,数据需要10 的 6 次方倍。
这意味着什么?意味着你就算把全中国的专职测试车都拉出去跑,也填不满这个数据黑洞。
那蔚来怎么办?影子模式。
蔚来在所有量产车上"无感"运行最新的待验证大模型,不干预用户驾驶,只在背后默默推演。一旦 AI 的判断和真实人类司机的动作出现分歧,这个"分歧瞬间"(Corner Case)就会被立刻传回云端。
这套体系有多猛?任少卿透露:每周能完成超 4000 万公里的主动安全测试——这相当于 1000 辆测试车连轴转一年才能跑出来的数据量。
而且这 4000 万公里里,Corner Case 可能只占 5%,但训练价值反而比那 95%的常规数据更高。
更狠的是,蔚来还在云端世界模型里给 AI"挖坑"——故意制造各种极端、违反常理的陷阱,强迫神经网络学习"怎么从错误状态把车救回来"。
四、两年前那场"4×100 米接力跑"
最近大家普遍感觉蔚来智驾能力蹭蹭往上涨,任少卿却说这"不是单点算法的突变",而是两年前那场组织架构变阵的结果。
任少卿把技术发展分成四个阶段:
- 第一阶段:目标不清晰,大家都在摸黑;
- 第二阶段:存在弯道超车的可能,鼓励底层创新;
- 第三阶段:技术路线收敛,开始拼人、堆策略、写代码;
- 第四阶段:红利消失,开始拼细节。
他判断,2020 年左右的智驾其实已经进入第三阶段——大家都在疯狂堆代码、拼策略数量。
但 2023 年,大模型和世界模型概念一出,整个行业又"倒退"回了第二阶段——底层创新重新有了弯道超车的机会。
蔚来在 2023 年果断变阵,把智驾团队重组成了"4×100 米接力跑":
- 第一棒:预研
- 第二棒:主线状态交付
- 第三棒:跨平台适配
- 第四棒:具体车型量产交付
任少卿把绝大部分资源砸在了"第一棒"的预研上。所以今天大家看到的"世界模型+闭环强化学习"的能力爆发,其实是 2023 年那场架构变阵叠加 2020 年开始搭的 Infra 底座,两个齿轮咬合到一起的结果。
五、几个关键问题的硬核回答
Q:VLA 和世界模型,到底谁才是未来?
任少卿的回答很工程师:"算法有不同想法太正常了,如果大家都走同一条路,世界也不会发展这么快。"他透露,蔚来内部从 2023 年下半年就开始做世界模型,当时这名字都不太清晰,但思路很简单:希望它能完全无监督或自监督训练,而且是个多模态统一的网络。
Q:重新训练小模型 vs 蒸馏大模型,哪条路对?
任少卿很诚实:"这两条路在 AI 发展史上一直在切换。"对蔚来目前车端跑的模型来说,蒸馏用得更多。但他强调,这两者对现有算法体系不会产生根本性变化。
Q:蔚来和特斯拉 FSD 差距有多大?
这是最敏感的问题。任少卿没有回避:"特斯拉在数据体量和训练资源上是世界领先的,计算量上可能高出一个量级以上。"但他话锋一转:"单从架构进度来说,我们在今年上半年推出了基于世界模型的闭环强化学习,在这个版本里还会再加 SFT(监督微调),应该不落后于特斯拉,尤其在闭环这一块,我们算是比较领先的。"
Q:未来能不能不依赖数据,靠 AGI 直接搞定自动驾驶?
任少卿直接否了这个幻想:"数据才是这个时代 AI 的根源。"
他解释,语言模型可以白嫖互联网数据几十 T,但智驾不行——所有应用场景的数据都得自己生产。智驾要解决的核心问题是:怎么产生相当于"10 亿网民筛选"的数据量?
"显然没有这么多人工去干这个事,所以只能通过自动化。"任少卿说。
Q:智驾要不要学点"通识"?
业内有种说法:"只会开车的自动驾驶,开不好车。"
任少卿的回应很务实:所谓"通识",对人类来说就是交规。让 AI 学交规有两种方式——一种是把大语言模型塞进去,另一种是用闭环强化学习让模型自己试错。比如不能压白线、不能闯红灯;看到红灯倒计时 2 秒就别死踩刹车。蔚来选的是后者,"目前来看更高效,效果也更好"。
说到底,蔚来这次智驾能力的集体爆发,并不是什么灵光一现的奇迹,而是 2020 年铺的 Infra、2023 年的架构变阵、2024 年的世界模型——这三步棋一步步走出来的必然结果。
任少卿那句"技术发展退回到了第二阶段",可能是理解蔚来这两年智驾逻辑最关键的一句话。在这个阶段,敢于在底层创新下重注的人,才有可能笑到最后。