专栏观察

自动驾驶的行至中场:毫末智行领跑“重感知、轻地图”路线

城市辅助驾驶正在进行高段位的比拼。

继毫末智行官宣毫末城市 NOH(城市导航辅助驾驶)将在第四季度交付的消息后,小鹏汽车也在新品发布会上同步了小鹏XNGP即将落地的消息。再加上特斯拉可能将FSD Beta引入中国市场,华为在“城市导航辅助驾驶”领域秀肌肉的动作,2022年被认为是中国城市辅助驾驶的元年。

同样是城市导航辅助驾驶,技术上却可以分为两个流派:一是毫末智行代表的“重感知、轻地图”路线,另一个是小鹏等选择的“多传感器融合 + 高精地图”路线。随着自动驾驶技术越来越近,围绕两个流派的口水战也越来越激烈。

相较于舆论场上的争论,似乎有必要探讨这样一个问题:刚刚穿越创业公司1000天生死线的毫末智行,为何会成为最早量产落地的玩家?

01

自动驾驶的第一性原理

可能在不少人的印象里,自动驾驶属于刚刚出现的新概念和新物种。可对自动驾驶的历史稍作盘点,答案或许会超出很多人的预期。

即使不考虑古典意义上的自动驾驶探索,单单是这一波自动驾驶浪潮,就可以追溯到2009年谷歌自动驾驶部门的成立。按照当时流行的预言,自动驾驶将在2020年前后上路,2025年将不再有人类司机。

让人始料未及的是,整整13年过去后,曾经喊话取代人类司机的自动驾驶,似乎成了一张空头支票。其中的原因有很多,比如算力、算法、数据的制约,再比如交通法律法规上的红灯,其实也可以在某种程度上归罪于“高精地图”。

自动驾驶曾经有很多技术路线,2019年后形成了两个主要流派:

一个是高精地图+激光雷达的地图派,高精地图和激光雷达就像是自动驾驶车辆的“两根拐杖”,靠激光雷达增强感知能力,高精地图提高规划能力,然后在算法的辅助下实现车辆的自动驾驶功能。

只是激光雷达在2016年才开始加速,高性能车规级激光雷达产品的成熟量产,在2021年才逐渐实现。高精地图还要“命途多舛”,分米级地图的测绘成本可能达到每公里上千元,直接限制了自动驾驶在非一二线城市的应用场景。自然资源部于日前收紧了高精地图资质,对依赖高精地图的玩家不亚于釜底抽薪。

另一个是摆脱了高精地图限制的感知派,简单来说就是丢掉了高精地图的拐杖,依赖于激光雷达+毫米波+摄像头的感知能力。“感知系统”就像是自动驾驶的“眼睛”与“耳朵”,然后对路况做出实时判断。

最著名的“感知派”正是特斯拉,也是第一家采用纯视觉技术方案的自动驾驶企业,埃隆·马斯克甚至多次吐槽“傻瓜才用激光雷达”。毫末智行也是“重感知”路线的重视拥趸,毫末智行的HPilot 3.0系统降低了对高精地图的依赖,即使在没有高精地图覆盖的城市场景里,也能够通过强大的感知能力实现高级辅助驾驶。

根据自动驾驶的第一性原理,底层逻辑在于利用AI在行驶过程中进行识别、判断和决策。在高精地图价格昂贵且无法及时更新的局面下,通过实时路况感知来提高自动驾驶系统的规划能力,可以说是现阶段的最优解。

不管是特斯拉、毫末智行,还是其他感知派玩家,无疑都选对了自动驾驶的技术路线,最终在落地环节率先开花结果。

02

“重感知轻地图”的新路径

如果说“重感知”是毫末智行的第一个技术标签,另一个鲜明的技术主张在于“轻地图”,在国内首次开辟了“重感知、轻地图”路线。

回到三年前的语境里,毫末智行的技术战略不可谓不冒险。彼时“感知、决策、控制”被奉为自动驾驶技术的三个核心要素,其中“感知”与“决策”都离不开高清地图,有着不可或缺的作用。

因为高精地图的“高精”在于数据精度更高、维度更多,譬如道路的弯度、坡度,车道线位置、类型、宽度,以及交通信号灯、交通标志、路边地标等元素,都在高精地图的采集范围内。国内的一些自动驾驶企业开始高举“重感知”的旗号,却仍然不愿舍弃对高精地图的依赖,即使深知其弊端。

然而高精地图的短板远不只是贵,特别是在国内的城市场景,城市道路养护频繁、大型车辆密集、变道空间狭窄、城市环境多样......高精地图想要起到“感知”与“决策”的价值,还需要以“天”为单位更新的保鲜期。

以至于埃隆·马斯克在吐槽完激光雷达后,将矛头直指高精地图,“高精地图是一个‘很糟糕的想法’,会导致自动驾驶系统过于依赖已存储的高精地图而失去灵活性,不能像真正的司机那样根据路况灵活应变。”

和特斯拉有所不同的是,毫末智行很少公开讨论高精地图的价值,却在技术上大胆去高精地图化。按照毫末智行技术总监潘兴的解释:“在重感知的技术下,不需要精度极高的地图即可实现城市辅助驾驶功能。”

相对应的是毫末智行在“重感知”方面的苦功:

首先,就是毫末智行的数据智能体系MANA。数据是人工智能最大的驱动力,也是自动驾驶能力进化的养料。自动驾驶想要走出实验室,需要大量的真实路况数据,并对数据进行规模化的标注、仿真与验证。通过“目标粗定位”和“属性精细估计”,MANA实现了数据标注过程的自动化,目前自动化率已经达到80%。

其次,毫末智行是国内第一家应用Transformer的自动驾驶企业。参考毫末智行CEO顾维灏的说法,毫末智行在一年多的时间里完成了训练平台的改造升级、数据规格和标注方法的切换准备以及针对感知、认知具体任务的细节探索。通过Transformer的全局注意力机制,MANA解决了自动驾驶在实际路况中的许多复杂难题。

结果印证了毫末智行的正确性,毫末城市 NOH是国内最早落地的城市辅助驾驶系统,哪怕是华为这样早期押注高精地图的玩家,也开始主动对高精地图“进行降权”,试图重押重感知路线。

03

城市场景的实战拉力赛

最应该被聚焦的信息点,可能不是毫末智行与特斯拉们的先后之争,而是毫末城市NOH在第四季度的交付落地。

似乎有必要重新解释下什么是城市导航辅助驾驶,简单来说就是帮助用户实现从城市A点到城市B点,比起半封闭、道路结构化的高速场景,城市路况复杂度高,行人、非机动车、机动车等道路因素较多。

两种流派最大的不同也在于此。“地图派”的落地往往会限制在特定城市中,无法在缺少高精地图测绘数据的城市落地,而毫末智行“重感知、轻地图”的路线,直接避开了高精地图的种种局限,将重心放在车辆本身的感知和决策,没有高精地图的场景里也能够实现高级别的辅助驾驶。

落地时间的早晚、落地场景的宽窄,直接影响着自动驾驶企业的真实路况数据,甚至左右下一赛段的竞争。因为只有大规模前装辅助驾驶系统,才有能力收集到足够规模和足够多样的数据,进而加速自动驾驶的能力进化。

就像毫末城市NOH之所以能够领先友商量产交付,原因可以追溯到毫末智行在北京、保定等城市的落地测试。两个北方重镇城市均以路况过于复杂著称,有着其他城市不具备的复杂性和不确定性,积累了大量的真实路况数据,让毫末智行的自动驾驶系统“学习”到了有价值的经验。

毕竟左右“老司机”养成速度的,除了足够多的行驶里程,还有路况的难易。如果每天在人少的乡间公路上开,车技的进步可能并不明显。可如果是行人、自行车、机动车来回穿梭,红绿灯、斑马线、绿化带处处可见,有时候一堵就是二三里的城市道路,恐怕很快就会成为“老司机”。

毫末智行“重感知、轻地图”的路线优势才刚刚显现。按照长城汽车的销量,意味着毫末智行将在短时间内积累海量的真实路况数据,远非几十辆测试车可以比拟的,一场有关城市场景的实战拉力赛即将打响。

可以找到的另一个佐证在于,毫末智行在两年前就开始研究Attention大模型,为了满足大模型训练所需的算力,毫末智行官宣了中国自动驾驶科技公司的首个超算中心,目标是满足千亿参数大模型,训练数据规模100万clips,整体训练成本降低200倍。一旦大模型和海量数据“双剑合璧”,自动驾驶将全面进入到数据驱动时代,里程数据将在自训练模式下迅速飙升到1亿公里以上。

自动驾驶已经经历了硬件驱动的1.0时代、软件驱动的2.0时代,正在走向数据驱动的3.0时代。随着毫末城市NOH的规模化交付,毫末智行将是国内第一个摆脱测试车进行数据采集,继特斯拉后第一家进入自动驾驶3.0时代的中国企业。

04

写在最后

做一个大胆的判断,2022年将是中国自动驾驶的分水岭。

诸如毫末智行等已经具备城市导航辅助驾驶的企业,早已跻身国内自动驾驶的第一梯队,而那些缺少城市级辅助驾驶能力,或者短期内无法打通城市场景的企业,将不可避免地退居第二梯队,甚至远离自动驾驶的话题中心。

因为数据驱动已经加剧了自动驾驶的迭代速度,等待市场上大中小玩家的,将是一场无法避免的降维打击。

希望看到您的想法,请您发表评论x