|

汽车

卓驭陈晓智:2025开始预埋L3硬件,真正落地还需两三年

来源:汽车之家

2025-03-31 14:38:10

(原标题:卓驭陈晓智:2025开始预埋L3硬件,真正落地还需两三年)

汽车之家 行业 3月28日-3月30日,以“夯实电动化 推进智能化 实现高质量发展”为主题的中国电动汽车百人会论坛(2025)正式举办。

在本届论坛期间,卓驭科技AI首席技术官陈晓智与包括汽车之家在内的核心媒体进行了交流。陈晓智在交流中表示,近期汽车圈流行的“全民智驾”对于卓驭科技这样的智能驾驶供应商来说是好事,有利于推动更多车企寻求相关合作。目前,城市NOA功能还有一定的价格下探空间,未来有望在更低价位车型上搭载。

在陈晓智看来,不论是特斯拉FSD这种非激光雷达方案,还是国内高端车型搭载的激光雷达方案,技术上车的本质逻辑应该保持同样的安全性标准,区别只应该在部分极端场景能否使用上。但车企是否选择搭载激光雷达,并不仅是出于对智驾系统本身的考量,还会考虑整车的成本、定位、市场宣传等维度的需求。

对于年内入华的特斯拉FSD功能体验,陈晓智认为,基础能力非常强,但对于中国道路交通环境的适应很差。在他看来,除了FSD所呈现出来的常规安全舒适体验之外,卓驭将在2025年升级到端到端的世界模型,在功能体验上可能会有更大的升级,实现千人千面的智能驾驶,有能力给用户FSD上也看不到的功能。

随着技术的不断演进,卓驭科技已经开始针对L3技术进行布局。据陈晓智透露,该公司将于2025年内开启硬件相关能力的布局,预计相关软件能力的落地还需要两到三年的时间。

卓驭科技AI首席技术官 陈晓智

媒体:刚才您演讲提到了L3,我想问一下卓驭科技的L3落地有时间表吗?

陈晓智:关于L3、L4,我们今年会把L3、L4的硬件做出来,包括控制器、传感器,满足L3、L4冗余的架构需求。这个传感器除了视觉摄像头,还会增加激光雷达来满足冗余;控制器也会有主系统和备份系统的架构设计。

再下一步,软件功能的落地,这块我们认为还需要一段时间。今年,更多要做的事情就是先把硬件预埋,把落地的事情先做了。整个行业,我们认为可能也会是这样的趋势,先预埋L3、L4的硬件,等算法,包括安全接管率、效率都提上去之后,我们再在一些特定场景把L3、L4的功能释放出来。

肯定今年会有一些落地。软件可能是还需要两三年的维度。

媒体:大家都知道卓驭在成本控制方面很厉害。现在的全民智驾背景下,预计成本还会不会下探?

陈晓智:全民智驾这个事情,跟我们卓驭一直以来倡导推动的高阶智驾普及是比较一致的。过去几年也一直在做这样一个事情。比如2023年,我们把全国无图高速领航下放到10万出头的车型;2024年,我们又把记忆城市领航下放到10万出头的车型。

我们过去比较擅长的是把高阶的智驾功能下放到更低价位区间的车型。今年,大家都说智驾标配、全民智驾,对我们来说是一个比较好的事情。我们也会跟更多客户加深这方面的合作,帮助他们更轻松地标配这些智驾功能。

我们现在比较关心的像城市领航的功能,它的成本肯定能做到更低。比如目前用的7V摄像头,再加32tops的算力平台就可以跑城市领航。目前,大家常见到的动不动跑城市领航要有激光雷达、要有几百tops算力的平台还会有比较大的成本,要下放到更低价位区间的车型还是会有一些压力和挑战。我们能支持更简单的硬件就能跑城市领航,可能会有一定的优势,对于我们的客户来说推动标配会更容易一些。

媒体:卓驭之前提出过智驾硬件可以插拔更换。卓驭将来会不会把这个想法实施,让它成为一个正式落地的产品形式?

陈晓智:这个方向其实我们已经落地了,比如在传感器不变的情况下,同样是7V摄像头,我们可以更换算力芯片,从32tops升级为100tops的算力,我们跑的功能体验还能进一步得到提升。

这样的方案我们可以做到PintoPin的替换,或者整车替换都可以,别的传感器、接插件都不需要变。这个我们已经给我们的客户提供了,预计2025年上半年就会在一些车型上有相应的升级。

媒体:最近一年,我们能看到不同厂商在车载激光雷达态度上有所分化,比如特斯拉和小鹏都明确说以后不会用,像华为和理想甚至全系标配,您怎么评价这种不同厂商的不同态度?

陈晓智:卓驭对于这个问题的观点一直也没有变。激光雷达,我们认为它的作用就是提供冗余安全性。当然,可能不同车企有不同观点,我要标配激光,或者我要减少激光雷达。我们认为,车企他们不仅是对于智驾系统的考量,他们装不装激光雷达还会考虑整车的成本,考虑车型的定位,甚至考虑市场宣传的需求。

从技术角度来说,装不装激光雷达,主要还是看冗余安全性。没有激光不影响基础能力,我们已经看到像特斯拉FSD。FSD已经进国内了,大家可以体验到,我们也体验了,我们会发现它基础能力非常强,基础能力的意思就是安全性、舒适性、拟人性,它是非常强的。它没有激光雷达,但是也可以做到这些基础能力很强。所以,有没有激光雷达不影响开车是否是老司机,或者是否安全,不太影响。

如果你要应对一些比较极端的场景,比如说有的媒体朋友可能也会测一些极端场景,比如夜晚有逆光大灯,还遇到一个静止的黑衣人,这种确实是视觉弱视的场景,加上激光肯定是有用的,对于L3、L4确实要考虑比较极端的场景,你就可以加,加不加激光取决于很多方面的因素,技术以外的因素也有,技术本身的因素也有。

媒体:当前有很多主机厂选择了自研+供应商合作的技术模式,供应商的角色从单纯的方案交付者转变到技术赋能者的地位,您认为供应商和车企的协作模式未来将发生哪些结构性的变化?

陈晓智:卓驭是作为供应商,我们给我们客户的提供方式本身是比较灵活的,我们在硬件、软件、算法各个层面都可以提供相应的合作,比如有的客户想要一个交钥匙方案,软硬件都给他,我们也可以做整套方案给他们。有的客户可能自己做硬件,或者在第三方采购硬件,我们也可以只提供软件算法。甚至有的客户有自研团队,你能不能赋能我们,给我们提供工具链,或者只要部分的算法,我们也是可以提供的。我们卓驭的合作模式本身比较灵活,会针对不同客户提供不同的合作选项。

对于车企自研,现在大家都看到自研,但是自研这个事情本身会有一定挑战。未来,不同的车企自研占多大比重可能还是得看持续的产品迭代能做到什么程度。

媒体:最近汽车出海事情是非常热的,但中国的很多非常好的技术在外国落地时遇到非常多的困难。从您的角度看,卓驭在技术出海方面会遇到哪些问题?

陈晓智:目前,我们海外做得比较多的还是像欧洲那边的海外适配。这方面适配的挑战更多不是技术上的,技术上相对简单,我们的算法模型在国内场景训练之后到国外场景泛化性会比预想中的要好,比如国内做到100%泛化,到海外的工况可能能做到80%,甚至还要多一些。它不会有太大适配的问题。对我们来说,可能针对一些长尾的场景或者当地一些特殊的场景,比如标识牌等等特殊的交规做相应的适配就可以了。

这里挑战更多的可能是在数据的采集,还有相应的路侧得符合当地的法规要求。这块,我们也是有对应的合规方案去做海外的适配。

媒体:特斯拉FSD在2025年入华,卓驭和特斯拉FSD之间的优劣势分别是什么?

陈晓智:我们认为它基础能力还是非常强的,比较老司机。但是它的短板确实也如很多媒体所体验的,对中国路况,特别是遵守交规、走对路方面还做得不够好,还需要一些时间去适配,它的优点和缺点都非常突出。

对于卓驭来说,我们也不太会跟FSD有什么直接竞争关系。他是卖车的,我们是供应商。我们可以帮助国内OEM提供可以跟FSD PK的智驾能力,并且我们在国内的数据以及适配的进展显然会更加多一些。对于国内OEM来说压力更大一点。

除了FSD所呈现出来的常规安全舒适体验之外,我们2025年在技术上还会升级到端到端的世界模型,在功能体验上可能会有更大的升级。它不仅能提供基础的安全舒适的智驾体验,还能做到千人千面的风格,能够通过自然语言控制这个车辆的行为。这种体验可能是一些常规车型看不到的,无论是FSD还是别的智驾车型看不到的。从这个体验上,我们可能也会有一些不一样的地方。

媒体:最近业内关于一段式、二段式端到端的争议,有些已经实现了一段式。您怎么看待一段式端到端的趋势?未来一段式的方案会对成本产生什么样的影响?可以透露一下卓驭在这方面的布局吗?

陈晓智:端到端确实会有不同的实现方案,二段式、一段式。

在我们看来,一段式跟二段式我们不太纠结。一段式比二段式只是多了一步,就是白感知和规划模型串联起来训练,二段式的训练方式就是先训感知模型,再训规划模型,而一段式增加了第三步训练,就是白感知和规划串起来训练我再微调一遍。

对我们来说,我们内部端到端是否要做一段式串联训练,会根据每个版本的需求来决定。串联起来训练必然训练的时间更长,训练周期更长,那么这个版本的发布是否能接受这种迭代周期,这是需要考量的。

对于发版的需求来说,其实每个版本都有一些要解决的问题。比如这个版本要解决某个安全性问题,比如说过路口不够丝滑的问题。这个问题不见得你要把感知和规划串联起来才能解决。你要判断这个问题是否要把感知也联合起来微调才能解决,如果不是,只是你的planning的模型就能解决,那我们就没有必要串联起来去训练。

在我们内部看来,它是一个比较灵活的处理方式,我们都可以支持二段式跟一段式的训练。什么时候做一段式训练就是根据版本的迭代目标,要解决什么问题来去决定要不要用这个手段。

媒体:DeepSeek开源对于整个AI领域也会有影响。卓驭对于这样一个开源的技术有什么运用领域,或者我们目前有什么效果?

陈晓智:DeepSeek开源大家都看到很多应用场景都有在探索。但是对于自动驾驶算法来说,它的作用跟原有的大模型区别不大,目前它比较多的还是自然语言的能力,多模态能力可能也是比较常见的,也没有特别突出。

对于自动驾驶的应用,它更多是技术上对我们会有一些启发,比如它引入强化学习,以及在训练的成本上控制得很好,是通过整个训练系统的优化,使得它使用更少的成本把这个大模型训出来。在这些技术方面对我们启发是比较大的,但是直接用这个模型放到我们车上去跑,或者怎么去开车,其实是不太行的,不太能直接去用它。更多是借鉴它的技术,像强化学习、推理的能力。

媒体:现在国内的车厂提出智驾平权,对于消费者来说他实际体验上感知区别会怎么样?对于用户来说,9万块钱买一辆车和20万买的车,他不知道智驾方面的区别会在哪里?

陈晓智:这个其实要取决于每家车企对不同价位车型所放的功能的区别,我们也不能判断别的车企是怎么做的。

对于卓驭来说,我们对于不同价位方案的区分度,绝大部分场景能力要做到它们是一样的,只有在一些比较极端的工况会有区别。

类似于不同的车可能会有不同的电机,有的单电机,有的双电机,从开车的角度其实没有区别,你用单电机还是双电机都能完成开车驾驶这个任务,没有区别。你可能只在一些特殊场景,比如说地面湿滑,容易打滑的场景,或者下雪天,双电机可能会好一点,可能会有这些区别,或者追求极致运动,我等红绿灯的时候,希望有声浪的声音出去,可能会有这些区别,但是基本能力是没有变成。

智驾也是做到类似这样的区别,大部分场景都有相同的安全性、舒适性、拟人性,只有在一些具体场景有区别。举个例子,比如可通过性可以有区别,比如说相对低成本的方案,可能在一些狭窄的路段不能通过,它就会告诉用户说不能通过或者我就刹停,停在这里等待接管,它有这个能力,但是不要影响它的安全性,只是不能通过,它只是没有这个能力通过,但是你的安全性、舒适性不能变;更高成本的呢,在更窄的路可以通过,可能在通过性的配置上会有区别。

媒体:卓驭科技现在已经公布的定点企业主要是自主品牌和大众汽车。豪华品牌现在也在找本土化的智驾供应商,卓驭接下来有没有一些合作的可能性?

陈晓智:除了我们目前正在合作的客户,我们也一直在跟一些全球客户在深入交流,相关的合作未来一定还会有增加的,具体是哪些,可能需要再过一段时间,大家可以等官方的消息。我们也一直在拓展这些海外客户,包括他们在本土化的车型、海外车型。

媒体:我们用AI只是一个语言模型,比如用DeepSeek或者用ChatGPT,它的模型量或者数据量比较小,但是智驾是非常复杂的情况,它怎么能做到千人千面以及动态调节?

陈晓智:我们上午在会场上也提了一个议价能力,就是千人千面和智驾的能力。它背后的技术关键是在于我们在研发端到端的世界模型,它跟传统的端到端区别在于,传统的端到端是基于模仿学习,你从大量的驾驶员数据中学习他的行为,就是模仿司机的行为。但是因为你的数据里面各种风格的司机都有,你学出来的风格其实就是一个平均的司机,你没有区分度,所以它很难做到千人千面,并且它的推理过程也是基于直觉式的。端到端,就是看到一个传感器输入就做一个驾驶动作,它是直觉式的一次性动作的预测。

为了做到千人千面,其实要有一些推理的能力,并且要区分不同的风格。我们通过世界模型,世界模型的特点不是直觉式的,它有推理能力,它可以生成未来可能发生的N种情况,就类似N个平行宇宙。N个平行宇宙里面可能有非预期的,有一些不符合用户驾驶意图的,你可能需要一个推理过程结合用户意图选择最有可能的驾驶轨迹,大概是这么一个思路。背后的技术核心,一个是世界模型的推理能力,在训练过程中会引入强化学习去克服模仿学习本身的局限性。

媒体:它的数据量会很大吗?

陈晓智:数据量其实没有太大区别,更多是算法上的创新。引入强化学习之后,在长尾数据积累,这种数据还能减少,因为模仿学习,你要模仿一些极端场景的行为,你得采集这个场景的数据。有一些场景数据是很难覆盖的,强化学习可以通过仿真手段生成这种场景,它可以降低数据采集的需求。

媒体:刚才您提到低成本和高成本的智驾方案对于路况的解决,我想请您展开聊一下。大家最关注的三个场景,一个是丝滑绕行,一个路口的灵活交汇,还有驾驶预判。这个低成本和高成本是什么样的解决思路?

陈晓智:首先对于安全性、舒适性,包括拟人性,我们认为在常规场景,不同成本方案还是可以做到非常接近的,但必然会有个别的场景确实会有差异,差异的地方可能会在高动态的场景,需要精密操作的场景,比如说突然快速横穿一个外卖小哥的车,高成本方案可能会刹得更快一点,响应更快一点,而低成本方案可能会慢一点,但是它也能刹住,安全性是有,但是它可能就是响应慢一点,可能硬件的时延在里面,这是一个例子。

另一种,高精密操作,比如非常复杂的人车混行,各种快速响应周围行人,或者电动车的交互,这时候你如果高成本的,你这个模型处理的分辨率更大一些,或者算力更大一些,它在这方面还是会体现出来一些更安心的感觉,但是在绝大部分场景,我们认为区别不大。

媒体:端到端世界模型的问题,业内也有一些厂商在尝试,比如您刚才说的推理,它其实是在发生环境去做,但是推理相比于强化学习是比较耗时的。我们怎么把在虚拟环境下的能力在最后部署上车的时候实现这方面的能力?

陈晓智:推大家如果了解像思维链、慢思考或者推理这些能力,慢思考要处理时间更长,可能没办法做到比较高的频率去处理,在车端应用并非这种用法。车端使用更多是慢思考或者推理更多是做长时的任务规划,就是对于驾驶的策略它可以做分解。比如说,根据导航,我要大概什么时候左转绕行,遇到复杂的路况怎么保证我走对路……

它需要更多的规划,并不是像原来直觉式的端到端,我看到一帧数据就输出一个动作,它可能会出错。如果通过更长时的规划可以做出更加合理的决策,它会是一个结合的过程。这是部署角度的一个方式。

媒体:业内也在谈论自动驾驶的终极解决方案,像前面有一些大佬说他觉得VLM可能只能做到L2+,如果要往L3或者往更高级别L4去做的话,可能要做VLA的大模型。不知道您对这个自动驾驶解决方案怎么看?

陈晓智:我们认为,无论是VLM还是VLA,跟是否L3、L4没有什么必然关系。L3、L4跟L2是安全责任的区别,谁来承担事故责任,并不是功能的区别。L3、L4就是你的接管率要足够高,你可能要比人类司机要高几个数量级,MPI(每次干预行驶的里程数)要高。你选用什么技术,端到端也好,VLM也好,VLA也好,只是影响你的接管率。但是接管率即使做到很低了,也不代表你能做到L3、L4。

L3、L4更多为了实现安全责任,驾驶员不接管,意味着系统必须还有另外一个备份系统代替驾驶员去接管这个车。L3、L4的区别是你得有一个备份系统代替这个人。对于主系统跑的是端到端还是VLA没有太大关系,至于VLA能不能满足L3、L4,其实没有什么关系。

媒体:在电动化时代刚开始的时候,续航其实是有泡沫的,很多用户会对续航非常焦虑。现在可能大家不会在乎这个。在智驾行业也存在这样的情况,但是挤泡沫的过程看起来比电动化稍微快一些,您怎么看这个趋势?大概需要多长时间?

陈晓智:泡沫可能是会不会有一些宣传过度,导致消费者有一些理解上或者使用上的误区。

对于这一块必然会有这样一个过程。毕竟是新技术,但是我们也看到,智能驾驶的功能,比如像高速领航,在两年前很多人不敢用、不愿意用,但现在很多人会愿意用了,并且觉得好用,其实需要大家使用的过程。一旦用户用了,他确实可能就回不去了,它确实能在高速场景解放他的疲劳。

城区的功能,像城市领航,目前确实还没达到这种成熟度,在功能上必然也会经过像高速领航的阶段,后面也会逐步让更多消费者觉得它安心,愿意用它。但现在其实还是有一定的距离。

对于城市的功能,我们认为在两年左右就会达到类似高速领航的成熟度。

媒体:2024年,卓驭公布了和英伟达的合作,基于索尔。基于索尔开发的一段式端到端方案进度怎么样?相比于低算力这些方案它的优势是什么?它的搭载车型有哪些?

陈晓智:索尔是我们今年重点在做的一个平台,最快实车体验下个月上海车展大家可能就能体验到,会是我们一个初步的版本,也会部署端到端的能力。

对于这个平台,它跟我们原来比如100tops、几十tops平台的主要区别是,我们可以上刚才提到的端到端世界模型这种技术。这种技术可以引入像大语言模型这种比较耗算力的模型,你要用100tops去跑确实比较困难,但是有1000tops可以跑VLA也好,世界模型、大语言模型都能跑。跑这些模型从功能上的区别就是能支持刚才我们说的千人千面的驾驶风格,实现个性化驾驶,还有自然语言控制车辆的行为。这些能力可能是中低算力平台比较难做到。

索尔因为算力大,所以我们在这个芯片上面部署,也能支持座舱的使用。座舱也想部署LLM,智驾也想部署LLM,部署两套LLM比较费算力。我们会提供一个共享部署的方案,一个LLM解决两个域的问题,索尔平台也能支持这种功能。

询价

询价信息已提交

确定
首页 股票 财经 基金 导航