李红林:智能汽车和人形机器人技术相关性很强


[汽车之家 行业] 10月21日~24日,第三十二届中国汽车工程学会年会暨展览会(SAECCE 2025)在中国重庆·科学会堂召开。SAECCE 2025通过汇聚行业智慧、展示前沿技术、搭建合作桥梁,并携手全球汽车科技力量,服务全球汽车科技发展,共创世界级汽车科技创新平台。

在SAECCE 2025于10月23日下午召开的“人工智能主论坛”上,东风汽车集团有限公司研发总院智能化技术总工程师李红林以《云智一体:构筑智能汽车的创新底座》为主题进行了演讲。

汽车之家

李红林表示,现在行业里面在谈具身智能更多是谈人形机器人行业,因为它从人形的角度来说更加贴合大家所理解的具身智能。但如果大家去分析智能汽车和人形机器人本身的技术路径,我们会发现从算法层面他们是逐渐趋同的,感知、决策、控制与执行,特别是李骏院士发布AI Car提到VAL模型,对于智能汽车智能驾驶任务的赋能,这种背景下面智能汽车和人形机器人他们的技术相关性更强烈了。

以下为演讲实录(汽车之家精编):

尊敬的董扬理事长,李升波主任,大家下午好!

今天报告题目是《汽车具身智能体工程化的思考与实践》,从下面三个方面展开。

第一是汽车行业的趋势,从政策角度,习总书记在众多论述中提到对人工智能要坚持自立自强,突出应用导向,推动人工智能健康有序发展,努力开发更多安全可靠的优势产品。从各个部委来看也出台了诸多的引导政策,特别是今年8月份国务院出台的《深入实施人工智能+行动的意见》,是我们下一步做“十五五”规划中一个重要的引导。

在这种引导下面,我们会发现人工智能赋能行业的发展有三个明显的特征:

第一是打破了传统创新路径的变化。从以前技术成熟后找应用场景到现在转向场景需求驱动。

第二是全链条的要素贯通,整个产业链在共同发展。

第三是生态闭环逐步形成。

如果从技术维度来看,结合今天的主题人工智能发展可以简单地分为2024年之前或者2024年这个时间段左右的离身智能,到2024年大家谈很多的具身智能。它的底层在于大模型能力的提升、大模型技术的突破。从离身智能以前赋能虚拟空间促进互联网经济的发展,到现在赋能制造业的发展,打造制造业产品的提升带来非常大的帮助。

今天我们一直在谈具身智能,我简单回顾一下具身智能的概念和架构。在不同的著作和论文当中有不同的描述,今天我想引用清华大学孙富春教授对于具身智能架构和定义的描述。

架构有四部分组成,感知体、认知体、行为体和所属的环境。定义角度,具身智能系统指在感知理解环境并在其中行动,同时利用感知反馈与运动反应构成持续循环。这句话中英文论文翻译不是很准确,我们可以从当中体会两个关键点,一是本质上讲,具身智能是通过物理身体与环境的动态交互来实现智能行为;二是它的核心在于本体、智能和环境三者之间的深度耦合。

从定义和架构来看,有两个非常典型的应用载体适合去开发具身智能系统,就是智能汽车和人形机器人。现在行业里面在谈具身智能更多是谈人形机器人行业,因为它从人形的角度来说更加贴合大家所理解的具身智能。但如果大家去分析智能汽车和人形机器人本身的技术路径,我们会发现从算法层面他们是逐渐趋同的,感知、决策、控制与执行,特别是刚才李骏院士发布AI Car提到VAL模型,对于智能汽车智能驾驶任务的赋能,这种背景下面智能汽车和人形机器人他们的技术相关性更强烈了。

基于以上的背景趋势分析,给各位领导和嘉宾汇报一下东风公司的实践。

首先东风公司在2024年提出,我们要把打造汽车具身智能体作为重点工作,我们认为它是未来汽车形态一个重要的形态模式。2025年6月底,东风公司也成功申报了汽车具身智能技术湖北省重点实验室。这种背景下,面向“十五五”我们也制定了AI+专业行动方案。

用四个数字来表述是“126X”,“1”是描述愿景,我们以用户为场景加速AI与汽车深度融合,重构未来出行新体验,助力打造AI创新企业。“2”条主线分别是从用户端打造汽车具身智能,在企业端构建新质生产力。“6”项举措分别是从场景、算法、数据、平台、生态和人才方面去重点开展工作。当然也有需要多项的保障支撑,包括安全伦理、标准法规、合作伙伴、智能投入等等。

结合刚才的架构和定义的描述,我们认为具身智能体在汽车上的实现,汽车具身智能体至少有三个基本的要素。第一是能够准确理解复杂环境;第二是能够实时响应安全任务;第三是能够确保与物理世界友好交互。

基于这样的理解,东风公司在汽车具身智能体进行了五方面的工作:

第一是在充分分析用户相关的需求,形成用户需求的牵引。我们提到以用户情感化的需求为核心,重塑个性化的需求体验,谈了三个方面:

一是汽车具身智能体应该具备与驾乘人员的共情能力,他的前提是准确理解驾乘人员的情感;

二是主动服务,大家知道现在的智能汽车更多是在被动响应驾驶员的指令输入,但对于汽车具身智能体,因为它能够准确地理解环境,从而能够主动向用户提供服务;

三是个性化的体验,各位嘉宾平时都会驾驶,个性化的操作在车辆设置那里,比如可以设置车辆的转向,助力的轻重缓,驾驶风格舒适、平稳和激进。对于汽车具身智能体它能够实现的是主动服务过程中,更好地学习用户的驾驶习惯、偏好,从而在主动服务中利用更加贴合驾驶员个性风格的方式去实施主动服务。

第二是架构设计方面,这张图描述了我们对于具体智能体架构的描述,我们把汽车具身智能体当做任务执行的主体。这里描述关键点在于具身智能体的构建拆分成主智能体和从智能体,主智能体聚焦全局决策,从智能体专注于局部任务执行,从而形成分工协同、闭环联动。从智能体我们又做拆分,包括面向驾驶任务以及非驾驶任务的。

这张图融合一个层面的融合要素,我们谈智能汽车的舱驾融合,很多时候我们谈硬件的融合,把智能驾驶控制器和智能座舱控制器进行融合,形成集中式域控。这里通过汽车具身智能体我们谈更多是软件层面的融合,智能体任务执行层面的融合。

第三是数据,刚才我们一直在谈数据驱动。对于汽车具身智能体构造中,图片点云的标注这种技术我们认为座舱场景的数据和舱外场景的数据同样重要。刚才提到图片点云上要更多实现VKA的标注,从而便于更好地理解场景,剖析思维链,判断决策过程的正确与否。经过舱内外高质量数据集的构建,能够提升模型特定领域的性能。

第四是模型能力的进化。持续进化太极大模型的能力,推动汽车具身智能体的落地,今年车展期间东风公司推出了太极大模型能力这个技术品牌,我们把面向用户端和企业端的大模型,我们概括成为太极大模型体系。结合用户端汽车具身智能体的能力,我们的模型能力从三方面提升,第一是跨模态的感知融合能力,第二是推理规划能力,第三是自适应的交互泛化能力。

第五是工程化落地。刚才谈到汽车具身智能体的打造,谈到工程化落地的挑战,挑战这个词既可以作动词也可以作名词,我先把它作动词来汇报。

东风公司在做汽车具身智能体的工程化落地,落地过程中涉及最关键的环节,刚才谈到具身智能体之所以变为可能是因为有非常好大模型的基础,在这个过程中我们就会发现,大模型的部署有非常大的工作量,因为这个地方涉及不同的部署方案。它的流程和小模型的部署大致相同,我们把它分为模型本身的训练、端侧部署、效果验证,根据验证的效果去做迭代。

这当中变化的部分是模型训练当中我们会结合大模型本身的能力、尺寸大小和参数量的大小做知识蒸馏。端侧部署端,我们需要对模型进行转化,对芯片的环境做适配,而且适配端侧的工具链,进行端侧的应用分装。

在这个过程当中我们会发现,工程化落地过程中应用部署有三种典型的方案。刚才AI Car里面提到端侧部署的重要性,三种不同的方案我们都会涉及,一个是云端部署,一个是车端,一个是端云协同。

这三个方案的组合我们以什么样的方法论来支撑?这个地方我想说的是,大家如果关注过2002年诺贝尔奖经济学奖得主丹尼尔·卡尼曼,他在《思考快与慢》当中的描述,说人类的大脑思考是由两个系统组成。大脑算系统这个概念的雏形,卡尼曼提之前前面也有学者提出,但这本著作当中两个系统描述的更加清晰。

这里面他简单把其称为系统一和系统二,系统一是自动且快速地运行,维护世界模型,这是他对整个世界的认识;系统二是将注意力分配给所需烧脑的活动,说明我们要进行深度的思考,并且负责持续集控行为,当事情变得困难时接管思维活动,我们为什么要在这个地方提这么观点,因为我们在车端和云端最关键三个要素是时延、响应时间、安全性。

基于这样的理论意味着日常的场景所需要应对的工况,所需要完成的任务,我们尽量部署在车端,这是我们在车端部署过程中刚才提到的重点所在。对于信息娱乐时延性要求不是那么高的应用场景我们可以部署在云端,这样可以充分运用云端算力和大模型本身的能力,为用户带来更好的体验。

刚才把挑战当做动词之后谈了,现在把挑战作为名词谈一下,也就是工程化落地过程中遇到了什么挑战,想说四个方面。

第一是模型能力。刚才我们提到为了适配车端轻量化的部署,我们对模型做了轻量化、对模型做了知识蒸馏,但如何去保证模型在特定环境下面仍然有足够高的能力边界,这是我们的第一项挑战。

第二是算力瓶颈。车端算力目前来说能够支撑我们在车端做大模型,即使是压缩了之后,比如1B左右大模型的部署的芯片为数不多,国产化的更少,所以我们算力确实遇到了相应的挑战。

第三是跨域协同的挑战。这个过程中,因为我们调度自动驾驶的原子能力,它的交互协议、服务接口,因为涉及到实时的安全性,所以这方面有非常多的挑战。

第四是智能化的框架,智能体框架。我们现在做基于云端智能体部署时有非常多、非常好可借鉴的框架可用,只要大家识别工作流就能快速搭建出一个智能体的查用流程。但对于汽车具身智能体,特别是车端环节去部署智能体调度的时候,相应的约束条件更多,难度更大。

基于四个挑战,对于行业来说我们提了一点点思考和建议。

第一是从大模型的角度,在座如果是主机厂都在做各自的企业垂类大模型,或者说是行业大模型,每家企业都在做,我们有没有可能去打破这个烟囱,我们来共建汽车行业大模型。好处当然在于,我们每家都能够充分地整合利用多模态数据,从而去提升模型的泛化能力。

第二是合作伙伴生态体系里面加强软硬筑基,去构建具身智能体在车端部署的环境。这里包括电子电气架构的引进、突破,部署过程中的操作系统、交互协议以及原子能力注册和服务的接口。

第三是倡导分工协同,培育健康汽车AI生态。为什么这么说?刚才给各位专家汇报时大家应该会意识到,刚才汇报这五方面没有涉及训练平台的算力、没有涉及基模的选择,因为我们认为这两个环节在行业有非常好的头部企业已经实现了,比如说几大运营商算力的构建、头部互联网公司对于基模能力的构建,所以刚才训练算力没有谈基模。对于整个行业来说,我们要充分做分工的协同,去培育好整个生态,加快技术转化,实现资源共享互用,凝聚生态合力,从而铸牢整个产业的核心竞争力。

以上是我们今天东风公司对于汽车具身智能体环节工程化方面的思考和实践,当中有内容不正确的地方请各位批评指正,谢谢!



Source link

赞(0)
未经允许不得转载:程序员中文网 » 李红林:智能汽车和人形机器人技术相关性很强
关于我们 免责申明 意见反馈 隐私政策
程序员中文网:公益在线网站,帮助学习者快速成长!
关注微信 技术交流
推荐文章
每天精选资源文章推送
推荐文章
随时随地碎片化学习
推荐文章
发现有趣的