具身智能元戎

DeepSeek阮翀加盟元戎首秀，详解基座VLA，研发提效10倍

前DeepSeek成员阮翀以元戎首席科学家身份介绍40B VLA自动驾驶基座模型及其研发提效案例

量子位2026年4月26日12 分钟阅读中文

为什么重要

2026年4月26日，量子位旗下“智能车参考”报道，前DeepSeek核心成员阮翀在加盟元戎后首次公开亮相北京车展，并以元戎首席科学家身份介绍元戎如何利用40B基座模型评估模型表现、用模型迭代模型。阮翀本硕毕业于北京大学，早年从事NLP研发，2023年加入DeepSeek，参与DeepSeek VL、V3、R1等工作，是VL2通讯作者，也是最新发布的DeepSeek V4作者之一。元戎此次介绍的核心技术是一个40B参数规模的VLA（Vision-Language-Action Model）基座模型。阮翀将其拆成三类角色：驾驶模型是“AI司机”，负责开车；分析模型是“AI分析员”，分析和解释AI司机为什么这么开；评估模型是“AI教练”，评估AI司机开车表现。文章称，过去自动驾驶研发常用很多小模型分别解决不同问题，带来开发和管理挑战，而行业正在向统一基座模型收敛，用一个大模型分化出多个版本来解决问题。在研发闭环方面，阮翀举了三个落地例子。第一是数据表征：过去通常要先训练出模型、发现模型问题后才知道哪些数据不够，存在滞后；现在可在训练前用基座模型对数据进行分析和归类，提前判断不同场景数据的多少与缺口，并调整训练数据配比。第二是数据质量评估：过去需要根据某批数据训练出的模型表现来反推数据质量，迭代周期较长；现在基于庞大的基座模型，只需简单微调就能评估数据质量。第三是模型评估：过去主要依赖路测，需要模型上车、人员跟车、实测后回传数据；现在可利用云端虚拟环境评估模型，判断AI司机开得好不好并进行修正。文章给出的关键结果是研发效率提升：阮翀估计，过去迭代一版模型可能需要100多个小时，现在加速了10倍，迭代时间缩短到十几个小时。报道还将元戎路线放入更大趋势中对比：小马智行最近发布的世界模型2.0具备自我诊断能力，可以实现自我强化；OpenAI在发布GPT-5.3 Codex时透露，该模型早期版本加速了自身开发。文章由此认为，在数字世界和物理世界，AI都初步呈现出自我进化趋势。圆桌讨论中，阮翀解释了他为何从LLM转向物理AI。他认为狭义物理AI需要现实载体，如机械手或车，并能获得现实世界反馈；但更重要的是闭环，广义上AI Coding这种“写代码—编译器反馈—调试”的过程也体现了闭环。他指出视觉模型当前较难的问题是空间方位感知，容易前后左右不分、车门左右混淆、车内外混淆。对于AI安全，他支持Harness，即通过系统工程约束AI边界，而不是期待AI“性本善”。对物流仓储机器人公司而言，文章虽聚焦自动驾驶，但其用基座模型提前做数据表征、数据质量评估和云端虚拟评估的思路，可作为机器人模型迭代闭环的参考。

新进展

元戎介绍40B参数VLA基座模型，并将其拆分为驾驶模型、分析模型和评估模型三类角色。
阮翀称基座模型让自动驾驶模型迭代从100多个小时缩短到十几个小时，研发效率约提升10倍。
元戎用基座模型做数据表征、数据质量评估和云端虚拟环境中的模型评估，以减少过去先训练、再发现问题、再补数据的滞后。
文章把小马智行世界模型2.0和OpenAI GPT-5.3 Codex作为对照，强调AI正在从训练结果变成训练系统的一部分。
阮翀认为物理AI的关键是闭环反馈，而不仅是是否有机械手或车这样的现实载体。

元戎deepseek阮翀vla自动驾驶物理ai北京车展小马智行openai codex