DeepSeek阮翀加盟元戎首秀,详解基座VLA,研发提效10倍
前DeepSeek成员阮翀以元戎首席科学家身份介绍40B VLA自动驾驶基座模型及其研发提效案例

为什么重要
2026年4月26日,量子位旗下“智能车参考”报道,前DeepSeek核心成员阮翀在加盟元戎后首次公开亮相北京车展,并以元戎首席科学家身份介绍元戎如何利用40B基座模型评估模型表现、用模型迭代模型。阮翀本硕毕业于北京大学,早年从事NLP研发,2023年加入DeepSeek,参与DeepSeek VL、V3、R1等工作,是VL2通讯作者,也是最新发布的DeepSeek V4作者之一。 元戎此次介绍的核心技术是一个40B参数规模的VLA(Vision-Language-Action Model)基座模型。阮翀将其拆成三类角色:驾驶模型是“AI司机”,负责开车;分析模型是“AI分析员”,分析和解释AI司机为什么这么开;评估模型是“AI教练”,评估AI司机开车表现。文章称,过去自动驾驶研发常用很多小模型分别解决不同问题,带来开发和管理挑战,而行业正在向统一基座模型收敛,用一个大模型分化出多个版本来解决问题。 在研发闭环方面,阮翀举了三个落地例子。第一是数据表征:过去通常要先训练出模型、发现模型问题后才知道哪些数据不够,存在滞后;现在可在训练前用基座模型对数据进行分析和归类,提前判断不同场景数据的多少与缺口,并调整训练数据配比。第二是数据质量评估:过去需要根据某批数据训练出的模型表现来反推数据质量,迭代周期较长;现在基于庞大的基座模型,只需简单微调就能评估数据质量。第三是模型评估:过去主要依赖路测,需要模型上车、人员跟车、实测后回传数据;现在可利用云端虚拟环境评估模型,判断AI司机开得好不好并进行修正。 文章给出的关键结果是研发效率提升:阮翀估计,过去迭代一版模型可能需要100多个小时,现在加速了10倍,迭代时间缩短到十几个小时。报道还将元戎路线放入更大趋势中对比:小马智行最近发布的世界模型2.0具备自我诊断能力,可以实现自我强化;OpenAI在发布GPT-5.3 Codex时透露,该模型早期版本加速了自身开发。文章由此认为,在数字世界和物理世界,AI都初步呈现出自我进化趋势。 圆桌讨论中,阮翀解释了他为何从LLM转向物理AI。他认为狭义物理AI需要现实载体,如机械手或车,并能获得现实世界反馈;但更重要的是闭环,广义上AI Coding这种“写代码—编译器反馈—调试”的过程也体现了闭环。他指出视觉模型当前较难的问题是空间方位感知,容易前后左右不分、车门左右混淆、车内外混淆。对于AI安全,他支持Harness,即通过系统工程约束AI边界,而不是期待AI“性本善”。对物流仓储机器人公司而言,文章虽聚焦自动驾驶,但其用基座模型提前做数据表征、数据质量评估和云端虚拟评估的思路,可作为机器人模型迭代闭环的参考。
新进展
- 元戎介绍40B参数VLA基座模型,并将其拆分为驾驶模型、分析模型和评估模型三类角色。
- 阮翀称基座模型让自动驾驶模型迭代从100多个小时缩短到十几个小时,研发效率约提升10倍。
- 元戎用基座模型做数据表征、数据质量评估和云端虚拟环境中的模型评估,以减少过去先训练、再发现问题、再补数据的滞后。
- 文章把小马智行世界模型2.0和OpenAI GPT-5.3 Codex作为对照,强调AI正在从训练结果变成训练系统的一部分。
- 阮翀认为物理AI的关键是闭环反馈,而不仅是是否有机械手或车这样的现实载体。