在自动驾驶领域,视觉-语言-动作(Vision-Language-Action, VLA)模型正逐渐成为端到端决策的新宠。然而,研究者们发现,这些模型在经过模仿学习(Imitation Learning, ...