【国内/海外职位招聘物理AI基础大模型算法工程师(VLA方向)】

物理AI基础大模型算法工程师(VLA方向)

收藏职位

1年以上

硕士

25 - 35岁

上海市、广州市

招聘企业

职位描述

岗位职责：

1、在物理AI基础大模型的统一架构（unified model）下，负责 VLA / Policy 模块的架构设计、训练与部署，覆盖视觉编码、语言条件、动作生成的完整链路

2、设计能跨任务、跨 embodiment 泛化的 VLA 模型，参考业界主流路线（PI0、RDT、OpenVLA、GROOT、Qwen-VLA 等），在视觉编码、动作头、语言条件等关键设计点上做工程选型与改进

3、负责大规模分布式训练（多机多卡），设计 SFT + RL 的完整 post-training pipeline，研究并实现具身 RL 算法（GRPO、DAPO、Flow Matching RL 等），处理 reward sparsity、长 horizon 训练稳定性等核心问题

4、设计跨 embodiment 的统一动作表征与适配方案，支持机械臂、人形、灵巧手、移动底盘等不同形态的快速接入，覆盖动作空间异构、控制频率差异、少样本适配等问题

5、推动推理加速与真机部署：将 VLA 模型压缩到边缘硬件可跑、端到端延迟 <200ms，涉及量化、KV cache 优化、action chunking、推理引擎对接等工作6、建立\"训练→真机部署→收集 badcase→重训\"的闭环迭代机制，解决真机部署中的泛化与稳定性问题

任职要求

1、计算机、人工智能、机器人或相关专业，硕士及以上学历

2、精通 Python 和 PyTorch，有大规模分布式训练经验（DeepSpeed / Megatron / FSDP 等至少一种）

3、对 VLA / VLM 架构（PI0、OpenVLA、RDT、GROOT、Qwen-VLA 等）有深入理解，能讲清楚视觉编码、动作头设计、语言条件注入等关键选型的 trade-off有 RL（PPO / GRPO / DAPO）或 IL（BC / Diffusion Policy）在仿真或真机环境中的完整训练经验

4、熟悉模型推理优化（量化、剪枝、TensorRT / vLLM）或 CUDA 算子开发5、能独立阅读并复现 VLA / RL 领域的顶会论文

热招职位/高薪职位