物理AI基础大模型算法工程师(VLA方向)
收藏职位
1年以上
硕士
25 - 35岁
上海市、广州市
行业领先
集团化企业
大单
最新需求开放
招聘企业
职位描述

岗位职责:



1、在物理AI基础大模型的统一架构(unified model)下,负责 VLA / Policy 模块的架构设计、训练与部署,覆盖视觉编码、语言条件、动作生成的完整链路



2、设计能跨任务、跨 embodiment 泛化的 VLA 模型,参考业界主流路线(PI0、RDT、OpenVLA、GROOT、Qwen-VLA 等),在视觉编码、动作头、语言条件等关键设计点上做工程选型与改进



3、负责大规模分布式训练(多机多卡),设计 SFT + RL 的完整 post-training pipeline,研究并实现具身 RL 算法(GRPO、DAPO、Flow Matching RL 等),处理 reward sparsity、长 horizon 训练稳定性等核心问题



4、设计跨 embodiment 的统一动作表征与适配方案,支持机械臂、人形、灵巧手、移动底盘等不同形态的快速接入,覆盖动作空间异构、控制频率差异、少样本适配等问题



5、推动推理加速与真机部署:将 VLA 模型压缩到边缘硬件可跑、端到端延迟 <200ms,涉及量化、KV cache 优化、action chunking、推理引擎对接等工作6、建立\"训练→真机部署→收集 badcase→重训\"的闭环迭代机制,解决真机部署中的泛化与稳定性问题



任职要求



1、计算机、人工智能、机器人或相关专业,硕士及以上学历



2、精通 Python 和 PyTorch,有大规模分布式训练经验(DeepSpeed / Megatron / FSDP 等至少一种)



3、对 VLA / VLM 架构(PI0、OpenVLA、RDT、GROOT、Qwen-VLA 等)有深入理解,能讲清楚视觉编码、动作头设计、语言条件注入等关键选型的 trade-off有 RL(PPO / GRPO / DAPO)或 IL(BC / Diffusion Policy)在仿真或真机环境中的完整训练经验



4、熟悉模型推理优化(量化、剪枝、TensorRT / vLLM)或 CUDA 算子开发5、能独立阅读并复现 VLA / RL 领域的顶会论文

热招职位/高薪职位
相关企业
热门招聘区域
热招行业
联系我们
联系我们