岗位职责
1、在物理AI基础大模型的统一架构(unified model)下,负责世界模型模块的架构设计、训练与评测,覆盖视觉编码、latent dynamics 建模、生成式仿真的完整链路推动多视角、多模态数据的统一利用,研究 latent 表征学习方法,使模型从单/多视角输入中提取真正的 3D 世界结构
2、设计并训练 action-conditioned 的 latent dynamics 模型,建模物理因果关系,处理接触、碰撞、形变等多峰场景下的预测稳定性
3、利用景烁跨域数据资产(自动驾驶、Egocentric、互联网视频、机器人轨迹)做大规模 self-supervised 预训练,最大化无标注数据对 dynamics 学习的贡献
4、与数据团队协作建立\\\\"模型表现差 → 自动挖掘失败模式 → 数据补充 → 重训\\\\"的完整闭环,并设计 sim-to-real 评测与归因体系,量化每次模型/数据迭代对下游策略的实际贡献
5、跟进世界模型领域前沿(V-JEPA、Cosmos、GAIA、UWM 等),具备快速复现、改进并融入自研体系的能力
任职要求、
1、计算机、人工智能、机器人或相关专业,硕士及以上学历
2、精通 Python 和 PyTorch,有大规模分布式训练经验在生成式建模(Diffusion / Flow Matching / NeRF / 3D Gaussian Splatting)和 self-supervised 表征学习上有扎实理解,能讲清楚不同方法在物理一致性、多峰建模、训练效率上的 trade-off
3、至少熟悉一种物理仿真平台(Isaac Sim / MuJoCo / Genesis),理解刚体动力学、接触/碰撞建模的基本原理有视频生成、3D 场景重建、动态预测、或物理仿真的完整项目经验(从数据到模型上线,非 Notebook 级别)能独立阅读并复现世界模型/视频生成领域的顶会论文

