工作职责
1.负责基于业内先进的大模型进行针对特定业务场景的训练,并推动其在实际应用中的落地;
2.负责文本、图像、视频等内容的消费信息理解,以及知识图谱领域的算法和技术研究,构建行业领域知识库;
3.负责多模态数字内容生成的算法研发,包括但不限于图像、视频和3D生成,旨在提升生成质量的稳定性、可控性等;
4.负责AIGC+图像的算法研究,文生图AIGC算法研究和广告业务落地,建设&优化文生图算法Pipeline;
5.通过Prompt强化、前后置插件优化、fine-tune等方式解决文生图模型在广告场景的生成质量、可控性问题;
工作要求
1.本科及以上学历,硕士学历者优先,计算机、人工智能、数学、电子信息与工程等相关专业;
2.熟悉多模态生成领域的最新技术,如ChatGPT、DALLE、StableDiffusion等前沿技术;
3.掌握计算机视觉和图像处理的基本算法,熟悉常用的深度学习算法,如LSTM、CNN、RNN、Transformer等,并有相关框架(如TensorFlow、PyTorch)的使用经验;
4.具有多模态大模型的研究和开发经验,熟悉常见ΑI生成模型框架,包括 GAN、 VAE、VQGAN、Diffusion等,熟悉ControlNet, LoRA,Text Inversion等生成模型插件模型;
5.有多模态图像/3D/视频生成实践经验者优先,具有AIGC相关产品落地经验者优先;
6.具备强的学习能力和自驱力、清晰的逻辑思维能力和出色的沟通能力。