一句话概括
负责3D/动画等美术资产生成大模型分布式训练和推理系统的性能优化;
优先画像
1-熟悉大模型强化学习工程技术和推理系统优化
2-Ai企业背景,熟悉3D/动画等美术资产生成大模型分布式训练和推理系统的性能优化
工作职责
1.负责3D/动画等美术资产生成大模型分布式训练和推理系统的性能优化;
2.通过数据并行、模型并行、流水线并行、专家并行等策略的工程实现和性能优化;
3.解决大模型训练中的显存瓶颈、通信延迟和负载均衡等核心计算资源问题;
4.负责多模态RLHF训练与推理平台的实现。
任职要求
1.熟悉 GPU 架构 & CUDA 编程、算子融合优化等;
2.熟悉 PyTorch FSDP、DeepSpeed、Megatron-LM 等分布式训练框架,具备大模型多种并行训练策略实战经验;
3.熟悉 vLLM、SGLang 等大模型推理框架,有实际性能调优经验(如 KV Cache 优化、动态批处理、Attention 算子定制等);
4.熟悉大模型强化学习的工程技术,比如 OpenRLHF 框架。
工作地点
广东省 深圳市 总部
薪资福利