优先画像:有LLM或AI模型服务平台开发经验者优先熟悉大模型推理框架(VLLM、TenSorRT-LLM),有模型推理优化经验者优先
工作职责
1、参与/负责大模型推理服务平台(MaaS)的架构设计、系统研发、产品研发等工作;
2、深入参与面向大模型场景的请求调度、异构资源调度、引擎优化等核心工作,实现千亿级Token并行推理平台;
3、为内部产品线提供解决方案,协助公司内用户解决大模型应用过程中业务在平台上的使用问题。
任职要求
1、优秀的代码能力、数据结构和基础算法功底,熟悉
C++/Golang/Python开发;
2、有大规模分布式系统实践经验,擅长对现实问题进行建模并运
用解决
3、熟悉大模型的基本原理和常见应用场景,例如Transformer、StableDiffusion、ViT等,并熟悉其优缺点和适用范围:
4、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力;
5、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步
【加分项】有LLM或AI模型服务平台开发经验者优先熟悉大模型推理框架(VLLM、TenSorRT-LLM),有模型推理优化经验者优先
薪资福利:
工作地点
上海 上海市黄浦区马当路388号SOHO复兴广场 企业总部
北京 北京朝阳区 安定路 中海国际B座18楼 企业总部