职位详情
大模型推理服务(MaaS)研发工程师
40-65K
上海-上海
本科
3年以上
更新 2025-09-24 浏览 719
职位福利
  • 休假制度
  • 五险一金
  • 包吃住
  • 综合补贴
  • 年终奖金
  • 奖励计划
  • 法定节假日
职位详情
  • 招 1 人
  • 3周以内到岗
  • 35周岁以下
  • 不限性别
  • 不限婚况

优先画像:有LLM或AI模型服务平台开发经验者优先熟悉大模型推理框架(VLLM、TenSorRT-LLM),有模型推理优化经验者优先

工作职责

1、参与/负责大模型推理服务平台(MaaS)的架构设计、系统研发、产品研发等工作;

2、深入参与面向大模型场景的请求调度、异构资源调度、引擎优化等核心工作,实现千亿级Token并行推理平台;

3、为内部产品线提供解决方案,协助公司内用户解决大模型应用过程中业务在平台上的使用问题。


任职要求

1、优秀的代码能力、数据结构和基础算法功底,熟悉

C++/Golang/Python开发;

2、有大规模分布式系统实践经验,擅长对现实问题进行建模并运

用解决

3、熟悉大模型的基本原理和常见应用场景,例如Transformer、StableDiffusion、ViT等,并熟悉其优缺点和适用范围:

4、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力;

5、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步

【加分项】有LLM或AI模型服务平台开发经验者优先熟悉大模型推理框架(VLLM、TenSorRT-LLM),有模型推理优化经验者优先

薪资福利:

  • 税前年薪50-80w
  • 薪资构成基本薪资(12薪),奖金/提成

工作地点

上海 上海市黄浦区马当路388号SOHO复兴广场 企业总部

北京 北京朝阳区 安定路 中海国际B座18楼 企业总部

公司信息
行吟信息科技(上海)有限公司
1000人以上 · 上市公司 · 计算机/互联网
上海市黄浦区马当路388号SOHO复兴广场
职介网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。 立即举报
公司问答
我要提问
对此职位有疑问?快来问问吧 !
相似职位
前端开发工程师
190-200K
四川-成都 本科学历 5年以上经验
法定节假日 五险一金 年终奖金
华西集采
2025-11-28
产品运营(体验评测)
110-130K
湖北-武汉 本科学历 1年以上经验
休假制度 销售奖金 综合补贴 奖励计划
腾讯云雀
2025-11-21
AI搜索数据产品运营
110-130K
湖北-武汉 本科学历 1年以上经验
休假制度 奖励计划 年终奖金 五险一金 法定节假日
腾讯云雀
2025-11-21
商务策略运营 北京/天津
180-300K
天津-天津 本科学历 3年以上经验
腾讯云雀
2025-11-21