职位详情
AI推理服务架构工程师-创作发布
500-1000K
上海-上海
硕士
3年以上
更新 2025-09-25 浏览 3841
职位福利
  • 五险一金
  • 休假制度
  • 奖励计划
  • 年终奖金
职位详情
  • 招 1 人
  • 35周岁以下

工作职责

小红书智创技术团队负责用户发布工具、增长&商业化业务等多个公司重要业务场景里的创作能力的支持,技术范围广,技术栈深,对技术有着极高的追求。

工作职责:

1. 负责端侧的AI算法的部署和工程化落地,提升端侧的智能化水平,并通过端侧推理架构的优化,提升用户的使用体验;

2. 负责服务端的Diffusion、LLM、VLLM等先进算法的部署和性能优化,提升推理效率,降低成本;

3. 打造具有业界一流水平的大模型推理技术能力,并通过开源共建等各类形式,形成在业界的广泛技术影响力。


任职要求

1. 对各种AI算法有一定的了解,有丰富的算法工程集成,性能优化和落地经验;

2. 熟悉CUDA编程、CUDNN,TensorRT等工具,有丰富的服务端性能优化经验者优先;

3. 深入了解NCNN、MNN、TNN、TVM、VLLM框架中的一种或多种,熟悉汇编优化和移动端GPU优化,有多类模型的优化经验者优先;

4. 有扎实的编程基础、良好的编程风格和工作习惯,实际动手能力强,具有ACMICPC, NOI/IOI比赛获奖者优先 ;

5. 有良好的沟通表达能力和团队精神,有很好的通过技术解决真实问题创造业务价值的意愿。

薪资福利

税前年薪:50-100w

薪资构成:基本薪资(16薪),现金+期权

工作地点

上海 上海市黄浦区马当路388号SOHO复兴广场 企业总部

北京 北京朝阳区 安定路 中海国际B座18楼 企业总部

公司信息
行吟信息科技(上海)有限公司
1000人以上 · 上市公司 ·
上海市黄浦区马当路388号SOHO复兴广场
职介网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。 立即举报
公司问答
我要提问
对此职位有疑问?快来问问吧 !
相似职位
前端开发工程师
190-200K
四川-成都 本科学历 5年以上经验
法定节假日 五险一金 年终奖金
华西集采
2025-11-28
产品运营(体验评测)
110-130K
湖北-武汉 本科学历 1年以上经验
休假制度 销售奖金 综合补贴 奖励计划
腾讯云雀
2025-11-21
AI搜索数据产品运营
110-130K
湖北-武汉 本科学历 1年以上经验
休假制度 奖励计划 年终奖金 五险一金 法定节假日
腾讯云雀
2025-11-21
商务策略运营 北京/天津
180-300K
天津-天津 本科学历 3年以上经验
腾讯云雀
2025-11-21