工作职责
小红书智创技术团队负责用户发布工具、增长&商业化业务等多个公司重要业务场景里的创作能力的支持,技术范围广,技术栈深,对技术有着极高的追求。
工作职责:
1. 负责端侧的AI算法的部署和工程化落地,提升端侧的智能化水平,并通过端侧推理架构的优化,提升用户的使用体验;
2. 负责服务端的Diffusion、LLM、VLLM等先进算法的部署和性能优化,提升推理效率,降低成本;
3. 打造具有业界一流水平的大模型推理技术能力,并通过开源共建等各类形式,形成在业界的广泛技术影响力。
任职要求
1. 对各种AI算法有一定的了解,有丰富的算法工程集成,性能优化和落地经验;
2. 熟悉CUDA编程、CUDNN,TensorRT等工具,有丰富的服务端性能优化经验者优先;
3. 深入了解NCNN、MNN、TNN、TVM、VLLM框架中的一种或多种,熟悉汇编优化和移动端GPU优化,有多类模型的优化经验者优先;
4. 有扎实的编程基础、良好的编程风格和工作习惯,实际动手能力强,具有ACMICPC, NOI/IOI比赛获奖者优先 ;
5. 有良好的沟通表达能力和团队精神,有很好的通过技术解决真实问题创造业务价值的意愿。
薪资福利
税前年薪:50-100w
薪资构成:基本薪资(16薪),现金+期权
工作地点
上海 上海市黄浦区马当路388号SOHO复兴广场 企业总部
北京 北京朝阳区 安定路 中海国际B座18楼 企业总部