招聘中 猎头职位

推理引擎工程师/Leader-创新引擎

70-100K·16薪

代招公司:某大型互联网地图服务上市公司北京 3-5年 本科

...
五险一金补充医疗保险定期体检年终奖股票期权带薪年假员工旅游免费班车餐补交通补助节日福利
五险一金补充医疗保险定期体检年终奖股票期权带薪年假员工旅游免费班车餐补交通补助节日福利
推理引擎工程师/Leader-创新引擎 70-100K·16薪
...
五险一金补充医疗保险定期体检年终奖股票期权带薪年假员工旅游免费班车餐补交通补助节日福利
五险一金补充医疗保险定期体检年终奖股票期权带薪年假员工旅游免费班车餐补交通补助节日福利

各大行业职位任你选

首次验证通过即注册BOSS直聘账号
+86
已阅读并同意BOSS直聘《用户协议》 《隐私政策》,允许BOSS直聘统一管理本人账号信息
计算

职位描述

岗位职责
1、主导AI模型推理引擎的架构设计与核心模块开发,优化LLM、CV等模型的低延迟、高吞吐推理性能;
2、深入硬件层(GPU/TPU/端侧芯片)进行算子和计算图优化,实现模型编译、量化压缩、动态批处理等关键技术;
3、探索大模型推理前沿技术(如 speculative decoding、continuous batching、vLLM优化等);
4、建立推理服务的监控、诊断与调优体系,实现端到端性能瓶颈分析。
任职要求
技术能力
1、3年以上推理引擎/高性能计算开发经验,熟悉主流推理框架(TensorRT、Triton、ONNX Runtime等);
2、精通C++/Python,具备CUDA/OpenCL等GPU编程能力,有算子优化实战案例;
3、深入理解计算机体系结构,熟悉模型编译技术(MLIR、TVM等),掌握性能分析工具(Nsight、perf);
4、熟悉模型量化(INT8/FP16)、剪枝、蒸馏等压缩技术,具备端-云协同推理经验者优先;
加分项:参与过LLM推理优化(如KV Cache优化、PagedAttention)、熟悉MoE架构或AIGC场景。

认证资质

  • 人力资源服务许可证

白先生

上海丰才·猎头顾问

竞争力分析

加载中...
个人综合排名:人中排名第
一般 良好 优秀 极好

BOSS 安全提示

BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报

了解更多职场安全防范知识

精选职位

页面更新时间:2025-05-08

快速完善简历,与Boss开聊

与在线Boss直接聊,最快当天拿offer

快速完善信息