职位&公司对比

招聘中

推理引擎工程师/Leader-创新引擎

-K·薪
某大型互联网地图服务上市公司
招聘中

资深后端开发工程师

-K
某大型互联网公司

职位详情

  • 北京
  • 3-5年
  • 本科

岗位职责 1、主导AI模型推理引擎的架构设计与核心模块开发,优化LLM、CV等模型的低延迟、高吞吐推理性能; 2、深入硬件层(GPU/TPU/端侧芯片)进行算子和计算图优化,实现模型编译、量化压缩、动态批处理等关键技术; 3、探索大模型推理前沿技术(如 speculative decoding、continuous batching、vLLM优化等); 4、建立推理服务的监控、诊断与调优体系,实现端到端性能瓶颈分析 任职要求 技术能力 1、3年以上推理引擎/高性能计算开发经验,熟悉主流推理框架(TensorRT、Triton、ONNX Runtime等); 2、精通C++/Python,具备CUDA/OpenCL等GPU编程能力,有算子优化实战案例; 3、深入理解计算机体系来自BOSS直聘结构,熟悉模型编译技术(BOSS直聘MLIR、TVM等),掌握性能分析工具(Nsight、perf); 4、熟悉模型量化(INT8/FP16)boss、剪枝、蒸馏等压缩技术,具备端-云协同推理经验者优先; 加分项:来自BOSS直聘参与过LLM推理优化(如KV Cache优化、PagedAttention)、熟悉MoE架构或AIGC场景。

职位详情

  • 北京
  • 5-10年
  • 本科
  • C/C++
  • Java
  • Python
  • Golang
  • 计算机相关专业
  • 后端开发经验

资深后端开发工程师 工作地:北京、杭州、珠海 职位描述 1、搭建电商包括商品,视频,直播切片等维度的复杂检索系统,包括索引构建框架,搜索框架,和稳定性保障框架等组件的设计,开发和维护工作; 2、负责搭建平台治理领域RAG框架,知识库中间架构的设计,开发和维护; 3、负责电商商品,视频,直播等多元消重系统的搭建,负责建设通用的海量数据聚类架构,持续提升系统吞吐量,性能和稳定性,保障电商核心特征的整体质量和效率。 职位要求 1、本科及以上学历,计算机相关专业,5年以上后端来自BOSS直聘开发经验,具有良好的计算机基础知识和架构设计能力; 2、熟悉Golang或至少一类后端编程语言(Python/Java/C++等); BOSS直聘3、沟通能力强,跨团队项目协作经验; 4、具备结构化思维,问题分析和持续学习的能力; 5、有RAG框架,LLM工程,聚类算法架构,审核平台,或者复杂业务系统架构经验优先。

技能解析

专有技能
  • CUDA
  • 性能分析
  • 模块开发
  • 分析工具
  • 关键技术
  • 编程能力
  • 性能分析工具
相同技能
  • 开发经验
  • 架构设计

数据来自CSL职业科学研究室

技能解析

专有技能
  • 设计能力
  • 海量数据
  • 编程语言
  • 系统架构
  • 维护工作
  • 沟通能力
  • 团队项目
  • 问题分析
  • 沟通能力强
  • 提升系统
  • 结构化思维
相同技能
  • 开发经验
  • 架构设计

数据来自CSL职业科学研究室

公司福利

  • 五险一金
  • 补充医疗保险
  • 定期体检
  • 年终奖
  • 股票期权
  • 带薪年假
  • 员工旅游
  • 免费班车
  • 餐补
  • 交通补助
  • 节日福利

公司福利

  • 就近租房补贴
  • 餐饮及下午茶
  • 年度体检
  • 节日礼品
  • 家庭关爱假
  • 弹性工作制
  • 交通补助
  • 节日福利
  • 住房补贴
  • 团建聚餐
  • 零食下午茶
  • 餐补
  • 带薪年假
  • 加班补助
  • 绩效奖金
  • 年终奖
  • 定期体检
  • 意外险
  • 补充医疗保险
  • 五险一金

备注

职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

备注

职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

首页 | 北京招聘 · 其他后端开发招聘 | 北京其他后端开发招聘 | 某大型互联网地图服务上市公司推理引擎工程师/Leader-创新引擎招聘 | 某大型互联网地图服务上市公司推理引擎工程师/Leader-创新引擎 怎么样
更新于 2025-05-12