职位&公司对比

招聘中
  • 互联网
  • 已上市
招聘中

推理引擎leader

-K·薪
某大型人力资源服务公司

职位详情

  • 北京
  • 1-3年
  • 本科
  • C/C++

工作职责: 负责高精地图生产过程中,GPS、IMU、Camera、Radar、LIDAR等多种传感器的标定配准与数据融合,地图元素自动化识别等技术研发 职位要求: -熟悉多传直聘感器标定、差分定位及精度评估以及IE/gabossmit等解算软件 -掌握深度学习技术,能够灵活运用caffe、TensorFlow等通用深度学习框架,有高水平论文和大型项目应用经验优先 -熟悉和掌握C/C++和脚本语言编程BOSS直聘 -熟悉大规模并行计算的基本原理并boss具有实现并行计算算法的基本能力 -拥有boss较强的自我驱动力和学习能力,逻辑思维能力优秀 -具有良好的沟通能力,和良好的团队合作精神

职位详情

  • 北京
  • 5-10年
  • 本科
  • 推理引擎

岗位职责 1、主导AI模型推理引擎的架构设计与核心模块开发,优化LLM、CV等模型的低延迟、高吞吐推理性能; 2、深入硬件层(GPU/TPU/端侧芯片)进行算子和计算图优化,实现模型编译、量化压缩、动态批处理等关键技术; 3、探索大模型BOSS直聘推理前沿技术(如 speculative decoding、continuous batching、vLLM优化等); 4、建立推理服务的监控、诊断与调优体系,实现端到端性能瓶颈分析。 任职要求 技术能力 1、5年以上推理引擎/高性能BOSS直聘计算开发经验,熟悉主流推理框架(TensorRT、Triton、ONNX Runtime等); 2、精通C++/Python,具备CUDA/OpenCL等GPU编程能力,有算子优化实战案例; 3、深入理解计算机体系构,熟悉模型编译技术(MLIR、TVM等),掌握性能分析工具(Nsight、perf); 4、熟悉模型量化(INT8/FP16)、剪枝、蒸馏等压缩技术,具备端-云协同推理经验者优先; 加分项:参与过LLM推理优化(如KV Cache优化、PagekanzhundAttention)、熟悉MoE架构或AIGC场景。

技能解析

专有技能
  • 深度学习框架
  • 脚本语言
  • 团队合作精神
  • 具有良好的沟
  • 深度学习
  • 逻辑思维能力
  • 团队合作
  • C/C++
  • 基本原理
  • 沟通能力
  • 合作精神
  • 语言编程
  • 生产过程
  • 学习能力
  • 逻辑思维
  • 好的沟通

    数据来自CSL职业科学研究室

    技能解析

    专有技能
    • CUDA
    • 性能分析
    • 模块开发
    • 分析工具
    • 开发经验
    • 关键技术
    • 架构设计
    • 编程能力
    • 性能分析工具

      数据来自CSL职业科学研究室

      工作时间

      上午09:30   -   下午06:30
      双休弹性工作

      公司福利

      • 五险一金
      • 补充医疗保险
      • 定期体检
      • 加班补助
      • 年终奖
      • 带薪年假
      • 员工旅游
      • 免费班车
      • 餐补
      • 通讯补贴
      • 交通补助
      • 节日福利
      • 住房补贴
      • 零食下午茶
      • 娱乐健身

      备注

      职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

      更新于 2025-05-16