职位&公司对比

招聘中
某大型智能驾驶技术公司

职位详情

  • 北京
  • 不限
  • 本科
  • pd分离
  • vLLM/sglang

职位描述: 优化大模型来自BOSS直聘推理性能,降低推理时延,提升吞吐,降低LLM模型推理成本。 职位要求: 1. 熟悉transformer,llama,deepseek等主模型结构。 2. 熟悉LLM主流推理引擎(如vLLM/sglang),熟悉常见推理优化技术,如MLA、FlashAtention、P来自BOSS直聘ageAttention、Continuous Batching、Speculative Decoding等。 3.具有AI模型推理优化经验,熟悉常见加速技术,如剪枝、量化、分布式推理等,能够根据不同场景和硬件平台进行针对性的优化。 4.熟悉GPU硬件结构,有CUDAkanzhun/Cutlass开发优化经验者优先。

职位详情

  • 北京
  • 3-5年
  • 本科
  • 大模型部署
  • 模型量化优化
  • 模型推理加速
  • 投机采样
  • vllm
  • ai编译器开发
  • 云端模型
  • 算子开发

岗位描述: 1. 参与大模型端侧部署工作 2. 参与大模型的量化优化、推理加速等性能优化工作 工作要求 岗位要求: 1. 熟练使用c++、python 2. 有大模型的开发经验,熟悉大模型的相关基础 3. 熟悉大模型加速技术,如kv cache、模型量化、flash-attention、推理并行、投机采样等 加分项: 1. 熟悉常见直聘一种开源社区的大模型推理框架,如vllm、tensorrt-kanzhunllm、lmdeplokanzhuny等 2. 有ai编译器开发、算子开发经验boss 3. 有大模型多卡并行推来自BOSS直聘理经验 4. 有vlm云端或端侧部署经验者优先

技能解析

专有技能
  • CUDA
  • 优化技术

    数据来自CSL职业科学研究室

    技能解析

    专有技能
    • 性能优化
    • 开发经验

      数据来自CSL职业科学研究室

      工作时间

      上午10:00   -   下午07:00
      双休弹性工作

      公司福利

      • 交通补助
      • 节日福利
      • 有无线网
      • 团建聚餐
      • 零食下午茶
      • 餐补
      • 员工旅游
      • 带薪年假
      • 工龄奖
      • 法定节假日三薪
      • 节假日加班费
      • 夜班补助
      • 股票期权
      • 保底工资
      • 绩效奖金
      • 年终奖
      • 定期体检
      • 意外险
      • 补充医疗保险
      • 五险一金

      公司福利

      • 五险一金
      • 补充医疗保险
      • 定期体检
      • 年终奖
      • 股票期权
      • 带薪年假
      • 员工旅游
      • 通讯补贴
      • 交通补助
      • 节日福利
      • 住房补贴
      • 零食下午茶

      备注

      职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

      更新于 2025-05-14