职位&公司对比
职位详情
- 北京
- 不限
- 本科
- pd分离
- vLLM/sglang
职位描述: 优化大模型来自BOSS直聘推理性能,降低推理时延,提升吞吐,降低LLM模型推理成本。 职位要求: 1. 熟悉transformer,llama,deepseek等主流模型结构。 2. 熟悉LLM主流推理引擎(如vLLM/sglang),熟悉常见推理优化技术,如MLA、FlashAtention、P来自BOSS直聘ageAttention、Continuous Batching、Speculative Decoding等。 3.具有AI模型推理优化经验,熟悉常见加速技术,如剪枝、量化、分布式推理等,能够根据不同场景和硬件平台进行针对性的优化。 4.熟悉GPU硬件结构,有CUDAkanzhun/Cutlass开发优化经验者优先。
职位详情
- 北京
- 3-5年
- 本科
- 大模型部署
- 模型量化优化
- 模型推理加速
- 投机采样
- vllm
- ai编译器开发
- 云端模型
- 算子开发
岗位描述: 1. 参与大模型端侧部署工作 2. 参与大模型的量化优化、推理加速等性能优化工作 工作要求 岗位要求: 1. 熟练使用c++、python 2. 有大模型的开发经验,熟悉大模型的相关基础 3. 熟悉大模型加速技术,如kv cache、模型量化、flash-attention、推理并行、投机采样等 加分项: 1. 熟悉常见直聘一种开源社区的大模型推理框架,如vllm、tensorrt-kanzhunllm、lmdeplokanzhuny等 2. 有ai编译器开发、算子开发经验boss 3. 有大模型多卡并行推来自BOSS直聘理经验 4. 有vlm云端或端侧部署经验者优先
技能解析
- CUDA
- 优化技术
数据来自CSL职业科学研究室
技能解析
- 性能优化
- 开发经验
数据来自CSL职业科学研究室
工作时间
公司福利
- 交通补助
- 节日福利
- 有无线网
- 团建聚餐
- 零食下午茶
- 餐补
- 员工旅游
- 带薪年假
- 工龄奖
- 法定节假日三薪
- 节假日加班费
- 夜班补助
- 股票期权
- 保底工资
- 绩效奖金
- 年终奖
- 定期体检
- 意外险
- 补充医疗保险
- 五险一金
公司福利
- 五险一金
- 补充医疗保险
- 定期体检
- 年终奖
- 股票期权
- 带薪年假
- 员工旅游
- 通讯补贴
- 交通补助
- 节日福利
- 住房补贴
- 零食下午茶
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。