「职位对比」PPIO 推理引擎资深工程师/专家（北京/上海）怎么样

推理引擎资深工程师/专家（北京/上海）

立即沟通

PPIO

更换职位

大模型强化学习_P6-7

立即沟通

某大型互联网OTO平台上市公司

更换职位

招聘中

职位详情

北京
不限
本科

pd分离
vLLM/sglang

职位描述：优化大模型推理性能，降低推理时延，提升吞吐，降低LLM模型推理成本。职位要求： 1. 熟悉transformer，ll来自BOSS直聘ama，deepseek等主流模型结构。 2. 熟悉LLM主流推理引擎（如vLLM/sglang），熟悉常见推理优化技术，如MLA、FlashAtention、PageAttention、Continuous Batching、Speculative Decoding等。 3.具有AI模型推理优化经验，熟悉常见加速技术，如剪枝、boss量化、分布式推理等，能够根据kanzhun不同场景和硬件平台进行针来自BOSS直聘对性的优化。 4.熟悉GPU硬件结构，有CUDA/Cutlass开发优化经验者优先。

职位详情

北京
1-3年
本科

熟悉PPO/DPO/GRPO
RLHF实战
精通Transformerx
精通BERT/GPT

岗位职责： 1、负责强化学习算法的工程化实现boss与性能优化; 2、构建可扩展的分布式训练系统，支持大规模并行训练和实验; 3、优化策略网络的训练流程，提升训练效率和模型性能; 4、实现前沿强化学习算法的落地应用. 任职要求： 1、1-2年深度学习或强化学习方向优秀博士/硕士; 2、精通PyTorch/Tensor直聘Flow框架; 3、具备RLHF实战经验; 4、熟悉主流强化学习算法(DPO/PPO/GPRO等); 5、熟悉并直聘行计算和分布式系kanzhun统设计.

技能解析

专有技能

CUDA
优化技术

数据来自CSL职业科学研究室

技能解析

专有技能

优化策略
性能优化
深度学习
学习算法
分布式系统
系统设计

数据来自CSL职业科学研究室

工作时间

上午10:00 - 下午07:00

双休、弹性工作

公司福利

交通补助
节日福利
有无线网
团建聚餐
零食下午茶
餐补
员工旅游
带薪年假
工龄奖
法定节假日三薪
节假日加班费
夜班补助
股票期权
保底工资
绩效奖金
年终奖
定期体检
意外险
补充医疗保险
五险一金

公司福利

五险一金
补充医疗保险
定期体检
年终奖
股票期权
带薪年假
员工旅游
免费班车
餐补
交通补助
节日福利

备注

职位发布者未明确表明公司信息，具体可咨询职位发布人进行确认。

职位&公司对比

推理引擎资深工程师/专家 （北京/上海）

大模型强化学习_P6-7

推理引擎资深工程师/专家 （北京/上海）

大模型强化学习_P6-7

职位详情

职位详情

技能解析

技能解析

工作时间

公司福利

公司福利

推理引擎资深工程师/专家（北京/上海）

推理引擎资深工程师/专家（北京/上海）