「职位对比」PPIO 推理引擎资深工程师/专家（北京/上海）怎么样

推理引擎资深工程师/专家（北京/上海）

立即沟通

PPIO

更换职位

端到端算法工程师

立即沟通

某大型汽车研发制造公司

更换职位

招聘中

职位详情

北京
不限
本科

pd分离
vLLM/sglang

职位描述：优化大模型推理性能，降低推理时延，提升吞吐，降低LLM模型推理成本。职位要求：boss 1. 熟悉transformer，llama，deepseek等主流模型结构。 2. 熟悉LLM主流推理引擎BOSS直聘（如vLLM/sglang），熟悉常见推理优化技术，如ML直聘A、FlashAtention、PageAttention、Continuous Batching、Speculative Dekanzhuncodikanzhunng等。 3.具有AI模型推理优化经验，熟悉常见加速技术，如剪枝、量化、分布式推理等，能够根据不同场景和硬件平台进行针对性的优化。 4.熟悉GPU硬件结构，有CUDA/Cutlass开发优化经验者优先。

职位详情

北京
5-10年
硕士

端到端算法
感知OneModel
planning

职位描述 1.负责端到端算法的预研，探索e2e自动驾驶的上限; 2.科研岗需要发表有行业影响力的发表物; 3.量产岗需要支持端到端量产直聘团队做好技术落地; 4.包括但不限于以下方向来自BOSS直聘: a.基础模型方向: -熟悉或了解 MAE/JEPA/MAGE/VAR/MkanzhunAR等基于表示学习的基础模型/世界模型， -熟悉或了解主流VLM的基座模型，Prompt与SFT的原理和应用:b.自动驾驶方向:e2e自动驾驶/感知OneModel/预决策一体模型;c.神经网络理论方向:可解释神经网络/因果推断/神经网络优化理论。职位要求 1.硕士/BOSS直聘博士毕业1-3年; 2.对科研有热情，愿意做难而正确的事情，乐于面对挑战解决困难; 3.有团队意识和合作精神; 4.以下条件满足两项即可: a.顶刊/顶会有发表过相关领域高质量的论文; b.代码能力出色，具有熟练的模型开发，调试，部署的能力; c.数学竞赛，物理竞赛等有获奖经历;

技能解析

专有技能

CUDA
优化技术

数据来自CSL职业科学研究室

技能解析

专有技能

自动驾驶
代码能力
解决困难
合作精神
团队意识
神经网络

数据来自CSL职业科学研究室

工作时间

上午10:00 - 下午07:00

双休、弹性工作

公司福利

交通补助
节日福利
有无线网
团建聚餐
零食下午茶
餐补
员工旅游
带薪年假
工龄奖
法定节假日三薪
节假日加班费
夜班补助
股票期权
保底工资
绩效奖金
年终奖
定期体检
意外险
补充医疗保险
五险一金

备注

职位发布者未明确表明公司信息，具体可咨询职位发布人进行确认。

职位&公司对比

推理引擎资深工程师/专家 （北京/上海）

端到端算法工程师

推理引擎资深工程师/专家 （北京/上海）

端到端算法工程师

职位详情

职位详情

技能解析

技能解析

工作时间

公司福利

推理引擎资深工程师/专家（北京/上海）

推理引擎资深工程师/专家（北京/上海）