职位&公司对比
职位详情
- 北京
- 不限
- 本科
- pd分离
- vLLM/sglang
职位描述: 优化大模型推理性能,降低推理时延,提升吞吐,降低LLM模型推理成本。 职位要求:boss 1. 熟悉transformer,llama,deepseek等主流模型结构。 2. 熟悉LLM主流推理引擎BOSS直聘(如vLLM/sglang),熟悉常见推理优化技术,如ML直聘A、FlashAtention、PageAttention、Continuous Batching、Speculative Dekanzhuncodikanzhunng等。 3.具有AI模型推理优化经验,熟悉常见加速技术,如剪枝、量化、分布式推理等,能够根据不同场景和硬件平台进行针对性的优化。 4.熟悉GPU硬件结构,有CUDA/Cutlass开发优化经验者优先。
职位详情
- 北京
- 5-10年
- 硕士
- 端到端算法
- 感知OneModel
- planning
职位描述 1.负责端到端算法的预研,探索e2e自动驾驶的上限; 2.科研岗需要发表有行业影响力的发表物; 3.量产岗需要支持端到端量产直聘团队做好技术落地; 4.包括但不限于以下方向来自BOSS直聘: a.基础模型方向: -熟悉或了解 MAE/JEPA/MAGE/VAR/MkanzhunAR等基于表示学习的基础模型/世界模型, -熟悉或了解 主流VLM的基座模型,Prompt与SFT的原理和应用:b.自动驾驶方向:e2e自动驾驶/感知OneModel/预决策一体模型;c.神经网络理论方向:可解释神经网络/因果推断/神经网络优化理论。 职位要求 1.硕士/BOSS直聘博士毕业1-3年; 2.对科研有热情,愿意做难而正确的事情,乐于面对挑战解决困难; 3.有团队意识和合作精神; 4.以下条件满足两项即可: a.顶刊/顶会有发表过相关领域高质量的论文; b.代码能力出色,具有熟练的模型开发,调试,部署的能力; c.数学竞赛,物理竞赛等有获奖经历;
技能解析
- CUDA
- 优化技术
数据来自CSL职业科学研究室
技能解析
- 自动驾驶
- 代码能力
- 解决困难
- 合作精神
- 团队意识
- 神经网络
数据来自CSL职业科学研究室
工作时间
公司福利
- 交通补助
- 节日福利
- 有无线网
- 团建聚餐
- 零食下午茶
- 餐补
- 员工旅游
- 带薪年假
- 工龄奖
- 法定节假日三薪
- 节假日加班费
- 夜班补助
- 股票期权
- 保底工资
- 绩效奖金
- 年终奖
- 定期体检
- 意外险
- 补充医疗保险
- 五险一金
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。