职位&公司对比
职位详情
- 北京
- 不限
- 本科
- pd分离
- vLLM/sglang
职位描述: 优化大模型推理性能,降低推理时延,提升吞吐,降低LLM模型推理成本。 职位要求: 直聘1. 熟悉transformer,llama,deepseek等主流模型结构。 2. 熟悉LLM主流推理引擎(如来自BOSS直聘vLLM/sglang),熟悉常见推理优化技术,如MLA、FlashAtention、PagBOSS直聘eAttention、Cont来自BOSS直聘inuous Batching、Speculative Decoding等。 3.具有AI模型推理优化经验,熟悉常见加速技术,如剪枝、量化、分布式推理等,能够根据不同场景和硬件平台进行针对性的优化。 4.熟悉GPU硬件结构,有CUDA/Cutlass开发优化经验者优先。
职位详情
- 北京
- 5-10年
- 硕士
岗位职责: 1、探索超大规模模型,并进行系统优化; 2、数据boss建设、指令微调、偏好对齐、模型优化; 3、相关应用落地,包括生成创作、逻辑推理、代码生成等; 4、在未来生活中的更多使用场景的深入研究和探索。 任职要求: 1、优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;boss 2、熟悉NLP、CV相关的算法和技术,熟悉大模型训练、RL算法boss者优先; 3、在大模型领域,主导过大影响力的项目或论文者优先; 4、出色的问题分析和解决能力,能深入解决大模型训练和应用存在的问题; 来自BOSS直聘5、良kanzhun好的沟通协作能力,能和团队一起探索新技术,推进技术进步。
技能解析
- CUDA
- 优化技术
数据来自CSL职业科学研究室
技能解析
- 逻辑推理
- 数据结构
- 沟通协作
- C/C++
- 代码能力
- 沟通协作能力
- 协作能力
- 系统优化
- 基础算法
- 模型训练
- 问题分析
- 好的沟通
- 解决能力
- 良好的沟通协
数据来自CSL职业科学研究室
工作时间
公司福利
- 交通补助
- 节日福利
- 有无线网
- 团建聚餐
- 零食下午茶
- 餐补
- 员工旅游
- 带薪年假
- 工龄奖
- 法定节假日三薪
- 节假日加班费
- 夜班补助
- 股票期权
- 保底工资
- 绩效奖金
- 年终奖
- 定期体检
- 意外险
- 补充医疗保险
- 五险一金
公司福利
- 五险一金
- 补充医疗保险
- 定期体检
- 加班补助
- 年终奖
- 股票期权
- 带薪年假
- 员工旅游
- 餐补
- 通讯补贴
- 交通补助
- 包吃
- 节日福利
- 住房补贴
- 零食下午茶
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。