职位&公司对比
职位详情
- 北京
- 不限
- 本科
- pd分离
- vLLM/sglang
职位描述: 优化大模型推理性能,降低推理时BOSS直聘延,提升吞吐,降低LLM模型推理成本。 职kanzhun位要求来自BOSS直聘: 1. 熟悉transformer,llama,deepseek等主流模型结构。 2. 熟悉LLM主流推理引擎(如vLLM/sglang),熟悉常见推理优化技术,如MLA、bossFlashAtention、PageAttention、Continuous Batching、Speculative Decoding等。 3.具有AI模型推理优化经验,熟悉常见加速技术,如剪枝、量化、分布式推理等,能够根据不同场景和硬件平台进行针对性的优化。 4.熟悉GPU硬件结构,有kanzhunCUDA/Cutlass开发优化经验者优先。
职位详情
- 北京
- 1-3年
- 硕士
- sft
- 多模态
- agent
- 预训练全链路
- 基座模型训练
- rl
- llm
岗位描述 1.操控万卡规模的GPU集群,boss对超大参数量级的预训练模型进行高效分布式训练与优化。 2.深度参与多模态(图像、语音、文本、视频)大模型的研发,探索多学科交叉领域的新奇玩法。 3.我们的技术将为夸克亿万用户提供高品质的AI智能服务,见证前沿技术实现真正的用户价值 加入我们,你将获得: 1.与顶级专家携手,以世界级算力资源和数据支持为背书,不断挑战技术极限。 2.极具竞争力的薪酬与福利,人性化、追求boss卓越技术的的工程师团队文化,助你在职业成长道路上全速前进。 3.在通往AGI的征途上,亲历关键技术的诞生与应用,留下属于你的时代印记。 如果你渴望驰骋在大模型与AGI的蓝海之中,那么这将是你的最佳舞台!快来加入我们,一同开创智能时代的新纪元。 岗位要求 1.计算机、数学或统计学相关专业硕士及以上学历,具有2年以上计算机NLP/CV/BOSS直聘AUDIO相关工作经验 2.扎实的深度学习理论基础,精通主流深度学习框架(如TensorFlow、PyTorch),拥有大规模模型训练经验优先。 3.熟悉分布式训练、自动混合精度、数据并行/模型并行、高性能计算加速等技术。 4.对多模态学习、自然语言处理、计算机视觉、语音识别等方向有研究与实践经验。 5.具备快速学习与开拓创新的能力,对AGI的未来趋势与挑战BOSS直聘有浓厚兴趣。
技能解析
- CUDA
- 优化技术
数据来自CSL职业科学研究室
技能解析
- 深度学习框架
- 开拓创新
- 计算机视觉
- 深度学习
- 创新的能力
- 关键技术
- 熟悉分布式
- AUDIO
- 数据支持
- 理论基础
- 自然语言
- 模型训练
- 提供高品质
数据来自CSL职业科学研究室
工作时间
公司福利
- 交通补助
- 节日福利
- 有无线网
- 团建聚餐
- 零食下午茶
- 餐补
- 员工旅游
- 带薪年假
- 工龄奖
- 法定节假日三薪
- 节假日加班费
- 夜班补助
- 股票期权
- 保底工资
- 绩效奖金
- 年终奖
- 定期体检
- 意外险
- 补充医疗保险
- 五险一金
公司福利
- 五险一金
- 补充医疗保险
- 年终奖
- 股票期权
- 员工旅游
- 免费班车
- 餐补
- 交通补助
- 节日福利
- 零食下午茶
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。