各大行业职位任你选
首次验证通过即注册BOSS直聘账号职位描述
- C++
- PyTorch
- Python
1、参与大模型超大规模任务离线训练的效率和稳定性提升的工作;
2、参与大模型在线inference吞吐/延迟优化,提升inference性价比的工作;
3、参与上述算力加速软硬件及平台体系化的设计和建设工作,支撑大模型能力建设和落地应用;
岗位要求
1. 精通C/C++、Python等至少一门编程语言,以及Linux下的系统开发经验
2. 熟悉常用机器学习算法,对文本/多模态大模型相关领域模型,有极佳的工程实现能力,熟悉TF/Pytorch/Jax等深度学习框架,有相关模型训练和模型效果优化者优先
3. 熟悉大模型MegatronLM/Deepspeed/Colossal分布式训练框,深入了解模型量化、蒸馏、剪枝等模型优化原理和策略,有文本、语音、以及多模态模型相关训练、效果调优经验优先
4. 熟练使用包括vllm/sglang/tgi/tensorrtLLM/lmdeploy等一种以上模型推理服务框架,有代码分析及实践经验优先
5. 对于GPU/ASIC芯片等熟悉了解硬件系统架构,能够针对性的编写高性能的算子实现,有分析及调优能力者优先
6. 有Bert、语音TTS/ASR,以及SD等模型训练、推理优化经验者亦可
7. 在训练/推理加速相关领域的研究和成果发表者优先
同时我们还希望你
1、学习能力强,有良好的英文论文阅读能力,对新事物保有好奇心,并能快速适应新环境;
2、良好的沟通能力和团队协同能力;能与他人合作,共同完成目标;
3、对所在领域有热情,相信方法总比困难多,善于独立思考并反思总结。
认证资质

周女士
竞争力分析


BOSS 安全提示
BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报
了解更多职场安全防范知识精选职位
页面更新时间:2025-05-17