各大行业职位任你选
首次验证通过即注册BOSS直聘账号职位描述
- 分布式训练
- 深度学习
- 大模型算法
- 模型加速/性能优化
职位描述
1、MOE 训练 Infra 开发
•设计并实现高效的 MOE 训练框架,支持大规模分布式训练,优化训练性能,缩短训练时间
•解决 MOE 训练过程中的技术难题,如专家网络的选择、负载均衡、通信优化等
•与算法团队密切合作,根据算法需求调整和优化训练基础设施,确保算法的顺利实现
2、MOE 推理 Infra 开发
•开发高性能的 MOE 推理引擎,支持多种硬件平台(如 CPU、GPU、TPU 等),实现模型的快速部署和推理。
•优化推理流程,提高推理效率和准确性,降低推理成本。
•对推理结果进行监控和分析,及时发现并解决推理过程中出现的问题。
3、系统优化与维护
•对 MOE 训练和推理基础设施进行性能调优,不断提升系统的稳定性和可靠性。
•定期对系统进行维护和升级,确保系统的安全性和兼容性。
•编写技术文档,为团队成员提供技术支持和培训。
4、团队协作与沟通
•与算法团队、数据团队、产品团队等跨部门协作,共同推进项目的进展。
•参与技术交流和分享活动,不断提升自己的技术水平和团队的整体实力。
认证资质

邓先生
竞争力分析


BOSS 安全提示
BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报
了解更多职场安全防范知识精选职位
页面更新时间:2025-05-14