各大行业职位任你选
首次验证通过即注册BOSS直聘账号职位描述
- 爬虫
- 推理框架
- 训练框架
- cuda算子
毕业时间:2025年 招聘截止日期:2025.08.31
我们正在寻找经验丰富、技术卓越的大模型训练与推理基础设施工程师,负责构建和优化支持大规模深度学习模型的高效计算和部署平台。此职位将深入参与分布式计算、模型优化、推理加速等核心领域,为前沿 AI 模型的开发和落地提供强大的技术支持。
主要职责
1. 模型训练基础设施开发
- 设计和实现支持大规模分布式训练的计算平台,优化模型训练效率和资源利用率。
- 维护和扩展现有的分布式训练框架,确保平台的高性能和稳定性(如基于 PyTorch、TensorFlow 或 JAX)。
- 集成和优化高性能计算技术(如 CUDA、MPI、NCCL 等)。
2. 模型推理基础设施开发
- 构建高效的推理框架,支持大模型的在线和离线推理需求。
- 优化推理速度、内存占用和能耗,支持多种硬件架构(GPU、NPU等 )。
- 实现PD分离、Context Caching、模型量化、推敲编码等推理优化技术。
3. 性能监控与优化
- 开发工具链和监控系统,跟踪训练与推理过程的性能瓶颈。
- 分析并优化数据加载、通信效率和硬件利用率等关键环节。
4. 跨团队协作
- 与模型研究团队密切合作,理解模型需求,定制训练和推理策略。
- 支持产品团队的模型部署需求,推动大模型在实际场景中的落地应用。
职位要求
基本要求:
- 计算机科学、软件工程、机器学习或相关领域的本科及以上学历,硕士或博士优先。
- 深入理解深度学习原理和分布式训练框架(如 Horovod、DeepSpeed、Ray 等)。
- 熟练掌握至少一种主流深度学习框架(如 PyTorch、TensorFlow 或 JAX)。
- 熟悉高性能计算技术(CUDA、NCCL、cuDNN 等)及硬件架构(GPU、NPU 等)。
- 具有扎实的编程能力,精通 Python 和至少一种系统级编程语言(如 C++)。
优先条件:
- 有参与或主导过大规模模型(如 Transformer、大语言模型)的训练和部署经验。
- 熟悉模型优化技术(如混合精度训练、剪枝、量化等)。
- 对云计算和容器化技术(如 Kubernetes、Docker、Terraform)有实际经验。
- 对新兴 AI 硬件(如 H卡)有实操经验。
- 具备优秀的系统设计和性能调优能力。

潘先生 刚刚活跃
竞争力分析


BOSS 安全提示
BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报
了解更多职场安全防范知识公司介绍
胸怀“和用户交朋友,做用户心中最酷的公司”的愿景,小米致力于持续创新,不断追求极致的产品服务体验和公司运营效率,努力践行“始终坚持做感动人心、价格厚道的好产品,让全球每个人都能享受科技带来的美好生活”的公司使命。
小米目前是全球领先的智能手机品牌之一,同时,小米已经建立起全球领先的消费级AIoT物联网平台,截至2021年9月30日,AIoT平台已连接的IoT设备(不包括智能手机及笔记本电脑和平板)数突破4亿。集团业务已进入全球逾100个国家和地区。2021年8月,小米集团连续三年进入《财富》2021年「世界500强排行榜」 (Fortune Global 500) ,位列338名,较2020年大幅提升84位。
小米集团目前为恒生指数、恒生中国企业指数、恒生科技指数及恒生神州50指数成份股。
工商信息
- 公司名称北京小米移动软件有限公司
- 法定代表人屈恒
- 成立日期2012-05-08
- 企业类型有限责任公司(法人独资)
- 经营状态存续
- 注册资金148800万人民币
工作地址
点击查看地图
精选职位
页面更新时间:2025-05-16