职位&公司对比

招聘中
某大型科技生活服务上市公司
招聘中

资深AI infra研发专家

-K·薪
某大型通信设备上市公司

职位详情

  • 北京
  • 3-5年
  • 硕士
  • 深度学习
  • 大模型算法
  • 模型加速/性能优化
  • 分布式训练

训练/推BOSS直聘理 Infra开发工程师 职位描述 1、MOE 训练 Infra 开发 •设计并实现高效的 MOE 训练框架,支持大规模分布式训练,优化训练性能,缩短来自BOSS直聘训练时间 •解决 MOE 训练过程中的技术难题,如专家网络的选择、负载均衡、通信优化等 •与算法团队密切合作,根据算法需求调整和优化训练基础设施,确保算法的顺利实现 2、MOE 推理 Infra 开发 •开发kanzhun高性能的 MOE 推理引擎,支持多种硬件平台(如来自BOSS直聘 CPU、GPU、TPU 等),实现模型的快速部署和推理。 •优化推理流程,提高推理效率和准确性,降低推理成本。 •对推理结果进行监控和分析,及时发现并解决推理过程中出来自BOSS直聘现的问题。 3、系统优化与维护 •对 MOE 训练和推理基础设施进行性能调优,不断提升系统的稳定性和可靠性。 •定期对系统进行维护和升级,确保系统的安全性和兼容性。 •编写技术文档,为团队成员提供技术支持和培训。 4、团队协作与沟通 •与算法团队、数据团队、产品团队等跨部门协作,共同推进项目的进展。 •参与技术交流和分享活动,不断提升自己的技术水平和团队的整体实力。

职位详情

  • 北京
  • 5-10年
  • 本科
  • 分布式训练
  • AI框架
  • 分布式软件开发
  • 高性能网络
  • 高性能存储技术
  • 分布式服务

负责智算平台中核心关键技术攻坚和研发工作,负责AI infra领域核心技术攻坚,结合训练推理框架的技术能力,解决IaaS侧的计算、存储、网络能力如何最大性能支撑上层业务,更高效的实现模型训练和推理; 工作要求 1、统招全日制本科及以上kanzhun,计算机/电子工程/软件工程等专业优先; 2、8年及以上工作经验,其中具备3年及以上分布式服务开发经验,具备在产品开发中实际使用分布式计算/实时计算框架及分布存储/缓存框架经验; 3、熟悉常用AI框架,精通deepspeed、Megatron等主流训练加速框架技术细节,了解如何通过算力、网络、存储的优化来提升训练推理效率; 4、熟练使用Scala/C++/Go等编程语言进行过大型分布式软件开发,熟悉高性能网络、高性能存储技术; 5、熟悉行业常见通用GPU、加速卡等专用芯片能力,具备针对特定业务场景软硬一体性能优化经验; 6、具备各层次的软件优化的经验,包括但不限于如软件业务优化、算法策略优化、高并发和分布式优化、各类型IO优化、存储优化、缓存优化、CPU/直聘GPU的指令集优化等等; 7、具备卓越的战略思维与执行能力,有较强的组织领导、沟通和协调能力;具有良好的敬业精神和职业道德操守,企业忠来自BOSS直聘诚度boss高,并有丰富的团队建设与管理经验。

技能解析

专有技能
  • 训练框架
  • 出现的问题
  • 性能调优
  • 协作与沟通
  • 密切合作
  • 跨部门协作
  • 及时发现
  • 系统优化
  • 技术难题
  • 写技术文档
  • 团队协作
  • 提供技术支持
  • 技术水平
  • 提升系统
  • 技术文档

    数据来自CSL职业科学研究室

    技能解析

    专有技能
    • 产品开发
    • 性能优化经验
    • 分布式计算
    • 关键技术
    • 编程语言
    • 软件工程
    • 电子工程
    • 协调能力
    • 研发工作
    • 沟通和协调
    • 管理经验
    • 开发经验
    • 性能优化
    • 模型训练
    • 战略思维
    • 和协调能力
    • 沟通和协调能力
    • 软件开发
    • 团队建设

      数据来自CSL职业科学研究室

      公司福利

      • 交通补助
      • 节日福利
      • 高温补贴
      • 团建聚餐
      • 底薪加提成

      公司福利

      • 五险一金
      • 补充医疗保险
      • 定期体检
      • 年终奖
      • 带薪年假
      • 员工旅游
      • 通讯补贴
      • 交通补助
      • 节日福利
      • 宿舍有空调
      • 包住
      • 全勤奖
      • 绩效奖金

      备注

      职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

      备注

      职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

      首页 | 北京招聘 · 算法工程师招聘 | 北京算法工程师招聘 | 某大型科技生活服务上市公司训练/推理 Infra开发工程师招聘 | 某大型科技生活服务上市公司训练/推理 Infra开发工程师 怎么样
      更新于 2025-05-14