职位&公司对比

招聘中
某大型互联网直播平台上市公司
招聘中

高级高性能计算工程师

-K·薪
某知名互联网公司

职位详情

  • 深圳
  • 10年以上
  • 硕士
  • C/C++
  • 网络结构搜索
  • 深度学习
  • 软硬件联合优化
  • 并行计算
  • 混合精度
  • 模型加速/性能优化
  • Python

工作职责 1. 负责芯片SDK的架构设计和算法优化: a) 跨化、DSP部署和NPU部署的NNSDK,性直聘/效率/质量持续对标业界优秀芯片SDK; b) 联合网络结构、量化和编译的优化算法设计和规划,效果持续对标业界SOTA; 2. 负责DSA架构NPU/DSP编译器工具链设计、开发和维护,实现对TensorFlow/PyTorch/Onnx等主流深度学习框架的支持; 3. 基于TVM/MLIR等开源框架做二次开发,实现编译器工具链中各种优化算法; 4. 开发AI算法模型高效算子,负责NN算法、图像算法在嵌入式异构平台上的实现; 5. 通过与相关领域(算法、芯片)的联合设计提升计算性能,并设计下一代AI编译器架构规范。 任职要求 1. 硕士及以上学历,具备计算机科学、信息工程、电子工程、自动化等相关专业背景; 2. 具备2年以上异构计算平台算法优化经验,对以下一种或多种异构计算硬件体系结构、并行计算有深入研究和实践经验: a) 基于业界前沿A来自BOSS直聘I加速器平台上算法性能优化经验; b) 基于业界前沿GPU平台的算法性能优化经验,熟悉GPU架构编程; c) ARM/x86等CPU上算法性能优化经验,熟悉多线程编程和内存管理技术; 3. 具备3年以上AI编译器框架开发经验: a) 熟悉TensorFlow/PyTorch/Onnx等主流深度学习框架; b) 有基于TVM/MLIR等开源编译器开发经验; c) 有NPU/DSP/GPU等异构计算平台开发和调优经验;kanzhun 4. 熟悉C/C++以及python等编程语言,熟悉数据结构和软件设计模式,具备良好的软件工程习惯; 5. 具备良好的沟通协调和组织能力、技术项目管理能力。

职位详情

  • 深圳
  • 5-10年
  • 硕士
  • 高性能
  • 编译器
  • 加速
  • 模型优化

工作职责 1. 负责网络训练任务性能优化,分析和优化性能瓶颈,提高GPU训练速度直聘和资源利用率;来自BOSS直聘 2. 跟进业界先进的训练框架和技术,结合训练业务优化需求,搭建具有竞争力的训练平台; 3. 负责与算法工程师沟通协作,分析算法业务框架,推kanzhun来自BOSS直聘高效训练的算法框架设计。

技能解析

专有技能
  • 深度学习框架
  • 项目管理
  • 编程语言
  • 架构设计
  • 软件工程
  • 组织能力
  • 算法优化
  • 内存管理
  • C/C++
  • 熟悉数据
  • 线程编程
  • 开发经验
  • 算法设计
  • 开源框架
  • 熟悉多线程
  • 性能优化经验
  • 图像算法
  • 项目管理能力
  • 优化算法
  • 深度学习
  • 软件设计
  • 沟通协调
  • 多线程编程
  • 电子工程
  • 数据结构
  • 设计模式
  • 二次开发
  • 熟悉数据结构
  • 管理能力
  • 框架开发
  • 好的沟通
  • 算法模型
  • 良好的沟通协
相同技能
  • 性能优化

数据来自CSL职业科学研究室

技能解析

专有技能
  • 训练框架
  • 分析和优化
  • 算法工程
  • 框架设计
  • 沟通协作
相同技能
  • 性能优化

数据来自CSL职业科学研究室

公司福利

  • 交通补助
  • 生日福利
  • 节日福利
  • 零食下午茶
  • 餐补
  • 员工旅游
  • 带薪年假
  • 股票期权
  • 年终奖
  • 定期体检
  • 五险一金
  • 团建
  • 弹性时间
  • 企业滴滴
  • 加班餐补

备注

职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

备注

职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

更新于 2025-05-13