各大行业职位任你选
首次验证通过即注册BOSS直聘账号职位描述
- C/C++
- 网络结构搜索
- 深度学习
- 软硬件联合优化
- 并行计算
- 混合精度
- 模型加速/性能优化
- Python
1. 负责芯片SDK的架构设计和算法优化:
a) 跨量化、DSP部署和NPU部署的NNSDK,性能/效率/质量持续对标业界优秀芯片SDK;
b) 联合网络结构、量化和编译的优化算法设计和规划,效果持续对标业界SOTA;
2. 负责DSA架构NPU/DSP编译器工具链设计、开发和维护,实现对TensorFlow/PyTorch/Onnx等主流深度学习框架的支持;
3. 基于TVM/MLIR等开源框架做二次开发,实现编译器工具链中各种优化算法;
4. 开发AI算法模型高效算子,负责NN算法、图像算法在嵌入式异构平台上的实现;
5. 通过与相关领域(算法、芯片)的联合设计提升计算性能,并设计下一代AI编译器架构规范。
任职要求
1. 硕士及以上学历,具备计算机科学、信息工程、电子工程、自动化等相关专业背景;
2. 具备2年以上异构计算平台算法优化经验,对以下一种或多种异构计算硬件体系结构、并行计算有深入研究和实践经验:
a) 基于业界前沿AI加速器平台上算法性能优化经验;
b) 基于业界前沿GPU平台的算法性能优化经验,熟悉GPU架构编程;
c) ARM/x86等CPU上算法性能优化经验,熟悉多线程编程和内存管理技术;
3. 具备3年以上AI编译器框架开发经验:
a) 熟悉TensorFlow/PyTorch/Onnx等主流深度学习框架;
b) 有基于TVM/MLIR等开源编译器开发经验;
c) 有NPU/DSP/GPU等异构计算平台开发和调优经验;
4. 熟悉C/C++以及python等编程语言,熟悉数据结构和软件设计模式,具备良好的软件工程习惯;
5. 具备良好的沟通协调和组织能力、技术项目管理能力。
认证资质

张女士
竞争力分析


BOSS 安全提示
BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报
精选职位
页面更新时间:2025-05-13