职位&公司对比
职位详情
- 深圳
- 5-10年
- 本科
- hpc
- 算子
- 异构计算
- 高性能计算
- 算子优化
工作职责 1. 负责NN算BOSS直聘法、图像算法在主流移动端处理器上的部署、优化和调试; 2. 负责NN部署框架boss设计、开发实现、算子优化和工具链直聘维护; 3. 负责撰写相关业务设计文档。 任职要求 1. 硕士及以上学历,5年及以上相关经验; 2. 熟悉至少2款boss主流移动端处理器,了解硬件基本架构和优化策略,有基于NPU/DSP/GPU的NN和图像算法深入部署调优经验; 3. 了解主流NN部署框架中的一种,包括但不限于QNN/coreml/MNN/ncnn/caffe/tensorflow等; 4. 熟悉芯片性能评估,具备评估方法论; 5. 熟悉C/C++和软件设计模式,了解openbossCL/openGL/opencv/cuda,具备良好的软件工程习惯; 6. 熟悉NN模型量化方法。
职位详情
- 深圳
- 5-10年
- 本科
- 高性能计算
- 模型部署
- 推理引擎
- CUDA
- 模型优化
岗位职责: 1. 负责智能驾驶AI模型和算法在车载芯片平台上的全链路优化与部署,支撑核心智驾功能的量产落地; 2. 在包含DSP/GPU/CPU/NPU/加速器等异构算力单元的芯片平台上定位和分析性能瓶颈,与算法团队合作改进算法设计,通过优化算法框架、模型结构、算子设计和异构调度,提高硬件计算效率,优化算法性能。 3. 负责开发车端AI推理框架、跨端AI部署工具链BOSS直聘、搭建软硬件系统,优化AI模型部署全流程的效率,构建业界领先的车端AI部署能力。 任职要求: 1. 本科及以上学历,计算机科学、电子信息、自动化等相关专业背景,熟悉计算机体系结构; 2. 具备2年以上AI模型部署及优化开发经验: a. 了解深度学习基本原理,熟悉NN基本架构和典型OP的计算方式,熟悉至少一种主流深度学习框架,如TensorFlow/PyTorch等; b. 熟悉常用计算库及推理引擎,如cuBLAS/CUTLASS/TensorRT/QNN/MNN/TF Lite等; c. 具备NPU/DSP/GPU等异构计算平台开发和调优经验,了解OpenVX/MediaPipe等异构计算框架。 3. 具有CPU(ARM/x86),GPU(NVIDIA/Adreno/Mali)、DSP来自BOSS直聘(TI/高通)中的1个或多个平台的高性能计算优化经验,熟直聘悉直聘芯片体系结构和性能分析工具,掌握相应的编程接口或指令集; 4. 掌握C++/python等编程语言,熟悉数据结构和软件设计模式,具备良好的软件工程习惯; 5. 具备强烈的技术热情和学习能力,具有良好的沟通协调能力。 优先条件: 1. 有基于英伟达平台的CUDA开发和调优经验及TensorRT模型部署优化经验者优先; 2. 熟练掌握直聘深度学习编译优化技术,有基于TVM/MLIR等开源编译器的开发经验者优先; 3. 有自动驾驶AI算法工程化落地经验者优先;熟悉大模型推理加速相关技术者优先。
技能解析
- 设计文档
- C/C++
- 图像算法
- 优化策略
- 框架设计
- 软件设计
- 软件工程
- 设计模式
数据来自CSL职业科学研究室
技能解析
- 深度学习框架
- 电子信息
- 具有良好的沟
- 部署能力
- 编程语言
- 熟悉数据
- 优化技术
- 开发经验
- 算法设计
- 掌握C++
- 自动驾驶
- 性能分析
- 分析工具
- 优化算法
- 深度学习
- 沟通协调
- 团队合作
- 数据结构
- 协调能力
- CUDA
- 基本原理
- 熟悉数据结构
- 沟通协调能力
- 算法工程
- 学习能力
- 好的沟通
- 具有良好的沟通协调能力
- 性能分析工具
- 良好的沟通协
- 软件设计
- 软件工程
- 设计模式
数据来自CSL职业科学研究室
工作时间
公司福利
- 五险一金
- 定期体检
- 年终奖
- 股票期权
- 带薪年假
- 零食下午茶
公司福利
- 交通补助
- 生日福利
- 节日福利
- 通讯补贴
- 住房补贴
- 团建聚餐
- 零食下午茶
- 餐补
- 员工旅游
- 带薪年假
- 年终奖
- 定期体检
- 补充医疗保险
- 五险一金
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。