职位&公司对比

招聘中

深度学习

-K
  • 电子商务
  • 已上市
招聘中

AI推理架构师

-K
某大型互联网公司

职位详情

  • 北京
  • 3-5年
  • 硕士
  • 深度学习
  • 算法
  • 数据分析

1.         扎实的kanzhun软件开发基础,较好的Java/Python/R/C++开发经验,3年以上Java经验优先; 2.         熟悉算法和数据结构; 3.         熟悉运用和评估开源应用软件 4.         根据业务需求进行,执行数据分析项目工作,起草工作方案; 5.         按要求完成数据分析报告、建模报告、数据报表等; 6.         按要求对模型及算法进行验证和实现; 7.         有曾经应用运筹学方法和统计学建立数据模型,解决实际工业优化决策问题的背景boss者优; 8.     来自BOSS直聘    有曾经应用数据挖掘和机器学习方法建立预测数据模型的背景者优先; 9.         思路清晰、态度认真、BOSS直聘责任心、有较强的时间管理能力; 10.     较好的英语科技文献阅读能力。

职位详情

  • 北京
  • 不限
  • 博士
  • 大模型算法
  • C/C++
  • Python
  • 分布式训练
  • 发表算法相关优秀论文
  • 团队管理经验
  • 算法工程化经验
  • 高并发系统
  • 大模型推理优化
  • 高性能算子优化
  • GPU集群调优
  • ILM推理全链路优化

工作内容: 1、负责搭建和优化大规模分布式 GPU推理集群,设计高性能、高可用的推理架构,支持千亿级参数模型的低延迟高吞吐推理服务 2、开发与优化大模型推理引擎(如LM、SGlang等),集成前沿技术(如FlashAttention、PageAttention、Continuous Batching等),持续提升推理效率。 3、主导算子级优化如 来自BOSS直聘CUDA 算子开发,最大来自BOSS直聘化 GPU 资源利用率。 4、设计分布式推理方案(多机多卡、流水线并行等),解决通信瓶颈,优化资源调度策略 职位要求: 1、人工智能大模型相关专业博士或5年以上高并发系统开发经验或2年以上大模型推理优化经验。 2、精通 C++/Python,熟悉 CUDATriBOSS直聘ton 开发,有高性能算子优化经验;熟悉主流框架(PyTorch、TensorRT) 3、深入理解分布式系统设计,具备大规模 GPU集群调优经验,熟悉 NCCL、RDMA 等通信优化技术。 4、熟悉 ILM推来自BOSS直聘理全链路优化(如 KVCache 管理、显存优化),精通量化(INT8/FP8)、FlashAttention、Continuous Batching等核心方法。

技能解析

专有技能
  • C++开发
  • 学习方法
  • 数据结构
  • 算法和数据结构
  • 数据分析
  • 机器学习
  • 较好的英语
  • 文献阅读
  • 项目工作
  • 分析报告
  • 管理能力
  • 数据模型
  • 熟悉算法
  • 数据分析报告
  • 阅读能力
  • 数据挖掘
  • 预测数据
  • 软件开发
  • 数据报表
相同技能
  • 开发经验

数据来自CSL职业科学研究室

技能解析

专有技能
  • CUDA
  • 优化技术
  • 分布式系统
  • 系统设计
  • 系统开发
相同技能
  • 开发经验

数据来自CSL职业科学研究室

公司福利

  • 交通补助
  • 餐补
  • 带薪年假
  • 全勤奖
  • 年终奖
  • 定期体检
  • 意外险
  • 补充医疗保险
  • 五险一金

公司福利

  • 节日福利
  • 零食下午茶
  • 带薪年假
  • 夜班补助
  • 绩效奖金
  • 年终奖
  • 定期体检
  • 五险一金

备注

职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

更新于 2025-05-14