职位&公司对比

招聘中

深度学习

-K
  • 互联网
  • 已上市
招聘中
  • 计算机软件
  • D轮及以上

职位详情

  • 北京
  • 不限
  • 本科
  • 机器学习
  • 深度学习
  • 人工智能

岗位描述: 1. 负责神马搜索及推荐产品中的离线及在线算法研发和持续优化; 2. 和业务团队深入BOSS直聘合作,通过算法改进不断提升用户体验和促进业务发展; 3. 具体工作内容包括: a. 基于大规模用行为及海量数据,优化搜索排序基础算法及策kanzhun探索个性化、场景化的搜索排序。 b. 基于大规模用户行为,以用户体验、业务效果未目标,建立并优化推荐系统的基础算法和策略 c. 跨行业、垂类的通用搜索、推荐算法技术及解决直聘方案的积累 d. 应用深度学习尖端技术,突破推荐及搜索领域核心算法问题 岗位要求: 1. 具备较好的算法知识背景。能熟练运用深度学习模型解决相关问题。 2. 了解常领域用算法,理解算法思想,并有实际应用经验。 3. 有深度学习、大规模并行化机器学习研发经历为佳。 4. 熟悉linux平台,精通c++/java,熟悉python,具有良好的编程习惯和算法基础。 5. 了解相关领域的最新进展,能够将前沿方法引入到工作中不断提升效果。

职位详情

  • 北京
  • 5-10年
  • 硕士
  • 大模型算法
  • 机器学习
  • 强化学习
  • 模型加速/性能优化
  • Python

岗位职责: 降本增效:负责深度学习框架底kanzhun层的性能优化工作,解决大模型大数据集大计算难点,提升多机训练效率,提升GPU利用率到90%以上,降低GPU消耗,缩短训练时间,包括: 1. 研发profiler工具,定位和分析IO通讯、CPU/GPU计算、内存/显存瓶颈。 2. 研发模型并行、流水并行等训练策略,支持预训练/多任务/多模态大模型的多机训练。 3. 优化计算速度和显存消耗,如图编译优化、OP Fusion、Mixed Precision、Gradient Checkpoint。 4. 优化Data Input Pipeline(数据IO、预处理、Host2Device)性能。 5. 优化多机多卡通信性能,提升单机、多机训练加速比。 基本要求: 1. 本科及以上学历,计算机/软件工程/人工智能等相关专业优先。 2. 良好的编程风格和文档撰写能力,有多人协作开发及Code Review经验,对代码有严格的质量要求。 3. 熟悉Python/C/C++多线程开发和调试,对各种内存管理技术有一定了解。 4. 熟悉CUDA计算,有1年以上高性能计算经验,有训练速度和显存优化经验的优先。 5. 有深度学习框架研发经验的优先,如TensorFlow、PyTorch、MxNet、Paddle、MegEngine。 6. 有CV、NLP等深度学习算法研发经验的优先。 7. 有较强的发现、分析、解决问题的能力,负责、自驱、细致、好奇、耐心,优秀的沟来自BOSS直聘通协作能力。 加分项: 1. 熟悉PyTorch、Oneflow、DeepSpeed、Megatron-LM、PatrickStar等框架中的多卡并行训练原理。 2. 熟悉常见CV算法,如Objection Detection、Semantic SegmBOSS直聘entation、Multitask Learning。 3. 熟悉分布式缓存来自BOSS直聘技术,如redis等。 4. 熟悉分布式计算框架,如MPI、NCCL、OPENMP等。 5. 熟悉GPU多卡通信算法,如Ring Allreduce等。 6. 熟悉并行训练加速库,如快手Bagua、GPipe、Horovod等。 7. 熟悉Parameter Server等并行计算架构。 8. 有开源项目开发贡献经验。 9. 熟悉PyTorch-Lightning、Detectron2等算法框架/包的原理及底层实现。 10. 熟悉TVM、XLA等AI编译器中的图优化和OP Fusion技术。 11. 熟悉异构编程环境的相关研发,如CUDA、OPENCL等。

技能解析

专有技能
  • 解决方案
  • 用户体验
  • 海量数据
  • 基础算法
  • 机器学习
  • 算法基础
  • 提升用户体验
  • 编程习惯
  • 用户行为
  • 算法技术
相同技能
  • 深度学习

数据来自CSL职业科学研究室

技能解析

专有技能
  • 深度学习框架
  • 编程风格
  • 优秀的沟通
  • 分布式计算
  • 降本增效
  • 软件工程
  • 内存管理
  • 沟通协作
  • C/C++
  • 性能优化
  • 学习算法
  • 多线程开发
  • 文档撰写
  • 撰写能力
  • 解决问题的能力
  • 解决问题
  • 熟悉分布式
  • 开发和调试
  • 深度学习算法
  • CUDA
  • 缓存技术
  • 沟通协作能力
  • 协作能力
  • 文档撰写能力
  • 研发经验
  • 人工智能等
相同技能
  • 深度学习

数据来自CSL职业科学研究室

工作时间

上午09:00   -   下午06:00

工作时间

上午09:00   -   下午06:30
双休弹性工作

公司福利

  • 五险一金
  • 补充医疗保险
  • 年终奖
  • 股票期权
  • 员工旅游
  • 免费班车
  • 餐补
  • 交通补助
  • 节日福利
  • 零食下午茶

公司福利

  • 节日福利
  • 通讯补贴
  • 住房补贴
  • 团建聚餐
  • 带薪年假
  • 节假日加班费
  • 股票期权
  • 年终奖
  • 定期体检
  • 意外险
  • 补充医疗保险
  • 五险一金
更新于 2025-05-16