职位&公司对比

招聘中
某大型互联网平台上市公司

职位详情

  • 北京
  • 不限
  • 本科
  • pd分离
  • vLLM/sglang

职位描述: 优化大模型推理性能,降低推理时BOSS直聘延,提升吞吐,降低LLM模型推理成本。 职kanzhun位要求来自BOSS直聘: 1. 熟悉transformer,llama,deepseek等主流模型结构。 2. 熟悉LLM主流推理引擎(如vLLM/sglang),熟悉常见推理优化技术,如MLA、bossFlashAtention、PageAttention、Continuous Batching、Speculative Decoding等。 3.具有AI模型推理优化经验,熟悉常见加速技术,如剪枝、量化、分布式推理等,能够根据不同场景和硬件平台进行针对性的优化。 4.熟悉GPU硬件结构,有kanzhunCUDA/Cutlass开发优化经验者优先。

职位详情

  • 北京
  • 1-3年
  • 硕士
  • sft
  • 多模态
  • agent
  • 预训练全链路
  • 基座模型训练
  • rl
  • llm

岗位描述 1.操控万卡规模的GPU集群,boss对超大参数量级的预训练模型进行高效分布式训练与优化。 2.深度参与多模态(图像、语音、文本、视频)大模型的研发,探索多学科交叉领域的新奇玩法。 3.我们的技术将为夸克亿万用户提供高品质的AI智能服务,见证前沿技术实现真正的用户价值 加入我们,你将获得: 1.与顶级专家携手,以世界级算力资源和数据支持为背书,不断挑战技术极限。 2.极具竞争力的薪酬与福利,人性化、追求boss卓越技术的的工程师团队文化,助你职业成长道路上全速前进。 3.在通往AGI的征途上,亲历关键技术的诞生与应用,留下属于你的时代印记。 如果你渴望驰骋在大模型与AGI的蓝海之中,那么这将是你的最佳舞台!快来加入我们,一同开创智能时代的新纪元。 岗位要求 1.计算机、数学或统计学相关专业硕士及以上学历,具有2年以上计算机NLP/CV/BOSS直聘AUDIO相关工作经验 2.扎实的深度学习理论基础,精通主流深度学习框架(如TensorFlow、PyTorch),拥有大规模模型训练经验优先。 3.熟悉分布式训练、自动混合精度、数据并行/模型并行、高性能计算加速等技术。 4.对多模态学习、自然语言处理、计算机视觉、语音识别等方向有研究与实践经验。 5.具备快速学习与开拓创新的能力,对AGI的未来趋势与挑战BOSS直聘有浓厚兴趣。

技能解析

专有技能
  • CUDA
  • 优化技术

    数据来自CSL职业科学研究室

    技能解析

    专有技能
    • 深度学习框架
    • 开拓创新
    • 计算机视觉
    • 深度学习
    • 创新的能力
    • 关键技术
    • 熟悉分布式
    • AUDIO
    • 数据支持
    • 理论基础
    • 自然语言
    • 模型训练
    • 提供高品质

      数据来自CSL职业科学研究室

      工作时间

      上午10:00   -   下午07:00
      双休弹性工作

      公司福利

      • 交通补助
      • 节日福利
      • 有无线网
      • 团建聚餐
      • 零食下午茶
      • 餐补
      • 员工旅游
      • 带薪年假
      • 工龄奖
      • 法定节假日三薪
      • 节假日加班费
      • 夜班补助
      • 股票期权
      • 保底工资
      • 绩效奖金
      • 年终奖
      • 定期体检
      • 意外险
      • 补充医疗保险
      • 五险一金

      公司福利

      • 五险一金
      • 补充医疗保险
      • 年终奖
      • 股票期权
      • 员工旅游
      • 免费班车
      • 餐补
      • 交通补助
      • 节日福利
      • 零食下午茶

      备注

      职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

      更新于 2025-05-08