职位&公司对比

招聘中
  • 互联网
  • 不需要融资
招聘中

大模型训练引擎工程师

-K·薪
  • 社交网络与媒体
  • 已上市

职位详情

  • 北京
  • 1-3年
  • 博士
  • 计算机相关专业
  • 深度学习经验
  • 有国际期刊/会议论文发表

与清华大学联合培养博士后招生计划 一、应聘条件: 1、品学兼优,身体健康,无不良记录;BOSS直聘 2、获得博士直聘学位不超过3年,或已满足颁发博士学位要求;以及从其他博士后科研流站 (工作站)出站的博士后研究人员,年龄35周岁以下; 3、具备全日制进站工作条件,不招收在职研究人员。 二、福利待遇 1、业界最前沿科研课题; 2、中国顶级高校教授&行业领军人双导师团队; 3、有竞争力直聘的薪酬待遇和学习成长机会。 三、研究方向: 3.1 预训练语言模型及模型小型化技术研究 1、在深度学习、自然语言处理、预训练模型等方向有深入的研究积累; 2、在模型蒸馏、模型量化、训练及推理加速等方面有一定经验; 3、在AI相关领域顶会发表论文不少于 3 篇,熟悉深度学习主流编程框架。 3.2 AIGC方向研究 研究方向包括不限于自然语言生成、图像生成、代码生成、人机对话等方向。 1、在深度学习、自然语言处理、计算机视觉等方向有深入的究积累 2、有文本、图像生成,或人机对话等相关研究或应用实践经验优先; 3、在AI相关领域顶会发表论文不少于 3 篇,熟悉深度学习主流编程框架。

职位详情

  • 北京
  • 1-3年
  • 本科
  • 训练框架
  • 大模型

大模型训练与推理引擎工程师(社招) 工作地点:北京 岗位亮点 ● 加入快手领先业界的「可灵」大模型团队。「可灵」大模型在视频生成领域权威评测(Video-Generation-Arena-Leaderboard)中,图生视频方向排名世界第一,明显领先Google Veo 2模型。 ● 组内技术氛围浓厚,每年都有正式员工作为第一作者,在ATC等系统领域顶级会议发表多篇论文,业界首次提出并实现了pipeline-aware offload等创新技术,并已合入Megatron Core。 ● 每年多次受邀在NVIDIA GTC大会上进行技术分享,与NVIDIA、清华大学计算机系有深度学术与工程合作,合作成果发表于多个国际顶级系统会议。 ● 深度参与最前沿的万卡级SOTA视频生成模型训练与推理优化,包括业内首个视频生成领域的sparse attention、FP8训练与推理方案,以及实现超大规模异构集群端到端优化等。 岗位职责 1. 负责快手可灵大模型训练与推理引擎的研发与优化,包括训练框架、微调平台及推理平台的开发建设。 2. 与业务团队合作,搭建定制化的大模型微调与推理平台,助力业务提升,获得实际业务收益。 3. 深入研究并落地大模型训boss练推理领域前沿技术,并积极推进工程boss实现与创新论文发表,包括但不限于: ○ 超大规模异构集群下的训练稳定性优化(集群建模、热插拔、快速恢复、冗余调度等kanzhun); ○ 模型小型化与低成本推理优化(FP8训推优化、sparse attention算法工程协同、蒸馏技术开发等); ○ 创新的数据调度与组框架(自动并行、端到端solver优化、packing与split方案创新等); ○ 等等 4. 持续优化现有大模型工具链,提升训练与推理整体效率、稳定性,降低运行成本。 任职要求 1. 计算机、电子工程、数学等相关专业,本科及以上学历,0~3年相关工作经验。 2. 熟悉模型训练与推理的流程及性能优化方法,熟悉Transformer/BERT/GPT架构者优先。 3. 熟练掌握Python/C++语言,熟悉并能熟练使用PyTorch训练框架。 4. 热爱技术探索,有良好的团队协作意识,具备分析并解决复杂工程问题的能力。 5. 以下经验为加分项: ○ 具备大模型训练、微调、推理优化经验; ○ 有分布式训练或HPC相关知识,熟悉集合通信或CUDA编程; ○ 熟悉Deepspeed、Megatron、ColossBOSS直聘al-AI、Ray、Horovod等框架之一; ○ 有机器学习平台或深度学习框架的开发经验; ○ 在国际顶级会议或期刊上发表过相关论文。 联系方式:liaoyiqiao@kuaishou.com

技能解析

专有技能
  • 计算机视觉
  • 研究方向
  • 自然语言
  • 技术研究
相同技能
  • 深度学习

数据来自CSL职业科学研究室

技能解析

专有技能
  • 深度学习框架
  • 训练框架
  • 优化方法
  • C++语言
  • 电子工程
  • 良好的团队协
  • 团队合作
  • 论文发表
  • 协作意识
  • CUDA
  • 机器学习
  • 技术开发
  • 算法工程
  • 团队协作
  • 性能优化
  • 开发经验
  • 模型训练
  • 创新技术
  • 大学计算机
  • 团队协作意识
  • 分析并解决
相同技能
  • 深度学习

数据来自CSL职业科学研究室

工作时间

上午09:30   -   下午06:30
双休弹性工作

工作时间

上午10:00   -   下午07:00
双休弹性工作

公司福利

  • 生日福利
  • 节日福利
  • 免费工装
  • 团建聚餐
  • 零食下午茶
  • 餐补
  • 包吃
  • 带薪年假
  • 股票期权
  • 年终奖
  • 定期体检
  • 补充医疗保险
  • 五险一金
  • 定期团建

公司福利

  • 五险一金
  • 补充医疗保险
  • 定期体检
  • 年终奖
  • 股票期权
  • 带薪年假
  • 节日福利
更新于 2025-04-29