职位&公司对比

职位关闭

【深圳】大模型后训练算法工程师

-K·薪
  • 互联网
  • 不需要融资
招聘中

大模型+MLP(P8-9)

-K·薪
某知名互联网公司

职位详情

  • 深圳
  • 5-10年
  • 硕士

岗位职责 1.面向AI应用场景的大模型微调,优化PostTraining (SFT/RM直聘/RL) 算法的训练效率和实际用户体验效果; 2.研究各领域高质量数据的自动化合成方法,建设高效的线上数据飞轮链路; 3.配合产品和工程,探索LLM在创作、教育、金融、代码等kanzhun场景下的创新应用。 岗位要求 1.研究生及以上学历,计算机、人工智能、数学等相关专业(有数学、编程竞赛加分); 2.多年NLP/深度学习研发经验,至少1年大模型应用相关实战经验; 3.深入理解LLM技术栈(如SFT、RbossM、RLHF、数据合成等); 4.熟悉Python/PyTorch,以及Transformer、MoE等核心网络架构;具备扎实的代码能力(Python/C++); 5.在ACBOSS直聘L/EMN直聘LP/NeurIPS等顶会发表LLM相关论文者加分。

职位详情

  • 深圳
  • 不限
  • 硕士
  • 大模型

工作职责: 从事大型语言模型(LLM)预训练算法的研究、训练和应用,涉及多语言、知识增强、模型性能提升等领域。 负责自然语言处理(NLP)方向基于GPU并行多机多卡训练、高性能模型推理等。 主要从事AIGC语言内容生成工作,将先进的NLP生成技术应用到实际BOSS直聘业务中BOSS直聘,获得商业效益,更好地为用户服务。 跟踪和研究前沿技术支持公司常规和垂直职前培训模式的开发和持续优化。 要求: 1、计算机、数学、统计等相关专业硕士及以上学历,具有5年及以上NLP相关经验,熟练使用Pytorch/Tensorflow深度学习框架; boss对NLP文本生成或大模型预训练方向有深入研究; LLM有深入的理解和实践,对前期培训和可控内容生成方向有经验者优先; 精通GPT、T5等算法训练范式,kanzhun有从零开始构建NLP大型模型(10B参数以上)经验者优先; 良好的逻辑思维能力、沟通协作能力,以及自学能力。

技能解析

专有技能
  • 代码能力
  • 用户体验
  • 研发经验
相同技能
  • 深度学习

数据来自CSL职业科学研究室

技能解析

专有技能
  • 深度学习框架
  • 良好的逻辑
  • 逻辑思维能力
  • 沟通协作
  • 自学能力
  • 沟通协作能力
  • 协作能力
  • 技术应用
  • 自然语言
  • 逻辑思维
  • 良好的逻辑思维
  • 良好的逻辑思维能力
相同技能
  • 深度学习

数据来自CSL职业科学研究室

工作时间

上午09:30   -   下午06:00
双休弹性工作

公司福利

  • 五险一金
  • 补充医疗保险
  • 定期体检
  • 年终奖
  • 股票期权
  • 带薪年假
  • 员工旅游
  • 免费班车
  • 餐补
  • 交通补助
  • 包吃
  • 节日福利
  • 住房补贴
  • 零食下午茶
  • 公仔周边活动
  • 免费健身房
  • 免费早晚餐

备注

职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

更新于 2025-05-05