职位&公司对比

职位关闭

【深圳】大模型后训练算法工程师

-K·薪
  • 互联网
  • 不需要融资
招聘中
某大型互联网公司

职位详情

  • 深圳
  • 5-10年
  • 硕士

岗位职责 1.面向AI应用场景的大模型微调,优化PostTraining (SFT/RM/RL) 算法的训练效率和实际用户体验效果; 2.研究各领域高质量数据的自动化合成方法,建设高效的线上数据飞轮链路; 3.配合产品和工程,探索LLM在创作、教育、金融、代码等场景下直聘的创新应用。 岗位要求 1.研究生及以上学历,计算机、人工智能、数学等相关专业(有数学、编程竞赛加分); 2.多年NLP/深度学习研发经验,至少1年大模型应用相关实战经验; 3.深入理直聘解LLM技术栈(如SFT、直聘RM、RLHF、数据合成等); 4.熟悉Python/PyTorch,以及Transformer、MoE等核心网络架构;具备扎实的代码能力(Python/C++); 5.在ACL/EMNLP/NeurIPS等顶会发表LbossLM相关论文者加分。

职位详情

  • 深圳
  • 10年以上
  • 硕士
  • 后训练/预训练
  • 类O1先进后训练技术
  • RLHF
  • 大模型
  • 多模态
  • GPT/BERT
  • 深度学习
  • NLP

【岗位职责】: 1. 模型训练与优化 负责大模型的后训练/预训练和精调工作、开展微调、提示工程、低资源训练等技术研究、深入研究类O1等先进后训练技术、利用RLHF等强化学习方法优化模型性能、研究模型蒸馏、压缩及量化技术、负责模型性能评估与调优。 2. 数据处理与管理 负责领域数据的收集、清洗、标注及增强boss、开发和维护语料处理流程、制定数据策略,利用迁移学习、数据增强等手段、监控分析数据对模型性能的影响、建立知识体系,研究知识与大模型的集成方法。 3. 技术创新与研发 探索后训练在多模态数据、跨语言应用、领域适配等方面的应用、研究前沿大模型相关技术、提出创新解决方案、搭建和优化大模型训练框架。 4. 业务落地与协作 针对通信行业深度挖掘需求,制定解决方案、推动技术成果向产品形态转化、与算法团队和产品团队合作制定迭代计划、与工程团队协作完成模型部署和监控、确保模型在生产环境中稳定运行。 5. 性能提升与应用优化 提升模型在行业场景中的表现、优化模型生成质量、对话交互能力及稳定性、加强模型的自适应性和泛化能力、解决大规模应用中的性能瓶颈。 【任职要kanzhun求】: 1、教育与专业背景 1)硕士及以上学历(博士优先),计算机、软件工程、人工智能、数学或相关专业,10年以上工作经验。 2)具备扎实的机器学习、深度学习理论基础,对大模型以及NLP、CV、多模态等相关领域有深入了解。 2、后训练技术能力 1)至少3~5年在大型深度学习模型或预训练模型(GPT、BERT等)领域的研发经验,有“模型微调、量化、蒸馏、提示工程”等实践经验者优先。 2)熟悉类O1等先进后训练技术,对其在不同业务场景的适用性与局限性有实际应用或项目经验。 3、强化学习与模型优化 1)扎实的强化学习基础,熟悉RLHF(基于人类反馈的强化学习)在大模型后训练过程中的应用。 2)能够定义并实施强化学习策略以优化生成质量、对话交互和模型稳定性,有相关项目交付经验。 4、数据处理与管理 1)具备大规模数据收集、清洗、标注以及数据治理能力,熟悉数据增强、迁移学习等常用方法。 2)能根据不同业务或场景的需求,对数据进行系统化分析(如数据分布、噪声处理),并制定合理的数据来自BOSS直聘策略。 5、模型优化与部署 1)熟悉主流深度学习框架(如TensorFlow、PyTorch)并能实现模型蒸馏、压缩、量化等技术,提升推理效率和资源利用率。 2)具备分布式训练、模型部署、性能监控经验,能够发现并解决生产环境中的瓶颈和异常。 6、创新与研究能力 1)关注领域前沿技术(多模态学习、跨语言应用、自动化测试、形式化验证等),能结合实际业务场景进行灵活创新。 2)在国际顶级期kanzhun刊/会议发表过论文或拥有相关专利者优先,具备快速学习并输出成果的能力。 7、加分项 曾主导或深度参与过开源社区的NLP、RL相关项目,并具备一定的社区贡献或影响力。

技能解析

专有技能
  • 代码能力
  • 用户体验
相同技能
  • 深度学习
  • 研发经验

数据来自CSL职业科学研究室

技能解析

专有技能
  • 深度学习框架
  • 训练框架
  • 监控分析
  • 通信行业
  • 技术研究
  • 学习方法
  • 软件工程
  • 团队合作
  • 理论基础
  • 技术创新
  • 数据收集
  • 研究能力
  • 分析数据
  • 解决方案
  • 机器学习
  • 熟悉数据
  • 团队协作
  • 数据治理
  • 模型训练
  • 数据的收集
  • 数据处理
  • 深度挖掘
相同技能
  • 深度学习
  • 研发经验

数据来自CSL职业科学研究室

工作时间

上午09:30   -   下午06:00
双休弹性工作

公司福利

  • 五险一金
  • 补充医疗保险
  • 定期体检
  • 年终奖
  • 股票期权
  • 带薪年假
  • 员工旅游
  • 免费班车
  • 餐补
  • 交通补助
  • 包吃
  • 节日福利
  • 住房补贴
  • 零食下午茶
  • 公仔周边活动
  • 免费健身房
  • 免费早晚餐

备注

职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

更新于 2025-04-30