最新 猎头职位

AI Agent 后训练专家

30-50K·15薪

代招公司:某大型电子商务公司杭州 1-3年 硕士

...
五险一金
五险一金
AI Agent 后训练专家 30-50K·15薪
...
五险一金
五险一金

各大行业职位任你选

首次验证通过即注册BOSS直聘账号
+86
已阅读并同意BOSS直聘《用户协议》 《隐私政策》,允许BOSS直聘统一管理本人账号信息

职位描述

岗位描述
加入我们,你将构建阿里集团企业级Agent平台后训练技术体系,支撑核心电商、零售、本地生活等丰富业务场景的AI方案效果持续提升,通过先进AI技术探索,持续提升业务效果迭代飞轮,发现新的业务机会。
具体职责包括:
1. Agent效果优化体系建设
构建面向Agent平台的模型后训练技术体系,包括SFT(监督微调)、RLHF(基于人类反馈的强化学习)、DPO(直接偏好优化)等技术栈
设计并实现Agent效果持续优化的数据闭环机制,实现模型能力的自动化迭代升级
2. 平台优化流程
构建面向应用场景的低代码化优化机制,降低业务使用门槛
支持多种场景的Agent定制化优化,如智能客服、任务规划、工具调用等
3. 评估与反馈优化
建立Agent效果评估体系,包括自动化评估和人工评测
设计偏好学习和人类反馈优化机制,确保Agent行为符合业务预期
岗位要求
本科及以上学历,具备计算机科学/人工智能/统计学/数学或相关专业背景;
2年以上软件工程经验,1年以上NLP/算法经验,熟悉Python/Java等主流编程语言;
熟悉SFT、RLHF、DPO等主流后训练方法,能够根据业务场景设计智能化优化方案;
具备深度学习模型后训练经验,包含数据构建、训练方案设计和实施、效果评估,以及方案迭代优化;
有良好的沟通能力和逻辑思维,对技术有热情并乐于钻研;
加分项: 主导过企业级Agent平台的后训练体系建设;有构建数据飞轮并实现模型持续优化的成功案例;有开源社区核心贡献经验优先。

认证资质

  • 人力资源服务许可证

孙女士

河北途兴人力资源服务·猎头顾问

竞争力分析

加载中...
个人综合排名:人中排名第
一般 良好 优秀 极好

BOSS 安全提示

BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报

精选职位

页面更新时间:2025-11-26

快速完善简历,与Boss开聊

与在线Boss直接聊,最快当天拿offer

快速完善信息