职位&公司对比
职位详情
- 长春
- 3-5年
- 本科
- 大模型训练数据
- 数据标注
工作职责 1.AI 合成数据策略制定与实施:研究并开发基于 AI 的合成数据生成算法,用于构建高质量、多样化的训练数据集,针对特定任务和目标,设计和优化数据合成流程,提升合成数据的真实性和有效性,探索利用生成式模型(如 GAN、Diffusion Model 等)进行数据增强和扩充,提升模型泛化能力 2.数据标注团队管理与标准构建:组建和管理高效的数据标注团队,制定合理的标注流程和规范,设计并完善数据标注标准和指南,确保标注数据的准确性和一致性,开发自动化标注工具和平台,提升标注效率和质量,对标注人员进行培训和考核,持续提升团队标注能力 3.数据质量管理与评估:建立数据质量评估体系,对合成数据和标注数据进行全面评估和监控,BOSS直聘分析数据质量问题,提出改进方案并推动实施,与算BOSS直聘法团队紧密合作,根据模型训练需求不断优化数据质量 4.前沿技术探索与应用:关注大模型训练数据领域的前沿技术发展,探索新技术在数据合成和标注中的应用,参与相关技术交流和分享,推动团队技术进步 工作要求 1.国内大学统招本科及以上学历,或已取得教育部留学服务中心认证的“学历学位认证书”的本科及以上学历留学生 2.具备3年以上互联网或汽车产品工作经验,计算机科学、人工智能、数据科学等相直聘关专业 3.熟悉机器学习、深度学习基本原理,了解主流生成式模型(如 GAN、Diffusion Model 等),具备扎实的编程基础,熟练掌握 Python 等编程语言,具备良好的数据结构和算法基础,能够进行高效的算法实现和优化,具备良好的沟通能力和团队合作精神,能够与不同背景的团队成员有效协作 4.具有大模型训练数据合成或数据标注相关项目经验,熟悉数据标注平台和工具,具备数据标注团队管理经验 5.对数据安全和隐私保护有深入理解,能够制定相应的数据安全策略 6.国内高校毕业生大学英语四级(CET-4 425分)及以上或托福成绩80分及以上、雅思成绩6.0分及以上,海外高校毕直聘业生须达到同等水平,较好的英语或德语读写能力,能够进行日常对话 7.年龄40周岁及以下
职位详情
- 长春
- 3-5年
- 本科
1.在自然语言理直聘解、计算机视觉、多模态、深度学习等领域有较深入的研究,对LLM、多模态学习有深入理解和实践。 2、了解数据并行、流水线并直聘行、Tensor并行的训练方法,熟悉PS/AllReduce等分布式训练算法,精boss通CUDA、cuDNN、NCCL,熟悉GPU等硬件架构,有多机多卡并行的大规模联合训练经验; 3、有大规模机器学习平台的架构设计经验,对平台高性能、高可用有着深入的研究; 4、对 Tensorflow & Pytorch 等开源模型框架有深入的研究和实践经验。有开源模型框架优化经验的优先; 5、熟悉各类常见的分布式AI框架如来自BOSS直聘DeepSpeed,Ray,Megatron,Colossal,Horovod等; 6、熟练掌握 GPT、T5、GLM 等算法训练范式来自BOSS直聘,有从0到1构建7B参数以上大模型经验优先; 7、对复杂系统编程有扎实的理解和认识,如多线程、内存、网络、IO、编译等。
技能解析
- 团队管理经验
- 团队管理
- 数据质量
- 技术发展
- 评估体系
- 编程语言
- 沟通能力和
- CET-4
- 德语读写能力
- 分析数据
- 数据科学
- 安全策略
- 紧密合作
- 沟通能力
- 管理经验
- 较好的英语
- 熟悉数据
- 大学英语四级
- 英语四级
- 模型训练
- 合作精神
- 隐私保护
- 改进方案
- 读写能力
- 数据安全
- 数据标注
- 编程基础
- 算法实现
- 团队合作精神
- 数据结构和算法
- 数据结构和算
- 团队合作
- 数据结构
- 培训和考核
- 质量管理
- 质量问题
- 基本原理
- 算法基础
- 熟悉机器学习
- 好的沟通
- 机器学习
- 深度学习
数据来自CSL职业科学研究室
技能解析
- CUDA
- 设计经验
- 训练方法
- 计算机视觉
- 自然语言
- 架构设计
- 熟悉PS
- 机器学习
- 深度学习
数据来自CSL职业科学研究室
公司福利
- 五险一金
- 补充医疗保险
- 定期体检
- 加班补助
- 全勤奖
- 年终奖
- 带薪年假
- 员工旅游
- 免费班车
- 餐补
- 通讯补贴
- 交通补助
- 包吃
- 节日福利
- 住房补贴
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。