职位&公司对比

招聘中

大模型算法工程师

-K·薪
某大型互联网上市公司

职位详情

  • 上海
  • 1-3年
  • 硕士
  • Python
  • PyTorch
  • Word2vec
  • 自然语言处理项目经验
  • 有国际期刊/会议论文发表
  • 英文读写能力良好

工作职责: 开发GPT-3类千亿以上参数大规模预训练语言模型,复现ChatGPT,预训练多模态模型,应用于自动写作,自动摘要,信息检索,智能对话系统。 任职要求: 1.熟练掌握自然语言处理的算法和技术。熟练应用GPT-3, BERT, T5等预训练BOSS直聘语言模型于BOSS直聘下游任务,熟悉预训练技术,自监督学习,注意力机制,Transformer,多模态学习,RNN,Sequence2Sequence。 2. 有优秀的英文学术论文写作能力,在英文期和学术顶会ACL,EMNLP, AAAI, NeurIPS等上发表过学术论文 3.有大规模GPU集群并行计算,分布式机器学习,Hadoop/Spark经验者优先。 4.精通常用数据结构和算法。 5.计算机、物理、数学等相关专业, 6.扎实的编码能力,精通Python语言开发, 熟悉Pytorch,Tensorflow,熟练使用linux下的C/C++ 7.对人工智能世界前沿研究和算法来自BOSS直聘有很高的热情,渴望用人工智能技术解决商业世界的boss难题。

职位详情

  • 上海
  • 5-10年
  • 本科
  • 大模型

岗位职责: 1、负责大模型训练研发。构建训练数据集,运用SFT、RLHF等技术对大模型进行微调,满足大模型领域场景落地需求; 2、负责大模型推理优化。运用prompt工程、模型蒸馏、推理加速、超长上下文等技术,优化大模型性能,提升大模型落地成效; 3、负责大模型安全研究。降低大模型输出幻觉,提高大模型安全性及稳定性,解决大模型可控可信度不足问题; 4、参与大模型产品化落地,提供大模型产品化、公有云和私有云落地方案。 任职资格: 1、计算机、人工智能等专业,硕士及以上学历,具备5年以上算法工作验; 2、熟练掌主流大模型,包括不限于GPT-series、LLaMA、GLM等预训来自BOSS直聘练模型; 3、精通大模型微调、自监督学习来自BOSS直聘、注意力机制、Transformer、多模态学习、模型蒸馏、推理加速等技术; 4、精通Python/C++等编程语言,熟练掌握Pytorch/Tensorflow等深度学习框架、Deepspeed/Megatron等分布式训练框架; 5、具备优秀的分析问题和解决问题能力,勇于挑战困难问题; 6、具备良好的团队协作和沟通能力,能够带领团队达成大模型目标任务; 7、具备超大规模(集群千卡+/大模型100B+)训练、调优经验者优先; 8、在英文来自BOSS直聘期刊和学术顶会上发表过学术论文者优先。

技能解析

专有技能
  • 写作能力
  • C/C++
  • 常用数据结构
  • 机器学习
  • 数据结构和算法
  • 自然语言
  • 优秀的英文
  • 数据结构和算
  • 数据结构
  • 编码能力

    数据来自CSL职业科学研究室

    技能解析

    专有技能
    • 深度学习框架
    • 训练框架
    • 深度学习
    • 编程语言
    • 解决问题
    • 良好的团队协
    • 带领团队
    • 优秀的分析
    • 分析问题
    • 沟通能力
    • 团队协作
    • 模型训练
    • 人工智能等
    • 解决问题能力

      数据来自CSL职业科学研究室

      工作时间

      上午09:00   -   下午06:00

      公司福利

      • 底薪加提成
      • 保底工资
      • 绩效奖金
      • 年终奖
      • 定期体检
      • 五险一金

      公司福利

      • 五险一金
      • 补充医疗保险
      • 年终奖
      • 股票期权
      • 员工旅游
      • 免费班车
      • 餐补
      • 交通补助
      • 节日福利
      • 零食下午茶

      备注

      职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

      更新于 2025-05-09