职位&公司对比

招聘中
  • 互联网
  • D轮及以上

职位详情

  • 上海
  • 1-3年
  • 本科
  • Python
  • PyTorch
  • 数学/统计相关专业
  • 自然语言处理项目经验
  • 知识图谱相关经验
  • 知识图谱
  • 语言模型
  • 语义分析

经验要求: 1. 精通Bert模、GPT模型,了解最新的言模型kanzhun技术 2. 精通prompt tuning, instruct tuning等最新tuning技术、预训练技术 3. 精通pytorch、fastertranformer等 4. 有阅读理解、语句纠错、文章批改等直聘实战经验的尤佳 4. 有教育行业的经验尤佳

职位详情

  • 上海
  • 1-3年
  • 硕士
  • LLM
  • 多模态
  • 预训练
  • 微调
  • 对齐

工作职责: 1.负责大型语言模型(LLM)的训练和效果优化工作,包括但不限于预训练、微调、对齐、数据工程、模板工程、解码优化、O1等; 2.与数据工程、后端工程等其他团队密切合作,确保项目高质量落地; 3.探索跨模态的信息对齐方法,探索模态大模型的预训练、指令微调、 RLHF等技术,探索多模态的数据质量评估和清洗kanzhun方法; 4.跟踪多模态大模型的前沿探索,将研究成果转化为可落地的产品,推动模型效果达到业界领先水平。 任职资格: 1.计算机科学、信号处理、数学、软件工程、电子与通信、自动化或相关领域硕士及以上学历,有1年以上大模型相关研究或开发经验,对于个别具备较强NLP/NN技术能力的应聘者不受专业限制; 2.对NLP主流预训练语言模型(如BERT、GPT、T5、PaLM、GLM、Bloom、LLaMA等)有深入了解; 3.熟悉BLIP2、LLaVA、MiniGPT、VisualGLM、Qwen-VL等LMM模型结构及训练方法; 4.熟练掌握Python、C++等至少一种编程语言,熟悉Linux下的编程开发环境,以及数据结构和常见算法; 5.熟悉深度学习框架TensorF来自BOSS直聘low或PyTorch,具有使用Megatron-LM、Deepspeed等大模型训练框架的经验者优先; 6.具备深度学习、强来自BOSS直聘化学习、知识图谱等方面的研究经验和基础; 7.熟练掌握Linux基础命令和操作,能够独立完成集群运行环境的搭建; 8.具有良好的学习能来自BOSS直聘力、沟通能力、团队协作精神和责任心。

技能解析

专有技能
  • 阅读理解

    数据来自CSL职业科学研究室

    技能解析

    专有技能
    • 深度学习框架
    • 训练框架
    • 团队协作精
    • 密切合作
    • 研究成果
    • 数据质量
    • 深度学习
    • 编程语言
    • 软件工程
    • 知识图谱
    • 信号处理
    • 数据结构
    • 训练方法
    • 沟通能力
    • 团队协作精神
    • 协作精神
    • 团队协作
    • 开发经验
    • 模型训练
    • 学习能力
    • 编程开发
    • 开发环境

      数据来自CSL职业科学研究室

      工作时间

      上午09:30   -   下午06:30
      双休弹性工作

      工作时间

      上午09:00   -   下午06:00
      双休弹性工作

      公司福利

      • 生日福利
      • 节日福利
      • 团建聚餐
      • 零食下午茶
      • 员工旅游
      • 带薪年假
      • 保底工资
      • 年终奖
      • 定期体检
      • 补充医疗保险
      • 五险一金

      公司福利

      • 五险一金
      • 补充医疗保险
      • 定期体检
      • 加班补助
      更新于 2025-05-01