职位&公司对比

招聘中

大模型开发专家

-K
北京某中型互联网OTO平台公司

职位详情

  • 上海
  • 1-3年
  • 硕士
  • Python
  • PyTorch
  • Word2vec
  • 自然语言处理项目经验
  • 有国际期刊/会议论文发表
  • 英文读写能力良好

工作职责: 开发GPT-3类千亿以上参数大规模预训练语言模型,复现ChatGPT,预训练多模态模型,应用于自动写作,自动摘要,信息检索,智能对话系统。 任职要求: 1.熟练掌握自然语言处理的算法和技术。熟直聘练应用GPT-3, BERT来自BOSS直聘, T5等预训练语言模型于下游任务,熟悉预训练技术,自监督学习,注意力机制,Tr直聘ansformer,多模态学习,RNN,Sequence2Sequence。 2. 有优秀的英文学术论文写作能力,在英文期刊和学术顶会ACL,EMNLP, AAAI, Neu来自BOSS直聘rIPS等上BOSS直聘发表过学术论文 3.有大规模GPU集群并行计算,分布式机器学习,Hadoop/Spark经验者优先。 4.精通常用数据结构和算法。 5.计算机、物理、数学等相关专业, 6.扎实的编码能力,精通Python语言开发, 熟悉Pytorch,Tensorflow,熟练使用linux下的C/C++ 7.对人工智能世界前沿研究和算法有很高的热情,渴望用人工智能技术解决商业世界的难题。

职位详情

  • 上海
  • 5-10年
  • 本科

工作职责 1. 与产品方业务人员、大模型建模人员合作,共同负责大模型应用的开发、优化、部署等直聘工程化工作。 2. 深入研究并推动大模型技术在公司内部多个业务场景中的应用落地,保障BOSS直聘技术能有效带来商业价值。 3. 参与系统架构设计,建设大模型应用平台,提升现有系统的稳定性。 4. 跟踪大模型在金融领域的发展趋势与落地实践,探索大模型技术如何改进业务效率。 任职要求 1. 熟练掌握 Java/Python/CPP 等编程语言,具来自BOSS直聘备良好的编码习惯与文档编写能力,具备扎实的计算机理论基础。 2. 熟悉 SpringBoot 等主流 Java 框架,深入理解 IO、多线程、异步机制等基本概念,能独立进行基本的性能优化。 3. 熟悉基本的大模型应用技术 Prompt Engineering,RkanzhunAG,Agent,SFT 等工作原理,熟练使用 LangChain,LlamaIndex 等大模型应用框架。 4. 熟悉常用 AI 开发工具,例如直聘:PyTorch、TensorFlow 等,基本的推理引擎,例如:vLLM,TensorRT-LLM 等。 5. 了解大模型的基本架构原理 Transform,SelfAttention 等,了解常见的推理优化方法,例如:PageAttention、Continuous Batching。 6. 具备良好的沟通能力与团队协作能力,能够跨部门合作推进项目。 7. 对技术创新保持热情,有 LLM 在金融领域的实际落地案例的优先。

技能解析

专有技能
  • 写作能力
  • C/C++
  • 常用数据结构
  • 机器学习
  • 数据结构和算法
  • 自然语言
  • 优秀的英文
  • 数据结构和算
  • 数据结构
  • 编码能力

    数据来自CSL职业科学研究室

    技能解析

    专有技能
    • 文档编写
    • 优化方法
    • 模型建模
    • 系统架构设计
    • 文档编写能力
    • 编程语言
    • 架构设计
    • 商业价值
    • 系统架构
    • 编码习惯
    • 金融领域
    • 理论基础
    • 技术创新
    • 与团队协作
    • 协作能力
    • 沟通能力
    • 开发工具
    • 团队协作
    • 性能优化
    • 团队协作能力
    • 好的沟通
    • 发展趋势

      数据来自CSL职业科学研究室

      工作时间

      上午09:00   -   下午06:00

      公司福利

      • 底薪加提成
      • 保底工资
      • 绩效奖金
      • 年终奖
      • 定期体检
      • 五险一金

      备注

      职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

      更新于 2025-05-14