职位&公司对比

招聘中

大模型算法-nlp(AI agent)-北上杭

-K·薪
某大型互联网公司

职位详情

  • 北京
  • 不限
  • 本科
  • pd分离
  • vLLM/sglang

职位描述来自BOSS直聘: 优化大模型推理性能,降低推理时延,提升吞吐,降低LLM模型推理成本。 职位要求: 1. 熟悉来自BOSS直聘transformer,llama,deepseek等主流模型结构。 2. 熟悉LLM主流推理引擎(如vLLM/sglang),熟悉常见推理优化技术,如MLA、FlashAtention、PageAtten直聘tion、Continuous Batching、Speculative Decoding等。 3.具有AI模型推理优化经验,熟悉常见加速技术,如剪枝、量化、分布式推理等,能够根据不同场景和硬件平台进行针对性的优化。 4.熟悉GPU硬件结构,有CUBOSS直聘DA/Cutlass开直聘发优化经验者优先。

职位详情

  • 北京
  • 不限
  • 本科
  • AI agent
  • 智能客服

工作职责: 1. 参与基础大语言模型应用研发; 2. 结合机器学习、强化学习等技术优化基础大语言模型 3. 调研并探索SFT/RLHF方向前沿算法、框架,持续提升现有算法的效率与效果。直聘 任职资格: 1. 有计算机科学、数学、统计学或相关领域的硕士或博士学位; 2. 熟悉Python与深度学习框架,具有良好的编程能力和扎实的数学理论基础; 3来自BOSS直聘. 关注行业前沿进展,对技术开发及应用有热情,有自己的想法并乐于挑战自我; 4. 良好的沟通能力,跨团队协作能力,具备出色的规划、执行力,强烈的责任感,以及优秀的学习能力和自我驱动力; 加分项 1. 有相关领域的开BOSS直聘源项目、竞赛获奖、kanzhun顶会论文发表/在投; 2. 熟悉LangChain、Deep来自BOSS直聘Speed等LLM开源工具,工程能力较强;

技能解析

专有技能
  • CUDA
  • 优化技术

    数据来自CSL职业科学研究室

    技能解析

    专有技能
    • 深度学习框架
    • 深度学习
    • 编程能力
    • 工程能力
    • 理论基础
    • 论文发表
    • 协作能力
    • 学习能力和
    • 机器学习
    • 沟通能力
    • 技术开发
    • 团队协作
    • 团队协作能力
    • 好的沟通
    • 学习能力

      数据来自CSL职业科学研究室

      工作时间

      上午10:00   -   下午07:00
      双休弹性工作

      公司福利

      • 交通补助
      • 节日福利
      • 有无线网
      • 团建聚餐
      • 零食下午茶
      • 餐补
      • 员工旅游
      • 带薪年假
      • 工龄奖
      • 法定节假日三薪
      • 节假日加班费
      • 夜班补助
      • 股票期权
      • 保底工资
      • 绩效奖金
      • 年终奖
      • 定期体检
      • 意外险
      • 补充医疗保险
      • 五险一金

      公司福利

      • 交通补助
      • 节日福利
      • 高温补贴
      • 团建聚餐
      • 加班补助
      • 绩效奖金
      • 五险一金

      备注

      职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

      更新于 2025-05-14