职位&公司对比

招聘中

解决方案专家

-K
某中型半导体/芯片公司

职位详情

  • 北京
  • 不限
  • 本科
  • pd分离
  • vLLM/sglang

职位描述: 优化大模型推理性能,降低推理时延,提升吞吐,降低LLM模型推理成本。 职位要求: 1. 熟悉transformer,llama,deepseek等主流模型结构。 2. 熟悉LLM主流推理直聘引擎(如vLBOSS直聘LM/sglang),熟悉常见推理优化技术,如MLA、FlashAtention、PageAttentionContinuous Batching、Speckanzhunulative Decoding等。 3.具有AI模型推理优化经验,熟悉常见加速技术,如剪枝、量化、分布式推理等,能够根据不同场景和硬件平台进行针对性的优化。 4.熟悉GPU硬件结构,有CUDA/Cutlass开发优化经验者优先。

职位详情

  • 北京
  • 5-10年
  • 本科
  • 集群管理
  • AI 大模型

工作职责 岗位职责: 1. 负责智算中心 GPU集群硬件设BOSS直聘备交付实施以及全周期运维; 2. 负责智算中心硬件售后支持工作。 3. 负责客户 AI、算法以及软件侧应用与芯片适配问题解决与支持。 4. 负责客户侧硬件、软件问题导入以驱动产品迭代。 任职资格 任职要求: 1. 熟悉数据中心机房建设、网络建设、供电冷却、服务器上架等工程问题解决。 2. 熟悉服务器硬件以及复杂网络组网常见问解决。 3. 熟悉服务器软件运维管理以及系统问题排查定位。 4. 熟悉应用层软件(如 AI 训练/推)和硬件适配问来自BOSS直聘题以及部分性能问题排查和定位。 加分项: 1. 有智算芯片技术支持、智算项目交付落地经验。 2. 有虚拟化、K8S集群管理和调度经验。 3. 有大型IDC集群建设和IDC网络规划经验。 5. A直聘I 大模型搭建和应用经验

技能解析

专有技能
  • CUDA
  • 优化技术

    数据来自CSL职业科学研究室

    技能解析

    专有技能
    • 售后支持
    • 运维管理
    • 熟悉数据
    • 支持工作
    • 网络建设
    • 性能问题
    • 问题解决

      数据来自CSL职业科学研究室

      工作时间

      上午10:00   -   下午07:00
      双休弹性工作

      公司福利

      • 交通补助
      • 节日福利
      • 有无线网
      • 团建聚餐
      • 零食下午茶
      • 餐补
      • 员工旅游
      • 带薪年假
      • 工龄奖
      • 法定节假日三薪
      • 节假日加班费
      • 夜班补助
      • 股票期权
      • 保底工资
      • 绩效奖金
      • 年终奖
      • 定期体检
      • 意外险
      • 补充医疗保险
      • 五险一金

      公司福利

      • 定期体检
      • 加班补助
      • 年终奖
      • 股票期权
      • 带薪年假
      • 免费班车
      • 交通补助
      • 生日福利
      • 团建聚餐
      • 零食下午茶
      • 餐补

      备注

      职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

      更新于 2025-05-14