职位&公司对比

招聘中
某大型社交网络与媒体上市公司

职位详情

  • 北京
  • 不限
  • 本科
  • pd分离
  • vLLM/sglang

职位描述: 来自BOSS直聘优化大模型推理性能,降低推理时延,提升吞吐,降低LLM模型推理直聘成本。 职位要求: 来自BOSS直聘 1. 熟悉transformer,llama,deepseek等主流模型结构。 2. 熟悉LLM主流推理引擎(如vLLM/sglang),熟悉常见推理优化技术,如MLA、FlashAtention、PageAttention、Cobossntinuous Batchbossing、Speculative Decoding等。 3.具有AI模型推理优化经验,熟悉常见加速技术,如剪枝、量化、分布式推理等,能够根据不同场景和硬件平台进行针对性的优化。 4.熟悉GPU硬件结构,有CUDA/Cutlass开发优化经验者优先。

职位详情

  • 北京
  • 5-10年
  • 本科

职位描述 1、研发行业领先且实用的AIGC视觉生成大模型技术,包括AIGC视觉生成大模型、文生图、图生图、保ID的可控编辑、图文/视频多模态理解及生成技术落地; 2、构建完整的AIGC视觉生成系统链路,推动在快手创作/消费/搜索/商业化/AI生产工具等场景的规模应用,实现AIGC关键技术突破、极致打磨效果体验,在各业务场来自BOSS直聘景创作用户价值; 3、负责AIGC技术及产品效果创新,持续打造业界的技术口碑及影响力。 任职要求 1、在计算机视觉、kanzhun多模态一个或多个领域的来自BOSS直聘研究和实践经验,包括但不限于以下方向:视觉生成(如文生图、图生图、图像/视频生成与编辑)、多模态GPT、Diffusion模型、大规模训练、RLHF; 2、有通用图像视频生成模型、大语言模型、AIGC创新产品实战落地经验者优先; 3、顶会/期刊论文者优先,如CVPR/ECCV/ICCV/NeurIPS/ICLR/SIGGRAPH、PAMI/IJCV等,在重要算法比赛中取得过优秀名次的候选人优先;扎实的编程功底,熟悉 PyTorch 等主流深度学习框架,熟练使用 C++/ Python编程、Linux 开发环境; boss4、对技术前沿有浓厚兴趣,善于利用各类技术解决复杂实际问题,强烈的自驱力,良好沟通表达及的团队协作能力。

技能解析

专有技能
  • CUDA
  • 优化技术

    数据来自CSL职业科学研究室

    技能解析

    专有技能
    • 深度学习框架
    • 良好沟通
    • 协作能力
    • 计算机视觉
    • 团队协作
    • 深度学习
    • 团队协作能力
    • 关键技术
    • 开发环境
    • 沟通表达

      数据来自CSL职业科学研究室

      工作时间

      上午10:00   -   下午07:00
      双休弹性工作

      公司福利

      • 交通补助
      • 节日福利
      • 有无线网
      • 团建聚餐
      • 零食下午茶
      • 餐补
      • 员工旅游
      • 带薪年假
      • 工龄奖
      • 法定节假日三薪
      • 节假日加班费
      • 夜班补助
      • 股票期权
      • 保底工资
      • 绩效奖金
      • 年终奖
      • 定期体检
      • 意外险
      • 补充医疗保险
      • 五险一金

      公司福利

      • 五险一金
      • 补充医疗保险
      • 定期体检
      • 年终奖
      • 股票期权
      • 带薪年假
      • 节日福利

      备注

      职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

      更新于 2025-05-14