职位&公司对比
职位详情
- 北京
- 不限
- 本科
- pd分离
- vLLM/sglang
职位描述: 来自BOSS直聘优化大模型推理性能,降低推理时延,提升吞吐,降低LLM模型推理直聘成本。 职位要求: 来自BOSS直聘 1. 熟悉transformer,llama,deepseek等主流模型结构。 2. 熟悉LLM主流推理引擎(如vLLM/sglang),熟悉常见推理优化技术,如MLA、FlashAtention、PageAttention、Cobossntinuous Batchbossing、Speculative Decoding等。 3.具有AI模型推理优化经验,熟悉常见加速技术,如剪枝、量化、分布式推理等,能够根据不同场景和硬件平台进行针对性的优化。 4.熟悉GPU硬件结构,有CUDA/Cutlass开发优化经验者优先。
职位详情
- 北京
- 5-10年
- 本科
职位描述 1、研发行业领先且实用的AIGC视觉生成大模型技术,包括AIGC视觉生成大模型、文生图、图生图、保ID的可控编辑、图文/视频多模态理解及生成技术落地; 2、构建完整的AIGC视觉生成系统链路,推动在快手创作/消费/搜索/商业化/AI生产工具等场景的规模应用,实现AIGC关键技术突破、极致打磨效果体验,在各业务场来自BOSS直聘景创作用户价值; 3、负责AIGC技术及产品效果创新,持续打造业界的技术口碑及影响力。 任职要求 1、在计算机视觉、kanzhun多模态一个或多个领域的来自BOSS直聘研究和实践经验,包括但不限于以下方向:视觉生成(如文生图、图生图、图像/视频生成与编辑)、多模态GPT、Diffusion模型、大规模训练、RLHF; 2、有通用图像视频生成模型、大语言模型、AIGC创新产品实战落地经验者优先; 3、顶会/期刊论文者优先,如CVPR/ECCV/ICCV/NeurIPS/ICLR/SIGGRAPH、PAMI/IJCV等,在重要算法比赛中取得过优秀名次的候选人优先;扎实的编程功底,熟悉 PyTorch 等主流深度学习框架,熟练使用 C++/ Python编程、Linux 开发环境; boss4、对技术前沿有浓厚兴趣,善于利用各类技术解决复杂实际问题,强烈的自驱力,良好沟通表达及的团队协作能力。
技能解析
- CUDA
- 优化技术
数据来自CSL职业科学研究室
技能解析
- 深度学习框架
- 良好沟通
- 协作能力
- 计算机视觉
- 团队协作
- 深度学习
- 团队协作能力
- 关键技术
- 开发环境
- 沟通表达
数据来自CSL职业科学研究室
工作时间
公司福利
- 交通补助
- 节日福利
- 有无线网
- 团建聚餐
- 零食下午茶
- 餐补
- 员工旅游
- 带薪年假
- 工龄奖
- 法定节假日三薪
- 节假日加班费
- 夜班补助
- 股票期权
- 保底工资
- 绩效奖金
- 年终奖
- 定期体检
- 意外险
- 补充医疗保险
- 五险一金
公司福利
- 五险一金
- 补充医疗保险
- 定期体检
- 年终奖
- 股票期权
- 带薪年假
- 节日福利
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。