各大行业职位任你选
首次验证通过即注册BOSS直聘账号职位描述
- pd分离
- vLLM/sglang
优化大模型推理性能,降低推理时延,提升吞吐,降低LLM模型推理成本。
职位要求:
1. 熟悉transformer,llama,deepseek等主流模型结构。
2. 熟悉LLM主流推理引擎(如vLLM/sglang),熟悉常见推理优化技术,如MLA、FlashAtention、PageAttention、Continuous Batching、Speculative Decoding等。
3.具有AI模型推理优化经验,熟悉常见加速技术,如剪枝、量化、分布式推理等,能够根据不同场景和硬件平台进行针对性的优化。
4.熟悉GPU硬件结构,有CUDA/Cutlass开发优化经验者优先。

田女士 3日内活跃
竞争力分析


BOSS 安全提示
BOSS直聘严禁用人单位和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等,您一旦发现此类行为, 请立即举报
了解更多职场安全防范知识公司介绍
2019 年,PPIO 派欧云推出了“派欧边缘云”产品,开创性地采用去中心化的商业模式,整合分散在全球不同地点的计算资源,结合行业领先的分布式计算和边缘云原生技术,在网络边缘侧基础设施建构了覆盖全球的高质量边缘云计算服务网络,实现了与传统中心云的智能兼容和协同。目前,PPIO 已在全球 1500 多个城市及地区部署了 4000 多个算力节点,为客户提供低时延、广覆盖、高性价比的边缘计算与边缘渲染服务。凭借卓越的技术实力和服务能力,派欧边缘云已成为多家互联网巨头、一线云计算服务商、独角兽公司在边缘云服务领域的首选合作伙伴。根据全球主流分析机构 IDC 的权威报告,PPIO 作为唯一的分布式计算创业公司,跻身边缘公有云服务行业前 10。
2023 年,PPIO派欧云推出了全新的 AI 基础设施产品“派欧算力云”,依托行业领先的分布式计算、云原生、推理加速等创新技术,汇集模型 API 服务、GPU 容器服务等产品,释放推理计算潜能,为不同发展阶段的企业、开发者和研究者提供高性价比、弹性、易用的一站式 AI 云服务,助力客户摆脱搭建及运维服务器和调用大模型能力的繁琐,无需精通机器学习即可专注于构建下一代 AIGC 产品,聚焦应用创新与业务增长,为全球智能技术发展注入全新动力。
PPIO 派欧云已在上海、北京、深圳、西安、武汉等地设立多个办公室,汇聚了众多来自微软、谷歌、华为、腾讯、阿里巴巴、百度等知名高科技公司的顶尖技术专家,通过不断优化和扩展产品与服务能力,助力下一个智能时代加速到来。
工商信息
- 公司名称派欧云计算(上海)有限公司
- 法定代表人王闻宇
- 成立日期2018-05-22
- 企业类型有限责任公司(自然人投资或控股)
- 经营状态存续
- 注册资金1000万人民币
工作地址
点击查看地图
精选职位
页面更新时间:2025-04-25