「职位对比」PPIO 推理引擎资深工程师/专家（北京/上海）怎么样

推理引擎资深工程师/专家（北京/上海）

立即沟通

PPIO

更换职位

大模型应用开发专家P6-7_工程效率

立即沟通

某大型互联网OTO平台上市公司

更换职位

招聘中

职位详情

北京
不限
本科

pd分离
vLLM/sglang

职位描述：优化大模型推理性能，降低推理时延，提升吞吐，降低LLM模型推理成本。职位要求： 1. 熟悉transformer，llama，deepseek等主流模型结构。 2. 熟悉LLM主流推理引擎（如vLLM/sglangBOSS直聘），熟boss悉常见推理优化技术，如MLA、FlashAtention、PageAttention、Continuous Batching、SpeculativBOSS直聘e Decoding等。 3.具有AI模型推理优化经验，熟悉常见加速技术，如剪枝、量化、分布式推理等，能够根据不同场景和硬件平来自BOSS直聘台进行针对性的优化。 4.熟悉GPU硬来自BOSS直聘件结构，有CUDA/Cutlass开发优化经验者优先。

职位详情

北京
3-5年
本科

精通Transformer
RAG系统构建案例
Python/Go/Java
LoRA/P-tuning实战

（工程效率）-信息工程开发我们正在构建下一代智能编码体系，通过大模型重构软件工程范式。诚邀AI原生开发者加入，共同探索""AI+Engineering""的无人区。岗位使命：运用大模型技术重塑软件工程全流程，打造AI深度参与的智能研发体系，在代码生成、架构设计、系统优化等环节实现突破性创新。你将主导：大模型工程化落地; 基于LLM构建智能编码系统，实现需求分析→代码生成→测试验证的闭环赋能; 开发面向研发场景的领域大模型，构建代码知识图谱与Prompt工程体系; 探索AI结对编程、自主调试等前沿模式，突破传统研发效率边界；智能boss编码范式革新；利用Code Llama、GPT-En直聘gineer、Windsurf、cursor等工具重构研发流程，建立AI优先的工程方法论；构建自动化效能提升方案，实现代码生成准确率>65%的核心指标；创建智能编码最佳实践指南，驱动团队AI能力升级。职位描述：我们期待你： 1、大模型深度实践者；精通Transformer架构，具有LoRA/P-tuning等模型优化实战经验；熟悉LangChain、LlamaIndex等AI工程化框架，有RAkanzhunG系统构建案例；掌握Prompt Engineering高阶技巧，能设计结构化提示词工程； 2、工程化创新专家： 3-5年互联网架构经验，精通Python/Go/Java中至少两boss门语言，具备开发工具链建设来自BOSS直聘经验； 3、AI原生开发者：日均使用Copilot等工具编写300+行有效代码；具有代码自动生成、测试用例智能编写等落地项目经验。

技能解析

专有技能

CUDA
优化技术

数据来自CSL职业科学研究室

技能解析

专有技能

工程开发
系统优化
测试用例
开发工具
需求分析
软件工程
架构设计
知识图谱

数据来自CSL职业科学研究室

工作时间

上午10:00 - 下午07:00

双休、弹性工作

公司福利

交通补助
节日福利
有无线网
团建聚餐
零食下午茶
餐补
员工旅游
带薪年假
工龄奖
法定节假日三薪
节假日加班费
夜班补助
股票期权
保底工资
绩效奖金
年终奖
定期体检
意外险
补充医疗保险
五险一金

公司福利

五险一金
补充医疗保险
定期体检
年终奖
股票期权
带薪年假
员工旅游
免费班车
餐补
交通补助
节日福利

备注

职位发布者未明确表明公司信息，具体可咨询职位发布人进行确认。

职位&公司对比

推理引擎资深工程师/专家 （北京/上海）

大模型应用开发专家P6-7_工程效率

推理引擎资深工程师/专家 （北京/上海）

大模型应用开发专家P6-7_工程效率

职位详情

职位详情

技能解析

技能解析

工作时间

公司福利

公司福利

推理引擎资深工程师/专家（北京/上海）

推理引擎资深工程师/专家（北京/上海）