「职位对比」PPIO 推理引擎资深工程师/专家（北京/上海）怎么样

推理引擎资深工程师/专家（北京/上海）

立即沟通

PPIO

更换职位

大模型算法（对话）

立即沟通

某大型知名互联网上市公司

更换职位

招聘中

职位详情

北京
不限
本科

pd分离
vLLM/sglang

职位描述：优化大模型推理性能，降boss低推理时延，提升吞吐，降低LLM模型推理成本。职位要求： 1. 熟悉transformer，llama，deepseek等主流模型结构。 2. 熟悉LLbossM主流推理引擎（如vLLM/sglang），熟悉常见推理优化技术，如MLA、Flas直聘hAtention、PageAttention、Continuou来自BOSS直聘s Batching、Speculative Decoding等。 3.具有AI模型推理优化经验，熟悉常见加速技术，如剪枝、量化、分布式推理等，能够根据不同场景和硬件平台进行针对性的优化。 4.熟悉GPU硬件结构，有CUDA/Cutlass开发优化经验者优先。

职位详情

北京
3-5年
硕士

大模型算法
对话机器人
智能客服

岗位职责包括但不限于： 1. 负责基于通用基座大模型结合领域数据构建云计算服务领域大模型，包括大模型落地业务场景识别、数据清洗/构造，LLM训练和调优，搜索增强RAG，LLMkanzhun Ag直聘ents等LLM关键技术方向攻坚 2. 探索基于大模型技术的服务新形态，包括多个场景的大模型对话机器人，ChatUI服务形态升级，智能辅助Copilot等云计算服务新形态场景的大模型落地技术，打造云计算服务领域“大模型落地”的标杆 3. 深入公司服务内外部业务场景，结合大模型技术、搜索推荐、多模态等算法模型能力解决云服务领域实际业务痛点，并参与规划和设计未来云直聘服务领域的大模型技术演进规划和落地任职要求 1、计算机科学、软件工程、数学、统计学等相关专业，硕士及以上学历 2、具备独立的从业务需求到算法工程转化和落地能力，在自然语言理解NLU/自然语言生成NLG、对话机器人、搜索推荐、知识图谱等一个或多个领域有大规模场景落地经验 3、在大模型LLM相关技术方向有实战经验者优先，比如LLM训练和优化、搜索增强生成RAG、大模型推理以及大模型评估等一个或多个方向有实际经验 3、熟悉掌握Python/Java/C++中至少一门语言，有大型系统的算法模型开发和优化经验，熟练掌握至少一种深度学习框架（PyTorch、TensorFlow、Caffe等） 4、有顶级会议、顶级期刊上发表学术论文，有相关算法比赛（Kaggle等）获奖经验的同学优先

技能解析

专有技能

CUDA
优化技术

数据来自CSL职业科学研究室

技能解析

专有技能

开发和优化
深度学习框架
算法工程
自然语言
深度学习
关键技术
软件工程
算法模型
知识图谱
相关算法
数据清洗

数据来自CSL职业科学研究室

工作时间

上午10:00 - 下午07:00

双休、弹性工作

公司福利

交通补助
节日福利
有无线网
团建聚餐
零食下午茶
餐补
员工旅游
带薪年假
工龄奖
法定节假日三薪
节假日加班费
夜班补助
股票期权
保底工资
绩效奖金
年终奖
定期体检
意外险
补充医疗保险
五险一金

公司福利

五险一金
补充医疗保险
年终奖
股票期权
员工旅游
免费班车
餐补
交通补助
节日福利
零食下午茶

备注

职位发布者未明确表明公司信息，具体可咨询职位发布人进行确认。

职位&公司对比

推理引擎资深工程师/专家 （北京/上海）

大模型算法（对话）

推理引擎资深工程师/专家 （北京/上海）

大模型算法（对话）

职位详情

职位详情

技能解析

技能解析

工作时间

公司福利

公司福利

推理引擎资深工程师/专家（北京/上海）

推理引擎资深工程师/专家（北京/上海）