「职位对比」PerfXLab澎峰高性能计算工程师怎么样

高性能计算工程师

立即沟通

PerfXLab澎峰

更换职位

推理引擎leader

立即沟通

某大型人力资源服务公司

更换职位

招聘中

职位详情

北京
3-5年
本科

C/C++
C++
C
Linux
服务器开发

工作地点：北京、长沙、青boss岛职位类型：全职，兼职高性能计算工程师岗位职责： BOSS直聘参与研发嵌入式AI框架和底层计算库，贡献我们领导的开源项目InferXLite（轻量级深度学习推理框架）任职要求： 1. 计算机相关专业，具有性能优化或高性能计算经验 2. C或者C++基boss础扎实，具有三年以上经验 3. 有GPU等异构计算BOSS直聘经验（加分） 4. 对底层技术了解或者有兴趣（加分） 5. 熟悉github，有boss参与开源项目经验（加分）

职位详情

北京
5-10年
本科

推理引擎

岗位职责 1、主导AI模型推理引擎的架构设计与核心模块开发，优化LLM、CV等模型的低延迟、高吞吐推理性能； 2、深入硬件层（GPU/TPU/端侧芯片）进行算子和计算图优化，实现模型编译、量化压缩、动态批处理等关键技术； 3、探索大模型推理前沿技术（如 speculative decoding、continuous batching、vLLM优化等）； 4、建立推理服务的监控、诊断与调优体系，实现端到kanzhun端性能瓶颈分析。任职要求技术能力 1、5年以直聘上推理引擎/高性能计算开发经验，熟悉主流推理框架（TensorRT、Triton、ONNX Runtime等）； 2、精通C++kanzhunkanzhun/Python，具备CUDA/OpenCL等GPU编程能力，有算子优化实战案例； 3、深入理解计算机体系结构，熟悉模型编译技术（MLIR、TVM等），掌握性能分析工具（Nsight、perf）； 4、熟悉模型量化（INT8/FP16）、剪枝、蒸馏等压缩技术，具备端-云协同推理经验者优先；加分项：参与过LLM推理优化（如KV Cache优化、PagedAttention）、熟悉MoE架构kanzhun或AIGC场景。

技能解析

专有技能

深度学习
性能优化
基础扎实

数据来自CSL职业科学研究室

技能解析

专有技能

CUDA
性能分析
模块开发
分析工具
开发经验
关键技术
架构设计
编程能力
性能分析工具

数据来自CSL职业科学研究室

工作时间

上午09:00 - 下午06:30

双休、弹性工作

公司福利

加班补助
年终奖
股票期权
员工旅游
餐补
交通补助
节日福利
零食下午茶

备注

职位发布者未明确表明公司信息，具体可咨询职位发布人进行确认。

职位&公司对比

高性能计算工程师

推理引擎leader

高性能计算工程师

推理引擎leader

职位详情

职位详情

技能解析

技能解析

工作时间

公司福利