职位&公司对比
职位详情
- 北京
- 3-5年
- 本科
岗位职责 1、主导AI模型推理引擎的架构设计与核心模块开发,优化LLM、CV等模型的低延迟、高吞吐推理性能; 2、深入硬件层(GPU/TPU/端侧芯片)进行算子和计算图优化,实现模型编译、量化压缩、动态批处理等关键技术; BOSS直聘3、探索大模型推理前沿技术(如 speculative decoding、continuous batching、vLLM优化等); 4、建立推理服务的监控、诊断与调优体系,实现端到端性能瓶颈分析。 任职要求 技术能力 1、3年以上推理引擎/高性能计算开发经验,熟kanzhun悉主流推理框架(TensorRT、Triton、ONNX Runtime等); 2、精通C++/Python,具备CUDA/OpenCL等GPU编程能力,有算子优化实战案例; 3来自BOSS直聘、深入理解计算机体系结构,熟悉模型编译技术(BOSS直聘MLIR、TVM等),掌握性能分析工具(Nsight、perf); 4、熟悉模型量化(INT8/FP16)、剪枝、蒸馏等压缩技术,具备端-云协同推boss理经验者优先; 加分项:参与过LLM推理优化(如KV Cache优化、PagedAttention)、熟悉MoE架构或AIGC场景。
职位详情
- 北京
- 5-10年
- 本科
岗位职责 1、与业务、产品、算法高效配合,参与业务的关键决策和讨论,达成业务的关键目标; 2、设计高性能的系统架构,关注行业先进的解决方案,不断提升系统性能,满足算法在未来多国条件下的性能诉求; 3、确保系统有极好的业务扩展性,快速适配未来不同国家本地化的调度策略; 4、保障调度系boss统稳定性,设计全面的监控策略和容灾体系; 岗位基本要求 1、具备长线规划调度系统工程架构的能力,能够在面对未来多国复杂配送环境(如多种载具类型、不同路况和订单分布等)时,设计出兼具高性能与高扩展性的系统解决方案; BOSS直聘2、能够为调度算法策略提供有效输入,以业务结果为导向,在调度策略解空间与工程性能之间做好平衡,并提升算法代码的性能与稳定性; 3、在即时配送或打车领域有调度分单系统的丰富经验,能够有效应对复杂业务场景; 4、拥有创业精神,不自设边界,具备快速学习能力,并能够广泛支撑业务需求; 具备以下条件优先 有国际化系统建设经验、有较好的英语水平,能够作为工直聘作语言交流
技能解析
- CUDA
- 性能分析
- 模块开发
- 分析工具
- 开发经验
- 关键技术
- 架构设计
- 编程能力
- 性能分析工具
数据来自CSL职业科学研究室
技能解析
- 系统建设
- 解决方案
- 系统性能
- 较好的英语
- 系统稳定性
- 快速学习能力
- 学习能力
- 系统架构
- 英语水平
- 语言交流
- 提升系统
数据来自CSL职业科学研究室
公司福利
- 五险一金
- 补充医疗保险
- 定期体检
- 年终奖
- 股票期权
- 带薪年假
- 员工旅游
- 免费班车
- 餐补
- 交通补助
- 节日福利
公司福利
- 生日福利
- 节日福利
- 免费工装
- 团建聚餐
- 零食下午茶
- 包吃
- 带薪年假
- 股票期权
- 年终奖
- 定期体检
- 意外险
- 补充医疗保险
- 五险一金
- 提供三餐
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。