职位&公司对比
职位详情
- 北京
- 3-5年
- 本科
岗位职责 1、主导AI模型推理引擎的架构设计与核心模块开发,优化LLM、CV等模型的低延迟、高吞来自BOSS直聘吐推理性能; 2、深入硬件层(GPU/TPU/端侧芯片)进行算子和计算图来自BOSS直聘优化,实现模型编译、量化压缩、动态批处理等关键技术; 3、探索大模型推理前沿技术(如 speculative decoding、continuous batching、vLLM直聘优化等); 4、建立推理服务的监控、诊断与调优体系,实现端到端性能瓶颈分析。 任职要求 技术能力 1、3年以上推理引擎/高性能计算开发经验,熟悉主流推理框架(TensorRT、Triton、ONNX Runtime等); 2、精通C++/Python,具备CUDA/OpenCL等GPU编程能力,有算子优化实战案例; 3、深入理解计算机体系结构,熟悉模型编译技术(MLIR、TVM等),掌握性能分析工具(Nsight、perf); 4、熟悉模型量化(INT8/FP16)、剪枝、蒸馏等压缩技术,BOSS直聘具备端-云协同推理经验者优先; 加分项:参与过LLM推理优化(如KV Cache优化、PagedAttention)、熟悉MoE架构或AIGC场景。
职位详情
- 北京
- 10年以上
- 本科
- Java
- Golang
- Node.js
- 计算机相关专业
- 后端开发经验
要求:核心电商背景 工作职责 1.为基于 AWS的先进电子商务平台kanzhun开发高质量、可扩展且可靠的服务端解决方案 2.使用最新的开源和云技术kanzhun创建解决方案,例如 Java、Go、Node.js、AWS ECS、Lambda、Aurora 和 CloudFormation 3.负责大规模工程项目从开始到交付的全流程,包括细化需求、设计、编码、测试到部署和运营 4.运用工程最佳实践,并不断改进团队流程以提高效率 5.在高速发展的初创企业环境中工作,采用敏捷开发,快速BOSS直聘有效地完成工作任务 任职要求 1.10 年以上的服务端开发经验 2.熟悉电商核心系统的开发 3.精通至少其中一种开发语言或运行时:Java, Go, Python, JavaScript, Node.js 4.深入理解数据结构,算法,设计模式和常用的开发框架 5.熟悉高可用、高并发微服务后端开发和性能调优 6.熟悉 MySQL 和 NoSQL 数据库 7.熟悉Redis、Elasticsearch、Kafka 等主流中间件 8.有很强的自驱力,能快速学习并投入工作 9.优秀的人际交往能力和流利的英boss语(阅读和写作) 10. 计算机科学与工程或相关专业的学士或硕士(优先),具有知名大学教育背景 岗位职责:
技能解析
- CUDA
- 性能分析
- 模块开发
- 分析工具
- 关键技术
- 架构设计
- 编程能力
- 性能分析工具
- 开发经验
数据来自CSL职业科学研究室
技能解析
- 人际交往
- 性能调优
- 完成工作
- 科学与工程
- 人际交往能力
- 完成工作任务
- 理解数据
- 阅读和写作
- 数据结构
- 设计模式
- 交往能力
- 解决方案
- 提高效率
- 敏捷开发
- 开发框架
- 服务端开发
- 系统的开发
- 开发语言
- 开发经验
数据来自CSL职业科学研究室
公司福利
- 五险一金
- 补充医疗保险
- 定期体检
- 年终奖
- 股票期权
- 带薪年假
- 员工旅游
- 免费班车
- 餐补
- 交通补助
- 节日福利
公司福利
- 带薪年假
- 股票期权
- 底薪加提成
- 年终奖
- 定期体检
- 意外险
- 补充医疗保险
- 五险一金
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。