职位&公司对比
职位详情
- 北京
- 3-5年
- 本科
岗位职责 1、主导AI模型推理引擎的架构设计与核心模块开发,优化LLM、CV等模型的低延迟、高吞吐推理性能; 2、深入硬件层(GPU/TPU/端侧来自BOSS直聘芯片)进行算子和计算图优化,实现模型编译、量化压缩、动态批处理等关键技术; 3、探索大模型推理前沿技术(如 speculative decodin直聘g、continuous batchinbossg、vLLM优化等); 4、建立推理服务的监控、诊断与调优体系,实现端到端性能瓶颈分析。 任职要求 技术能力 1、3年以上推理引擎/高性能计算开发经验,熟悉主流推理框架(TensorRT、Triton、ONNX Runtime等); 2、精通C++/Python,具备CUDA/OpenCL等GPU编程能力,有算子优化实战案例; 3、深入理解计算机体系结构,熟悉模型编译技术(MLIR、TVkanzhunM等),掌握性能分析工具(Nsight、perf); 4、熟悉模型量化(INT8/FP16)、剪枝、蒸馏等压缩技术,具备端-云协同推理经验者优先; 加分项:参与过LLM推理优化(如KV Cache优化、PagedAttention)、熟悉MoE架构或AIGC场景。
职位详情
- 北京
- 不限
- 本科
- Java
- C/C++
- Golang
- 计算机相关专业
- 后端开发经验
1、带领团队负责国际化产品生活服务业务B端相关系统和产品的服务端研发工作; 2、负责技术团队搭建、业务把控、团队管理和人员培养; 3、深入了解生活服务涉及的商户/商品/boss交易相关业务,以不断提高B端服务的质量和效率; 4、与跨职能团队合作,了解需求并开发满足业务需求的解决方案。 任职要求: 1、具有丰富的BOSS直聘相关领域知识,成熟的团队搭建、管理能力; 2、扎实的计算机基础知识,有较强软件架构设计能力; 3、优秀的沟通和协作能力,战略思维能力。 带团队,Base北京/上海
技能解析
- CUDA
- 性能分析
- 模块开发
- 分析工具
- 开发经验
- 关键技术
- 编程能力
- 性能分析工具
- 架构设计
数据来自CSL职业科学研究室
技能解析
- 软件架构设计
- 优秀的沟通
- 服务业务
- 团队管理
- 设计能力
- 战略思维能力
- 团队合作
- 带领团队
- 研发工作
- 解决方案
- 协作能力
- 了解需求
- 管理能力
- 战略思维
- 软件架构
- 架构设计
数据来自CSL职业科学研究室
公司福利
- 五险一金
- 补充医疗保险
- 定期体检
- 年终奖
- 股票期权
- 带薪年假
- 员工旅游
- 免费班车
- 餐补
- 交通补助
- 节日福利
公司福利
- 就近租房补贴
- 年度体检
- 免费健身设施
- 家庭关爱假
- 家属自选保险
- 住房补贴
- 团建聚餐
- 餐补
- 带薪年假
- 股票期权
- 绩效奖金
- 年终奖
- 定期体检
- 意外险
- 补充医疗保险
- 五险一金
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。