职位&公司对比
职位详情
- 北京
- 3-5年
- 本科
岗位职责 1、主导AI模型推理引擎的架构设计与核心模块开发,优化LLM、CV等模型的低延迟、高吞吐推理性能; 2、深入硬件层(GPU/TPU/端侧芯片)进行算kanzhun子和计算图优化,实现模型编译、量化压缩、动态批处理等关键技术; 3、探索大模型推理前沿技术(如 speculative decoding、continuous batching、vLLM优化等); 4、建立推理服务的监控、诊断与调优体系,实现端到端性能瓶颈分析。 任职要求 技术能力 1、3年以上推理引擎/高性能计算开发经验,熟悉主流推理框架(TensbossorRT、Trbossiton、ONNX Runtime等); 2、精通C++/Python,具备CUDA/OpenCL等GPU编程能力,有算子优化实战案例; 3、深入理解计算机体系结构,熟悉模型编译技术(MLIR、TVM等),掌握性能分析工具(Nsight、perf); 4、熟悉模型量化(INT8/FP16)、剪枝、蒸馏等压缩技术,具备端-云协同推理经验者优先; 加分项:参与过LLM推理优化boss(如KV Cache优化、PagedAttention)、熟悉MoE架构或AIGC场景。
职位详情
- 北京
- 5-10年
- 本科
- 中大型项目架构设计经验
- 计算机相关专业
- 后端开发经验
职位描述 1、负责公司APP 的架构设计、技术选型和代码的开发工作; 2、参与产品需求讨论和技术方案的制定,确保产品的功能和性能指标; 3、带领开发团队进行技术攻关,解决项目中的技术难题; 4、对产品进行性能优化,提高系统的稳定性和可靠性; 5、发展、培养团队,进行业务和团队的管理规划,并带领团队落地。 职位要求 1、有良好的产品意识,能够主动思考并探索产品方向创新,至少5年以上研发或BOSS直聘架构经验; 2、有较强的学习能力boss,有来自BOSS直聘强烈的求知欲、好奇心和进取心,boss能及时关注和学习业界最新技术; 3、积极乐观,责任心kanzhun强,工作认真细致,有良好的团队沟通和协作能力,能够与不同岗位的人员进行有效的合作; 4、具有较强的学习能力和问题解决能力,善于独立思考和解决复杂的技术问题,并且能够适应多方合作和快速变化的需求; 5、深入了解LLM相关技术及应用,有AI工程落地经验者优先,有大规模系统架构经验优先。
技能解析
- CUDA
- 性能分析
- 模块开发
- 分析工具
- 开发经验
- 关键技术
- 编程能力
- 性能分析工具
- 架构设计
数据来自CSL职业科学研究室
技能解析
- 问题解决能力
- 技术问题
- 团队沟通
- 技术方案
- 系统架构
- 产品需求
- 带领团队
- 较强的学习
- 问题解决
- 善于独立思考
- 性能指标
- 协作能力
- 学习能力和
- 独立思考
- 技术难题
- 功能和性能
- 性能优化
- 学习能力
- 开发工作
- 解决能力
- 架构设计
数据来自CSL职业科学研究室
公司福利
- 五险一金
- 补充医疗保险
- 定期体检
- 年终奖
- 股票期权
- 带薪年假
- 员工旅游
- 免费班车
- 餐补
- 交通补助
- 节日福利
公司福利
- 五险一金
- 补充医疗保险
- 年终奖
- 股票期权
- 员工旅游
- 免费班车
- 餐补
- 交通补助
- 节日福利
- 零食下午茶
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。