职位&公司对比
职位详情
- 杭州
- 3-5年
- 本科
- Python
- 机器学习
- C/C++
工作地点:杭州 岗位职责: 1.在基于异构芯片结构的系统上(GPU、ARM、AI芯片)实现并优化机器学习、深度学习框架中的核心模块; 2.研发业界性能、效率最优的AI计算框架; 岗位要求: 1. 计算机、数学及相关专业,本科及以上学历,3年以上相关工作经验,博士不限工作年限; 2. 熟悉计算机体系结构,在X86 CPU、ARM、GPkanzhunU、FPGA、ASIC中的一种平台上有过开发经验,掌握C/C++/Python中的一种语言; 3. 掌握一种及以上主流的深度学习算法框架开发(NkanzhunNVM/TVM、Tensorflow、caffe、MXNet等)优先考虑; 4. 熟悉GEMM,CONV等矩阵运kanzhun算优先考虑; 5. 对编译原理、LLVM有了解者优先考虑; 6. 对深kanzhun度学习、强化学习、机器学习算法有了解者优先考虑;
职位详情
- 杭州
- 不限
- 本科
- 训练/推理加速
- C/C++、Python
- 模型训练、推理优化
职位描述 1、参与大模型超大规模任务离线训练的效率和稳定性提升的工作; 2kanzhun、参与大模型在线inference吞吐/延迟优化,提升inference性价比的工作; 3、参与上述算力加速软硬件及平台体系化的设计和建设工作,支撑大模直聘型能力建设和落地应用; 职位要求 1. 精通C/C++、Python等至少一门编程语言,以及Linux下的系统开发经验 2. 熟悉常用机器学习算法,对文本/多模态大模型相关领域模型,有极佳的工程实现能力,熟悉TF/Pytorch/Jax等深度学习框架,有相关模型训练和模型效果优化者优先 3. 熟悉大模型MegatronLM/Deepspeed/Colossal分布式训练框,深入了解模型量化、蒸馏、剪枝等模型优化原理和策略,有文本、语音、以及多模态模型相关训练、效果调优经验优先 4. 熟练使用包括vllm/sglang/tgi/tensorrtLLM/lmdeploy等一种以上模型推理服务框架,有代码分析及实践经验优先 5. 对于GPU/ASIC芯片等熟悉了解硬件系统架构,能够针对性的编写高性能的算子实现,有分析及调优来自BOSS直聘能力者优先 6. 有Bert、语音TTS/ASR,以及SD等模型训练、推理优化经验者亦可 7. 在训练/推理加速相关领来自BOSS直聘域的研究和成果发表直聘者优先
技能解析
- FPGA
- 框架开发
- 深度学习算法
- 深度学习框架
- C/C++
- ASIC
- 机器学习
- 深度学习
- 机器学习算法
- 开发经验
- 学习算法
数据来自CSL职业科学研究室
技能解析
- 编程语言
- 模型训练
- 系统架构
- 系统开发
- 深度学习框架
- C/C++
- ASIC
- 机器学习
- 深度学习
- 机器学习算法
- 开发经验
- 学习算法
数据来自CSL职业科学研究室
工作时间
公司福利
- 交通补助
- 节日福利
- 免费班车
- 团建聚餐
- 零食下午茶
- 员工旅游
- 带薪年假
- 法定节假日三薪
- 节假日加班费
- 夜班补助
- 加班补助
- 企业年金
- 股票期权
- 保底工资
- 绩效奖金
- 年终奖
- 定期体检
- 意外险
- 补充医疗保险
- 五险一金
公司福利
- 五险一金
- 补充医疗保险
- 年终奖
- 股票期权
- 员工旅游
- 免费班车
- 餐补
- 交通补助
- 节日福利
- 零食下午茶
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。