职位&公司对比
职位详情
- 北京
- 5-10年
- 本科
- C++
- C
- Python
- 编译器开发经验
- GPU/AI芯片编程
- 编译
- 软硬结合
岗位职责: 1.针对大模型直聘推理场景,负直聘责GPU/AI芯片底层性能优化与调优; 2.优化和扩展vLLM、SGLang、PyTorch等框架的核心模块,提升计算效率与资源利用率; 3.深入分析GPU/AI芯片的硬件架构特性,设计并实现高性能算子、算法和特性使能组件; 4.探索前沿技术方向(如混合专家模型MOE、动态计算图编译优化等)。 岗位要求: 1.熟练掌握C/C++、Python编程语言,具备良好的coding和调试能力; 2.熟悉GPU/AI芯片编程,如CUDA,ObosspenCL,Ascend C等; 3.熟悉Cublas,Cutlass,CK等高性能算子开发工具; 4.熟悉Torbossch-Compile等AI编译模块者优先; kanzhun4.熟悉主流大模型推理框架,有实际性能调优经验(如KV Cache优化、动态批处理、Attention算子定制等); 5.扎实的高性能计算基础,熟悉并行计算、内存优化、通信优化等技术; 加分项: 1、机器学习或者体系结构相关顶会论文,开源项目贡献者; 2、熟悉Attention结构MHA/MQA/GQA/MLA,以及MOE结构等;
职位详情
- 北京
- 3-5年
- 本科
- C++
- C
- 分布式经验
- 四层七层负载均衡
- 云网络
- 架构设计经验
- Linux开发/部署经验
- 网关
- Python
岗位职责: kanzhun1、负责腾讯云公网接入网关的架构设计和优化; 2、负责云网关数据面的软件设计和开来自BOSS直聘发; 3、负责前沿技术预研和实现,引入业内先进的软硬件技术,提升网关产品的产品体验。 岗位要求: 直聘1.熟悉Linux操作系统,熟悉C/C++/go中的一种语言; 2.熟悉 TCP/UDP/IP 协议。 有DPDK、Netmap,bossPFRING,网络协议栈开发经验者优先; 3.有智能网卡、可编程交换机、FPGA开发经验者优先; 4.热爱技术,勇于创新,追求极致。
技能解析
- CUDA
- 性能调优
- 机器学习
- 开发工具
- 性能优化
- 编程语言
- 深入分析
- 熟练掌握C
- 内存优化
- C/C++
数据来自CSL职业科学研究室
技能解析
- FPGA开发
- FPGA
- 软件设计
- 开发经验
- 架构设计
- 网络协议
- C/C++
数据来自CSL职业科学研究室
工作时间
工作时间
公司福利
- 五险一金
- 补充医疗保险
- 定期体检
- 年终奖
- 股票期权
- 带薪年假
- 员工旅游
- 免费班车
- 餐补
- 交通补助
- 包吃
- 节日福利
- 住房补贴
- 零食下午茶
- 公仔周边活动
- 免费健身房
- 免费早晚餐
公司福利
- 五险一金
- 补充医疗保险
- 定期体检
- 年终奖
- 股票期权
- 带薪年假
- 员工旅游
- 免费班车
- 餐补
- 交通补助
- 包吃
- 节日福利
- 住房补贴
- 零食下午茶
- 公仔周边活动
- 免费健身房
- 免费早晚餐