职位&公司对比

招聘中
  • 互联网
  • 不需要融资
招聘中
  • 互联网
  • 不需要融资

职位详情

  • 北京
  • 5-10年
  • 本科
  • C++
  • C
  • Python
  • 编译器开发经验
  • GPU/AI芯片编程
  • 编译
  • 软硬结合

岗位职责: 1.针对大模型直聘推理场景,负直聘责GPU/AI芯片底层性能优化与调优; 2.优化和扩展vLLM、SGLang、PyTorch等框架的核心模块,提升计算效率与资源利用率; 3.深入分析GPU/AI芯片的硬件架构特性,设计并实现高性能算子、算法和特性使能组件; 4.探索前沿技术方向(如混合专家模型MOE、动态计算图编译优化等)。 岗位要求: 1.熟练掌握C/C++、Python编程语言,具备良好的coding和调试能力; 2.熟悉GPU/AI芯片编程,如CUDA,ObosspenCL,Ascend C等; 3.熟悉Cublas,Cutlass,CK等高性能算子开发工具; 4.熟悉Torbossch-Compile等AI编译模块者优先; kanzhun4.熟悉主流大模型推理框架,有实际性能调优经验(如KV Cache优化、动态批处理、Attention算子定制等); 5.扎实的高性能计算基础,熟悉并行计算、内存优化、通信优化等技术; 加分项: 1、机器学习或者体系结构相关顶会论文,开源项目贡献者; 2、熟悉Attention结构MHA/MQA/GQA/MLA,以及MOE结构等;

职位详情

  • 北京
  • 3-5年
  • 本科
  • C++
  • C
  • 分布式经验
  • 四层七层负载均衡
  • 云网络
  • 架构设计经验
  • Linux开发/部署经验
  • 网关
  • Python

岗位职责: kanzhun1、负责腾讯云公网接入网关的架构设计和优化; 2、负责云网关数据面的软件设计和开来自BOSS直聘发; 3、负责前沿技术预研和实现,引入业内先进的软硬件技术,提升网关产品的产品体验。 岗位要求: 直聘1.熟悉Linux操作系统,熟悉C/C++/go中的一种语言; 2.熟悉 TCP/UDP/IP 协议。 有DPDK、Netmap,bossPFRING,网络协议栈开发经验者优先; 3.有智能网卡、可编程交换机、FPGA开发经验者优先; 4.热爱技术,勇于创新,追求极致。

技能解析

专有技能
  • CUDA
  • 性能调优
  • 机器学习
  • 开发工具
  • 性能优化
  • 编程语言
  • 深入分析
  • 熟练掌握C
  • 内存优化
相同技能
  • C/C++

数据来自CSL职业科学研究室

技能解析

专有技能
  • FPGA开发
  • FPGA
  • 软件设计
  • 开发经验
  • 架构设计
  • 网络协议
相同技能
  • C/C++

数据来自CSL职业科学研究室

工作时间

上午09:30   -   下午06:00
双休弹性工作

工作时间

上午09:30   -   下午06:00
双休弹性工作

公司福利

  • 五险一金
  • 补充医疗保险
  • 定期体检
  • 年终奖
  • 股票期权
  • 带薪年假
  • 员工旅游
  • 免费班车
  • 餐补
  • 交通补助
  • 包吃
  • 节日福利
  • 住房补贴
  • 零食下午茶
  • 公仔周边活动
  • 免费健身房
  • 免费早晚餐

公司福利

  • 五险一金
  • 补充医疗保险
  • 定期体检
  • 年终奖
  • 股票期权
  • 带薪年假
  • 员工旅游
  • 免费班车
  • 餐补
  • 交通补助
  • 包吃
  • 节日福利
  • 住房补贴
  • 零食下午茶
  • 公仔周边活动
  • 免费健身房
  • 免费早晚餐
首页 | 北京招聘 · C/C++招聘 | 北京C/C++招聘 | 腾讯大模型推理优化研发工程师-算子优化/编译招聘 | 腾讯大模型推理优化研发工程师-算子优化/编译 怎么样
更新于 2025-05-19