职位&公司对比

招聘中
  • 互联网
  • 不需要融资
招聘中

向量数据库高级研发工程师

-K·薪
  • 电子商务
  • 已上市

职位详情

  • 北京
  • 5-10年
  • 本科
  • C++
  • C
  • Python
  • 编译器开发经验
  • GPU/AI芯片编程
  • 编译
  • 软硬结合

岗位职责: 1.针对大模型推理BOSS直聘场景,负责GPU/AI芯片底层性能优化与调优; 2.优化和扩展vLLM、SGLang、PyTorch等框架的核心模块,提升计算效率与资源利用率; 3.深入分析GPU/AI芯片的硬件架构特性,设计并实现高性能算子、算法和特性使能组件; 4.探索前沿技术方向(如混合专家模型MOE、动态计算图编译优化等)。 岗位要求: 1.熟练掌握C/C++、bossPython编程语言BOSS直聘,具备良好的coding和调试能力; 2.熟悉GPU/AI芯片编程,如CUDA,ObosspenCL,Ascend C等; 3.熟悉Cublas,Cutlass,CK等高性能算子开发工具; 4.熟悉Torch-Compile等AI编译模块者优先; 4.熟悉主流大模型推理框架,有实际性能调优经验(如KV Cache优化、动态批处理、Attentkanzhunion算子定制等); 5.扎实的高性能计算基础,熟悉并行计算、内存优化、通信优化等技术; 加分项: 1、机器学习或者体系结构相关顶会论文,开源项目贡献者; 2、熟悉Attention结构MHA/MQA/GQA/MLA,以及MOE结构等;

职位详情

  • 北京
  • 3-5年
  • 本科
  • C++
  • RocksDB
  • 数据库开发经验
  • 向量
  • MySQL
  • Milvus
  • Raft
  • 检索

工作内容: 1.负责京东向量数据库Vearch的研发工作,定位和处理线上出现的各种问题。 2来自BOSS直聘来自BOSS直聘.负责搜索内容比对方向:视频、网页、图文、图片等大规模内容关系检索计kanzhun算系统建设。 岗位要求: 1.熟悉C++、Golang任意一种编程语言。 2.熟悉Faiss向量引擎,ANN、IVFPQ、HNSW、图计算、倒排等技术。 3.熟悉Raft、Paxos数据复制协议。 4.熟悉RocksDB、LevelDB等KV存储系统。 5.熟悉Milvus、Pinecone等开源向量数据库者优先。 6.熟悉Vue、SpringBoot、SpringMVC、MyBatis、MySQL、Red直聘is、MQ、Kafka、S3等后端开发技术;

技能解析

专有技能
  • CUDA
  • C/C++
  • 性能调优
  • 机器学习
  • 开发工具
  • 性能优化
  • 深入分析
  • 熟练掌握C
  • 内存优化
相同技能
  • 编程语言

数据来自CSL职业科学研究室

技能解析

专有技能
  • 系统建设
  • 开发技术
  • 熟悉C++
  • 研发工作
相同技能
  • 编程语言

数据来自CSL职业科学研究室

工作时间

上午09:30   -   下午06:00
双休弹性工作

工作时间

上午09:00   -   下午06:00
双休弹性工作

公司福利

  • 五险一金
  • 补充医疗保险
  • 定期体检
  • 年终奖
  • 股票期权
  • 带薪年假
  • 员工旅游
  • 免费班车
  • 餐补
  • 交通补助
  • 包吃
  • 节日福利
  • 住房补贴
  • 零食下午茶
  • 公仔周边活动
  • 免费健身房
  • 免费早晚餐

公司福利

  • 零食下午茶
  • 节日福利
  • 包吃
  • 交通补助
  • 餐补
  • 免费班车
  • 员工旅游
  • 带薪年假
  • 股票期权
  • 年终奖
  • 定期体检
  • 补充医疗保险
  • 五险一金
首页 | 北京招聘 · C/C++招聘 | 北京C/C++招聘 | 腾讯大模型推理优化研发工程师-算子优化/编译招聘 | 腾讯大模型推理优化研发工程师-算子优化/编译 怎么样
更新于 2025-05-19