职位&公司对比
职位详情
- 北京
- 3-5年
- 本科
岗boss位职责 1、主导AI模型推理引擎的架构设计与核心模块开发,优化LLM、CV等模型的低延迟、高吞吐推理性能; 2、深入硬件层(GPU/TPU/端侧芯kanzhun片)进行算子和计算图优化,实现模型编译、量化压缩、动态批处理等关键技术; 3、探索大模型推理前沿技术(如 speculative decoding、continuous batching、vLLM优化等); 4、建立推理服务的监控、诊断与调优体系,实现端到端性能瓶颈分析。 任职要求 技术能力 1、3年以上推理引擎/高性能计算开发经验,熟悉主流推理框架(TensorRT、Triton、ONNX Runtime等); 2、精通C++/Python,具备CUDA/OpenCL等GPU编程能力,有算子优化实战案例; 3、深入理解计算机体系结构,熟悉模型编译技术(MLIR、TVM等),掌握性能分析工具(Nsight、perf); 4、熟悉模型量化(INT8/FP16)、剪枝、蒸馏等压缩技术,具备端-云协同推理经验者优先; 加分项:参与过LLM推理优BOSS直聘化(如KV Cache优化、PagedAttentibosson)、熟悉MoE架构或AIGC场景。
职位详情
- 北京
- 3-5年
- 硕士
- C/C++
- 后端开发经验
- RAG
岗位描述 1.负责构建和优化基于RAG(Retrieval-Augmented Generation)架构的智能问答、知识推理系统开发高效的多模态数据(文本/图像/结构化数据)检索模块,优化Embedding模型与索引算法26设计生成模型(如LLM)与检索系统的协同机制,提升结果相关性与逻连贯性探索混合检索策略(密集检索+稀检索),优化召回率与排序精度4. 5.构建端到端性能评估体系,设计AB实验验证系统选代效果 6.跟踪LangChain、LamaIndex等RAG技术生态,推动前沿技术落地 岗位要求 技术能力: 1、计算机科BOSS直聘学/机器学习相关专业硕士及以上学历,3年以上搜索系统开发经验 2、熟悉检索系统技术栈 3、具备大规模分布式系统开发经验 有完整RAGboss系统落地经验者优先4
技能解析
- CUDA
- 性能分析
- 模块开发
- 分析工具
- 关键技术
- 架构设计
- 编程能力
- 性能分析工具
- 开发经验
数据来自CSL职业科学研究室
技能解析
- 机器学习
- 评估体系
- 分布式系统
- 系统开发
- 开发经验
数据来自CSL职业科学研究室
公司福利
- 五险一金
- 补充医疗保险
- 定期体检
- 年终奖
- 股票期权
- 带薪年假
- 员工旅游
- 免费班车
- 餐补
- 交通补助
- 节日福利
公司福利
- 五险一金
- 补充医疗保险
- 年终奖
- 股票期权
- 员工旅游
- 免费班车
- 餐补
- 交通补助
- 节日福利
- 零食下午茶
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。