职位&公司对比
职位详情
- 北京
- 不限
- 本科
- pd分离
- vLLM/sglang
职位描述: 优化大模型推理性能,降boss低推理时延,提升吞吐,降低LLM模型推理成本。 职位要求: 1. 熟悉transformer,llama,deepseek等主流模型结构。 2. 熟悉LLbossM主流推理引擎(如vLLM/sglang),熟悉常见推理优化技术,如MLA、Flas直聘hAtention、PageAttention、Continuou来自BOSS直聘s Batching、Speculative Decoding等。 3.具有AI模型推理优化经验,熟悉常见加速技术,如剪枝、量化、分布式推理等,能够根据不同场景和硬件平台进行针对性的优化。 4.熟悉GPU硬件结构,有CUDA/Cutlass开发优化经验者优先。
职位详情
- 北京
- 3-5年
- 硕士
- 大模型算法
- 对话机器人
- 智能客服
岗位职责包括但不限于: 1. 负责基于通用基座大模型结合领域数据构建云计算服务领域大模型,包括大模型落地业务场景识别、数据清洗/构造,LLM训练和调优,搜索增强RAG,LLMkanzhun Ag直聘ents等LLM关键技术方向攻坚 2. 探索基于大模型技术的服务新形态,包括多个场景的大模型对话机器人,ChatUI服务形态升级,智能辅助Copilot等云计算服务新形态场景的大模型落地技术,打造云计算服务领域“大模型落地”的标杆 3. 深入公司服务内外部业务场景,结合大模型技术、搜索推荐、多模态等算法模型能力解决云服务领域实际业务痛点,并参与规划和设计未来云直聘服务领域的大模型技术演进规划和落地 任职要求 1、计算机科学、软件工程、数学、统计学等相关专业,硕士及以上学历 2、具备独立的从业务需求到算法工程转化和落地能力,在自然语言理解NLU/自然语言生成NLG、对话机器人、搜索推荐、知识图谱等一个或多个领域有大规模场景落地经验 3、在大模型LLM相关技术方向有实战经验者优先,比如LLM训练和优化、搜索增强生成RAG、大模型推理以及大模型评估等一个或多个方向有实际经验 3、熟悉掌握Python/Java/C++中至少一门语言,有大型系统的算法模型开发和优化经验,熟练掌握至少一种深度学习框架(PyTorch、TensorFlow、Caffe等) 4、有顶级会议、顶级期刊上发表学术论文,有相关算法比赛(Kaggle等)获奖经验的同学优先
技能解析
- CUDA
- 优化技术
数据来自CSL职业科学研究室
技能解析
- 开发和优化
- 深度学习框架
- 算法工程
- 自然语言
- 深度学习
- 关键技术
- 软件工程
- 算法模型
- 知识图谱
- 相关算法
- 数据清洗
数据来自CSL职业科学研究室
工作时间
公司福利
- 交通补助
- 节日福利
- 有无线网
- 团建聚餐
- 零食下午茶
- 餐补
- 员工旅游
- 带薪年假
- 工龄奖
- 法定节假日三薪
- 节假日加班费
- 夜班补助
- 股票期权
- 保底工资
- 绩效奖金
- 年终奖
- 定期体检
- 意外险
- 补充医疗保险
- 五险一金
公司福利
- 五险一金
- 补充医疗保险
- 年终奖
- 股票期权
- 员工旅游
- 免费班车
- 餐补
- 交通补助
- 节日福利
- 零食下午茶
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。