职位&公司对比
职位详情
- 北京
- 3-5年
- 硕士
- 深度学习
- 大模型算法
- 模型加速/性能优化
- 分布式训练
训练/推理 Infra开发工程师 职位描述 1、MOE 训练 Inf来自BOSS直聘ra 开发直聘 •设计并实现高效的 MOE 训练框架,支持大规模分布式训练,优化训练性能,缩短训练时间 •解决 MOE来自BOSS直聘 训练过程中的技术难题,如专家网络的选择、负载均衡、通信优化等 •与算法团队密切合作,根据算法需求调整和优化训练基础设施,确保算法的顺利实现 2、MOE BOSS直聘推理 Infra 开发 •开发高性能的 MOE 推理引擎,支持多种硬件平台(如 CPU、GPU、TPU 等)boss,实现模型的快速部署和推理。 •优化推理流程,提高推理效率和准确性,降低推理成本。 •对推理结果进行监控和分析,及时发现并解决推理过程中出现的问题。 3、系统优化与维护 •对 MOE 训练和推理基础设施进行性能调优,不断提升系统的稳定性和可靠性。 •定期对系统进行维护和升级,确保系统的安全性和兼容性。 •编写技术文档,为团队成员提供技术支持和培训。 4、团队协作与沟通 •与算法团队、数据团队、产品团队等跨部门协作,共同推进项目的进展。 •参与技术交流和分享活动,不断提升自己的技术水平和团队的整体实力。
职位详情
- 北京
- 不限
- 本科
- Java
- 搜索算法
- 深度学习
- 自然语言处理算法
- 大数据处理框架(Spark/Hadoop/Hive)
- 其他
- Python
- SQL
【岗位职责】1、负责电商广告大模型能力构建,boss包括网络架构优化,训练优化算法、效率及稳定性提升、数据集建设等方面持续优化; 2、通过大模型预训练、指令微调、RLHF、模型加速等优化措施,提升大模型在业务场景的效果; 3、结合具体的电商广告业务场景,推动技术创新,保持技术领先优势,提升京东技术行业影响力,推动相关技术落地并取得收益; 直聘4、追踪业界相关技术的最新前沿,能够针对业务和技术上的问题提出解决方案 【任职要求】1、熟悉各类大模型算法,熟悉BERT、GPT、LLaMA、Qwen、baichuan、MoE等大模型,有百亿+参数量大模型相关领域研究及boss落地经验优先;包括但不限于智能客服、智能数据分析、智能助手Agent等。 2、优秀的编程能力,掌握python、golang、java等至少一种语言,掌握pytorchBOSS直聘、tensorflow等至少一种深度学习框架; 3、在深度学习、广告创意优化、搜索推荐、文本挖掘、知识图谱等相关领域有丰富的算法实战经验者优先; 4、优秀的沟通、学习及自我驱动能力,出色的团队合作意识; 5、相关领域顶级学术论文(NeurIPS、ICML、ICLR、CVPR、ICCV、ACL、KDD等)、优秀开源项目、高水平竞赛获奖者优先; 6、符合京东核心价值观:客户为先,创新,拼搏,担当,感恩,诚信。
技能解析
- 训练框架
- 出现的问题
- 性能调优
- 协作与沟通
- 密切合作
- 跨部门协作
- 及时发现
- 系统优化
- 技术难题
- 写技术文档
- 团队协作
- 提供技术支持
- 技术水平
- 提升系统
- 技术文档
数据来自CSL职业科学研究室
技能解析
- 深度学习框架
- 优秀的沟通
- 合作意识
- 广告创意
- 优化算法
- 深度学习
- 广告业务
- 推动技术创新
- 编程能力
- 知识图谱
- 团队合作
- 技术创新
- 解决方案
- 数据分析
- 领域研究
- 团队合作意识
- 提出解决方案
- 至少一种语言
- 模型算法
- 架构优化
数据来自CSL职业科学研究室
工作时间
公司福利
- 交通补助
- 节日福利
- 高温补贴
- 团建聚餐
- 底薪加提成
公司福利
- 五险一金
- 补充医疗保险
- 定期体检
- 全勤奖
- 年终奖
- 餐补
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。