职位&公司对比
职位详情
- 北京
- 3-5年
- 硕士
- Python
- TensorFlow/PyTorch
- CNN/RNN/LSTM
- 计算机相关专业
- 数学/统计相关专业
- 机器学习算法/工程化经验
岗位描述: 1、紧跟业界NLP⽂本⽣成技术,解决面向不同应用场景的内容文本生成问题; boss2、承担模型预训练的开发和调优工作,探索前沿技术,复现和创新任务。如:prompt设计,⼤模型fine-tuning,模型蒸馏等;可控⽂本⽣成,⻛格和主题控制; 3、利用自然语言处理、深度学习在海量文本处理及挖掘中的应用,包括信息抽取,新闻主题发现,文本相关度模型,知识图谱构建,语义理解等。 岗位要求: 1. 具有计算机或数学相关专业全日制硕士学历 2. 扎实的编程能力,使用 java、 python 或其他主流变成语言 3. 对⾃然语⾔处理技术体系和应⽤场景有深刻理来自BOSS直聘解,熟悉自然语言处理、深度学习领域一些开源的算法库或工具; 4. 熟练掌握tensorflow、pytorch等深度学习框架,有较强的算法⼯程能⼒;熟悉主流⽂本⽣成的原理 和⽅法,有结合业务的落地实践经验; 5. 具有优秀的分析、解决实际问题的能力,能够自我驱动,良好的团队合作精神,较强的沟通能力; 6. 有AIGC相关产品落地经验者优先。
职位详情
- 北京
- 5-10年
- 本科
- 大模型基座
工作职责 1. 基座大模型预训练,包括但不限于不同规模、不同结构的语言模型和多模态模型的数据准直聘备和优化、模型预训练、训练加速与框架优化等; 2. 大模型对齐技术(SFT、RLHF等)链路整体优化,包括数据探索与增强、对齐流程探索、奖励模型优化、强化学习策略迭代等,持续提升对齐效果; 3. 大模型训练和推理优化,包括但不限于高效训练技术和框架设计与实现、模型小型化技术(稀疏化、压缩、剪枝、蒸馏等)探索与落地、高效推理技术实现等; 4. 大模型相关技术前沿探索,包括但不限于Scaling Law、模kanzhun型架构探索(MoE、MAMBAkanzhun等)、训练范式探索、长序列技术探索、kanzhun高效训推框架探索等; 5. 支撑内部应用需求,对接搜索、推荐、广告等实际业务场景,实现大模型应用落地。 任职要求 1. 对大模型开发流程有深入认知,熟悉预训练、指令微调、RLHF等流程与框架,具备模型预训练、对齐、训练和推理加速、模型小型化和部署等方面的经验; 2. 熟悉Transformer等模型架构,对GPT系列、LLAMA系列和MoE等模型架构有深入理解并拥有大规模训练经验; 3. 具备扎实的算法和数学理论基础及良好的编程基础,熟悉自然语言处理、生成式AI和机器学习等技术,熟悉Python、Java等至少一种编程语言,熟悉PyTorch、Tensorflow等深度学习框架,对技术开发及应用有热情; 4. 目标感强,善于分析和发现问题,拆解简化,有想法并乐于挑战自我,能够从日常工作中发现新的空间; 5. 条理性强且有推动力,能够梳理繁杂的工作并建立有效机制,推动上下游配合完成目标。
技能解析
- 强的沟通能力
- 团队合作精神
- 优秀的分析
- 沟通能力
- 合作精神
- 知识图谱
- 编程能力
- 团队合作
- 解决实际问题
- 深度学习框架
- 深度学习
- 自然语言
数据来自CSL职业科学研究室
技能解析
- 编程基础
- 完成目标
- 善于分析
- 条理性强
- 编程语言
- 开发流程
- 框架设计
- 理论基础
- 机器学习
- 技术开发
- 发现问题
- 模型训练
- 深度学习框架
- 深度学习
- 自然语言
数据来自CSL职业科学研究室
工作时间
公司福利
- 五险一金
- 补充医疗保险
- 定期体检
- 加班补助
- 年终奖
- 员工旅游
- 通讯补贴
- 交通补助
- 包吃
- 节日福利
- 零食下午茶
公司福利
- 交通补助
- 节日福利
- 高温补贴
- 团建聚餐
- 底薪加提成
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。