职位&公司对比

招聘中

大规模算法架构

-K
某大型通信/网络设备公司
招聘中

大模型算法

-K·薪
某知名运营商公司

职位详情

  • 南京
  • 5-10年
  • 硕士

1 深入理解PyTorch原理,并能够熟练使用PyTorch进行大模型的训练和微调。 2 具备大模型国产适配和推荐加速的经验,能够优化大模型在国产硬件上的性能和效率。 3 拥有丰富的行业或领域大模型微调项目经验,并来自BOSS直聘成功实施过多个类似项目。 4 深入理解主流智能体框架,如Autogen、Crew等,并能够熟练使用这些框架进行智能体的开发和优化。 5 精通LLama Index等RAG框架和高级RAG技术,能够利用这些技术进行高效的信息检索和问答生成。 6 熟练使用向量数据库和图谱数据BOSS直聘库,对信息匹配技BOSS直聘术和算法有深入理解,能够优化信息检索和匹配的准确性和效率。 7 深入理解多模态对齐、多模态表征、多模态融合等技术,能够在大模型中实现高效的多模态信息处理和融合。 8 负责设计和开发大模型微调和领域通用智能体工具、领域RAG通用工具或领域级生成工具、写作工具等,并推动这些产品的研发和优化。 1 教育背景:海归,985或211大学算kanzhun法专业毕业,研究生学历5年以上,或博士生学历3年以上优先。 2 工作经历:在NLP算法领域有5年以上的研究经验,其中至少有2年专注于大模型算法的研究和开发。 3 精通Python等编程语言,kanzhun具备扎实的算法和数据结构基础。 4 具备良好的团队合作精神和沟通能力,能够跨部门协作,推动项目的顺利进行。

职位详情

  • 南京
  • 3-5年
  • 硕士
  • 模型训练
  • 模型推理
  • 大模型
  • 自然语言

方向一:模型训练 1、负责大模型训练研发。构建训练数据集,运用SFT、RLHF等技术对大模型进行微调,满足大模型领域场景落地需求; 2、负责大模型推理优化。运用prompt工程、模型蒸馏、推理加速、超长上下文等技术,优化大模型性能,提升大模型落地成效; 3、负责大模型安全研究。降低大模型输出幻觉,提高大模型安BOSS直聘全性及稳定性,解决大模型可控可信度不足问题; 4、参与大模型产品化落地,提供大模型产品化、公有云和私有云落地方案。 任职资格 1、计算机、人工智能等专业,硕士及以上学历,具备5年以上算法工作经验; 2、熟练掌握主流大模型,包括不限于GPT-series、LLaMA直聘、GLM等预训练模型; 3、精通大模型微调、自监督学习、注意力机制、Transformer、多模态学习、模型蒸馏、推理加速等技术; 4、精通Python/C++等编程语言,熟练掌握Pytorch/Tensorflow等深度学习框架、Deepspeed/Megatron等分布式训练框架; 5、具备优秀的分析问题和解决问题能力,勇于挑战困难问题; 6、具备良好的团队协作和沟通能力,能够带领团队达成大模型目标任务; 7、具备超大规模(集群千+/大模型100B+)训练、调优经验者优先; 8、在英文期刊和学术顶会上发表过学术论文者优先。 方向一:大模型应用方向 1、负责基于开源TEXT2SQL大模型和移动自有九天出行大模型的应用开发,实现基于自然语言交互的时空数据建模、挖掘和分析,持续优化梧桐洞察和触达大数据产品体验和服务效率。 2、针对开源TEXT2SQL大模型和移动自有九天出行大模型进行推理优化,提高模型性能和准确性,确保在实际业务场景中稳定应用。 3、负责大模型应用的部署和优化,包括模型集成、性能调优、错误处理等方面,确保模型在实来自BOSS直聘际环境中的高效运行。 4、参与移动自有出行大模型的数据集准备,构建画像属性、流动行为等用户建模数据,优化时空三元组(用户、基站、时间boss)数据质量,构建语义标注真值库等。 5、负责梧桐洞察和触达产品数智化升级技术方案,推进大模型在行业数智解决方案中创新应用。 任职资格 1、计算机、大数据、人工智能等相关专业硕士及以上学历,具备3年以上软件开发经验; 2、深入理解自然语言处理、数据库查询优化和机器学习等相关知识,掌握TensorFlow、PyTorch等深度学习框架,熟悉动态图数据神经网络架构(TGN)或TEXT2SQL技术框架或类似项目者优先。 3、熟练掌握文本、多模态等非结构化数据处理以及数据清洗、特征提取和数据增强等技术,熟悉运营商位置信令数据处理者优先。 4、具备良好的数据分析和解决问题的能力,对解决具有挑战性问题充满激情。 5、具有良好的团队合作精神和沟通能力,能够牵头带领团队承担大模型应用与落地任务。 方向二:模型服务平台方向 1、负责开源大模型、移动自有基础大模型的调优(如SFT、RLHF等)、训练范式优化及性能优化; 2、负责大模型prompt工程、模型蒸馏、推理加速、超长上下文等优化技术研究; 3、负责大模型安全与幻觉研究,提高大模型安全性及稳定性,解决大模型可控可信度不足问题; 4、参与大模型的产品落地,包括基于反馈的算法调优、算法创新、系统评测等。 任职资格 1、计算机、人工智能、自然语言处理等相关专业硕士及以上学历,具备5年以上自然语言处理算法经验; 2、熟练掌握语言大模型相关算法,掌握GPT-series、LLaMa等预训练模型,精通微调模型、自监督学习、注意力机制、Transformer、多模态学习等技术; 3、熟练掌握Python、C++等编程语言,熟悉常用的Pytorch/Tensorflow/PaddlePaddle/MindSpore等深度学习算法,掌握Deepspeed/Megatron等分布式训练框架; 4、优秀的分析问题和解决问题的能力,对解决具有挑战性的问题充满激情; 5、具有良好的团队合作精神和沟通能力,能够牵头带领团队承担大模型应用与落地任务; 6、具备超大规模(千卡及以上)集群进行大模型(100B+)训练及调优经验者优先; 7、有优秀的英文学术论文写作能力,在英文期刊和学术顶会上发表过学术论文者优先; 8、对人工智能领域的前沿研究和算法有很高的热情,渴望用人工智能技术解决商业世界的难题。

技能解析

专有技能
  • 开发和优化
  • 结构基础
  • 跨部门协作
  • 研究和开发
  • 数据结构
  • 算法和数据结构
  • 信息处理
  • 模型算法
相同技能
  • 团队合作精神
  • 沟通能力
  • 编程语言
  • 合作精神
  • 团队合作

数据来自CSL职业科学研究室

技能解析

专有技能
  • 深度学习框架
  • 训练框架
  • 性能调优
  • 数据质量
  • 用户建模
  • 技术方案
  • 技术框架
  • 技术研究
  • 神经网络
  • 相关算法
  • 带领团队
  • 良好的数据分
  • 数据分析
  • 优秀的分析
  • 分析问题
  • 机器学习
  • 优化技术
  • 分析问题和解决问题的能力
  • 团队协作
  • 开发经验
  • 性能优化
  • 模型训练
  • 学习算法
  • 数据处理
  • 解决问题能力
  • 软件开发
  • 分析和解决问题的能力
  • 数据产品
  • 良好的数据分析
  • 应用开发
  • 解决问题的能力
  • 深度学习
  • 解决问题
  • 优秀的英文
  • 良好的团队协
  • 深度学习算法
  • 数据清洗
  • 写作能力
  • 解决方案
  • 自然语言
  • 数据建模
  • 分析和解决问题
  • 人工智能等
相同技能
  • 团队合作精神
  • 沟通能力
  • 编程语言
  • 合作精神
  • 团队合作

数据来自CSL职业科学研究室

公司福利

  • 节日福利
  • 定期体检
  • 补充医疗保险
  • 五险一金

备注

职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

备注

职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

更新于 2025-04-16