职位&公司对比

招聘中
某大型互联网OTO平台上市公司

职位详情

  • 北京
  • 不限
  • 本科
  • pd分离
  • vLLM/sglang

职位描述: 优化大模型推理性能,降低推理时延,提升吞吐,降低LLM模型推理成本。 职位要求: 1. 熟悉transformer,llama,deepseek等主流模型结构。 2. 熟悉LLM主流推理引擎(如vLLM/sglangBOSS直聘),熟boss悉常见推理优化技术,如MLA、FlashAtention、PageAttention、Continuous Batching、SpeculativBOSS直聘e Decoding等。 3.具有AI模型推理优化经验,熟悉常见加速技术,如剪枝、量化、分布式推理等,能够根据不同场景和硬件平来自BOSS直聘台进行针对性的优化。 4.熟悉GPU硬来自BOSS直聘件结构,有CUDA/Cutlass开发优化经验者优先。

职位详情

  • 北京
  • 3-5年
  • 本科
  • 精通Transformer
  • RAG系统构建案例
  • Python/Go/Java
  • LoRA/P-tuning实战

(工程效率)-信息工程开发 我们正在构建下一代智能编码体系,通过大模型重构软件工程范式。诚邀AI原生开发者加入,共同探索""AI+Engineering""的无人区。 岗位使命: 运用大模型技术重塑软件工程全流程,打造AI深度参与的智能研发体系,在代码生成、架构设计、系统优化等环节实现突破性创新。 你将主导: 大模型工程化落地; 基于LLM构建智能编码系统,实现需求分析→代码生成→测试验证的闭环赋能; 开发面向研发场景的领域大模型,构建代码知识图谱与Prompt工程体系; 探索AI结对编程、自主调试等前沿模式,突破传统研发效率边界; 智能boss编码范式革新; 利用Code Llama、GPT-En直聘gineer、Windsurf、cursor等工具重构研发流程,建立AI优先的工程方法论; 构建自动化效能提升方案,实现代码生成准确率>65%的核心指标; 创建智能编码最佳实践指南,驱动团队AI能力升级。 职位描述: 我们期待你: 1、大模型深度实践者; 精通Transformer架构,具有LoRA/P-tuning等模型优化实战经验; 熟悉LangChain、LlamaIndex等AI工程化框架,有RAkanzhunG系统构建案例; 掌握Prompt Engineering高阶技巧,能设计结构化提示词工程; 2、工程化创新专家: 3-5年互联网架构经验,精通Python/Go/Java中至少两boss门语言,具备开发工具链建设来自BOSS直聘经验; 3、AI原生开发者: 日均使用Copilot等工具编写300+行有效代码; 具有代码自动生成、测试用例智能编写等落地项目经验。

技能解析

专有技能
  • CUDA
  • 优化技术

    数据来自CSL职业科学研究室

    技能解析

    专有技能
    • 工程开发
    • 系统优化
    • 测试用例
    • 开发工具
    • 需求分析
    • 软件工程
    • 架构设计
    • 知识图谱

      数据来自CSL职业科学研究室

      工作时间

      上午10:00   -   下午07:00
      双休弹性工作

      公司福利

      • 交通补助
      • 节日福利
      • 有无线网
      • 团建聚餐
      • 零食下午茶
      • 餐补
      • 员工旅游
      • 带薪年假
      • 工龄奖
      • 法定节假日三薪
      • 节假日加班费
      • 夜班补助
      • 股票期权
      • 保底工资
      • 绩效奖金
      • 年终奖
      • 定期体检
      • 意外险
      • 补充医疗保险
      • 五险一金

      公司福利

      • 五险一金
      • 补充医疗保险
      • 定期体检
      • 年终奖
      • 股票期权
      • 带薪年假
      • 员工旅游
      • 免费班车
      • 餐补
      • 交通补助
      • 节日福利

      备注

      职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

      更新于 2025-05-14