职位&公司对比

招聘中
  • 互联网
  • B轮
招聘中

推理引擎leader

-K·薪
某大型人力资源服务公司

职位详情

  • 北京
  • 1-3年
  • 本科
  • Linux
  • Python

我们爱热爱工程的工程师 我在找一些很酷的软件工程师。 很酷的工程师都是发自内心热爱工程的工程师。 × 自己动手解决问题 × 一般从中学开始就爱折腾,不是为了考试 × 爱分享,不藏私 × 追求效率,有一boss套自boss己用得顺手的工具链,很多是自己写的 我们在做什么:智能金融。具体来说就是自动化金融信息处理中的一些环节 1)自动解读公告、研报 2)证券分析模块的自动化 3)自动化写报告 4)金融搜索引擎,等等。 典型案例: × 某评级机构,利用自动化财务报表审查,将人工审核前错误率从50%降低到20boss% × 某券商,用自动化报告技术,提高报告生成效率一倍。 × 某大型行业机构,用机器替代传统要20人团队才能完成的公告处理自动化。 我们想和什么样的直聘人一起工作: × 非常熟悉Python × 熟悉工程栈:Linux+Git+(你的方向上的工具链) × 有项目证明你对工程的热爱BOSS直聘 × 坚持多年通过博客等分享你的技术心得 文因互联是非常靠谱和专业的创业公司,圈子里都知道 :) 自由,开放,阳光,硅谷文化,骗人是小狗。 具体请看我们的博客 http://blog.memect.cn/ 请看了以后再决定是否投简历。 怎么联系:请把简历发给我(微博:西瓜大丸子汤)baojie@memect.co (注意是.co不是.com) -------- P.S. 你应该来文因互联的理由 1:在这里你可以学到最正宗的知识图谱技术。鲍捷、王丛和郑锦光都是领域科班出身,Tim Berners-Lee(新近图灵奖得主)和Jim Hendler一脉相承的武林正宗。 2:(以后每天加一条)

职位详情

  • 北京
  • 5-10年
  • 本科
  • 推理引擎

岗位职责 1、主导AI模型推理引boss擎的架构设计与核心模块开发,优化LLM、CV等模型的低延迟、高吞kanzhun吐推理性能; 2、深入硬件层(GPU/TPU/端侧芯片)进行算子和计算图优化,实现模型编译、量化压缩、动态批处理等关键技术; 3、探索大模型推理前沿技术(如 speculative decoding、continuous batching、vLLM优化等); 4、建立推理服务的监控、诊断与调优体系,实现端到端性能瓶颈分析。 任职要求 技术能力 1、5年以上推理引擎/高性能计算开发经验,熟悉主流推理框架(TensorRT、Triton、ONNX Runtime等); 2、精通C++/Python,具备CUDA/OpenCL等GPU编程能力,有算子优化实战案例; 3、深入理解计算机体系结构,熟悉模型编译技术(MLIR、TVM等),掌握性能分析工具(Nsight、perf); 4、熟悉模型量化(INT8/FPboss16)、剪枝、蒸馏等压缩技术,具备端-云协同推理经验者优先; 加分项:参与过LLM推理优化来自BOSS直聘(如BOSS直聘KV Cache优化、PagedAttention)、熟悉MoE架构或AIGC场景。

技能解析

专有技能
  • 信息处理
  • 财务报表
  • 解决问题
  • 软件工程
  • 搜索引擎
  • 知识图谱

    数据来自CSL职业科学研究室

    技能解析

    专有技能
    • CUDA
    • 性能分析
    • 模块开发
    • 分析工具
    • 开发经验
    • 关键技术
    • 架构设计
    • 编程能力
    • 性能分析工具

      数据来自CSL职业科学研究室

      工作时间

      上午09:00   -   下午06:00
      双休偶尔加班

      公司福利

      • 交通补助
      • 节日福利
      • 带薪年假
      • 定期体检
      • 五险一金

      备注

      职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

      更新于 2025-05-16