职位&公司对比
职位详情
- 北京
- 1-3年
- 本科
- Linux
- Python
我们爱热爱工程的工程师 我在找一些很酷的软件工程师。 很酷的工程师都是发自内心热爱工程的工程师。 × 自己动手解决问题 × 一般从中学开始就爱折腾,不是为了考试 × 爱分享,不藏私 × 追求效率,有一boss套自boss己用得顺手的工具链,很多是自己写的 我们在做什么:智能金融。具体来说就是自动化金融信息处理中的一些环节 1)自动解读公告、研报 2)证券分析模块的自动化 3)自动化写报告 4)金融搜索引擎,等等。 典型案例: × 某评级机构,利用自动化财务报表审查,将人工审核前错误率从50%降低到20boss% × 某券商,用自动化报告技术,提高报告生成效率一倍。 × 某大型行业机构,用机器替代传统要20人团队才能完成的公告处理自动化。 我们想和什么样的直聘人一起工作: × 非常熟悉Python × 熟悉工程栈:Linux+Git+(你的方向上的工具链) × 有项目证明你对工程的热爱BOSS直聘 × 坚持多年通过博客等分享你的技术心得 文因互联是非常靠谱和专业的创业公司,圈子里都知道 :) 自由,开放,阳光,硅谷文化,骗人是小狗。 具体请看我们的博客 http://blog.memect.cn/ 请看了以后再决定是否投简历。 怎么联系:请把简历发给我(微博:西瓜大丸子汤)baojie@memect.co (注意是.co不是.com) -------- P.S. 你应该来文因互联的理由 1:在这里你可以学到最正宗的知识图谱技术。鲍捷、王丛和郑锦光都是领域科班出身,Tim Berners-Lee(新近图灵奖得主)和Jim Hendler一脉相承的武林正宗。 2:(以后每天加一条)
职位详情
- 北京
- 5-10年
- 本科
- 推理引擎
岗位职责 1、主导AI模型推理引boss擎的架构设计与核心模块开发,优化LLM、CV等模型的低延迟、高吞kanzhun吐推理性能; 2、深入硬件层(GPU/TPU/端侧芯片)进行算子和计算图优化,实现模型编译、量化压缩、动态批处理等关键技术; 3、探索大模型推理前沿技术(如 speculative decoding、continuous batching、vLLM优化等); 4、建立推理服务的监控、诊断与调优体系,实现端到端性能瓶颈分析。 任职要求 技术能力 1、5年以上推理引擎/高性能计算开发经验,熟悉主流推理框架(TensorRT、Triton、ONNX Runtime等); 2、精通C++/Python,具备CUDA/OpenCL等GPU编程能力,有算子优化实战案例; 3、深入理解计算机体系结构,熟悉模型编译技术(MLIR、TVM等),掌握性能分析工具(Nsight、perf); 4、熟悉模型量化(INT8/FPboss16)、剪枝、蒸馏等压缩技术,具备端-云协同推理经验者优先; 加分项:参与过LLM推理优化来自BOSS直聘(如BOSS直聘KV Cache优化、PagedAttention)、熟悉MoE架构或AIGC场景。
技能解析
- 信息处理
- 财务报表
- 解决问题
- 软件工程
- 搜索引擎
- 知识图谱
数据来自CSL职业科学研究室
技能解析
- CUDA
- 性能分析
- 模块开发
- 分析工具
- 开发经验
- 关键技术
- 架构设计
- 编程能力
- 性能分析工具
数据来自CSL职业科学研究室
工作时间
公司福利
- 交通补助
- 节日福利
- 带薪年假
- 定期体检
- 五险一金
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。