职位&公司对比

招聘中

数据架构师

-K
  • 互联网
  • A轮
招聘中
  • 其他金融业
  • 不需要融资

职位详情

  • 北京
  • 3-5年
  • 不限
  • 数据库
  • 数据架构
  • 数据处理

1、 负责公司技术框架和开发工来自BOSS直聘具的搭建,兼顾性能,可靠性以及安全性; 2、 负责产品基础架构设计,负责技术开发工作中核心模块的代码编写、测试以及复杂度高的代码集成; 3、优化产品开发流程,提高产品质量; 4、跟进最新的软件开发技术,整理培训文档,组织团队内部学习及培训; 5、对团队其他成员提供技术上的指导和支持,带领团队攻克技术难题。 任职要求: 1、 3-5年以上Java开发经验。精通Core JAVA,有良好的OOP编程思想,了解SBOSS直聘OAkanzhun思想。有深刻的技术领悟力。 2. 精通Oracle、Mysql、sql server、DB2等大型关系数据库,有数据库设计经验; 3. 精通J2BOSS直聘EE框架技术,熟悉Spring/Structs/Hibernate/iBatis/apache系列等开源项目。 3、 精通JAV直聘A开发语言,具有Java Web开发经验,理解J2EE与JSP执行机制原理,具备如何构建高性能、高可维护性系统,具备快速定位及解决问题能力; 4、精通Ajax,熟练使用Javascript/ext js或Jquery/CSS技术。 5、熟悉WebService/SOAP协议,熟悉中间件技术及各种中间件。 6、经历过大并发互联网项目架构设计经验,以及对应的技术、运维解决方案; 7、有良好的职业道德和工作态度,有良好的客户交流沟通能力和需求理解能力,较强的责任心和团队协作精神。

职位详情

  • 北京
  • 不限
  • 本科
  • 要求数据开发/架构经验
  • 要求有数据架构经验
  • 数据平台架构经验
  • 数据仓库架构经验
  • 大数据引擎架构经验
  • 其他数据架构经验
  • Spark
  • Hive
  • 其他
  • 其他
  • 计算机相关专业
  • 数据治理经验

职位描述: 1. 大模型数据工程架构设计:构建支持千亿级大模型持续迭代的弹性数据基础设施,设计高扩展性数据处理框架,实现数据清洗、特征工程、标注流水线的全自动化闭环,支撑模型周级迭代需求,确保数据处理吞吐量随模型复杂度增长动态扩容。 2. 智能FeatureSBOSS直聘tore研发:开发支持动态特征版本回溯的存储系统,构建特征血缘追踪、跨版本特征兼容性保障、在线特征热更新等模块,满足大模型AB测试和渐进式优化场景下的特征服务需求。 3. 评测驱动优化体系:打造模型迭代与数据优化的联动引擎,研发基于评估结果的数据自动增强系统,建立评估指标到数据缺陷的逆向定位机制,实现模型效果衰减的数据归因分析。 4. 持续训练数据工厂:设计支持增量数据融合的智能标注系统,开发数据价值密度评估、主动学习采样、合成数据插值增强等技术,确保每轮迭代数BOSS直聘据质量符合模型当前训练阶段的学习需求。 5. 迭代效能提升体系:构建模型训练与数据工程的协同工作流,研发分布式checkpoint与特征快照联动机制,实现模型回滚时数据状态的毫秒级一致性恢复,降低迭代试错成本。 职位要求: 6. 大模型迭代经验:具有3个以上大模型完整生命周期(预训练→SFT→RLHF→持续优化)的数据支撑实战经验,主导设计过支持模型效果提升2来自BOSS直聘0%以上的数据迭代方案。 7. 敏捷数据工程能力:精通CI/CD在数据领域的落地实践,具备构建分钟级数据版本回滚、AB测试数据隔离、灰度发布数据管道等工程化经验。 8. 性能优化专家:在数据供给效率优化上有成功案例,包括但不限于:分布式缓存加速特来自BOSS直聘征读取(10X+提升)、GPU直通数据预处理、异构存储自动分层等技术突破。 9. 数据-模型协同洞察:深度理解数据迭代对模型能力的影响机制,掌握数据分布偏移检测、数据新鲜度评估、特征重要性衰减预警等关键技术。 10. 技术前瞻性:主导过支持万亿参数模型数据工程的预研工作,在动态数据分片策略、训练中断数据一致性保障等方向有技术储备。 技术栈强boss化项: • 持续集成:Airflow Prefect/DVC Pipeline • 效能工具:NVIDIA RAPIDS/Dask • 监控系统:Prometheus+自定义数据质量埋点 • 存储优化:GPUDirect Storage/DAOS

技能解析

专有技能
  • JAVA
  • 产品开发
  • 团队协作精
  • 快速定位
  • 交流沟通能力
  • 理解能力
  • 技术框架
  • 沟通能力和
  • 开发流程
  • 带领团队
  • 关系数据
  • 客户交流
  • 精通JAVA
  • 沟通能力
  • 技术开发
  • 技术难题
  • 协作精神
  • 团队协作
  • 开发经验
  • 中间件技术
  • 开发工作
  • 软件开发
  • 解决问题能力
  • 交流沟通
  • 设计经验
  • 提高产品质量
  • 解决问题
  • 代码编写
  • 数据库设计
  • 编程思想
  • 关系数据库
  • 产品质量
  • 产品开发流程
  • 解决方案
  • 团队协作精神
  • 开发工具
  • 开发技术
  • 需求理解能力
  • JAVA开发
  • 开发语言
相同技能
  • 架构设计

数据来自CSL职业科学研究室

技能解析

专有技能
  • 测试数据
  • 数据处理框架
  • 数据质量
  • 关键技术
  • 理解数据
  • 工程能力
  • 数据清洗
  • 生命周期
  • 评估结果
  • 主动学习
  • 服务需求
  • 性能优化
  • 模型训练
  • 数据处理
相同技能
  • 架构设计

数据来自CSL职业科学研究室

工作时间

上午09:00   -   下午06:00

公司福利

  • 生日福利
  • 节日福利
  • 团建聚餐
  • 带薪年假
  • 工龄奖
  • 绩效奖金
  • 年终奖
  • 定期体检
  • 五险一金
更新于 2025-05-14