职位&公司对比
职位详情
- 上海
- 5-10年
- 本科
- 要求数据开发经验
- 大数据引擎开发经验
- Spark原理/源码
- Flink原理/源码
- 其他
- Clickhouse原理/源码
- Presto原理/源码
- 数据建模经验
- 非外包类
- Java
岗位描述 1、负责国际信贷业务的数据研发相关工作,运用数据技术,对信贷数据进行统计分析、来自BOSS直聘风险评估和数据建模,以支持信贷决策和风险管理,沉淀信贷业务全链路的优质数据资BOSS直聘产,配合风控、产品及技术团队,推动数据驱动的创新业务场景落地。 2、熟悉隐私安全法律法规,制定信贷数据领域的解决方案。规划业务大图和主要流程、针对复杂的业务问题能做提炼和拆解,帮助数据安全、合规、高效流转。 岗位要求 1、有3年及以上大数据研发经验,能独立主导完成某一业务领域的整体模型设计和研发交付;掌握数据模型设计方法论,能够将所负责的工作拆分成合理的数据主题,产出的数据模型和设计的数据链路,并充分考虑可复用、可扩展性。 2、精通Hadoop/Hive/Spark/MaxCompute等离线大数据技术,深入了解起背后的实现原理,并能够调优;熟悉主流OLAP引擎的实现和优化原理,如Clickhouse、Presto、Hologres等,深入理解分布式数据库架构,以及列存储、索引等技术,有实战boss经验优先。 3、掌握实时计算技术体系包括数据采集、计算引擎Storm/Spakanzhunrkstreaming/Flink其中一种,对实时计算所涉及的事务、容错、可靠性有深入理解。 4、了解数据质量保障和数据治理工作,能来自BOSS直聘够站在数据系统全链路视角,独立解决所负责工作的数据治理问题,能综合运用和优化现有数据技术和数据产品,形成可复用的治理解决方案,最终解决业务问题。 5、热爱大数据事业,性格沉稳,有较好的语言表达能力,能自我驱动,有强烈的求知欲与进取心,有团队合作精神,敢于挑战,能在压力下成长。 6、具备流利的英语口语与书面表达能力,能够胜任国际团队沟通、方案撰写及会议协作。 7、了解信贷相关业务(如风险评估、信用评分、违约预测等),有国际信贷业务经验优先
职位详情
- 上海
- 5-10年
- 本科
- 非外包类
- 要求数据开发经验
- 数据平台开发经验
- 数据仓库开发经验
- 大数据引擎开发经验
- 数据治理经验
- 数据建模经验
- Python
- Java
- Scala
- SQL
- Spark
- Kafka
- 其他
- 数据质量
- 大模型
- LLM
- 大规模数据
- 存储 / 爬虫
AI数据工程师(高级/资深) 一、计boss算引擎方向 1、参与千亿级数据处理平台的建设,构建自然语言和多模态大模型的数据分析、清洗、评测和反馈平台。 2、设计开发数据处理框架,提升数据分析、清洗人员的研发效率,提升系统性能。 3、设计开发数据评测和反馈平台,持续提高数据质量与迭代效率。 4、设计开发数据标准、流程、自动化工具,提升团队整体效率。 5、探索大数据组件、中间件在超大规模数量下AI+DATA场景的性能优化方案。 二、存储底座方向 1、设计开发PB级数据存储底座建设,构建多数据中心、多存储介质高性能存储框架。 2、设计开发面向支撑AI+DATA大kanzhun规模多层级智能路由缓存框架,包括对象存储、文件存储等。 3、设计开发基于数据湖、数据管理、存算分离架构的元数据管理框架。 4、设计开发数据重复检测、文件合并等存储治理框架。 5、探索AI+DATA大规模数据处理、训练场景下的性能优化方案。 三、爬虫方向 1、设计开发高效、可扩展的数据爬虫框架,以收集、清洗和整合大规模网络数据。 2、研究分析网络资源,制定有效的数据抓取策略。 3、处理反爬虫策略,包括但不限于IP代理、验证码识别等。 4、提供数据结果,支持数据分析和机器学习等后续步骤。 5、关注并应用一般的Web安全实践,尊重目标网站的Robot.t直聘xt指引。 职位要求 一、计算引擎方向 1、拥有计算机科学或相关领域的硕士学位。 2、具有千亿级大数据平台开发岗位3年及以上工作经验。 3、熟练掌握Hadoop/Hudi/Iceberg、Spark、Kubernetes、Elasticsearch、MongoDB等组件的使用,精通其中至少一个组件; 4、熟练掌握Python/Java/Go语言,熟悉常用数据结构及算法。 5、熟练掌握分布式、网络、操作系统领域的知识,掌握TCP/IP协议、掌握Linux系统的使用。 6、良好的沟通能力和团队合作精神。 加分项: 1、有AI数据平台建设经验。 二、存储底座方向 1、拥有计算机科学或相关领域的硕士学位。 2、具有存储领域相关3年及以上工作经验。 3、熟悉主流分布式文件系统如GPFS、Lustre等,熟悉主流对象存储协议S3等,熟悉主流数据湖技术如Iceberg/Hudi等,熟悉分布式缓存系统如Alluxio/Redis等,精通其中至少一个方向。 4、熟练掌握Java/Go/C++语言,熟悉常用数据结构及算法; 5、对常见RPC框架有深入的理解和实践经验。 加分项: 1、有AI存储底座相关建设经验。 三、爬虫方向 1、拥有计算机科学或相关领域的硕士学位。 2、精通Python等至少一种程序语言,具有使用Scrapy/BeautifulSoup等爬虫工具的经验。理解HTML,CSS,JavaScript及Web浏览器DOM结构。 3、熟悉网络爬虫技术,包括动态页面抓取、反封锁/IP代理等。 4、对大数据处理和存储有一定的了解和实践,比如Hadoop,Spark,MongoDBkanzhun等。 5、具备良好的问题解决能力,能独立处理问题,kanzhun并有持续学习和自我提升的动力。对数据抓取的合法性、道德性等有深厚的理解,能制定和遵循严格的数据抓取原则
技能解析
- 法律法规
- 方案撰写
- 安全法律
- 独立解决
- 数据模型
- 风险管理
- 英语口语
- 质量保障
- 数据安全
- 数据产品
- 语言表达能力
- 团队沟通
- 可扩展性
- 统计分析
- 书面表达能力
- 数据技术
- 数据驱动
- 运用数据
- 解决方案
- 模型设计
- 数据治理
- 数据建模
- 业务问题
- 分布式数据
- 表达能力
- 研发经验
- 设计和研发
- 语言表达
- 风险评估
- 数据采集
- 书面表达
- 团队合作精神
- 数据质量
- 合作精神
- 团队合作
数据来自CSL职业科学研究室
技能解析
- 数据处理框架
- 系统性能
- C++语言
- 自动化工具
- 元数据管理
- 研究分析
- 沟通能力和
- IP协议
- HTML
- 数据分析
- 数据存储
- 常用数据结构
- 机器学习
- 沟通能力
- 优化方案
- 性能优化
- 平台建设
- 数据处理
- 提升系统
- 熟悉常用数据
- 解决能力
- 问题解决能力
- 数据管理
- 数据爬虫
- 基于数据
- 设计开发
- 熟悉分布式
- 数据结构
- 问题解决
- 自然语言
- 程序语言
- 好的沟通
- 团队合作精神
- 数据质量
- 合作精神
- 团队合作
数据来自CSL职业科学研究室
公司福利
- 五险一金
- 补充医疗保险
- 年终奖
- 股票期权
- 员工旅游
- 免费班车
- 餐补
- 交通补助
- 节日福利
- 零食下午茶
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。