职位&公司对比
职位详情
- 上海
- 3-5年
- 本科
- 要求有数仓开发经验
- 接受无实时数仓经验
- Java
- Python
- SQL
- Shell
- Hive
- Flink
- MapReduce
- Presto
- HBase
- 数据建模经验
- 数据治理经验
- 计算机相关专业
- 非外包类
1.负责拼多多数仓的架构设计和研发,持续集成相关工具产品,建设拼多多统一的数据体系; 2.负责拼多多(离线/实时)数仓的稳定性,保障核心链路数据流稳定产出; 3.负责拼多多(离线/实时)数据建模、研发与质量把控,关键技术攻关,不断优化系统性能、降低资源开销; 4.推进批流一体落地,提升拼多boss多数据采集、生产与使用的时效性; 5.与业务深入合作,以解决实际问题导向,助力业务及产品不断优化; 6.构建丰富多样的应用,解决实时数据在数据分析、业务决策、服务化、产品化来自BOSS直聘等BOSS直聘场景的一系列挑战
职位详情
- 上海
- 3-5年
- 不限
- Hadoop
- MapReduce
- Flink
- 实时数仓
- 数据仓库
- 大数据仓库
- 数据资产
- 数据治理
(中高级,2025应届&实习可投) 岗位职责: 1.参与建设统一的数据资产体系,持续集成相关工具产品,以搭建大数据业务统一计算层等相关工作; 2.参与数据仓库的架构设计和研发,挖掘数据价值,建设与管理X PB级的公共数据平台和服务系统,实现高质量数据的互通与共享; 3.助力数据化运营业务,构建丰富多样的BI应用; 4.对数据采集、数据融合、数据治理、数据应用链路有深入理解,并能赋能业务数据集市建设,搭建业务领域模型; 岗位要求: 1.数学、计算机、统计学等相关专业,来自BOSS直聘5年以上相关工作经历; 2.从事数据仓库领域至少5年以来自BOSS直聘上,熟悉数据仓库模型设计与ETL开发 ,并有不断优化模型设计及ETL代码成功经验; 3.有从事分布式数据存储与计算平台应用开发经验,熟悉Hadoop生态相关技术并有相关实践经验着优先,重点考察Hdfs、Mapreduce、Hive、Hbase; 4.有实时ETL研发经验,对分布式实时大数据处理系统有深入理解,包括但不限于Spark streaming、Flink、Storm...; 5.熟悉数据仓库领域知识和技能者优先,对元数据管理、主数据管理、数据治理、质量、稳定性、安全等领域有独到的见解; 6.具有电商行业经验,有业务sense,能够通过梳理设计业务模型发现业务问题,并驱动业务目标实现; 加分项: 1.对数据挖掘和机器学习有所了解,包括常用的机器学习算法和数据建模过程的优先,并有落地的项目; 2.对E来自BOSS直聘lasticsearch、Hbaseboss、Druid、Kylin有深入理解并成功应用的大型项目;
技能解析
- 系统性能
- 数据分析
- 实时数据
- 关键技术
- 优化系统
- 质量把控
- 解决实际问题
- 数据建模
- 架构设计
- 设计和研发
- 数据采集
数据来自CSL职业科学研究室
技能解析
- 应用开发经验
- 数据仓库
- 业务数据
- 元数据管理
- 机器学习算法
- 数据应用
- 熟悉数据仓库
- 数据存储
- 机器学习
- 熟悉数据
- 数据仓库模型
- 开发经验
- 学习算法
- 数据处理
- 数据挖掘
- 数据管理
- 应用开发
- ETL开发
- 模型设计
- 数据治理
- 业务问题
- 分布式数据
- 研发经验
- 数据建模
- 架构设计
- 设计和研发
- 数据采集
数据来自CSL职业科学研究室
工作时间
公司福利
- 节日福利
- 全勤奖
- 定期体检
公司福利
- 五险一金