职位&公司对比
职位详情
- 北京
- 不限
- 不限
- Python
岗位职责: • 参与云合大数据分析平台的开发 • 网页爬虫构架设计与核心技术开发 • 平台管理和运维 技能要求:直聘 • 算法和数据结构基础 • 至少熟悉Python来自BOSS直聘、Java、C++、Pebossrl等语言中的一种 • 网页爬虫开发经直聘验 • 分布式系统经验 加分项: •直聘 大数据平台相关经验,如Spark,Hadoop,Kafka、HBase等 • 数据可视化、数据建模、数据挖掘等经验
职位详情
- 北京
- 3-5年
- 本科
- Scrapy
岗位职责: 1、负责通用spider的信息抽取和技术算法的研发,提升数据采集的效率和质量 2、负责设计开发超大规模的分布式以及海量公开数据采集技术,支撑百亿千亿级数据采集落地。包括但不限于调度算法、监测网页更新、高质量网页数据的监测等算法相关技术,提升采集的性能及效率 3、负责抓取策略的BOSS直聘设计与研发,包括链接筛选算法的开发,网页质量排名算法,通过历史数据动态更新网页的排名策略,主题侧重的自适应爬虫系统的设计与实BOSS直聘现 4、负责构建完善的监控机制,实时监控爬虫状态及数据质量,包括但不限于反爬虫策略 任职要求: 1、精通python/Java/c++中至少一种编程语言 BOSS直聘2、熟悉主流的爬虫采集框架,如Scrapy/Selenium等 3、有扎实的数据结构以及算法基础 boss4、有搜索引擎的通用爬虫系统建设者优先直聘 5、参与过大型分布式爬虫系统设计、优化以及成功的经验 6、有抓取策略算法设计经验者优先
技能解析
- 算法和数据结构
- 结构基础
- 大数据分析
- 数据分析
- 技术开发
- 开发经验
- 数据建模
- 分布式系统
- 数据可视化
- 数据挖掘
- 数据结构
数据来自CSL职业科学研究室
技能解析
- 设计经验
- 数据质量
- 编程语言
- 设计开发
- 算法相关
- 设计与研发
- 系统的设计
- 系统建设
- 算法基础
- 算法设计
- 系统设计
- 搜索引擎
- 数据采集
- 数据结构
数据来自CSL职业科学研究室
工作时间
工作时间
公司福利
- 餐补
- 员工旅游
- 带薪年假
- 年终奖
- 五险一金
公司福利
- 节日福利
- 零食下午茶
- 带薪年假
- 五险一金
- 企业文化