职位&公司对比

招聘中

爬虫工程师

-K
  • 移动互联网
  • A轮
招聘中

爬虫开发工程师

-K
  • 计算机软件
  • 已上市

职位详情

  • 北京
  • 不限
  • 不限
  • Python

岗位职责: • 参与云合大数据分析平台的开发 • 网页爬虫构架设计与核心技术开发 • 平台管理和运维 技能要求:直聘 • 算法和数据结构基础 • 至少熟悉Python来自BOSS直聘、Java、C++、Pebossrl等语言中的一种 • 网页爬虫开发经直聘验 • 分布式系统经验 加分项: •直聘 大数据平台相关经验,如Spark,Hadoop,Kafka、HBase等 • 数据可视化、数据建模、数据挖掘等经验

职位详情

  • 北京
  • 3-5年
  • 本科
  • Scrapy

岗位职责: 1、负责通用spider的信息抽取和技术算法的研发,提升数据采集的效率和质量 2、负责设计开发超大规模的分布式以及海量公开数据采集技术,支撑百亿千亿级数据采集落地。包括但不限于调度算法、监测网页更新、高质量网页数据的监测等算法相关技术,提升采集的性能及效率 3、负责抓取策略的BOSS直聘设计与研发,包括链接筛选算法的开发,网页质量排名算法,通过历史数据动态更新网页的排名策略,主题侧重的自适应爬虫系统的设计与实BOSS直聘现 4、负责构建完善的监控机制,实时监控爬虫状态及数据质量,包括但不限于反爬虫策略 任职要求: 1、精通python/Java/c++中至少一种编程语言 BOSS直聘2、熟悉主流的爬虫采集框架,如Scrapy/Selenium等 3、有扎实的数据结构以及算法基础 boss4、有搜索引擎的通用爬虫系统建设者优先直聘 5、参与过大型分布式爬虫系统设计、优化以及成功的经验 6、有抓取策略算法设计经验者优先

技能解析

专有技能
  • 算法和数据结构
  • 结构基础
  • 大数据分析
  • 数据分析
  • 技术开发
  • 开发经验
  • 数据建模
  • 分布式系统
  • 数据可视化
  • 数据挖掘
相同技能
  • 数据结构

数据来自CSL职业科学研究室

技能解析

专有技能
  • 设计经验
  • 数据质量
  • 编程语言
  • 设计开发
  • 算法相关
  • 设计与研发
  • 系统的设计
  • 系统建设
  • 算法基础
  • 算法设计
  • 系统设计
  • 搜索引擎
  • 数据采集
相同技能
  • 数据结构

数据来自CSL职业科学研究室

工作时间

上午09:30   -   下午06:30
双休弹性工作

工作时间

上午09:00   -   下午06:00
双休偶尔加班

公司福利

  • 餐补
  • 员工旅游
  • 带薪年假
  • 年终奖
  • 五险一金

公司福利

  • 节日福利
  • 零食下午茶
  • 带薪年假
  • 五险一金
  • 企业文化
更新于 2025-05-14