职位&公司对比

招聘中

爬虫工程师

-K
  • 移动互联网
  • A轮
职位关闭

高级爬虫工程师

-K
  • 互联网
  • 未融资

职位详情

  • 北京
  • 不限
  • 不限
  • Python

岗位职责: • 参与云合大数据分析平台的开发 • 网页爬虫构架设计与核心技术开发 • 平台管理和运维 技能要求: • 算法和数据结构基础 • 至少熟悉Python、Java、C++、Perl等语言中的一种 • kanzhun网页爬虫开发经验 • 分布boss式系统来自BOSS直聘经验 加分项: • 大数据平台相关经验,如Spark,Hadoop,Kafka、HkanzhunBase等 • 数据可视化、数据建模、数据挖掘等来自BOSS直聘经验

职位详情

  • 北京
  • 3-5年
  • 本科
  • 爬虫
  • 商品数据
  • 电商

工作职责: 1、负责分布式爬虫系统的架构设计与开发,负责设计并实现高效、稳定的爬虫系统,抓取各类互联网数据源(如新闻、社交媒体、电商平台等); 2、究反爬虫策略,以及采集支撑服务建设,保障数据获取能力,掌握常 JavaScript 混淆的调试分析; 3、负责海量数据的爬取、清洗boss、解析、入库,维护抓取程序的监控和报警,并且快速修复问题; 4、遵守robots.txt协议和网站使用条款,确保爬虫操作符合法律法规; 5、熟悉数据库技术,如MySQL、MongoDB等,能够进行数据存储和查询优化。 任职要求: 1、计算机科学、软件工程或相关直聘专业本科及以上学历; 2、扎实的编程能力,精通Python/C++/Java等至少一种编程语言‌ 3、精通网页抓取原理及技术,能从结构化和非结构化的数据中获取信息; 4、掌握web/app常见的反爬机制,精通各种反爬破解,包括但不限于:hook,js调试,js补环境,浏览器引擎,混淆、逆向分析工程等技能; 5、熟悉TCP,Http协议原理;熟悉正则表达式,DOM,XPath等技术;

技能解析

专有技能
  • 算法和数据结构
  • 结构基础
  • 大数据分析
  • 数据分析
  • 技术开发
  • 开发经验
  • 数据建模
  • 分布式系统
  • 数据结构
  • 数据可视化
  • 数据挖掘

    数据来自CSL职业科学研究室

    技能解析

    专有技能
    • 熟悉数据库
    • 数据存储
    • 海量数据
    • 熟悉数据
    • 数据库技术
    • 法律法规
    • 编程语言
    • 获取信息
    • 架构设计
    • 软件工程
    • 编程能力

      数据来自CSL职业科学研究室

      工作时间

      上午09:30   -   下午06:30
      双休弹性工作

      工作时间

      上午10:00   -   下午07:00
      双休偶尔加班

      公司福利

      • 五险一金
      • 年终奖
      • 带薪年假
      • 员工旅游
      • 餐补

      公司福利

      • 五险一金
      • 年终奖
      更新于 2025-04-28