职位&公司对比

招聘中

爬虫工程师

-K
  • 计算机软件
职位关闭

高级爬虫工程师

-K
  • 互联网
  • 未融资

职位详情

  • 北京
  • 1-3年
  • 大专
  • 数据抓取
  • 网络爬虫
  • 数据采集

采集软编写来自BOSS直聘,采集,清洗,整理,boss储存。也可灵活形式合作来自BOSS直聘

职位详情

  • 北京
  • 3-5年
  • 本科
  • 爬虫
  • 商品数据
  • 电商

工作职责: 1、负责分布式爬虫系统的架构设计与开发,负责设计并实现高效、稳定的爬虫系统,抓取各类互联网数据源(如新闻、社交媒体、电商平台等); 2、研究反爬虫策略,以及采集支撑服务建设,保障数据获取能力,掌握常用 JavaScript 混淆的调试分析; 3、负责海量数据的爬取、清洗、解析、入库,维护抓取程序的监控和报警,并且快速修复问题; 4kanzhun、遵守robots.txt协议和网站使用条款,确保爬虫操作符合法律法规; 5、熟悉数据库技术,如MySQL、MongoDB等,能够进行数据存储和查询优kanzhun化。 任职要求: 1、计算机科学、软件工程或相关专业本科及以上学历; 2、扎实的编程能力,精通Pybossthon/C++/Java等至少一种编程语言‌ 3、精通网页抓取原理及技术,能从结构化和非结构化的数据中获取信息; 4、掌握web/app常见的反爬机制,精通各种反爬破解,包括但不限于:hook,js调试,js补环境,浏览器boss引擎,混淆、逆向分析工程等技能; 5、熟悉TCP,Http协议原理;熟悉正则表达式,DOM,XPath等技术;

技能解析

    暂无识别出相关技能要求

    技能解析

    专有技能
    • 熟悉数据库
    • 数据存储
    • 海量数据
    • 熟悉数据
    • 数据库技术
    • 法律法规
    • 编程语言
    • 获取信息
    • 架构设计
    • 软件工程
    • 编程能力

      数据来自CSL职业科学研究室

      工作时间

      上午10:00   -   下午07:00
      双休偶尔加班

      公司福利

      • 五险一金
      • 年终奖
      更新于 2025-04-28