职位&公司对比

招聘中

爬虫工程师

-K
  • 互联网
  • 天使轮
招聘中

爬虫工程师

-K
  • 互联网金融
  • 天使轮

职位详情

  • 杭州
  • 1-3年
  • 本科
  • 数据采集
  • 数据抓取
  • python爬虫

1boss、主导爬虫系统的架构设计和开发; 2、主导爬核心算法的设计和优化; 3、指导boss项目团队成员的boss日常开发工作,解决开发中的技术问,满足数据爬取需求。

职位详情

  • 杭州
  • 3-5年
  • 本科
  • 新闻舆情网站

工作内容: 1、完成对复杂网站的信息抓取和交互模拟,通过各种渠道或方式对相关网站进行抓取; 2、不断完善并维护相关网站的直聘抓取,检查抓取后是否有遗漏等工作,确保站点按周期采集及时、全面; 3、负责信息抓取结果的抽取、数据清洗、分类、聚类等工作; 4、反爬策略的设计及优化 任职要求: 1、熟练掌握python语言,熟悉requests/scrapy等常用爬虫技术组件和框架,熟悉正则表达式、dom等,从非结构化的数据中获取信息 2、3年以上爬虫工作经验,有舆情类相关网站等爬取数据经验优先; 3、有较强的网站分析能力,熟知各种反爬措施及相关解决办法 4、责任心强,有boss良好的沟通能力和团队合作精神,较强的学习能力和发现解决问题能力 5、熟练使用gevent、requests、selenium等技术实现高并发稳定抓取; 6、熟练使用消息队列(MQ)、celery等异步框架实现分布式任务处理; 7、熟知HTTP、TCP、Socket等底层知识; 8、熟练掌握Fiddler、Http debugger等抓捕工具; 9、熟悉WebMagic、adsl拨号、正则表达式、脱壳技术、二维码识别、滑来自BOSS直聘块验证码破解、httpCBOSS直聘lient、分词、分布式爬虫调度、数据质boss量监控、代理ip调度算法、配置化爬虫、授权爬虫、舆情、应用市场;

技能解析

专有技能
  • 技术问题
  • 架构设计
  • 开发工作

    数据来自CSL职业科学研究室

    技能解析

    专有技能
    • 质量监控
    • 团队合作精神
    • 数据质量
    • 获取信息
    • 沟通能力和
    • 解决问题
    • 团队合作
    • 数据清洗
    • 较强的学习
    • 设计及优化
    • 学习能力和
    • 沟通能力
    • 分析能力
    • 合作精神
    • 消息队列
    • 好的沟通
    • 学习能力
    • 解决问题能力

      数据来自CSL职业科学研究室

      工作时间

      上午09:00   -   下午05:30
      双休弹性工作

      公司福利

      • 生日福利
      • 节日福利
      • 住房补贴
      • 零食下午茶
      • 员工旅游
      • 带薪年假
      • 加班补助
      • 定期体检
      • 五险一金
      更新于 2025-05-14