职位&公司对比

招聘中

爬虫工程师

-K
  • 计算机软件
  • 未融资
招聘中

python爬虫工程师

-K
  • 广告/公关/会展
  • 不需要融资

职位详情

  • 上海
  • 1-3年
  • 本科
  • java爬虫
  • python爬虫
  • 自然语言处理

岗位职责: 1.负责爬虫软件工具和爬虫技术的取; 2.负责爬虫采集器设计、开发、优化; BOSS直聘 3.实现各种互联网来源的数据标准化处理入库; 任职要求: 1.本科及以上学历,能力优秀者可放宽到大专学历; 2.精通HTTP协议,熟悉各种WEB认证机制,掌握nutch\solr\lucece\heritrix等工具优先考虑; 3.一年以上JAVA/PYTHON使用开发经,熟悉数据库架构,在PDF文本化、表格提取、图像OCR、文本清理、智能识别某一方面有一定的特长; 4.工作认真负责来自BOSS直聘,能够快速学习各种新技术,有强烈的专研精神和决问题能力。

职位详情

  • 上海
  • 1-3年
  • 本科

本岗位不接受线上面试! 岗位职责: 1、主导公司所需的爬虫系统架构设计和开发工作 2、负责整个主题爬虫系统架构和数据存储设计,应对各种互联网爬虫规则 3、对各网站、APP和社交媒体内容的爬取和维护 4、负责核心爬虫系统设计、数据库设计与实现 5、设计策略和算法,提升网页抓取的效率和质量 6、分析爬虫系统的技术缺陷,对策BOSS直聘略架构做出合理地调整和改kanzhun进  岗位要求: 1、熟悉爬虫系统整个生命周期的设计及实现,有负责核心框架建设和技术攻关能力 2、2 年及以上 Python 爬虫经验,扎实的BOSS直聘编程功底,良好的编码风格及编码能力  3、熟悉常用的信息抓取策略、js逆向、浏览器指纹、自动化技术和数据重组算法 4、熟练kanzhun使用Request、Scrapy、Celery等采集技术,Plabossywright、Puppteer、uiautomator2自动化技术 5、熟练使用Mysql、Mongodb、Redis、RabbitMq、Elasticsearch等中间件 6、掌握小红书数据采集的方案(必须),有抖音、微信公众号等数据抓取经验者更优 7、对人工智能、模型训练有一定的了解 8、对新技术有浓厚的学习欲望,有较强的独立处理问题的能力

技能解析

专有技能
  • JAVA
  • 熟悉数据库
  • 熟悉数据
  • 开发经验
  • HTTP协议
  • 解决问题
  • PYTHON
  • 解决问题能力

    数据来自CSL职业科学研究室

    技能解析

    专有技能
    • 编码风格
    • 系统架构设计
    • 架构设计
    • 系统架构
    • 微信公众号
    • 数据库设计
    • 生命周期
    • 数据存储
    • 模型训练
    • 系统设计
    • 开发工作
    • 编码能力
    • 数据采集
    • 处理问题的能力

      数据来自CSL职业科学研究室

      工作时间

      上午9:00   -   下午5:30
      双休弹性工作

      工作时间

      上午09:00   -   下午06:00
      双休弹性工作

      公司福利

      • 五险一金
      • 加班补助
      • 年终奖
      • 带薪年假
      • 员工旅游
      • 餐补
      • 节日福利

      公司福利

      • 五险一金
      • 加班补助
      • 全勤奖
      • 年终奖
      • 带薪年假
      • 员工旅游
      • 节日福利
      更新于 2025-04-28