职位&公司对比

招聘中

爬虫工程师

-K
  • 计算机软件
招聘中

爬虫工程师

-K
  • 智能硬件
  • 未融资

职位详情

  • 北京
  • 1-3年
  • 大专
  • 数据抓取
  • 网络爬虫
  • 数据采集

采集软件来自BOSS直聘的编写,采集,清洗,整直聘理,存。来自BOSS直聘也可灵活形kanzhun式合作。

职位详情

  • 北京
  • 3-5年
  • 本科
  • 爬虫

岗位职责: 设计和开发高效,可扩展的数据爬虫系统,以收集、清洗和整合网络上的大规模数据。 负责研究和分析网络资源,制定有效的数据抓取策略。 能够处理反爬虫策略,包括但不限于IP代理、来自BOSS直聘验证码识别等。 提供数据结果,支持数据分析和机器学习等后续步骤。 与数据科学家来自BOSS直聘、业务分析师和其他开发人员紧密合作,理BOSS直聘解并满足他们的数据需来自BOSS直聘求。 关并应用一般的Web安全实践,尊重目标网站的Robot.txt指引。 岗位要求: 计算机科学、信息技术或相关专业的学士学位,或具有相关工作经验。 精通Python等至少一种程序语言,具有使用Scrapy,BeautifulSoup等爬虫工具的经验。 理解HTML,CSS,JavaScript及Web浏览器DOM结构。 熟悉网络爬虫技术,包括动态页面抓取、反封锁/IP代理等。 对大数据处理和存储有一定的了解和实践,比如Hadoop,Spark,MongoDB等。 具备良好的问题解决能力,能独立处理问题,并有持续学习和自我提升的动力。 对数据抓取的合法性、道德性等有深厚的理解,能制定和遵循严格的数据抓取原则。

技能解析

    暂无识别出相关技能要求

    技能解析

    专有技能
    • 问题解决能力
    • 数据爬虫
    • 研究和分析
    • HTML
    • 问题解决
    • 业务分析
    • 数据分析
    • 数据科学
    • 机器学习
    • 紧密合作
    • 信息技术
    • 程序语言
    • 数据处理
    • 解决能力

      数据来自CSL职业科学研究室

      工作时间

      上午9:30   -   下午6:30
      双休偶尔加班

      公司福利

      • 有无线网
      • 夜班补助
      • 保底工资
      • 绩效奖金
      • 年终奖
      • 五险一金
      更新于 2025-05-11