职位&公司对比

招聘中

爬虫工程师

-K
  • 移动互联网
  • A轮

职位详情

  • 北京
  • 不限
  • 不限
  • Python

岗位职责: • 参与云合大数据分析平台的开发 • 网页爬虫构架设计与核心技术开发 • 平台管理和bossBOSS直聘维 技能要求: • 算法和数据kanzhun结构基础 • 至少熟悉Python、Java、C++、P来自BOSS直聘erl等语言中的一种 • 网页爬虫开发经验 • 分布式系统经验 加分项: • 大数据平台相来自BOSS直聘关经验,如Spark,Hadoop,Kafka、HBase等 • 数据可视化、数据建模、数据挖掘等经验

职位详情

  • 北京
  • 5-10年
  • 本科
  • python
  • 爬虫工程师

工作描述: 1.负责各类平台的大数据抓取平台建设和维护; 2、设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量,解决爬虫遇到的各种反爬问题; 3、负责爬虫逻来自BOSS直聘辑的开发,分析开发效率瓶颈,利用devops手段,实现爬虫采集工具化、自动化、平台化,提高爬虫团队生产效率; 4、负责爬虫数据的清洗,存储等大数据开发工作; 5、与项目经理、产品、下游团队等部门人员沟通,对外提供各种服务完成整体业务需求达成业务目标; 6、使用容器化技术,解决系统自动化部署及爬虫资源分配问题kanzhun; ----------------------------------------------------------------------------------------------- 1. 负责数据平台的数据采集与爬取、解析处理、入库及备份等数据日常工作; 2. 数据采集工具软件平台的开发、测试工作; 3. 负责分析新的数据需求, 完成数据处理的设计(文档)和实现; 4. 负责数据的清洗、整理、整合及合并等工作; 5. 负责数据处理程序设计框架改善, 数据处理性能优化, 系统数据处理的能力提高; 6. 实时监控爬虫的进度和警报反馈。 ------------------------------------------------------------------------------------------------------------------ 职位要求: 1、本科以上学历,计算机相关专业,熟悉操作系统(多线程、多进程)、计算机网络编程、数据结构与算boss法等基础知识; 2、5年以上Linux 环境下常用语言(C/C++/JAVA/Python)开直聘发经验,熟练使用常用 Linux 命令; 3、5年以上大规模网页、App爬虫开发经验,熟悉Scrapy等常用爬虫框架,熟悉浏览器原理、前端 JS、AJAX; 4、深入了解前端JS反爬,能解决前端动态 JS 混淆问题; 5、深入了解非逆向、非侵入式手机APP采集方法; 6、熟悉了解容器化编排技术(swar来自BOSS直聘m/k8s/mesos); 7、熟练使用一门以上脚本语言(Python/Javascript); 8、熟练使用一种以上的数据库(Mongodb/HBase/MySQL); 9、有前后端或大数据项目开发经验优先; 10、有分布式系统设计开发落地经验优先。

技能解析

专有技能
  • 算法和数据结构
  • 结构基础
  • 大数据分析
  • 数据分析
  • 技术开发
  • 数据建模
  • 数据可视化
  • 数据挖掘
相同技能
  • 开发经验
  • 分布式系统
  • 数据结构

数据来自CSL职业科学研究室

技能解析

专有技能
  • JAVA
  • 脚本语言
  • 项目开发经验
  • 测试工作
  • 系统设计开发
  • 数据处理程序
  • C/C++
  • 数据开发
  • 生产效率
  • 平台建设
  • 性能优化
  • 大数据开发
  • 系统设计
  • 数据处理
  • 开发工作
  • 手机APP
  • 开发效率
  • 程序设计
  • 设计开发
  • 工具软件
  • 网络编程
  • 项目经理
  • 数据结构与算
  • 系统数据
  • 数据结构与算法
  • 数据采集
  • AJAX
相同技能
  • 开发经验
  • 分布式系统
  • 数据结构

数据来自CSL职业科学研究室

工作时间

上午09:30   -   下午06:30
双休弹性工作

公司福利

  • 餐补
  • 员工旅游
  • 带薪年假
  • 年终奖
  • 五险一金
更新于 2025-05-16