职位&公司对比

招聘中

爬虫工程师

-K
  • 移动互联网
  • A轮
招聘中
  • 互联网
  • 已上市

职位详情

  • 北京
  • 不限
  • 不限
  • Python

岗位职责: •BOSS直聘 参与云合大数据直聘分析平台的开发 • 网boss页爬虫构架设计与核心BOSS直聘技术开发 • 平台管理和运维 技能要求: • 算法和数据结构基础 • 至少熟悉Python、Java、C++、Perl等语言中的一种 • 网页爬虫开发经验 • 分布式系统经验 加分项: • 大数据平台相关经验,如Spark,kanzhunHadoop,Kafka、HBase等 • 数据可视化、数据建模、数据挖掘等经验

职位详情

  • 北京
  • 1-3年
  • 本科

岗位职责: 1. 根据业务需求,研究爬虫策略和防屏蔽规则,设计和开发分布式爬虫,支持高并发多平台抓取; 2. 负BOSS直聘责网页信息抽取、简单清洗、数据BOSS直聘入库等开发; 3. 提升爬虫稳定性及可扩展性,充分利用资源,优化爬虫效率和质量。 任职资格: 1. 计算机软件及相关专业本科毕业; 2. 1年以上爬虫项来自BOSS直聘目开发经验,优秀毕业生亦可; 3.了解或处理过手机端抓包、源码分析等; 4.了解或处理过webpack、jsvmp等 5. 熟悉爬虫原理及常见的反爬虫技术,如cookie、js加密、base64等; 6. 熟练运用python及多进程、多线程开发; 7. 熟练使用scrapy、requests、selenium、pyppeteer等爬虫包; 8. 熟悉html,正则、xpath等提取技术; 9kanzhun. 熟悉Mysql、Redis等数据库及相关操作; 10. 熟悉Linux基础命令; 11. 有Django/Flask等web框架开发经验者优先。

技能解析

专有技能
  • 算法和数据结构
  • 结构基础
  • 大数据分析
  • 数据分析
  • 技术开发
  • 数据建模
  • 分布式系统
  • 数据结构
  • 数据可视化
  • 数据挖掘
相同技能
  • 开发经验

数据来自CSL职业科学研究室

技能解析

专有技能
  • 项目开发经验
  • 框架开发
  • 可扩展性
  • 计算机软件
  • 多线程开发
相同技能
  • 开发经验

数据来自CSL职业科学研究室

工作时间

上午09:30   -   下午06:30
双休弹性工作

工作时间

上午09:00   -   下午06:00
双休偶尔加班

公司福利

  • 餐补
  • 员工旅游
  • 带薪年假
  • 年终奖
  • 五险一金

公司福利

  • 五险一金
  • 补充医疗保险
  • 定期体检
  • 带薪年假
  • 节日福利
更新于 2025-05-09