职位&公司对比

招聘中

爬虫工程师

-K
  • 移动互联网
  • A轮
招聘中
某大型知名互联网公司

职位详情

  • 北京
  • 不限
  • 不限
  • Python

岗位职责: • 参与云合大数据分析平台的开发 • 网页爬虫构架设计与核心技术开发 • 平台管理和运维 技能要求: • 算法和数据结构基础 • 至少熟悉Python、Javakanzhun、C++、Perl等语言中的一种 • 网页爬虫开发经验直聘 • 分布式系统经kanzhun验 加分项: • 大数据平台相关经验,如Spark,Hadoop,Kafka、HBase等 • 数据可视化、数据来自BOSS直聘建模、数据挖掘等经验

职位详情

  • 北京
  • 5-10年
  • 本科
  • 数据采集
  • 爬虫
  • 逆向
  • 网页
  • 抓取

工作直聘职责: 负责互联网网页、文档、图片、音视频等内容数据的发现、采集、解析及存储优化。 负责建设高性能、高稳定性的浏览器集群,优化 JavaScript 渲染性能,提升爬虫对抗能力及页面加载效率。 优化爬虫架构,提升系统稳定性、可扩展性,完善爬虫平台能力提高业务支持效率。 研究和对抗各类反爬机制,提升爬虫隐蔽性、智能性,确保大规模数据采集任务的来自BOSS直聘顺利执行。 参与搜索、AI 训练数据采集相关业务,支持大模型数据爬来自BOSS直聘取、解析及处理。 任职资格: 扎实的编程能力,熟练掌握 Go、Java、Python 其中至少一种,熟悉高性能编程、并发编程及系统优化。 熟悉爬虫及网页渲染技术,深入理解 Chromium/Blink 内核,或有 无头浏览器(Puppeteer、Playwright、Selenium 等) 相关经直聘验。 有 大规模分布式爬虫 经验,熟悉浏览器渲染优化、高并发数据抓取、智能调度策略等技术。 熟悉常见的 反爬机制及对抗策略(IP 代理、行为模拟、验证码破解等),有真实对抗案例优先。 对 搜索引擎、数据分析、大模型数据采集 相关行业有深入理解者优先。

技能解析

专有技能
  • 算法和数据结构
  • 结构基础
  • 大数据分析
  • 技术开发
  • 开发经验
  • 数据建模
  • 分布式系统
  • 数据结构
  • 数据可视化
  • 数据挖掘
相同技能
  • 数据分析

数据来自CSL职业科学研究室

技能解析

专有技能
  • 系统优化
  • 可扩展性
  • 系统稳定性
  • 渲染技术
  • 并发编程
  • 提升系统
  • 编程能力
  • 搜索引擎
  • 数据采集
  • 浏览器渲染
相同技能
  • 数据分析

数据来自CSL职业科学研究室

工作时间

上午09:30   -   下午06:30
双休弹性工作

公司福利

  • 餐补
  • 员工旅游
  • 带薪年假
  • 年终奖
  • 五险一金

公司福利

  • 交通补助
  • 节日福利
  • 高温补贴
  • 团建聚餐
  • 加班补助
  • 绩效奖金
  • 五险一金

备注

职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。

更新于 2025-05-14