职位&公司对比

招聘中

爬虫工程师

-K
  • 计算机软件
  • 未融资
职位关闭

爬虫工程师

-K
  • 电子商务
  • 已上市

职位详情

  • 上海
  • 1-3年
  • 本科
  • java爬虫
  • python爬虫
  • 自然语言处理

岗位职责: 1.BOSS直聘负责爬虫软件工具和爬虫技术的选取; 2.负责爬虫采boss集器设计、开发、优化; 3.实现各种互联直聘网来源的数据标准化处理入库; 任职要求: 1.本科及以上学历,能力优秀者可宽到大专学历; 2.精通HTTP协议,熟悉各种WEB认证机制,掌握nutch\solr\lucece\heritrix等工具优先考虑; 3.一年以上JAVA/PYTHON使用开boss发经验,熟悉数据库架构,在PDF文本化、表格提取、图像OCR、文本清理、智能识别某一方面有一定的特长; 4.工作认真负责,能够快速学习各种新技术,有强烈的专研精神和解决问题能力。

职位详情

  • 上海
  • 3-5年
  • 本科
  • 爬虫

岗位职责: 1、数据抓取与分析:负责从多种来源(包括网站、App、移动端等)抓取数据。 BOSS直聘2、反爬机制突破:针对目标网站或App的反爬机制,研究并实施解决方案, 熟悉Android 逆向,有脱壳和反混淆经验, 能够还原 so层加密算法或直接调用。 3、协议解析与逆向开发:解决复杂协议(如QUIC、WebSocket、JCE等)和加密算法的抓取难点,完成非HTTP协议的请求处理。 4、自动化工具开发:开发自动化工具,提升爬取效率和数据处理能力。 5、系统架构设计:参与爬虫系统的架构设计,优化任务调度、数据存储及处理流程,确保系统的高可用性和可扩展性。 6、各boss平台验证码突破:通过算法识别各类验证码,生成拟人轨迹,通过协议突破各类验证码。 任职要求: 1、教育背景:本科及以上学历,计算机相关专业优先。 2、工作经验:至少2年以上的爬虫开发经验,有丰富的多平台(Web、App)数据抓取经验。 3、编程能力:熟练掌握Python、Node.js、Go、Java中的一种或多种语言,具备高效的代码实现能力。 4、反爬与逆向技术:熟悉常见的反爬机制及解决方案,有JS逆向、Android/iOS逆向经验,熟悉boss使用Unidbg、Frida-RPC等工具完成加密算法还原或生成加密参数。 5、协议与加密处理:熟悉多种网络协议(如HTTP/HTTPS、QUIC、WebSocket等),了解SSL验证绕过、加密参数破解等技术。 6、学习能力:来自BOSS直聘对新技术有较强的学习能力,能够快速适应复杂多变的BOSS直聘项目需求。 7、工作态度:具备较强的责任心和团队合作精神,能够承受一定的工作压力,具备独立解决问题的能力。

技能解析

专有技能
  • JAVA
  • 熟悉数据库
  • 熟悉数据
  • PYTHON
  • 解决问题能力
相同技能
  • 开发经验
  • HTTP协议
  • 解决问题

数据来自CSL职业科学研究室

技能解析

专有技能
  • 自动化工具
  • 数据处理能力
  • 架构设计
  • 数据存储
  • 独立解决
  • 合作精神
  • 数据处理
  • 团队合作精神
  • 解决问题的能力
  • 系统架构设计
  • 可扩展性
  • 系统架构
  • 编程能力
  • 网络协议
  • 团队合作
  • 较强的学习
  • 解决方案
  • 加密算法
  • 高可用性
  • 学习能力
  • 独立解决问题
  • 多种语言
相同技能
  • 开发经验
  • HTTP协议
  • 解决问题

数据来自CSL职业科学研究室

工作时间

上午9:00   -   下午5:30
双休弹性工作

工作时间

上午09:00   -   下午06:30
双休弹性工作

公司福利

  • 五险一金
  • 加班补助
  • 年终奖
  • 带薪年假
  • 员工旅游
  • 餐补
  • 节日福利

公司福利

  • 五险一金
  • 定期体检
  • 股票期权
  • 加班补助
  • 工龄奖
  • 全勤奖
  • 带薪年假
  • 员工旅游
  • 餐补
  • 团建聚餐
  • 节日福利
更新于 2025-05-12