职位&公司对比

招聘中

爬虫工程师

-K
  • 计算机软件
  • 未融资
招聘中

数据采集工程师

-K·薪
  • 信息安全

职位详情

  • 上海
  • 1-3年
  • 本科
  • java爬虫
  • python爬虫
  • 自然语言处理

岗位职责: 1.负责爬虫软件BOSS直聘工具和爬虫技术的选取; 2.负责爬直聘虫采集器设计、开发、优化; 3.实现各种互联网来源的数据标准化处理入库; 任职要求: 1.本科及以上学历,能力优秀者可放宽到大专学历; 2.精通HTTP协议,熟悉各种W来自BOSS直聘EB认证机制,掌握nutch\solr\lucece\heritrix等工具优先考虑;kanzhun 3.一年以上JAVA/PYTHON使用开发经验,熟悉数据库架构,在PDF文本化、表格提取、图像OCR、文本清理、智能识别某一方面有一定的特长; 4.工作直聘认真负责,能够快速学习各种新技术,有强烈的专研精神和解决问题能力。

职位详情

  • 上海
  • 不限
  • 本科
  • 爬虫
  • 数据采集

岗位职BOSS直聘责: 1、负责设计和开发高效、稳定的网络爬虫系统,从各种数据源中抓取数据; 2、对抓取到的数据进行清洗、去重、转换等处理,确保数据的质量和准确性; 3、解决爬虫过程中遇到的各种技术问题,如反爬机制、IP封锁、验证码识别等; 4、持续优化爬虫策略和算法,提高数据抓取的效率和覆盖率; 5、与数据分析师、开发团队等合作,将抓取到的数据集成到公司的数据平台或应用中。 任职要求: 1、计算机、软件工程等统招本科及以上学历,应届生或有相关开发经验; 2、熟练掌握至少一门编程语言 Python、Java 等,熟悉常用的爬虫框架和工具,如 Requests、BeautifulSoup、Selenium(Python)/Jsoup、OkHttp、SeleniuBOSS直聘m直聘(Java) 等; 3、熟悉 HTTP 协议、HTML、CSS、JakanzhunvaScript 等,能够分析网页结构和数据提取逻辑; 4、熟悉数据库操作,如 MySQL、MongoDB等; 5、了解分布式爬虫架构和技术,能够应对各种复杂直聘的反爬机制;有大规模数据抓取经验者优先; 6、对数据敏感,有数据分析和挖掘经验者优先。

技能解析

专有技能
  • JAVA
  • HTTP协议
  • 解决问题
  • PYTHON
  • 解决问题能力
相同技能
  • 熟悉数据库
  • 熟悉数据
  • 开发经验

数据来自CSL职业科学研究室

技能解析

专有技能
  • 数据敏感
  • 数据分析
  • 技术问题
  • 数据库操作
  • 编程语言
  • 数据分析和挖掘
  • 软件工程
  • HTML
  • 有数据分析
相同技能
  • 熟悉数据库
  • 熟悉数据
  • 开发经验

数据来自CSL职业科学研究室

工作时间

上午9:00   -   下午5:30
双休弹性工作

公司福利

  • 五险一金
  • 加班补助
  • 年终奖
  • 带薪年假
  • 员工旅游
  • 餐补
  • 节日福利
更新于 2025-05-14