职位&公司对比
职位详情
- 北京
- 不限
- 不限
- Python
岗位职责: • 参与云合大数据分析平台的开发 • 网页爬虫构架设计与核心技术开发 • 平台管理和运维 技能要求: • 算法和数据结构基础 • 至少熟悉Python、Javakanzhun、C++、Perl等语言中的一种 • 网页爬虫开发经验直聘 • 分布式系统经kanzhun验 加分项: • 大数据平台相关经验,如Spark,Hadoop,Kafka、HBase等 • 数据可视化、数据来自BOSS直聘建模、数据挖掘等经验
职位详情
- 北京
- 5-10年
- 本科
- 数据采集
- 爬虫
- 逆向
- 网页
- 抓取
工作直聘职责: 负责互联网网页、文档、图片、音视频等内容数据的发现、采集、解析及存储优化。 负责建设高性能、高稳定性的浏览器集群,优化 JavaScript 渲染性能,提升爬虫对抗能力及页面加载效率。 优化爬虫架构,提升系统稳定性、可扩展性,完善爬虫平台能力,提高业务支持效率。 研究和对抗各类反爬机制,提升爬虫隐蔽性、智能性,确保大规模数据采集任务的来自BOSS直聘顺利执行。 参与搜索、AI 训练数据采集相关业务,支持大模型数据爬来自BOSS直聘取、解析及处理。 任职资格: 扎实的编程能力,熟练掌握 Go、Java、Python 其中至少一种,熟悉高性能编程、并发编程及系统优化。 熟悉爬虫及网页渲染技术,深入理解 Chromium/Blink 内核,或有 无头浏览器(Puppeteer、Playwright、Selenium 等) 相关经直聘验。 有 大规模分布式爬虫 经验,熟悉浏览器渲染优化、高并发数据抓取、智能调度策略等技术。 熟悉常见的 反爬机制及对抗策略(IP 代理、行为模拟、验证码破解等),有真实对抗案例优先。 对 搜索引擎、数据分析、大模型数据采集 相关行业有深入理解者优先。
技能解析
- 算法和数据结构
- 结构基础
- 大数据分析
- 技术开发
- 开发经验
- 数据建模
- 分布式系统
- 数据结构
- 数据可视化
- 数据挖掘
- 数据分析
数据来自CSL职业科学研究室
技能解析
- 系统优化
- 可扩展性
- 系统稳定性
- 渲染技术
- 并发编程
- 提升系统
- 编程能力
- 搜索引擎
- 数据采集
- 浏览器渲染
- 数据分析
数据来自CSL职业科学研究室
工作时间
公司福利
- 餐补
- 员工旅游
- 带薪年假
- 年终奖
- 五险一金
公司福利
- 交通补助
- 节日福利
- 高温补贴
- 团建聚餐
- 加班补助
- 绩效奖金
- 五险一金
备注
职位发布者未明确表明公司信息,具体可咨询职位发布人进行确认。