职位&公司对比
职位详情
- 北京
- 1-3年
- 大专
- 数据抓取
- 网络爬虫
- 数据采集
采集软件的编写来自BOSS直聘,采集,清洗,整理,boss储存。也可灵活形式合作来自BOSS直聘。
职位详情
- 北京
- 3-5年
- 本科
- 爬虫
- 商品数据
- 电商
工作职责: 1、负责分布式爬虫系统的架构设计与开发,负责设计并实现高效、稳定的爬虫系统,抓取各类互联网数据源(如新闻、社交媒体、电商平台等); 2、研究反爬虫策略,以及采集支撑服务建设,保障数据获取能力,掌握常用 JavaScript 混淆的调试分析; 3、负责海量数据的爬取、清洗、解析、入库,维护抓取程序的监控和报警,并且快速修复问题; 4kanzhun、遵守robots.txt协议和网站使用条款,确保爬虫操作符合法律法规; 5、熟悉数据库技术,如MySQL、MongoDB等,能够进行数据存储和查询优kanzhun化。 任职要求: 1、计算机科学、软件工程或相关专业本科及以上学历; 2、扎实的编程能力,精通Pybossthon/C++/Java等至少一种编程语言 3、精通网页抓取原理及技术,能从结构化和非结构化的数据中获取信息; 4、掌握web/app常见的反爬机制,精通各种反爬破解,包括但不限于:hook,js调试,js补环境,浏览器boss引擎,混淆、逆向分析工程等技能; 5、熟悉TCP,Http协议原理;熟悉正则表达式,DOM,XPath等技术;
技能解析
暂无识别出相关技能要求
技能解析
- 熟悉数据库
- 数据存储
- 海量数据
- 熟悉数据
- 数据库技术
- 法律法规
- 编程语言
- 获取信息
- 架构设计
- 软件工程
- 编程能力
数据来自CSL职业科学研究室
工作时间
公司福利
- 五险一金
- 年终奖