职位&公司对比
职位详情
- 上海
- 1-3年
- 本科
- java爬虫
- python爬虫
- 自然语言处理
岗位职责: 1.负责爬虫软件工具和爬虫技术的选取; 2.负责爬虫采集器设计、开发、优化; 3.实现各种互联网来源的数据标准化处理入库; 任职要求: 1.本科及以上学历,能力优秀者可放宽到大专学历; 2.精通HTTP协议,熟悉各种WEB认证机制,掌握nutch\solr\lucece\heritrix等工具优先考虑; 3.一年来自BOSS直聘以上JAVA/PYTHON使用开发经验,熟来自BOSS直聘悉数据库架构,在PDF文本化、表格提取、图像OCR、文本清理、智能识别某一方面有一定的特长; 4.工作认真负责,能够快速学习各种新技术,有强烈的BOSS直聘专研精神和解决问题能力。
职位详情
- 上海
- 不限
- 本科
- 数据清洗
- 具身智能
- 大模型
- Numpy
- Open3D
- Python
- Pandas
- Omniverse
岗位职责: 1. 专注于具身智能大模型数据的清洗、过滤和整理,与模型训练团队密切合作,确保高质量的数据支持机器学习项目,数据形式包括但不限于二维图像视频、三维模型、文本、动作序列等。 2. 数据清洗与整理:负责收集和处理原始数据,识别和修正数BOSS直聘据中的错误与异常,以确保数据的准确性和一致性; 3. 协作构建训练数据集,与模型训练侧紧密合作,理来自BOSS直聘解项目需求,构造和准备符合要求的高质量训练数据集,提升模型性能; 4. 开发数据处理管道:设计和维护自动化的数据处理管道,以提高数据清洗和整理的效率,减少人工干预; 5. 监控与维护数据管道:实时监控数据管道的运行状态,及时识别并解决潜在问题,确保数据流的连续性和稳定性; 6. 文档与最佳实践分享:撰写清晰的文档,记录数据处理流程和方法,并与团队分享数据处理的最佳实践,以促进知识传递。 职位要求: 1. 本科及以上学历,计算机、软件工程、电子信息等相关专业优先,具备1年以上数据清洗工作经验; 2. 精通 Python 编程语言,能够使用相关库(如 Pandas、NumPy、Open3D)进行数据处理,同时具备 Omniverse 等仿真平台使用经验者优先; 直聘3. 了解具身智能和大模型相关基础知识,具备具身智能和大模型相关经验kanzhun者优先,能kanzhun够应用于数据处理和分析中; 4. 具备良好的沟通能力,能够与不同团队成员有效协作,推动项目进展。
技能解析
- JAVA
- 熟悉数据库
- 熟悉数据
- 开发经验
- HTTP协议
- 解决问题
- PYTHON
- 解决问题能力
数据来自CSL职业科学研究室
技能解析
- 电子信息
- 清洗工作
- 密切合作
- 编程语言
- 数据处理和分析
- 软件工程
- 数据支持
- 数据清洗
- 项目进展
- 监控数据
- 机器学习
- 紧密合作
- 沟通能力
- 模型训练
- 数据处理流程
- 好的沟通
- 数据处理
数据来自CSL职业科学研究室
工作时间
工作时间
公司福利
- 五险一金
- 加班补助
- 年终奖
- 带薪年假
- 员工旅游
- 餐补
- 节日福利
公司福利
- 平台好
- 住房补贴
- 节日福利
- 交通补助
- 带薪年假
- 年终奖
- 五险一金