职位&公司对比
职位详情
- 合肥
- 1-3年
- 本科
- 大数据处理经验
- 机器学习经验
- Spark
- 计算机相关专业
- Python
- 数学/统计相关专业
【岗位描述】 1.负责大模型预kanzhun训练数据的清洗、去噪与结构化处理,构建高质量语料库,支持模型训练需求。 2.设计并实现基于Python的高效数据处理Pipeline,优化数据预处理流程,提升数据质量。 3.擅长对接数据采集(上游)与模型训练(下游),制定数据规范、质量监控及闭环优化策略,确保数据-模型高效协同。 【核心技能要求】 1.编程能力 a. 熟练掌握Python语言,熟练使用正则表达式,掌握面向对象编程及类的继承等,有html,json等数据处理经验。 b. 熟练掌握Linux,能够自主进行conda环境配置与依赖管理,擅长使用grep/awk/sed等命令进行文本处理。 c. 具备NLP实战经验,熟悉中文分词技术,掌握文本分类模型训练流程及调优方法,有实际项目经验 2.加分项 a. 熟悉lxml,BeautifulSoup等技术,有一定的爬虫经验。 b. 熟悉DeepSeek、通义千问等国产大模型的选型、量化、推理加速及ollama部署,具备Prompt工程和RAG优化等垂直领域适配经验。 c. 熟练部署并优化开源工具,掌握容器化封装、性能调优及生产级落地能力,确保高效稳定服务于业务场景。 d. 有spark分布式和并发数据处理经验;来自BOSS直聘 【来自BOSS直聘任职资格】 1.本科及以上学历(学信网可查),计算机、数据科学、人工智能相关专业。 2.2年以上数据清洗/处理经验,有LLM或NLP项目经验者优先。 3.具备良好的数据敏感度,能来自BOSS直聘独立解决复杂数据问题。 4.强烈的责任心与团队协作能力,适应快节奏技术迭代。
职位详情
- 合肥
- 3-5年
- 硕士
- Java
- 大数据处理经验
- Python
工作职责: 1、负责对接业务条线(主要有设备,工艺,质量等)的数据挖掘及分析需求,协助完成模型的开发、部署、测试、监控及应用管理: 2、负责推进与子公司业务方联合分析建模工作,为业务方提供模型应用支持: 3、负直聘责模型特征库和指标体系建设,协助完成模型数据需求整合,包括业务含义和业务口径梳理,推进数据需求的开发、测试并完成指标的验证: 4、负责利用机器学习技术开发和落地不同业务场景的模型,包括但不限于特征工程、机器学习、知识图谱、神经网络等建模方法与无监督学习、半监督学习、有监督学习目标交叉融合的模型。 kanzhun任职资格: 1.全日制大学硕士及以上学历,统计学、应用数学、信息与计算科学、运筹学、来自BOSS直聘计算机科学等数学与计算机相关专业,掌握扎实的统计学,数据挖掘,机器学习理论基础; 2.具有数据挖掘等方面的项目经验; 3.能熟练运用Python\Java等boss数据挖掘工具和技能(至少精通一种); 4.有志于制造业业务数据分析,具有自我驱动能力,对新技术有强烈求知欲和学习能力; 5.善于从商业角度解读数据,能推动数据分析结果落地和应用创新; 6.良好的团队沟通合作能力。
技能解析
- 面向对象
- 质量监控
- 性能调优
- 数据质量
- 数据处理经验
- 编程能力
- 数据清洗
- 数据敏感
- 数据科学
- 数据敏感度
- 与团队协作
- 协作能力
- 独立解决
- 优化策略
- 团队协作
- 团队协作能力
- 模型训练
- 面向对象编程
- 数据处理
- 数据采集
数据来自CSL职业科学研究室
技能解析
- 团队沟通合作
- 建模方法
- 沟通合作能力
- 业务数据
- 团队沟通
- 应用数学
- 沟通合作
- 神经网络
- 知识图谱
- 分析结果
- 理论基础
- 需求整合
- 数据分析
- 机器学习
- 数据挖掘工具
- 技术开发
- 学习能力
- 体系建设
- 数据挖掘
- 合作能力
数据来自CSL职业科学研究室
工作时间
工作时间
公司福利
- 节日福利
- 餐补
- 全勤奖
- 保底工资
- 绩效奖金
- 年终奖
公司福利
- 节日福利
- 免费班车
- 包住
- 包吃
- 带薪年假
- 股票期权
- 绩效奖金
- 五险一金
- 子女幼儿园