职位&公司对比

招聘中

Lead Site Reliability Engineer

-K·薪
  • 智能硬件
  • 已上市

职位详情

  • 成都
  • 3-5年
  • 本科
  • Shell
  • Linux
  • Docker
  • K8S
  • 分布式技术
  • Redis
  • 自动化运维
  • 容器技术

岗位责: 1、负责大数据平台系统运维工作(Hadoop/Hive/Yarn/Spark/Storm/Kafka//Flume等),对系统可用性负责; 2来自BOSS直聘、设计和开发大数据集群各服务自动化运维与监控工具; 3、梳理优化业务使用集群的流程和规范,使集群使用boss在资源利用、质量等方面均达到较高水平; 4、理解并实施大数据产品的部署场景。 任职资格: 1、计算机科学、计算机工程及相关专业的本科及以上学历; 2、3年及以上系统大数据开发或大数据运维工作经验; 3、熟悉Hadoop生态圈,对HBase、Hive、Spark、Impala、Kafka、Redis等主流分布式开发套件有一定认识, 有相关安装部署及调优经验者优先; 4、熟悉掌握Java/Shell等相关语言, 掌握常用网络知识,掌握常用的安全配置策略,了解常用的服务器硬件,有良好的Linux运维操作功底BOSS直聘; 5、主性强,积极乐观,学习能力强,抗压能力强,能及时响应各类突发状况; 6、负责大数据平台相关组件和商业化产品的安装部署及日常运维。 7、加分项:对云原生(docker、k8s、golang) 等技术有了解和兴趣

职位详情

  • 成都
  • 5-10年
  • 本科
  • Docker
  • 计算机相关专业

提供中英文简历 In this role, your responsibilities include: • Lead efforts to monitor, maintain, and enhance the reliability and availability of our production systems. • Design and implement robust monitoring, alerting, and incident response processes. • Collaborate with development teams to ensure seamless deployment and operation of applications. • Manage our cloud-based infrastructure (AWS) and systems. • Automate routine tasks to improve efficiency and reduce manual intervention. • Scale infrastructure to meet growing demands. • Participate in on-call rotations and respond prombossptly to critical incidents. • Optimize resource utilization, including CPU, memory, and storage. • Drive continuous improvement in system reliability and operational excellence. • Champion reliability best practices across the organi直聘zation. In this role, the preferred skills and qualifications are: • Bachelor’s degree in Computer Science, Engineering, or a related field (or equivalent experience). • Proven t来自BOSS直聘rack record as a Site Reliability Engineer or similar role. • Experience with containerization (Docker, Kubernetes) and orchestration. • Familiarity with cloud platforms (AWS, Azure, GCP) and infrastructure-as-code (Terraform, Ansible). • Excellent problem-solving abilities and a passion for automating repetkanzhunitive tasks. • Certifications in cloud technologies (AWS Certified DevOps Engineer, Google Professional Cloud DevOps Engineer, etc.). • Experience with observability tools (Prometheus, Grafana, ELK stack). • Knowledge of CI/CD pipelines and GitOps practices.

技能解析

专有技能
  • 数据开发
  • 数据产品
  • 系统运维
  • 系统运维工
  • 突发状况
  • 大数据开发
  • 自动化运维
  • 学习能力
  • 运维工作
  • 监控工具

    数据来自CSL职业科学研究室

    技能解析

      暂无识别出相关技能要求

      工作时间

      上午09:00   -   下午06:00
      双休弹性工作

      工作时间

      上午09:00   -   下午06:00
      双休弹性工作

      公司福利

      • 专属健身房
      • 试用期全薪
      • 五险一金
      • 定期体检
      • 全勤奖
      • 带薪年假
      • 餐补
      • 节日福利

      公司福利

      • 五险一金
      • 补充医疗保险
      • 定期体检
      • 股票期权
      • 带薪年假
      • 餐补
      • 节日福利
      • 零食下午茶
      更新于 2025-05-15