职位&公司对比
职位详情
- 西安
- 不限
- 本科
职位描述 1、负责公有云IaaS、PaaS客户稳定性机直聘制的构建工作,涵盖故障观测、响应机制建立、快速止损措施制定以及系统性改进建设,以确保客户线上业务稳定、可靠运行; 2、负责识别当前客户使用云产品全链路环节的可靠性,通过指标量化评估客户系统部署的健康程度,持续优化系统架构,从故障检测、通知与响应机制、自动恢复和止损效率等方面进行提升,增强IaaS产品的可靠性和稳定性; 3、负责推动IaaS&PaaS客户使用云产品最佳实践的落地,借助风险筛查、隐患排查等亚健康观测手段,帮助客户发现资源使用和系统架构方面的改进点,并协同客户团队落实改进措施; 4、持续跟踪业界前沿技术方案,结合IaaS、PaaS相关实际业务场景,不断迭代引入新技术和新方案,如AI OPS、观测降噪和精准,智能辅助运维等。 职位要求 1、拥有5年以上公有云/IaaS、PaaS相关稳定性保障、解决方案架构师或客户重保经验BOSS直聘中的一项或多项; 2、具备大规模分布式系统、基础设施系统等设计开发或运维保障的实战经验,例如复杂业务场景的流程优化、系统高可用性架构实现等; 3、具备搭建观测系统、抽取指标、调优阈值等思路和实操经验,能够分类提炼故障自愈模式,助力系统实现自动/半自动恢复运行;kanzhun 4、对问题具备清晰的分析逻辑和全局思维,能够提出建设性思路和解决方案,具备良好的沟通和结构化表达能力,具有团队协作意识; 5、熟悉云计算架构,具备扎实的开发编程能力,熟练掌握一门以上开发语言(Golang/Python/C)。 具备以下条件者优先: 1、有业务上云经验,熟悉一家或多家业界主流云厂商的IaaS /PaaS产品者优先; 2、具备一定的全栈能力,对稳定性、SLA保障体系、稳定性优化有深入思考,有面向ToB客boss户线上稳定性保障经验者优先; 3、擅长架构设计、性能优化,有故障处理、巡检、监控、限流、降级、预案、容量规划等经验者优先。
职位详情
- 西安
- 3-5年
- 本科
- 集群运维
- 存储运维
- Linux
- Python
- 分布式技术
- ELK
- GlusterFS
- K8S
1. 负责云存储产品的日常变更及维护 2,负责系统的稳定性,包括但不限于来自BOSS直聘性能指标监控,异常发现,异常定位,异常排查 3,负责支撑上述分布式系统的自动化运维平台的研发,维护 4,负责提升研发、测试效能,开发持续集成、持续交付系统 5kanzhun,支撑来自BOSS直聘重大活动的保障和护航工作
技能解析
- 熟悉云计算
- 技术方案
- 全局思维
- 设计开发
- 架构设计
- 系统架构
- 编程能力
- 协作意识
- 解决方案
- 流程优化
- 团队协作
- 具有团队协作
- 性能优化
- 优化系统
- 表达能力
- 高可用性
- 好的沟通
- 结构化表达
- 团队协作意识
- 开发语言
- 分布式系统
数据来自CSL职业科学研究室
技能解析
- 性能指标
- 自动化运维
- 分布式系统
数据来自CSL职业科学研究室
工作时间
工作时间
公司福利
- 五险一金
- 补充医疗保险
- 意外险
- 定期体检
- 年终奖
- 绩效奖金
- 股票期权
- 带薪年假
- 餐补
- 团建聚餐
- 住房补贴
- 家属自选保险
- 家庭关爱假
- 免费健身设施
- 年度体检
- 就近租房补贴
公司福利
- 公仔周边活动
- 免费健身房
- 五险一金
- 补充医疗保险
- 意外险
- 定期体检
- 年终奖
- 带薪年假
- 员工旅游
- 团建聚餐
- 有无线网
- 免费班车
- 节日福利
- 交通补助