- 岗位职责
岗位职责:
- 负责公司内部 Kubernetes 集群的运维,协助开发进行发版更新;
- 协助客户管理私有化部署的集群及其他中间件组件;
- 完善监控,报警,排错等管理平台建设,及时处理异常告警
- 保证关键系统的安全性及灾备高可用
- 岗位要求
岗位要求
- 有充足的 Docker / Kubernetes 落地实战经验,包括但不限于部署、业务运维、网络管理、分布式存储、监控、日志等技术知识积累,了解 Rancher、Helm 等更佳;
- 对容器、云原生方向的主流 Linux 发行版均有涉猎,包括但不限于 CentOS、Ubuntu、Alpine 等;
- 能够运用 Shell 或 Python 解决工作上的问题;
- 有主流中间件的部署、运维、排障灾备经验,包括但不限于 Zookeeper、Kafka、Consul、Mongo、PostgreSQL、MariaDB 等;
- 对 Prometheus 监控套件有落地经验,能够运用 PromQL 在 Grafana 上做出符合要求的面板展示,能够运用 PushGateway 按照需求采集自定义指标,了解如何配置监控告警、监控服务自动发现;
- 对 Ansible 等自动化配置管理工具拥有实战经验;
- 会有需要面向客户的情况,需要良好的沟通能力