关于
运维工程师 / SRE
专注于云原生基础设施、高可用架构设计与自动化运维体系建设。
技术栈
云平台
- AWS(EKS、EC2、ALB、Route53、IAM)
- 阿里云
容器与编排
- Kubernetes(EKS 自管节点、Karpenter 扩缩容)
- Docker、Containerd
- Helm、Kustomize
监控与可观测性
- Prometheus + VictoriaMetrics
- Grafana(Dashboard 定制、告警优化)
- Loki / ELK 日志体系
- Jaeger 链路追踪
大数据平台
- CDH(Cloudera Distribution Hadoop)
- Hadoop(HDFS、MapReduce、YARN)
- Hive、Impala、Spark
- HBase、Kafka(数据管道)
- Sqoop、Flume(数据采集)
- Oozie、Azkaban(调度系统)
CI/CD 与 GitOps
- GitLab CI、GitHub Actions
- ArgoCD
- Jenkins
数据库与中间件
- MySQL、PostgreSQL、TiDB
- Redis、RocketMQ、Kafka
- Nacos、Zookeeper
工作方式
- 故障驱动改进:所有线上问题必须沉淀为 SOP 或自动化修复
- 监控先行:无监控不上线,无告警不变更
- 文档即代码:运维操作全部文档化、脚本化、版本化
联系方式
- GitHub: mrchicn
- 站点: wr.mrchi.cn
- 邮箱: devops@mrchi.cn
本站使用 AstroPaper 主题构建,记录云原生环境下的运维实践与基础设施治理。