记录一下自己做运维这些年的发展历程
第一阶段:救火队长
出现了故障,赶紧找原因。最常用的计俩,重启服务,再不行了,重启服务器,重启数据库
第二阶段:预警消防
对所有服务,服务器,网络设备做好监控,出现问题了提前预警
第三阶段:人机交互
之前是有一个环境搞一个环境,服务器多了搞一个环境就要半天,升级也是一台一台来。太麻烦。使用脚本进行人机交互。
第四阶段:统一标准
之前遇到问题时候老是这里问题,那个问题。而且每台服务器环境不一样,导致出现问题的原因五花八门。这一阶段就需要进行重构了,所有的服务环境全部统一。利用脚本进行环境的部署,甚至可以采用镜像的模式,每台服务器除了IP不一样,应该几乎是长得一模一样。
第五阶段:自动化执行
通过各种脚本,组合,可以构建自己的运维平台,通过运维平台自动化执行各种任务,部署升级,服务初始化,监控告警,定时构建、重启等等
第六阶段:智能化运维
智能化运维,俗称AIOPS,要达到这个阶段必须要有海量的数据进行支撑。像阿里云,腾讯,美团,字节这样的超级大的科技公司可能会有使用场景。
以上是我根据自己多年的运维经验做的一些总结。俗话曰:先有后优。第一步肯定就是要保证服务的稳定。在保证服务正常的状态下,再去做一些尽可能解放双手,提升自己技能的事情。俗话曰:8小时以内谋生存,8小时以外谋发展。如果一天工作12个小时996的班制都在忙活救火,那基本没啥大的发展可言了。共勉!~

一个有意思的话题:我们做运维是应该成为devops还是成为opsdev呢。给我留言,我们来讨论讨论。