1:运维人员身体不舒服,状态不佳时,禁止做高风险变更。带病和状态不佳时,进行高风险工作是不建议的,高风险变更前要神智清晰,不可过量饮酒等。
2:禁止大范围更新配置和数据前,没有进行小范围试点。灰度发布同样适用于运维,灰度发布过程中能提前发现问题,避免大范围影响到全局环境。小范围验证通过后,按批次更新剩余节点。
3:禁止将公司敏感文档,商业方案,产品关键架构和代码上传到外部网站换取积分等。可能给公司带来无法预测的后果,甚至引发公司倒闭。
4:禁止变更后不检查业务,信心十足地认为业务无问题而无需检查。变更前尽早检查是否满足变更前提,变更后验证业务是否正常。一次成功的变更包括了业务运行状态的检查。
5:运维误操作之后不可隐瞒,尽快通知其他运维人员,迅速恢复。误操作之后不要有侥幸心里,不要认为不会被发现,没人知道,从而避免自己被批评,隐瞒不报会给公司带来更多损失。
6:禁止运行自己不理解的命令和未知脚本。尤其是在生产环境,不要运行自己不理解的命令,可能会闯祸。有人使用dd命令测试磁盘性能,却毁掉了生产数据,给公司带来数十万损失。
7:生产环境禁止用于个人试验用途,禁止用来练习脚本技能等。保持学习和持续提高自身技能,是很赞的工作态度。但是请不要在生产环境进行练习,有闯祸风险。
8:禁止运行来路不明的破解软件,优先选择开源软件或授权的商业软件。网络上随意下载的软件可能包括木马病毒和勒索软件等,如发生内网传播,对严重破坏公司数字资产,如勒索软件。
9:禁止从数据库中导出用户数据后,未经脱敏步骤就发送给其他人员(运营,开发等)。从源头上保护用户数据安全,减少泄露风险。禁止出于好奇心和炫耀目的,将用户数据发放到社交平台。
10:禁止变更方案中不包含回退方案,要有应对意外的准备。不怕一万,就怕万一,要为突发情况准备应急方案。
11:禁止以任何方式变相压榨外包运维工程师。道德上来说,尊重他人。其二,公司运维负担临时增加时,外包工程师辅助完成公司任务,管理层应能力范围内为外包同学多争取福利。