监控硬盘

折腾最好方式就是让我盘服务器硬盘

约一年前,根据单位需求,我部门借助办公协同软件,开发了套固定资产管理系统。约一个月前,固定资产管理部门通知我们,让我们盘点机房服务器的硬盘,按照某文件规定硬盘属于固定资产,应打上固定资产标签,归固定资产管理部门管,而我们技术部门有使用权。

想了想,从管理角度讲正确无误无懈可击,我只好换个方式来吐槽。

的确,这难住了我,机柜里的服务器,安静而平稳地运行着,最大的年龄十岁多了,最小的年龄也年满四岁,每每重启运维服务器我都提心吊胆,哪怕有个伺候不周,某台因此闹意见就此眼睛一闭,从此不管红尘事。让我从机架上拆下服务器,搬出来用螺丝刀拧开箱盖,拍照验明正身,走固定资产入库,生成并贴固定资产标签,再一丝不苟复原。

监控硬盘
监控硬盘

重建磁盘冗余,一套组合拳打下来,必定精疲力竭,期间服务还要停止。

这种恐惧,我想了下,不可能是不作为因素作怪,更可能是承担不起操作的巨大风险。信息安全原理列出的十二类信息安全威胁里,人为过失或失败排名第五,排名第九的是技术硬件故障或错误。想想错综复杂的域环境,想想交叉存储的备份数据,想想彼此交织的业务逻辑。

我知道无效,但我绝对理解,信息机房做法事,运维给服务器上香的行为。

信息安全原理
信息安全原理

悲观点来说,哪怕运维良好的域环境,也只是一个临界状态,就如累卵经不起过多的震动,又如驮草的疲惫骆驼,不能身加几根稻草。蝴蝶效应是存在的,黑天鹅也会不期而来。乐观点来说,这是个很好的机会,我可以趁此机会复盘这几年的经验,考核各部件及服务器的健壮性,顺便调整部分已经同当前环境不匹配的业务策略和逻辑。

就是说,尽可能保证业务持续性的同时,我会把更多的资源和精力放在修正某些已知问题和教授年轻有干劲的同事上,这对年轻人来说,特别是云服务器成为主流的现在来说,是个难得的学习机会。大拆大卸的过程,我敢打包票,就是检验各种应急策略的过程,不出问题都对不住我活了这么多年。同时,解决问题的过程也是让我和同事成长的过程。

人为过失过失败行为
人为过失过失败行为

换句话讲,当跨领域指挥和专业知识不对称的情形下,若换个角度和立场来看,折腾反而成了机会。王朔说过孔雀开屏虽然好看,转过身却是屁眼儿,我现在说,当看到一个屁眼时,我绕个圈去看,也许就是孔雀开屏。若我把这看成瞎折腾,我肯定是对的,因为确实够折腾,若我把这看成吹牛皮的趣谈,技术的考验,也未尝不可。

技术硬件故障或错误
技术硬件故障或错误

于是我想,若此次劫难我有幸和同事一起淌过,那就狠一点,提出建议并出台策略,每年或每半年盘点硬盘内存处理器等核心部件,杜绝一直锁着的机房,某些东西不翼而飞罢?

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注