虽然不知道最终我朝诉讼双方和诉讼和稀泥一方最终会搞出个什么结果出来,但窃以为作为曾经的一名“运维架构师”,还是要为大家科普一下云上数据的安全性问题…
很多人有个误区:觉得一年花个几千块钱上云,数据和服务就万事无忧了, 其实这是有问题的。 不管你是上了AWS,还是阿里云,腾讯云,甚至现在的华为云, 他们只是在基础设施服务层面比你做的好很多,但远没有说可以100%不出问题。 对于技术团队中的运维团队来说,他们最尴尬的地方就在于, 他们纵然再努力,都只能无限趋近100%不出问题天际线, 但却永远达不到,抓不着, 嗯, 跟夸父追日有一拼。
所以, 回到今天某数据公司在腾讯云出了故障之后数据皆丢失的问题上来:
架构上有个原则(老调重弹了, 哥10年前的经验): 不信任任何第三方依赖。
对于某企业来说,腾讯云就是他的第三方依赖, 遵循不信任任何第三方依赖就意味着,你要清醒的认识到, 任何第三个组件或者服务都是不可靠的,有可能出问题的,所以,要提前做好预防工作,包括但不限于重试,断路器,多副本,高可用,多供应商等等手段。
而针对此次事件, 该企业即使做一个简单的定时脚本每天备份一下数据,也不至于说数据全都丢失, 一点儿运维意识都没有,明明一个定时定期的冷备就可以搞定80%-90%的风险敞口, easy却不去做, 不该你去死又该是谁呢?愚蠢至此,还好意思要1000万赔偿,我也是醉了, 不想想你才花了多少点儿银子?!如果风险那么大,收益还那么低,SB才干这个生意那,早赔光早托生啊~
给各位CEO和老板们几点建议:
嗯,就这么些, 前阵子有兄弟跟我说生产库被删了, 也不止恢复过来没有, 我已经听到不知道多少家公司的CEO或者CTO跟我实时报道这种事件了, 该踩的坑儿,看来谁也躲不过,哈