google云故障导致unisuper服务中断,在google云上的两份数据都被删除掉了,索性unisuper在其他地方还有备份,不然就直接挂掉了。基于这个现象,实际多云部署才是未来
1) 云作为基础设施,从架构设计层面会考虑各种各样的冗余、多活设计。从设计上,应该是具备高可用的。
2)云难保不会出现各种问题,不论是人为问题,还是代码bug,又或者是基础设施问题
3)对于企业和云厂商来看,大部分企业实际是将自己的性命完全托付给云厂商,因为企业自身的高可用、容灾都是依托与云的高可用及多活。当一些故障发生的时候,自身实际是做不了任何事情的。
4)如果只把云厂商比作一个issS提供商来说,大部分情况下是可以把云厂商对比为传统的服务器厂商、网络设备厂商、存储厂商。当一个非常核心的数据需要确保万无一失的时候,从企业自身出发,在设计上需要同时采购多家厂商的提供的设备才能保障架构层面的稳定可靠。
5)当然云厂商的同学可能会说,实际的机房建设的过程中,机房设备本身就会对传统厂商做备份冗余。但在云这个环境下,云的IssS层可以认为传统的服务器厂商+云侧的运维人员。硬件设备可能都会有冗余,但难以避免人员的误操作。
6)从故障场景的出现概率上看。人员导致的故障>>> 软件bug导致的故障>>>架构设计导致的故障>>>硬件设备导致的故障。安全生产的机制建设,以及安全生产的流程管理非常非常非常重要。