3月3日凌晨,一则关于阿里云宕机的消息高居微博热搜前列,众多网友在微博上进行互动反馈,舆论瞬时炸开了锅。原来,阿里云疑似出现大规模宕机事故,该事故造成众多APP、网站一时陷入瘫痪状态。
针对这一事件,阿里云在官方回应中称,华北2地域可用区C部分ECS服务器等实例出现IO HANG,经紧急排查处理后逐步恢复。目前阿里方面已经全面排查其他地域及可用区,未发现此类情况。针对本次故障,阿里云将根据SLA协议,尽快处理赔偿相关事宜。
宕机事故频发 带来严重危害
其实,对于大规模化的数据中心而言,宕机事故并不罕见。不过,对于数据中心而言,宕机仍是难以承受的事故。宕机会造成数据中心的业务中断,云端服务终端,进而导致用户无法正常访问应用程序。在严重的情况下,会给企业造成巨大经济损失。据相关行业专家表示,数据中心停机在美国每分钟造成的平均损失约为8000美元。
随着互联网行业的快速崛起,在数据存储和处理上都有了更高的要求。巨头们纷纷搭建数据中心以支撑日常业务的开展,并以此抢占更大的市场份额。无论宕机原因如何,最终的影响范围有多大,一旦出现宕机,企业对公有云的信心都会发生动摇。
回顾整个2018年,国内外云服务提供商宕机事故不在少数。导致的原因也各不相同,不过均造成了严重后果。OFweek光通讯网摘选了几个2018年中发生的代表性宕机事件,看一看它们有哪些特点。
Youtube宕机-2018年10月16日
2018年10月16日晚上,美国、南美和欧洲许多网友像往常一样打开YouTube,本想着像往常一样刷上几个视频,可在输入了账号和密码后,发现怎么也登陆不上去,仔细核对账号密码后,依然登陆不上。
事后才发现,原来YouTube在当时发生了宕机事故。事故当天,许多用户出现网页无法打开、用户无法登陆、视频播放中断的情况。网页端和移动端均出现类似情况,整个中断时间超过2个小时。
腾讯云宕机-7月24日
2018年7月24日上午,腾讯云因广州运营商光缆物理中断宕机。据微博用户@卢松松爆料,腾讯云此次宕机影响较大,导致腾讯云广州区域全面断网,包括腾讯云主页、控制台、DNSPod等。
谷歌云-2月15日/7月17日
2018年2月15日,谷歌应用开发平台的出现了数据库故障引发了不少该平台客户的烦恼。该问题于接近于中午12点时发生在Google Cloud Datastore上,这是为规模型用户设计的一款非关系型数据库。
在事故中,谷歌PaaS服务Google App Engine的用户经历了长达一小时的错误与延迟情况。游戏玩家在这次事件中受波及最为严重,因为不少的热门在线游戏使用了谷歌服务。而像Pokemon Go和Snapchat也备受冲击。