3月3日凌晨,阿里云开始出现大规模故障,位于华北地区的多家互联网公司的 IT 运维人员发现多个 APP 和网站开始陷入卡顿。随后一批程序员赶往公司加班。这起宕机事故持续了三个小时左右,事后观察了两个小时。
根据阿里云发布的公告,华北2地域可用区C部分的 ECS 服务器(云服务器)等实例出现 IO HANG(IO 不响应),经紧急排查处理后已全部恢复。阿里云表示其他区域未发现此类情况。
阿里云是中国市场份额最大的公有云厂商,而 ECS 服务器是阿里云最为核心的 IaaS(基础设施即服务)之一。针对故障,阿里云表示将根据 SLA 协议,尽快处理赔偿事宜。
SLA 协议即服务等级协议(Service Level Agreement, SLA)。根据阿里云官网资料显示,对于单 ECS 实例,如服务可用性低于 99.95%,用户可获得月度服务费 10%、25%、100% 不等的赔偿。—— 华为云、腾讯云的赔偿标准均与此相似。
所以,阿里云并未公开详细的赔偿细节。不过根据阿里云开发者论坛上的网友说法,赔偿通常是按照故障时间的100倍进行,而方案则根据包年包月预付费模式和按量付费模式有所不同,但总额不超过支付的单台云服务器费用总额。
简单来说,赔偿方式主要就是“送时间”。
“不过,这些赔偿与企业的损失差距很大”,一位云计算企业工程师向中新社国是直通车如此表示,“如果京东淘宝5分钟不能登陆,其造成的损失会比宕机做出的赔偿要多得多。”
还有网友提出,除了赔偿使用时长和代金券,还应该赔偿“加班费”,不少运维和程序员得从被窝里爬起来加班。
原创文章,作者:蓝洛水深,如若转载,请注明出处:https://blog.lanluo.cn/6179