又来免费30天

SAE数据库故障

常关注我博客的朋友应该知道,6月5-6日那阵我博客无法访问。就因为数据库出现了严重故障,导致许多应用链接失败。作为一个云平台,SAE出问题后受影响的不止我一个人,而当时新浪官微@SinaAppEngine居然一点反应都没有。我猜那些人当时都在家睡觉,最终故障也是拖到了第二天早上才解决。

今年伊始算起来,我心中一贯稳定的SAE至今出了两次严重故障了,上次是3月24日SAE的数据中心出现极为罕见的“跳闸”,因为市电频率、相位不稳,备用供电选择脱网“自保”,最终导致整个数据中心瞬间断电!而这次SAE官方则大大方方承认他们数据库服务器宕机了,硬盘文件数据出现了严重损坏,抢救恢复数据用了点时间,所以……

作为一个用户,我实在不想听他们解释那些鸡毛蒜皮的细节,我是奇怪这所谓的云服务居然对咱普通用户“吊单线”。官方也承认,企业用户具有一主多从的SLA,所以不受此次故障影响,只可怜咱普通用户是一根绳子吊着的,玄之又玄,说断就断!

故障之后,官方保证了加强数据库服务的SLA,也决定将普通用户的数据库服务SLA提高到企业用户的等级。而我心底仍旧有点忐忑,我看得见的地方是这样了,那我看不到地方的呢?今天是数据库,那明天会不会是别的地方?

我并非奢求能跟企业用户同等标准,毕竟个人跟企业的服务的差别理所当然。但我仍旧坚持认为,既然是云,不管什么地方,都应该具备容错的机制。不要像普通主机那样,一个硬盘坏了就整机数据报废。以前没出事的时候,我都觉得SAE容错性很强,这波潮水来了又退,我才发现其实SAE也在裸泳。

上次电力故障几个小时,SAE官方就补偿了一个月。这次数据库故障,它也仍旧使用同样的招数安抚咱,今天账户多了一个月的云豆。我是没什么感觉,而新浪SAE那边估计就比较心疼了。这两次故障让新浪SAE损失了两个月的收入。教训够狠,他们也该加快建立南方数据中心的的步伐了,等到新浪SAE能做到像谷歌那样“跨地区平衡负载”,一个数据中心倒了,另外一个数据中心还能接上,那才是十足的稳定。

觉得好可以点个赞!
(1个赞)
Loading...

《又来免费30天》有8个想法

  1. 知道我为什么不用这些云那个云了吧?所有的什么容错机制,灾难性预防了,都是台面上说说,真有问题时,可能就一个回答:停电了。

发表评论

电子邮件地址不会被公开。 必填项已用*标注