从4sq宕机到本·拉登宕机

一直在玩Android版本的FourSquar,前些日子忽然无法登录。作为一个身处中国的ITer,首先很自然的想到是由于“非技术因素”导致。没想到这次却是完完全全的技术故障。而且并非是4sq自己的故障,故障来自亚马逊的云托管服务。

同样的,前些天最让奥巴马同志欣慰的莫过于总算搞掉了本·拉登这块心病。美国人一窝蜂的愣是挤爆了CNN的手机网站。据说全美所有新闻网站的平均响应时间瞬间提升了6倍以上——可以说,都是处在了宕机的边缘。拉登果然是“恐怖之王”连他的死讯都能媲美一次完美的DDOS攻击。

两个新闻都与宕机有关,而且都与移动互联和宕机有关。

不管愿不愿意接受,整个互联网已经逐步向移动互联网过渡。不管是4SQ、微博这样的应用型访问还是CNN这样的资讯型访问,与手机的结合无疑于绑定了所有人的垃圾时间,带来可观的流量和利润——随时,随地,随性访问互联网真的很方便。然而在此乐观的背后是恐怖的瞬间爆发式访问。正如之前twitter不止一次的宕机事故,每一次都少不了热门事件的推手。

相信这些知名网站的架构设计绝对不是我能想象的完善,硬件投入也绝非“抠门”。唯一的可能就是瞬间提升的访问量导致服务器处理速度和集群带宽容量的饱和。于是加上现在无处不在的“云计算”,像4SQ这样的“成长型企业”很自然的选择了亚马逊以及其他的云服务。选择的背后无疑是将自己的全副家当交给了云,云也会有处理速度和带宽的限制,同样也有可能出现爆发式访问,而且很自然的会出现波及效应,导致云中所有的用户离线。当然,亚马逊对此次事故的评价为“前所未见的”,可以预见的是,一切才刚刚开始!

在此之前我曾经认为移动互联短期内出现的瓶颈是在手机和基站之间的通讯,例如在人多拥挤的地方(事实上是“机多拥挤”)手机信号往往不好。以前年三十大家挤在一起发短信拜年,往往隔几个小时才能收到,对于数据的访问也应如此。后来我看到一篇华为的成功案例,觉得随着时间的推移,迟早这个瓶颈会消失。流量的压力迟早一股脑的扔给了服务端。

对于移动互联的架构师所要考虑的问题就是如何快速的处理“瞬间爆发”,没有任何侥幸心理。这似乎也只有更大的访问冗余可以解决。可以预见的是,现在加上了移动互联的概念后web2.0已经接近成熟,但目前的技术瓶颈已经出现。1.0时代的瓶颈来自带宽,2.0的瓶颈将会是在冗余和弹性上。而对于很多心存幻想的朋友,4SQ的宕机恰恰说明了另一点“云靠不住!”

发表评论

电子邮件地址不会被公开。 必填项已用*标注

请补全下列算式: *

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据