一直觉得系统的默认配置总归是相对而言最保守,最安全的设置,昨天的一件事让我彻底改变了看法。
一台FC的主机,其实也不是什么重要的服务器,仅仅只是做php程序的本地测试而已。按照FC的"默认”磁盘分区安装。FC的默认磁盘分区大致都是这样:一个100M左右的/boot以后,所有的磁盘规整为一个LVS,不管你的Swap还是/ /usr,都在这个LVS里面——类似于win的逻辑磁盘的用法。
倒霉就在这里了。使用了一段时间后,磁盘出现了坏簇——暂且不管是物理的还是逻辑的,总之我遇到的问题就是那个LVS出现了毛病。运气不错,重启之后系统无法挂装/分区,而且错误修正不了,系统竟然自说自话的开始了fsck!结束后整个LVS成了一个新的分区,而且没有盘符和挂装点,数据全部丢失!系统完全崩溃。唯一庆幸的是硬盘上最有价值的东西也不过就是我一个写了3000多行的PHP,其余的都已近作了备份。
这台机器总共就只有一个硬盘,而且根本不需要平滑升级磁盘分区,而且就算需要平滑升级,默认把/也放在了LVS中,怎么可能拆得下?系统的这个默认设置真实有点滑稽。换成分为n个分区的话,这场事故充其量也就是损坏一个磁盘分区而已,大部分数据还是可以保留的。
| anyShare分享到: | |
| |

#1 by litrin on 2006年07月18日 - 08:59
看来这个毛病是普遍存在的。有位访客的服务器也发生了同样的毛病而导致系统崩溃,不同的是,他的系统是由于负载过高,系统不响应,打电话叫机房重启,估计是机房里那个毛手毛脚的管理员直接拔掉了电源,系统跟随拔掉的电源灰飞烟灭了。
据我个人估计,真正的原因可能是由于频繁的读写swap导致磁盘带宽占满,系统不响应,大量磁盘读写操作停滞——系统内存少的可怜,却开了2个mysql的服务。系统掉电后出现文件碎片,开机自动fsck,可能耗费很长时间,该同学情急之下又让机房“拔了电源”,人为破坏了fsck过程也就破坏了包含最重要“/”分区的LVS。