关注近期几起网站运维事故

最近看到几则新闻,都是和网站运营维护有关的,一个比一个离谱。

第一个是云网主站点不可访问。看新闻是从上午折腾到下午还没有修复。有趣的是出了故障之后云网居然把 IP 指向了 127.0.0.1。这是 8 月 9 号的事情。好像找不到云网任何官方对这次故障的说明,至少我没有找到。

第二个是关于工行的。8 月 15 号到 16 号,工行个人银行服务出现故障。据说是”由于15日是存款利息税下调、系统升级改造、新基金发行和拆分、养老金和工资的发放等业务集中所致”,更具体一点是什么原因,恐怕永远不得而知。要说起银行的 IT 系统建设,那可是天文数字啊。可以不夸张的说,硬件只挑贵的买。业务流程,什么标准化的东西,也都是早早建立起来的,但是,但是,但是,但是,还是不管用。

第三个,”当当当”, 当当网的数据库账户泄漏事件。程序出错页面居然把数据库连接串和密码什么的都打印出来了。不得不佩服一下。

点击查看出错页面的精彩图片

当当用的是 SQL Server.

网站的运维是个高精度而高复杂度的事情,远非弄一堆所谓的花哨流程、买一堆昂贵的机器所能解决一切问题的。

当然类似的事情也不止国内有,Facebook 不也出了个源代码泄漏的事故么。总算和国际接轨了。

最让人晕死的事情是今天 Dreamhost DNS 服务出现问题,导致我这个 Blog 10 来个小时不能访问。

EOF


  • http://yanfeng.org/blog 桑葚

    原来是 dns 问题啊。怪不得我的站都在一个服务器上,有的能访问有的不能。

  • http://www.imdba.net brotherxiao

    hehe,光花钱买好东西不顶用,光有流程也不管事
    运维不容易啊,高度+细节?

  • http://www.xiaojb.com jieer

    我的dreamhost倒是没有问题呀
    或者我没发现。

  • xh4n

    在反ddos的时候 会将 IP 指向了 127.0.0.1

  • http://www.fcicq.net/wp/ fcicq

    有些已经不能称作事故了.隔一段肯定要冒出几个典型?

  • Platinum

    verycd.com 也有把数据库密码打印到页面上的事情,很厚道的给他们发了封邮件提醒他们

  • http://www.xiha.org summer

    怪不得那天我的数据库服务器有问题呢。我看啊,专注做生意的人不太重视网站的:)

  • http://weibo.com/fakegov 董金

    第一个是云网主站点不可访问。看新闻是从上午折腾到下午还没有修复。有趣的是出了故障之后云网居然把 IP 指向了 127.0.0.1。这是 8 月 9 号的事情。好像找不到云网任何官方对这次故障的说明,至少我没有找到。
    这个可能是次ddos攻击
    因为 解决ddos攻击最没办法的办法就是把dns设置成127.0.0.1