my cognition

書きたいことを書きます。

ファーストサーバ(fitst Server)がぶっとんだらしい。その4

投稿が遅かった!くそ!遅かったんや!


こういうのって何となく大手サイトにニュースが載るよりも早く書きたいですよね。「そんなのしってるよー」ってなる前にっ

ということで、件のファーストサーバの件でYahoo!ニュースに取り上げられていました。


ファーストサーバ、大規模障害の概要と原因を中間報告――複数要因が重なりデータ消失


http://headlines.yahoo.co.jp/hl?a=20120625-00000100-cwj-sci

今日午前2時の時点で発表されていたファーストサーバさんの中間報告がこちら。


大規模障害の概要と原因について(中間報告)

http://support.fsv.jp/info/nw20120625_01.html



( ゚д゚ )・・・


(ノ∀`)アチャー


これは無いわあ・・・2chで噂されていたRAID1とかそういうレベルじゃなくて無いわあ・・・図を見て頂くとわかりますが、これただのコールドスタンバイ(ホットスタンバイもワンチャン・・・)にしか見えないんですよね。

今回起きた事例の原因というのは、「システムのぜい弱性を更新するためにある検証環境1台に対して行おうとしたプログラムに不具合があり、検証環境どころか本番環境・バックアップ環境までそのプログラムが実行されちゃった☆(ゝω・)」とのことみたいですね。

そもそもとして、バックアップというのはスナップショット(ある時点での環境の丸ごとコピー)にすべきじゃないのかしら、と思います。あるぜい弱性がわかっているのであれば、そのパッチ当て自体があるスナップショットからの差分になるので、そのほうが全体のデータの整合性(例えばDBの差分を適用するとか)が取れると思うんですね。

というかこんなことデータセンターを持ってるとこなら当然知っていることのでしょうが、何故こんなことが起こってしまったのか・・・

エンジニアさんが余りに少なかったのか、コスト削減しまくってこうなってしまったのか。営業さんが無理に案件を取りまくっていたのか。
何にせよ大手でこんなことになってしまうみたいなので、データをクラウドに置く、つまり自分でも把握できないようにするということの恐ろしさが垣間見ることが気がしますね。