冗長化構成

羽田の管制塔で電源ストップ、空港を閉鎖したそうです。電源は2重化していたそうですが、バックアップ電源もダウンしたそうです。

 二重化しているのになぜ障害になるんだとお思いの方が多いと思いますが、2重化にすることによって新たな問題が抱え込むこともよくあります。
 私が扱うネットワークでも機器を二重化することがあります。ルーターやスイッチ、サーバーなどは片方が落ちるとスタンバイしている機器に切り替わるようになっています。しかしこれは冗長化の仕組みがちゃんと動いていればの話で、これがよくトラぶります。
 例えばルーターでも特殊なプロトコルで2つのルーターがお互い監視していて片方が落ちるともう片方があがるというしくみがあります。しかしこの監視がうまくいかないと両方落ちることがあります。原因として設定が間違っていたりバグだったり色々です。結局絶対に落ちないネットワークなどできるわけもなく、落ちる確率を下げることしかできません。

 今回の空港の障害も2重化のしくみがうまく働かなかった典型的な例でしょう。2重化するとシステムは複雑になります。複雑さが増すと故障も増えることになります。

 私はシステムはできるかぎりシンプルな方がいいと思っていますが、世の中の傾向として複雑になっていってます。航空機などのクリティカルなシステムに複雑な技術がどんどん導入されると事故が増えるのではないかとこの事故のことを聞いて思いました。

ランキングに一票お願いします!