29日〜30日に関東圏で発生した10時間にも及ぶLTEの通信障害の原因が4月中旬に発生したメールの障害原因と類似していることが明らかとなりました。
前回の大規模障害の教訓が活かされなかったことが明らかに
日本経済新聞によると、auは29日未明にサブ環境にてソフトウェアのアップデートを実施。アップデート中に本番環境にてハードウェアの障害が発生したため、サブ環境のアップデート作業を中止し、サブ環境を本番環境として移行・運用したところ、アップデートしたソフトウェアに不具合が見つかり1回目の通信障害が発生したとのこと。2回目の障害については詳細な原因を調査中としています。
1系統だけで本番運用していた方の基地局制御装置でネットワークカードの故障が発生。これを受けてソフトウエア更新作業を中止し、もう1系統を本番運用に戻したところ、今度はこの系統で、修正しようとしていたソフトウエアのバグが発生した。その結果、2系統とも運用できなくなり、半日以上LTE回線がつながりにくい状態となってしまった。
引用元:KDDI、LTE障害の原因判明 ソフトと機器が同時故障 :日本経済新聞
4月中旬に発生したメールが送受信できなくなる障害では、起こり得た障害に対策を施さずして本番環境への移行を行ったことが問題の1つとして挙げられていたわけですが、今回はサブ環境で行ったソフトウェアアップデート後の検証を行わず、そのまま本番環境に移行するというなんとも大胆な行動に出て、前回の障害が全く教訓になっていないことが明らかになってしまいました。
ずさん過ぎて開いた口が塞がらないというか口を開く気力さえ出ませんな・・・。
コメントを残す