KDDIが7月2日午前1時35分ごろから続いていた音声通話およびデータ通信の利用しづらい状況が解消され、全国で発生していた通信障害が完全に復旧したと発表しました。
今回の障害によって、au・UQ mobile・povo、MVNOや楽天モバイルなどau回線利用事業者の通信、ホームプラス電話、ホーム電話、auフェムトセル、SMS送受信、法人向けサービスなどが利用できない、または利用しづらい状況が長時間続きました。
障害発生から完全復旧の発表までの時間は約86時間、障害の影響を受けた期間は約61時間、影響規模は最大3,915万回線(正確な数字は今後精査した上で発表)で、KDDIの歴史上一番大きな障害になっています。
データ通信・音声通話ともに正常利用可能に
障害発生中という異例のタイミングで実施された3日の会見では、定期メンテナンスによる設備交換(ルーター)時に発生した何らかの不具合が通信障害のきっかけと発表されました。
この不具合によって音声通話サービスが15分間止まったため、切り戻し(交換した設備・システムを元に戻した)を行ったところ、原因不明の輻輳(通信回線にアクセスが集中して混み合うこと)が発生。
輻輳は他の設備・システムにて連鎖的に発生したことで、設備・システム間にデータ不一致が起こり、エラーとリトライが頻発して輻輳がさらに悪化します。
KDDIは輻輳に対して負荷軽減措置を実施。これにより音声通話・データ通信がつながりにくくなる状況が長時間続くことになります。
もう1つの障害の原因であるデータ不一致の解消作業も開始します。
1日かけて全てのデータ不一致を解消。復旧作業終了と報告した上で、ネットワーク試験の検証中につき、利用しづらい状況が継続すると案内していましたが、「繋がるようになったら復旧完了じゃないか?作業が終わったのと、復旧したのとは意味が違うと思う」「復旧というのは、障害の起こる前の状態に戻ることを言うんだよ」と広報の表現にイラだちを表すユーザーも多くいました。
KDDIは3日に予定していた作業をすべて終わらせたものの、想定したよりも負荷が低減していないことが判明。4日午前中に原因を突き止め、昼過ぎには対処を完了。
これにより、負荷を大幅に下げることに成功し、通話の成功率が大幅に向上。負荷を低減するために行なっていた流量制御も解除したことでサービスが復旧に向かい、4日16時に「音声通話・データ通信含め全国的にほぼ回復」と発表。
完全復旧を宣言するための条件としていた個人・法人サービスが正常に利用されているのか確認が取れたことで、5日16時15分に「個人・法人のお客さまのサービス利用状況およびネットワークのトラヒック正常性に問題がないことを2022年7月5日(火)15時36分に最終確認しました」と完全復旧が発表されました。
なお、KDDIは音声通話やデータ通信が利用しづらい場合、端末の電源オフ・オンを試すよう呼びかけています。
通信障害によってサービスを利用できなかったことに対する補償については今後検討すると説明しています。