ニュース

KDDIネットワークセンター、昨夏の通信障害を経て復旧自動化推進

KDDI多摩センタービル

KDDIは、東京都多摩市に開設した通信ネットワークの運用・監視を行なう施設「多摩第5ネットワークセンター」を報道陣に公開し、ネットワーク運用の最新の状況や、2022年7月の大規模通信障害以後の対応、最新の災害対策設備を公開した。

多摩第5ネットワークセンターは、全国を対象に通信ネットワークの運用・監視を行なう基幹施設で、同時期に建設したKDDI多摩センタービル内に設置、2年前の2021年7月にオープンしている。また同年11月には大阪にも同様の施設をオープンし完全ミラー化を実現。2拠点で同時に全国を統合監視する体制になっている。

ネットワークセンターの監視室
東京と大阪で完全ミラー化

KDDIの最新のネットワークセンターの最大の特徴は、従来型の運用業務すべてが各分野の人手や経験に頼る「匠の技」だったところから脱却し、「スマートオペレーション」として多くの業務を自動化した点。この開発作業は2016年度から取り組まれていたもので、約2,000業務、約4万件のシステム要件を、すべて可視化・標準化するという膨大な作業の結果実現したシステムになっている。

スマートオペレーションでは、モバイル、ネットワーク、サーバーといった基本となる設備からのエラーを受け取ると、前述の可視化・標準化したプログラムにより自動で復旧措置をとる“ゼロタッチ”オペレーションを実現している。より深刻な状態である、サービスに影響が出ている場合は、自動で分析を行ない、ダッシュボード上で監視スタッフがボタンを押すだけで、予め用意されたシナリオで復旧を図るワンタッチ運用を行なっている。

大規模通信障害で手順や復旧体制を見直し

スマートオペレーションが実現する以前にも、装置ごとの復旧の自動化システムは実現していた。しかし、2022年7月には全国が対象で61時間以上にわたってVoLTE(4Gの音声通話)やデータ通信などKDDIのモバイルネットワークに大規模な通信障害が発生し、運用・監視体制についていくつかの部分は見直しやさらなる改善が求められることになった。

復旧の自動化については、複数の装置への対応や輻輳といった複雑な状況には対応できていなかったため、前述のように「スマートオペレーション」として進化を図り、複数の装置が絡む障害に対応できる体制になった。

2022年夏の大規模通信障害は、誤った手順書(古い手順書)のまま作業登録を行なったことが直接的な原因だった。手順書のバージョン管理が厳格化されていなかったためで、社内の管理システムがこれを承認し、通信障害につながった。それを受けて、新たな手順書管理システムが開発されている。また、「コマンドを打つ前に、誤ったノードを選択していた」などの、間違いを起こしそうになった経験を共有する「ヒヤリハット分析システム」も新規に開発し、作業単位で“気付き”を共有・分析するシステムを導入している。

このほかにも、2022年夏の通信障害では輻輳(ふくそう)が全国に波及したことから、障害発生時の負荷の分散・軽減を目的に整備していた通信ネットワークの「全国フルメッシュ構成」を、東日本と西日本に分けた「東西分離構成」に変更。輻輳が全国へ波及しない構成にしている。

また輻輳など複数システムが絡む復旧は人の判断を基本に手動で実施していたが、通信障害後は「スマートオペレーション」に機能を追加して、輻輳が検知されてもワンタッチで対処を実行できる体制にした。

今後は、これまで単体で運用していたAIによる障害検知を本格的に導入し、過去データを学習して予測したり、分析機能により異常を検知したりする機能をモバイル通信ネットワークに対して導入する。これにより障害検知から復旧対処まで一連のプロセスの自動実行を目指す。AIによる障害検知は2023年度末までにモバイル通信ネットワークに導入する予定で、2024年度には5Gや固定系ネットワークにも適用していく計画。

このほか障害発生時にユーザー周知や関係機関に周知する仕組みを改善、システムの自動連携を含め迅速に周知できる体制にしている。2022年夏の通信障害を機に整備が始まった副回線サービスは、すでに提供を開始。事業者間ローミングや公衆Wi-Fiサービスの開放といった仕組みは検討を進めている段階になっている。

災害対策、スターリンクを大規模導入

災害対策は、設備の復旧手段として従来の「陸・海・空」での対策に加えて、「宇宙」が本格化する。KDDIが法人向けサービスとして展開している、SpaceXの衛星ブロードバンドサービス「Starlink」(スターリンク)を、KDDIの災害対策でも本格的に活用するもので、スターリンクの設備は2023年度末までに約200台を全国に配備する計画。車載型や可搬型、船舶型の復旧用機材がスターリンクにより小型・軽量化されるほか、従来の衛星通信よりも高速なサービスを提供できるようになる。

「陸」の災害対策では、基地局への進入路が(土砂などで)途絶するケースにおいて、徒歩で調査したり機材を手搬入で運搬したりする場合に対応するため、特殊車両の4輪バギーや水陸両用車を一部に導入する。「海」では船上基地局を搭載する船舶を今後も拡大していく。

「空」では、災害時や遭難といったケースで、被災者・遭難者の携帯電話の位置を推定するシステムを開発しており、上空のヘリと低空のドローンからの探査を組み合わせた「携帯電話電波補足システム」を開発、2023年1月に実証実験に成功している。

災害対策のシステムも、近年の広域化・長期化する災害に対応するため独自の災害対応システムを開発している。地図上に停電や停波、気象情報など、さまざまな情報を選んで表示できる災害復旧支援ツールのほか、ヒートマップやグラフ、優先順位表を組み合わせた「災害ダッシュボード」は10以上のテンプレートが用意され現場に適した情報を表示できるようになっている。ビッグデータを活用し、優先順位を自動判定して早急な復旧計画を策定するシステムも用意されている。災害用のドローンは、立ち入り困難なエリアに入り、画像・動画とフライトレコーダから現場を3D画像化して、詳細を把握しやすくなる仕組みが開発されている。

災害対策設備

四輪バギー
水陸両用車
可搬型基地局
可搬型基地局など復旧機材でバックホール回線として使うスターリンクの衛星通信アンテナ(右)は従来の衛星通信アンテナ(左)と比べて小型・軽量化されるため利用しやすい
アンテナは正方形に近い形状で、一般ユーザーに提供されているより製品より高性能なタイプ
スターリンクのモデム
車載型基地局
ミニバン車のルーフ、左側にスターリンクのアンテナ
キャンピングカーと同等の設備の車両。災害現場で復旧にあたる人員が寝泊まりできる

KDDI多摩センタービル

ビル地下にある免震構造。右のオレンジ色のシリンダーは制振ダンパー
最下層にあるエレベーターかごも地面から浮いている。奥の配管も建物側とはゴムやチューブで接続される
屋上のヘリポート。発着には対応しないレスキュー用
多摩センタービルは中央が吹き抜けになっており、冬季はデータセンターを冷却した後の排気がここから上昇していく構造