石野純也のモバイル通信SE
第10回
楽天モバイル通信障害で考えるユーザーの“備え”
2022年9月7日 08:20
4日(日)楽天モバイルで通信障害
9月4日の10時58分ごろ、楽天モバイルで通信障害が発生した。障害の内容は、通話やデータ通信が利用しづらくなるというもの。影響範囲が全国、130万回線に及ぶ大規模な通信障害となった。約2時間半続いた通信障害は、13時26分ごろに復旧したとして、復旧報が13時55分に出されている。
かく言う筆者も、この通信障害の影響を受けた1人だ。
厳密に言えば、通信障害発生のツイートを見かけてからeSIMとしてiPhone 13 Proに入れておいた楽天モバイル回線をオンにしたため、「影響を受けた」というより「影響を受けにいった」という方が正しい。それはさておき、実際、楽天モバイル回線をオンにしても、アンテナピクトが表示されず、「圏外」の状態になってしまった。
しばらく端末を放置していたところ、アンテナマークが復活した。試しにデータ通信を使ってみたが、ダウンロード、アップロードとも問題なく行なえた。一方で、7月に発生したKDDIのように、音声通話にのみ影響が残っていることも考えられる。そこで、まず通常の音声通話アプリから筆者の所有するドコモのメイン回線に発信を試みた。結果はNG。ドコモの端末はまったく鳴らず、通話が終了してしまった。
次に試したのが「Rakuten Link」での発信。こちらは、VoLTEを使った通常の音声通話とは異なり、無事に発信ができた。ドコモ回線側の端末には、着信履歴も残っている。一方で、その履歴から折り返したときには、やはり通話がつながらない。留守番電話につながるなどの挙動もなく、通話を拒否したときのように、ブチっと発信が終わってしまった。
iPhoneの場合、OSの制限から、Rakuten Linkアプリでは通話の着信ができない。そのため、着信はすべてVoLTEを使った通常の音声通話になる。着信時は、音声通話障害の影響をもろに受けてしまうというわけだ。時間の関係で試せていないが、Rakuten Linkで着信が可能なAndroid端末だったら、発着信とも、通信障害の影響を受けなかった可能性はある。
音声通話が復活したのは、通信障害発生からちょうど2時間が過ぎた13時ごろ。この時点では、発信に失敗することもあり、徐々に回復に向かっていることがうかがえた。復旧報には13時26分と書かれているが、このころには発着信に失敗することもなくなった。通信障害発生後から初報までに約1時間半かかっていたのは少々遅いようにも思えたが、復旧報は比較的正確だったと言えるだろう。
130万人に影響。残念ながら「障害を起こさない」は不可能
総務省では、「重大な事故」を人数や時間で定義しており、該当する場合は30日以内に詳細を報告しなければならない。基本的には2時間以上でかつ3万人以上に影響が及んだ場合が対象になるが、緊急通報を取り扱っている回線では1時間に基準が厳格化する。また、影響範囲が10万人以上の場合は、緊急通報の有無を問わずに1時間以上になる。
今回の通信障害は、障害の時間が2時間以上継続しており、範囲も130万回線と広いため、時間と規模のどちらも基準を満たしている。重大な事故は、'21年9月11日以来2回目。楽天モバイルは、通信障害の理由を「ネットワーク設備の再起動に伴うトラフィックの輻輳」としている。なぜ再起動の必要があったのかは不明だが、何らかのトリガーを引いた結果、大多数のトラフィックに波及した点で、メカニズムは他社の通信障害に近い。
同社が本格サービスを開始した翌年から、重大な事故に該当する通信障害は年1回のペースで発生している。頻度としては、他の通信事業者と同等かやや多い。一方で、楽天モバイルは参入時から、ネットワークが完全仮想化されているため、大規模な通信障害は起こらない、もしくは起こりづらいと説明してきた経緯がある。しかも繰り返しだ。
直近では、8月10日に開催された決算説明会で、楽天グループの会長兼社長、三木谷浩史氏が、KDDIやドコモで起こった通信障害(と思われる事例)を引き合いに出しつつ、「なぜ楽天モバイルが安定的に大きな障害を回避できるよう設計されているのか」として、ネットワークの仮想化をメリットに挙げていた。
仮想化されたネットワークでは、専用ハードウェアを必要としないため、冗長構成を取りやすく、モニタリングもしやすい。ソフトウェアでできているため障害発生時には「レプリカを作るのも簡単」(三木谷会長)。自動修復も行ない、「人的な介入をできるだけ少なくしようと考えている」(同)としていた。
一方で、実際には上記のとおり。三木谷氏が「大きな通信障害を回避する」と豪語するほどには、ネットワークが安定稼働しているわけではないのが実情だ。1カ月も経たずに“フラグ”をしっかり回収してしまった格好だが、やはり完全仮想化ネットワークだからといって、輻輳が原因となる大規模な通信障害を完全に回避したり、超短期間で収束させたりするのは難しいことがわかる。
KDDIの通信障害発生後に受け止めを問われた際に、NTTの島田明社長は「これは他人事ではない」とコメント。ソフトバンクの宮川潤一社長も、「正直に言って、対岸の火事という認識は一切ない。本当に自分事だと思い、本気で色々なことを考えた」と語っている。
楽天モバイルにも、他社で起こった通信障害を他山の石として、自社のネットワークを再点検する姿勢は必要だと感じた。
通信障害に備えユーザーができること
原因はそれぞれ異なるが、システムはいつか止まるもの。過剰なまでにコストをかけて通信障害をゼロにしようとするより、発生数を抑えつつ、起こったときの被害を最小限にする方が合理的だ。
現在、総務省では緊急通報を含めたローミングのあり方を検討しようとしているが、方向性としては正しいものと言えるだろう。
スマホの重要性が以前より増していることを考えると、ユーザー側で維持費の安いサブ回線を契約し、“保険”をかけておいてもいい。料金値下げでそのコストも下がっているため、利用しない手はないだろう。