ニュース

IOWNのインフラ変革、大規模化に一石のtsuzumi「NTT R&Dフォーラム 2024」

太田亮三

2024年11月25日 07:00

NTTは、研究開発の成果を発表するイベント「NTT R&Dフォーラム 2024」を11月25日～29日にかけて開催する。NTTグループ会社からの招待制イベントで、会場は東京・武蔵野市のNTT武蔵野研究開発センタ。本稿では、メディア向け内覧会で紹介された注目技術についてレポートする。

今年の「NTT R&Dフォーラム 2024」のテーマは「IOWN INTEGRAL」。INTEGRAL(インテグラル)には積分と不可欠の2つの意味があり、NTTが注力する光通信技術のIOWN(アイオン)を、幅広い領域に広げて積み重ね、不可欠な存在になるという想いが込められている。イベント全体でも主要な話題はIOWNと生成AIの「tsuzumi」の2つで、これら2大領域で展開されるさまざまな研究開発の成果が披露されている。

展示エリアの構成

強烈な「APN」の可能性が現実に

IOWNでは、高速・大容量で低遅延な光通信網「APN」(オールフォトニクス・ネットワーク)新たに構築し、さまざまな分野に適用することで、従来では考えられなかった遠隔制御や遠隔サービスを実現できる。

11月18日には法人向けに、高速化した800Gbpsの通信サービス「All-Photonics Connect powered by IOWN」を発表、11月20日に発表されたTBSとのリモートプロダクション環境の構築も最新の例で、撮影現場からのデータを伝送し、リモート制作が可能になっている。

IOWNのロードマップ

800Gbpsの通信サービス

APNのリモートプロダクション

ほかにも、複数のデータセンター間をAPNでつなぎ、あたかもひとつのデータセンターであるかのように稼働できるDC間接続や、携帯電話基地局の制御にAPNを活用して、昼夜で人口密度が異なる住宅地と商業地の基地局の稼働を一体となって最適制御し消費電力を抑えるRAN最適化などにも取り組む。

DC間接続

APNによるRAN最適化

また、APNを活用すれば「ワット・ビット連携」も加速する。データセンターは、都心(東京・大手町)から半径50km圏内に建設する需要が増加する一方、利用が推進されている太陽光発電の拠点はさらにその外側に位置しているケースが増えている。発電拠点とデータセンターを結ぶ「送電網」は、長くなるとコストがかさむが、APNを活用すれば、電力消費が大きいデータセンターを都心から離れた発電拠点の近くに建設しても、大容量・高速・低遅延で接続でき、高コストな送電網を長距離で敷設する必要がなくなる。

APNによるワット・ビット連携

さらに、例えば九州のデータセンターが接続している発電拠点の発電量が(雨や曇りなどで)下がっていれば、天気が良く発電量の多い北海道のデータセンターにリソースを振り分けるなど、日本を縦断したリソース制御も可能になり、再生可能エネルギーの利用率を高めることができる。

生成AIの開発や運用においても、IOWNのAPNはインフラとして活用が可能。現在の生成AI開発は、一般的に、GPUを数千台や数万台レベルで稼働させるなど大規模なものになっており、施設としてのデータセンターを複数に分散せざるを得ない状況という。APNであれば、データセンター間を大容量・高速・低遅延で接続できるため、あたかもひとつのデータセンターであるかのように稼働させる「分散GPUクラウド」が可能になる。

分散GPUクラウド

APNは今後、最終型(ステップ3)として、伝送容量の拡大や低消費電力化のほかに「オンデマンド光パス制御」も開発される。これは1つのAPNの中で複数の波長を衝突させることなく共存させる技術で、複数ある経路を利用した際に波長が被らないよう、波長帯変換を遅延なく行なうもの。

既存のダークファイバーと比較した優位性

今後「オンデマンド光パス制御」が開発される

また光電融合デバイス(PEC)のロードマップも最新のものが紹介されている。現在はレーザー発振の仕組みをいかに小さくできるかに注力しており、従来のシリコンフォトニクスに変えて、メンブレン化合物半導体により薄型化し極小の半導体レーザーを出すことに成功したという成果が報告されている。このメンブレンフォトニクスは、2028年度の実用化を見込んでいる。

メンブレンフォトニクス

大規模化に抗うジャパンメイドの生成AI「tsuzumi」

IOWNと並び注力される生成AIの「tsuzumi」(ツヅミ、鼓の意味)は、進化、拡張、応用、AIコンステレーションとしての活用まで、取り組みが加速していることが紹介されている。

tsuzumiはNTT版LLMとして2023年11月に発表、同年の「NTT R&Dフォーラム」でも披露された。2024年3月からは商用提供が開始されており、現在までに導入相談は900件以上に上るという。11月20日からは、マイクロソフトの「Microsoft Models-as-a-Service」(MS MaaS)に採用されるAIのひとつになるなど、グローバル市場でも存在感を高めつつある。

900件以上の導入相談

MSのMaaSにも採用

NTTが訴えるtsuzumiの最大の特徴は、軽量で、元から日本語に対応する点。アメリカなど外国製品がベースではなくNTTによるスクラッチ開発で、チューニングしやすく企業独自のデータを反映させるRAGにも対応しやすいという。13B版も、開発中に性能が向上してきたとのこと。

tsuzumiの特徴

tsuzumiのバリエーション

性能比較

生成AIのモデル開発では現在、大規模化が顕著に進んでおり、GPT-4やGemini Ultraクラスでは1回の学習にかかるコストが150～200億円に上るとも試算されている。そうした学習には巨大なデータセンターと膨大なエネルギーが必要で、サステナビリティの観点から問題視する声も高まっている。

また市場では最近、その莫大なコストに見合った収益を得られていないとして、株主や投資機関が生成AIを開発する企業に対し厳しい目を向けつつある。あるLLMでは、“最強モデル”として予告した上位バージョンが、期待していた性能を得られなかったとして公開を延期している例もあり、まだまだ発展するといったイメージとは裏腹に、進化が袋小路に入っているのではないかと指摘する声もある。

NTTは、パラメータを増やして大規模化する流れに対し、明確に否定的な立場を表明している。

「サイズがすべてではない。大規模化させなければいけないというのなら、(LLMの開発は)やらない。軽量化や効率化が重要。サイズ競争やお金で解決できるものは、知性とは関係がない」(NTT 執行役員研究企画部門長の木下真吾氏)。

NTT 執行役員研究企画部門長の木下真吾氏

tsuzumiでは、拡張された機能で実現する「AIエージェント」も披露されている。これは、ユーザーに代わって一部PCの操作を行なうもので、社内の煩わしい作業を支援できるというもの。例えば物品購入に際して、画像を投入するだけで画像の中の商品を認識したり図表や型番を識別したりでき、希望する商品の発注が可能。さらに社内のマニュアルを理解し、発注伝票ページで入力を支援するといったことも可能になる。

tsuzumiによるAIエージェント

画像から型番などを抜き出して認識、購入サイトでカートに入れるといったことができる

購入に関連した伝票作成も社内マニュアルを参照して支援

自然な対話や、UIを認識して操作を代行する機能が追加された

また、ユーザーの反応があると会話を途中で止めるといった、自然に振る舞えるデジタルヒューマンも実現。

自然に振る舞えるデジタルヒューマン

音声に対応するtsuzumiも開発されており、例えばサポートセンターで相手の声の特徴や内容を理解して、年代や話し方の特徴(落ち着いている、怒っているなど)を分析、対応に役立てる機能などを実現できる。

声の特徴などを理解できる

「発話単位音声要約」は音声認識による文字起こし機能を発展させたもので、一字一句再現するのではなく、内容を即座に要約する機能。より理解しやすい形で記録を残すことができる。

「発話単位音声要約」

内容が即座に要約される(左の青字)

ほかにも映像とお手本映像の違いを分析して、スポーツトレーナーの代わりに走り方を指導するといったものも、tsuzumiの動作理解、指導計画といったマルチモーダル生成を経て実現できることが紹介されている。

スポーツトレーナーの代わりに走り方を指導

通信サービスでもtsuzumiは応用され、高度化や自動化で活用。デジタルツインの環境で故障シミュレーションを行ないAIの学習に反映させるといった取り組みが行なわれているほか、社内向けに作成するセキュリティレポートでは「ベテランの暗黙知」を形式化して適用、新人のレポートをブラッシュアップ、ベテランが業務に集中できる環境を実現できる。

ネットワークオペレーションにtsuzumiを活用

ベテランの暗黙知を吸収し、新人が作成するレポートもブラッシュアップ

AI同士が議論する「AIコンステレーション」もミニマムな形でスタートしている。福岡県の大牟田市では、市の課題について話し合う議論に生成AIが参加する試みが行なわれ、生成AIの発言により議論が活発化したほか、「言いにくいことを代わりに言ってくれる」といった効果もあったという。

AIコンステレーション

医師や社会疫学者など生成AIによる複数のキャラクターが議論に参加

複数のAIに回答させることでさまざまな意見が得られる

現代の生成AIに関して基礎研究も行なう。これは、生成AIの仕組みがブラックボックス化していることに対し、その内部の仕組みを説いていく試み。「Physics of Intelligence」(知性の物理学)と称し、ハーバード大学脳科学センター(CBS)と共同で研究分野を旗揚げしており、物理学、心理学、神経科学を統合してAIの理解と信頼性について研究を進める。代表的な研究として、画像生成の拡散モデルにおいて、“AIの想像力”を数学的に定義し実証する研究(NeurIPS2023)が行なわれている。