ニュース
IOWNのインフラ変革、大規模化に一石のtsuzumi「NTT R&Dフォーラム 2024」
2024年11月25日 07:00
NTTは、研究開発の成果を発表するイベント「NTT R&Dフォーラム 2024」を11月25日~29日にかけて開催する。NTTグループ会社からの招待制イベントで、会場は東京・武蔵野市のNTT武蔵野研究開発センタ。本稿では、メディア向け内覧会で紹介された注目技術についてレポートする。
今年の「NTT R&Dフォーラム 2024」のテーマは「IOWN INTEGRAL」。INTEGRAL(インテグラル)には積分と不可欠の2つの意味があり、NTTが注力する光通信技術のIOWN(アイオン)を、幅広い領域に広げて積み重ね、不可欠な存在になるという想いが込められている。イベント全体でも主要な話題はIOWNと生成AIの「tsuzumi」の2つで、これら2大領域で展開されるさまざまな研究開発の成果が披露されている。
強烈な「APN」の可能性が現実に
IOWNでは、高速・大容量で低遅延な光通信網「APN」(オールフォトニクス・ネットワーク)新たに構築し、さまざまな分野に適用することで、従来では考えられなかった遠隔制御や遠隔サービスを実現できる。
11月18日には法人向けに、高速化した800Gbpsの通信サービス「All-Photonics Connect powered by IOWN」を発表、11月20日に発表されたTBSとのリモートプロダクション環境の構築も最新の例で、撮影現場からのデータを伝送し、リモート制作が可能になっている。
ほかにも、複数のデータセンター間をAPNでつなぎ、あたかもひとつのデータセンターであるかのように稼働できるDC間接続や、携帯電話基地局の制御にAPNを活用して、昼夜で人口密度が異なる住宅地と商業地の基地局の稼働を一体となって最適制御し消費電力を抑えるRAN最適化などにも取り組む。
また、APNを活用すれば「ワット・ビット連携」も加速する。データセンターは、都心(東京・大手町)から半径50km圏内に建設する需要が増加する一方、利用が推進されている太陽光発電の拠点はさらにその外側に位置しているケースが増えている。発電拠点とデータセンターを結ぶ「送電網」は、長くなるとコストがかさむが、APNを活用すれば、電力消費が大きいデータセンターを都心から離れた発電拠点の近くに建設しても、大容量・高速・低遅延で接続でき、高コストな送電網を長距離で敷設する必要がなくなる。
さらに、例えば九州のデータセンターが接続している発電拠点の発電量が(雨や曇りなどで)下がっていれば、天気が良く発電量の多い北海道のデータセンターにリソースを振り分けるなど、日本を縦断したリソース制御も可能になり、再生可能エネルギーの利用率を高めることができる。
生成AIの開発や運用においても、IOWNのAPNはインフラとして活用が可能。現在の生成AI開発は、一般的に、GPUを数千台や数万台レベルで稼働させるなど大規模なものになっており、施設としてのデータセンターを複数に分散せざるを得ない状況という。APNであれば、データセンター間を大容量・高速・低遅延で接続できるため、あたかもひとつのデータセンターであるかのように稼働させる「分散GPUクラウド」が可能になる。
APNは今後、最終型(ステップ3)として、伝送容量の拡大や低消費電力化のほかに「オンデマンド光パス制御」も開発される。これは1つのAPNの中で複数の波長を衝突させることなく共存させる技術で、複数ある経路を利用した際に波長が被らないよう、波長帯変換を遅延なく行なうもの。
また光電融合デバイス(PEC)のロードマップも最新のものが紹介されている。現在はレーザー発振の仕組みをいかに小さくできるかに注力しており、従来のシリコンフォトニクスに変えて、メンブレン化合物半導体により薄型化し極小の半導体レーザーを出すことに成功したという成果が報告されている。このメンブレンフォトニクスは、2028年度の実用化を見込んでいる。
大規模化に抗うジャパンメイドの生成AI「tsuzumi」
IOWNと並び注力される生成AIの「tsuzumi」(ツヅミ、鼓の意味)は、進化、拡張、応用、AIコンステレーションとしての活用まで、取り組みが加速していることが紹介されている。
tsuzumiはNTT版LLMとして2023年11月に発表、同年の「NTT R&Dフォーラム」でも披露された。2024年3月からは商用提供が開始されており、現在までに導入相談は900件以上に上るという。11月20日からは、マイクロソフトの「Microsoft Models-as-a-Service」(MS MaaS)に採用されるAIのひとつになるなど、グローバル市場でも存在感を高めつつある。
NTTが訴えるtsuzumiの最大の特徴は、軽量で、元から日本語に対応する点。アメリカなど外国製品がベースではなくNTTによるスクラッチ開発で、チューニングしやすく企業独自のデータを反映させるRAGにも対応しやすいという。13B版も、開発中に性能が向上してきたとのこと。
生成AIのモデル開発では現在、大規模化が顕著に進んでおり、GPT-4やGemini Ultraクラスでは1回の学習にかかるコストが150~200億円に上るとも試算されている。そうした学習には巨大なデータセンターと膨大なエネルギーが必要で、サステナビリティの観点から問題視する声も高まっている。
また市場では最近、その莫大なコストに見合った収益を得られていないとして、株主や投資機関が生成AIを開発する企業に対し厳しい目を向けつつある。あるLLMでは、“最強モデル”として予告した上位バージョンが、期待していた性能を得られなかったとして公開を延期している例もあり、まだまだ発展するといったイメージとは裏腹に、進化が袋小路に入っているのではないかと指摘する声もある。
NTTは、パラメータを増やして大規模化する流れに対し、明確に否定的な立場を表明している。
「サイズがすべてではない。大規模化させなければいけないというのなら、(LLMの開発は)やらない。軽量化や効率化が重要。サイズ競争やお金で解決できるものは、知性とは関係がない」(NTT 執行役員 研究企画部門長の木下真吾氏)。
tsuzumiでは、拡張された機能で実現する「AIエージェント」も披露されている。これは、ユーザーに代わって一部PCの操作を行なうもので、社内の煩わしい作業を支援できるというもの。例えば物品購入に際して、画像を投入するだけで画像の中の商品を認識したり図表や型番を識別したりでき、希望する商品の発注が可能。さらに社内のマニュアルを理解し、発注伝票ページで入力を支援するといったことも可能になる。
また、ユーザーの反応があると会話を途中で止めるといった、自然に振る舞えるデジタルヒューマンも実現。
音声に対応するtsuzumiも開発されており、例えばサポートセンターで相手の声の特徴や内容を理解して、年代や話し方の特徴(落ち着いている、怒っているなど)を分析、対応に役立てる機能などを実現できる。
「発話単位音声要約」は音声認識による文字起こし機能を発展させたもので、一字一句再現するのではなく、内容を即座に要約する機能。より理解しやすい形で記録を残すことができる。
ほかにも映像とお手本映像の違いを分析して、スポーツトレーナーの代わりに走り方を指導するといったものも、tsuzumiの動作理解、指導計画といったマルチモーダル生成を経て実現できることが紹介されている。
通信サービスでもtsuzumiは応用され、高度化や自動化で活用。デジタルツインの環境で故障シミュレーションを行ないAIの学習に反映させるといった取り組みが行なわれているほか、社内向けに作成するセキュリティレポートでは「ベテランの暗黙知」を形式化して適用、新人のレポートをブラッシュアップ、ベテランが業務に集中できる環境を実現できる。
AI同士が議論する「AIコンステレーション」もミニマムな形でスタートしている。福岡県の大牟田市では、市の課題について話し合う議論に生成AIが参加する試みが行なわれ、生成AIの発言により議論が活発化したほか、「言いにくいことを代わりに言ってくれる」といった効果もあったという。
現代の生成AIに関して基礎研究も行なう。これは、生成AIの仕組みがブラックボックス化していることに対し、その内部の仕組みを説いていく試み。「Physics of Intelligence」(知性の物理学)と称し、ハーバード大学脳科学センター(CBS)と共同で研究分野を旗揚げしており、物理学、心理学、神経科学を統合してAIの理解と信頼性について研究を進める。代表的な研究として、画像生成の拡散モデルにおいて、“AIの想像力”を数学的に定義し実証する研究(NeurIPS2023)が行なわれている。
なお、NTT法が4月に改正され、NTTにおける研究開発成果の開示義務は撤廃されているが、NTTの木下氏は、これまでのR&Dフォーラムなどは開示義務だけを理由に開催していたわけではないとした上で、「今後はさらに展開していきたい」と、むしろ拡大させていく方針を語っている。