プレスリリース 2026年

通信業界向け生成AI基盤モデル「Large Telecom Model」
の安全な学習を実現する合成データ生成基盤を構築

~NVIDIA NeMo Safe Synthesizerを活用して、データ品質の保持と情報保護を両立~

2026年3月17日
ソフトバンク株式会社

ソフトバンク株式会社(以下「ソフトバンク」)は、通信業界向けの生成AI基盤モデル「Large Telecom Model」(LTM)※1において、通信ネットワークの運用などに関する機密性の高い情報を保護しながら安全かつ高精度な学習を可能にする、合成データ生成基盤を構築しました。この合成データ生成基盤は、差分プライバシー(Differential Privacy)※2に対応した合成データ生成ツールであるNVIDIA NeMo Safe Synthesizerを活用することで、データ品質の保持と機密情報の保護を両立し、安全性を担保した形でLTMの学習に利用することができます。

[注]
  1. ※1
    「Large Telecom Model」(LTM)の詳細は、2025年3月19日付のプレスリリース「通信業界向けの生成AI基盤モデル『Large Telecom Model』(LTM)を開発」をご覧ください。
  2. ※2
    差分プライバシー(Differential Privacy)とは、データの学習や分析の過程に厳密に計算されたノイズを付加することで、特定の個別データの有無によって出力結果が大きく変化しないことを数学的に保証するデータ保護技術。

背景

ソフトバンクはLTMの活用において、自社の通信ネットワークの運用・品質に関するデータや基地局の設定情報など、詳細かつ大規模なデータを用いて学習を行い、継続的なモデルの高度化を進めてきました。しかし、学習データに機密性の高い情報が含まれるため、情報の保護やセキュリティーの観点から、モデルやデータの活用範囲が限定されるという課題がありました。また、通信ネットワークのデータは、多岐にわたる情報が複雑に連動して構成されているため、単純な匿名化や一律のノイズ付加処理では、障害の予兆や通信品質の低下の原因を示す微細な相関関係が損なわれ、AI(人工知能)の学習データとしての価値が失われてしまいます。そこでソフトバンクは、LTMにNVIDIA NeMo Safe Synthesizerを活用して、安全かつ高精度な学習を可能にする合成データ生成基盤を構築しました。

合成データ生成基盤の特長

今回構築した合成データ生成基盤は、NVIDIA NeMo Safe SynthesizerをLTMのデータ処理プロセスに導入し、これを大規模なネットワークデータに適用することで、情報の複雑な相関関係を維持しながら、機密情報を含まない安全な合成データセットを生成することができます。主に下記の二つの手法により、データの品質を保持したまま強固なデータ保護を実現しています。

  • 差分プライバシーによる数学的に保証されたデータ保護

    差分プライバシー技術を活用することで、特定の1件のデータを削除または変更しても、モデルが学習・出力する内容に実質的な影響を及ぼさないことを数学的に保証することが可能です。これにより、個々のネットワーク機器にひも付く固有データなどを含む希少で機密性の高い情報がAIモデル内部にそのまま記憶されるリスクに、定量的な上限を設けています。

  • 推論攻撃(MIA/AIA)に対する耐性評価

    差分プライバシーによる保護に加え、生成された合成データセットに対して脆弱性テストを実施し、推論攻撃に対する耐性を評価します。具体的には、特定のデータが学習に使われたかを推測する攻撃であるMIA(Membership Inference Attack)の成功率が、無作為に推測した際の確率と統計的に同水準に収まることを確認します。また、一般的な属性から基地局の位置情報などの機密属性を推測する攻撃であるAIA(Attribute Inference Attack)への耐性も評価し、機密情報の推定が困難であることを確認します。これらの安全性評価を通過したデータのみを、LTMの学習用および共有用データとして使用します。

    ソフトバンクは、この合成データ生成基盤の有効性を検証するため、生成された合成データセットを用いてLTMの学習と性能評価を行いました。その結果、通信ネットワークに関するデータ特有の相関関係を維持したまま、ネットワーク品質の傾向分析や運用データに対する解釈・推論などのタスクにおいて、実業務に適用可能な水準の精度が得られることを確認しました。

今後の展開

ソフトバンクは今後、国内外の通信事業者やネットワーク機器ベンダー、教育機関などと協力し、LTMの合成データ生成基盤を活用した実証実験を進めることで、実務環境における有用性や安全性の検証を深めていく予定です。また、AIの推論においてもLLM(大規模言語モデル)ガードレール※3による保護を導入し、多層的な対策を推進します。長期的には、AI-RANアライアンスなどのコンソーシアムを通したエコシステムへの還元も視野に入れ、次世代通信ネットワークの高度化と通信業界全体における生成AIの安全な社会実装を牽引していきます。

[注]
  1. ※3
    LLMガードレールとは、大規模言語モデルの入出力を監視・制御する安全対策技術のこと。

ソフトバンクの執行役員 兼 先端技術研究所 所長の湧川隆次は、次のように述べています。
「通信インフラの高度化において、生成AIの活用は不可欠ですが、データの機密性が社外連携における最大の壁となっていました。今回、NVIDIA NeMo Safe Synthesizerを活用し、データの有用性と強固なデータ保護を高いレベルで両立する基盤を構築できたことは、LTMの社会実装に向けた大きなブレイクスルーです。ソフトバンクは、安全なAI活用基盤を業界全体のエコシステムに広げ、自律型ネットワークへの進化を牽引していきます」

NVIDIAの通信部門ビジネス開発担当バイスプレジデントであるクリス・ペンローズ氏は、次のように述べています。
「ソフトバンクの『Large Telecom Model』向け合成データ生成基盤は、通信分野のAIにおいて極めて重要なマイルストーンです。NVIDIA NeMo Safe Synthesizerを活用することで、ソフトバンクは機密性の高い情報を保護した形で自社のネットワークデータの活用を可能にし、ソフトウエア開発者からネットワークベンダー、通信事業者に至るまで、業界全体に新たなイノベーションの波を起こす扉を開いています。これにより、パートナー企業が高品質な合成ネットワークデータを用いてAIの構築やトレーニングを行える、安全かつ協調的なエコシステムの基盤が整い、5G-Advancedやそれ以降の通信環境における生成AIおよびエージェント型AI(Agentic AI)の展開が加速するでしょう」

  • SoftBankおよびソフトバンクの名称、ロゴは、日本国およびその他の国におけるソフトバンクグループ株式会社の登録商標または商標です。
  • その他、このプレスリリースに記載されている会社名および製品・サービス名は、各社の登録商標または商標です。
ソフトバンク 先端技術研究所について

ソフトバンク 先端技術研究所は「テクノロジーの社会実装」を使命に、次世代社会インフラを支える技術のAI-RANやBeyond 5G/6Gをはじめ、通信、AI、コンピューティング、量子技術、宇宙・エネルギー分野など、さまざまな先端技術の研究開発と事業創出を推進しています。国内外の大学・研究機関との産学連携や、パートナー企業との国際的な協業を通して、グローバルなビジネスの創出と、持続可能な社会の創造に貢献していきます。詳細は公式ウェブサイトをご覧ください。