プレスリリース 2026年

ネオクラウド事業として、
「Infrinia AI Cloud OS」を搭載した
「AIデータセンター GPUクラウド」を
2026年10月に提供開始

～AIモデルの開発から推論、データ処理までの幅広いAIワークロードを
効率的かつ柔軟に実行可能～

2026年5月25日
ソフトバンク株式会社

ソフトバンク株式会社（以下「ソフトバンク」）は、新たな成長戦略「Activate AI for Society」の下、ネオクラウド^※1事業として、AI（人工知能）データセンター向けのソフトウエアスタック^※2「Infrinia（インフリニア） AI Cloud OS」を搭載したクラウドサービス「AIデータセンター GPUクラウド」を、2026年10月から提供します。提供に先立ち、本日からベータ版を展開して、ソフトバンクおよびグループ会社での利用を開始します。

「AIデータセンター GPUクラウド」は、マルチテナント環境に対応したKubernetes^※3 as a Service（KaaS）や、大規模言語モデル（LLM）の推論機能をAPI（Application Programming Interface）として提供するInference as a Service（Inf-aaS）を利用できるAIデータセンター向けのソフトウエアスタック「Infrinia AI Cloud OS」と、ソフトバンクのAI計算基盤を組み合わせたクラウドサービスです。ソフトバンクが国内のデータセンターに構築した「NVIDIA GB200 NVL72」など最先端のGPU（Graphics Processing Unit）搭載のAI計算基盤を活用することで、日本国内における安全なデータ管理・運用の下、AIモデルの学習から推論、データ処理まで幅広いAIワークロードを効率的かつ柔軟に実行することができます。また、GPUの管理やKubernetesによる運用、AIワークロードの実行などを一元管理および自動化することで、最適な環境で各ワークロードの処理が可能です。これにより、開発環境の構築や計算リソースの調整などにかかる手間を削減して、運用負荷とコストの低減を実現するとともに、変化する要件にも柔軟に対応できる安定した環境を実現します。

ソフトバンクは今後、通信基盤を生かしてAI時代の社会インフラを構築するTelco AI Cloud構想^※4に基づき、「AIデータセンター GPUクラウド」と「AI-RAN」を統合することで、学習から推論までのAIの計算処理の最適化を図るとともに、低遅延・高信頼を実現するソブリン性を備えた分散型のAIインフラの構築を目指していきます。

「AIデータセンター GPUクラウド」の特長

1. 学習から推論まで幅広いワークロードに対応可能

LLMの開発など大量の計算資源を必要とするAIの学習用途から、迅速なレスポンスが求められる推論用途まで、幅広いワークロードに対応したGPU環境を提供します。「NVIDIA GB200 NVL72」をはじめとする最先端のアクセラレーテッドコンピューティング基盤上で、NVIDIA NVLinkを介して相互接続された高性能なNVIDIA Blackwell GPU間通信と高性能なストレージを組み合わせることで、マルチテナント環境においても、LLMの学習や複雑な推論処理に適した環境を実現します。

2. Kubernetes as a Service（KaaS）による柔軟な運用

Kubernetesを活用することで、多数のコンテナを一元的かつ自動的に管理することが可能で、開発環境の構成変更やスケーリングといった煩雑な運用負荷を大幅に軽減します。また、コンテナ技術により、アプリケーションの起動を高速化するとともに、デプロイやスケーリングを効率化して、AIモデルの開発から実装、運用までの一連のプロセスを迅速化します。さらに、Kubernetesによる負荷分散により安定したサービス提供を可能にするとともに、障害発生時に自動復旧する仕組みにより、高い継続性を実現します。

3. Inference as a Service（Inf-aaS）によるモデル推論環境の提供

Kubernetes上でのモデル推論基盤の構築・運用を自動化することで、推論API（Application Programming Interface）の構築を支援します。これにより、インフラ管理にかかる負荷を軽減して、独自開発のAIモデルや任意のAIモデルを選択するだけで、迅速で、かつ安定した推論環境を利用できます。

ソフトバンクの代表取締役社長執行役員兼 CEOである宮川潤一は、次のように述べています。
「AI共存社会の本格化に伴い、競争力の源泉はAIそのものに加え、それを支えるコンピューティングパワーと運用ソフトウエアへ広がっています。新たな成長戦略『Activate AI for Society』の下、ネオクラウド事業者として、国内で安心して利用できる計算基盤とソフトウエアを一体で提供していきます。『Infrinia AI Cloud OS』と、それを搭載した『AIデータセンター GPUクラウド』は、その中核を担うサービスとして、お客さまのAI開発と社会実装を力強く後押しします」

NVIDIAのDGXシステム担当バイスプレジデントであるチャーリー・ボイル氏は、次のように述べています。
「通信分野をAIネイティブアーキテクチャーへと変革させるには、最も複雑なソブリンAIワークロードを処理できる、新たなAIインフラ基盤が必要です。ソフトバンクによる『NVIDIA GB200 NVL72』および『Infrinia AI Cloud OS』の導入により、日本の企業に対して、各業界の革新を加速させるための高性能かつ安全で拡張性の高いプラットフォームを提供します」

「Infrinia AI Cloud OS」について

「Infrinia AI Cloud OS」は、次世代のAIインフラアーキテクチャーやシステムの開発を担うInfriniaチームにより開発された、AIデータセンター向けのソフトウエアスタックです。マルチテナント環境に対応したKaaSと、LLMの推論機能をAPIとして提供するInf-aaSを自社のGPUクラウドサービスの機能として構築することが可能です。また、オーダーメードのソリューションの導入や自社開発をした場合と比較して、TCO（Total Cost of Ownership：総所有コスト）や運用負荷の低減が期待できます。そのため、AIモデルの学習から推論まで効率的かつ柔軟にできるGPUクラウドサービスを、迅速に提供することが可能になります。

「Infrinia AI Cloud OS」の詳細は、2026年1月21日付のプレスリリース「AIデータセンター向けのソフトウエアスタック『Infrinia AI Cloud OS』を発表」をご覧ください。

[注]

※1
ネオクラウドとは、高性能なGPU中心のインフラとAIネイティブサービスを提供する大規模なAIワークロードに特化したクラウドプラットフォーム群です。
※2
ソフトウエアスタックとは、システムやアプリケーションの構築・運用に必要な複数のソフトウエアや機能を組み合わせて提供するものです。
※3
Kubernetes（クバネティス）とは、アプリケーションのデプロイやスケーリングを自動化したり、コンテナ化されたアプリケーションを管理したりするためのオープンソースのシステムです。
※4
Telco AI Cloud構想の詳細は、2026年3月2日付のプレスリリース「通信基盤を生かしてAI時代の社会インフラを構築するTelco AI Cloud構想を発表」をご覧ください。

SoftBankおよびソフトバンクの名称、ロゴは、日本国およびその他の国におけるソフトバンクグループ株式会社の登録商標または商標です。
その他、このプレスリリースに記載されている会社名および製品・サービス名は、各社の登録商標または商標です。