プレスリリース 2026年
ソフトバンクとAmpere、CPUを活用して
小規模AIモデルの運用を効率化する共同検証を開始
~AIエージェント時代に向けて、多数の小規模AIモデルをCPUで分散運用し、
計算資源の利用効率を向上~
2026年2月17日
ソフトバンク株式会社
ソフトバンク株式会社(以下「ソフトバンク」)は、米国の半導体設計企業である Ampere® Computing LLC(アンペア・コンピューティング、以下「Ampere」)と、次世代のAI(人工知能)インフラを構成する要素の一つとして、CPU(Central Processing Unit)を活用したAIモデルの運用の効率化に向けた共同検証を開始しました。
今回の共同検証では、ソフトバンクが開発を進めている、計算資源の管理やAIモデルの最適な配分を行うオーケストレーターと、AIの推論処理向けに設計されたAmpere製のCPUを活用することで、CPUをAI推論用の計算資源として利用できることを確認しました。AIエージェントなどで一般的に利用されるSLM(Small Language Model:小規模言語モデル)やMixture of Experts(MoE)※などの推論モデルをCPU上で実行することで、AIモデルの運用を最適化し、計算資源の利用効率の向上を実現することが可能です。
- [注]
-
- ※推論の際に一部の専門家(Expert)のみを動作させることで、計算処理の負荷を抑えるモデルのこと。
- ※
背景
AIの普及が加速する中、大規模言語モデル(LLM)だけでなく、特定の用途に特化し、比較的少ないパラメーター数でも高い実用性を発揮するAIモデルの需要が拡大しています。特にAIエージェントや業務の自動化、ネットワーク制御といった分野では、低遅延な応答性と、常時稼働を前提とした高い電力効率を兼ね備えた推論処理が求められています。こうした背景を踏まえ、ソフトバンクとAmpereは、次世代のAIインフラにおける計算資源の利用効率の向上を目指し、CPUを活用したAI推論環境の運用の効率化および導入に向けた取り組みを開始しました。
共同検証の概要
今回の共同検証では、分散型の計算環境を想定し、AIエージェント向けのSLMおよびMoEモデルを対象に、CPU上でのAI推論環境における性能やスケーラビリティー、運用性を評価しました。また、CPUのみを搭載したノードや、CPUとGPU(Graphics Processing Unit)を搭載したノードなどのマルチノード環境を前提として、オーケストレーターに最適な配分制御機能を実装することで、ユースケースや計算処理の負荷などの特性に応じてAIモデルを柔軟に配置・管理し、最適化できることを確認しました。
さらに、オープンソースのAI推論フレームワークであるllama.cppをベースに、Ampere製のCPU向けに最適化した「Ampere® optimized llama.cpp」を実装することで、一般的なGPUベースの構成と比較して、消費電力を抑えながら同時実行可能数を増加できることを確認しました。加えて、AIモデルの読み込み時間が大幅に短縮され、モデルの高速な切り替えも可能です。
今後の展開
今後ソフトバンクとAmpereは、これらの成果を生かし、AIエージェント向けに複数のモデルを動的に切り替えながら、TPS(Tokens Per Second:1秒当たりのトークン出力数)を安定的に維持できるAI推論プラットフォームの実現に向けた取り組みを進めていきます。ソフトバンクは、Ampereとの協業を通して、次世代のAIインフラを支える要素技術の一つとして、低遅延かつ高効率なAI推論環境の確立を推進し、AIエージェントやSLMのさらなる活用の拡大に貢献していきます。
ソフトバンクの執行役員 兼 先端技術研究所 所長の湧川隆次は、次のように述べています。
「CPUを用いたAI推論処理の実用性について、Ampereと共に検証を進めてきました。今回の取り組みにより確認されたAmpere製のCPUの性能と、Armアーキテクチャーを生かした高い電力効率は、今後のAIエージェントの大規模な展開を支える重要な要素であると考えています」
Ampereのチーフエバンジェリストのショーン・ヴァーリー氏は、次のように述べています。
「Ampere CPUは、SLMやMoEモデルに代表される負荷変動の大きい分散型AI推論ワークロードに向けて、安定した性能と優れた電力効率を提供するよう設計されています。今回の共同検証により、CPUが次世代のAIインフラの基盤として高効率で費用対効果が高く、拡張しやすい選択肢となり得ることが確認され、AIエージェントのさらなる普及に向けた基盤が整いました」
- SoftBankおよびソフトバンクの名称、ロゴは、日本国およびその他の国におけるソフトバンクグループ株式会社の登録商標または商標です。
- その他、このプレスリリースに記載されている会社名および製品・サービス名は、各社の登録商標または商標です。
- ソフトバンク 先端技術研究所について
-
ソフトバンク 先端技術研究所は「テクノロジーの社会実装」を使命に、次世代社会インフラを支える技術のAI-RANやBeyond 5G/6Gをはじめ、通信、AI、コンピューティング、量子技術、宇宙・エネルギー分野など、さまざまな先端技術の研究開発と事業創出を推進しています。国内外の大学・研究機関との産学連携や、パートナー企業との国際的な協業を通して、グローバルなビジネスの創出と、持続可能な社会の創造に貢献していきます。詳細は公式ウェブサイトをご覧ください。