AITRASオーケストレーターとAIエージェントによるAI-RAN基盤の自律運用の実現

#AI-RAN #AITRAS

私たちは通信インフラの高度化とAI活用の加速を両立させる取り組みとして、AIワークロードとRANワークロードを同一インフラ上で柔軟に実行・制御する「AI-RAN」の実現を進めています。
私たちが開発するAITRASオーケストレーターは、AIエージェントと連携することにより、マルチクラスターをより効率的に管理するための仕組みを有しています。
本記事では、AITRASオーケストレーターのAIエージェント連携にフォーカスした解説を行います。

1. AI-RANインフラ運用における課題

マルチクラスターで構成されたAI-RANインフラを運用する際の大きな課題として、シチュエーションに対して柔軟な意思決定が求められるという課題があります。
例えば、リソースが逼迫している際には、負荷を分散させるためにワークロードを適切に配置する必要があります。
しかし、一口にリソースの逼迫と言っても、各クラスタの消費電力やリソース使用率、ネットワーク帯域などの多くの要因が絡みあっており、さらに、アプリ性能(推論スループットやレイテンシなど)や、性能に対するアプリの費用対効果など、様々な観点での評価から総合的に判断する必要があります。

これらの多様な観点でのマルチクラスター評価を可能にする仕組みとして、クラスターごとの評価を中央に集約するDynamic Scoring Frameworkを開発しました[1]。
これにより、多角的にリソース状況を把握しつつ動的な評価を行うことで、状況に応じて最適な意思決定を行うことが可能になります。

Dynamic Scoring Frameworkを用いたマルチクラスター最適化のイメージ

図1. Dynamic Scoring Frameworkを用いたマルチクラスター最適化のイメージ

しかし、多様な評価を集めたあと実際に最適化を施すには、状況から何を重視して最適化するべきかの意思決定が必要な場面も存在します。例えば推論スループットと消費電力は一般的にトレードオフの関係がありますが、このようなトレードオフが複数評価軸で発生する場合、それらのトレードオフを加味した最適な意思決定を人間がルールベースで設定することは困難です。

2. AIエージェント連携による解決

これに対して、私たちは、AIエージェントを人間の意図を解釈するインタフェースとして立て、AIエージェント経由でAITRASオーケストレーターによるマルチクラスター最適化を実行するシステムの開発に取り組んでいます。
例えば、AIエージェントがAITRASオーケストレーターから受け取ったクラスターの評価を受け取りサマリーを作成、そこに人間の意図を踏まえて最適化方針を決定し、AIエージェントがAITRASオーケストレーター経由で最適化を施すことが可能です。

ここで私たちは、

・各クラスターの評価や評価指標が選ばれたときの最適化など、統計処理やML、数理最適化などのロジックで性能を担保するべき部分はロジックの作り込みを行う。

・得られた現状の評価からどの指標に対して最適化するべきかは、AIエージェントが人間の意図を汲み取りつつ判断を行う。

といった、役割分担を行いながら基盤の最適運用を自律的に行えることが重要と考えています。

AIエージェントとAITRASオーケストレーターの連携による推論アプリ最適化

図2. AIエージェントとAITRASオーケストレーターの連携による推論アプリ最適化

3. AIエージェントによる最適化を実現するための工夫

このセクションでは、AITRASオーケストレーターとAIエージェントを接続してマルチクラスターを最適化するシステムを構築するにあたって、いくつか意識して作っている点をご紹介します。

3.1. LTMを用いたAIエージェントの構築

私たちは、通信インフラの専門性をあらかじめ学習した基盤モデルとして、Large Telco Modelの構築に取り組んでいます[2]。このモデルは通信インフラの設定をあらかじめ学習したモデルになっているため、LTMを用いたAIエージェントを構築することにより、RANの知識を持った状態で基盤を運用することができます[3]。AITRASオーケストレーターと連携することで、RANの知識を元に通信に必要なリソース設定を行いつつ、余剰リソースをAIワークロードのために利用するなど、専門知識を活用しながら自律的に基盤を運用することができます。

3.2. AIフレンドリーなインターフェース設計

AIエージェントとの連携が上手く機能するためには、AIフレンドリーなインターフェース設計が重要です。
例えば、AITRASオーケストレーターとAIエージェントを繋ぐインターフェースとして、MCPサーバを介して連携を行っています。
このとき、AITRASオーケストレーターは、各Scoring APIの説明や入力されるメトリクスのクエリをまとめ、集約されたスコア情報の要求があった場合にはスコアの値に加えて、スコアの説明や値の範囲、評価に用いたメトリクスの名前などの付帯情報も固めて提供するようにしています。
これにより、人間の手を介さずに、スコアの意味をAIエージェントが理解できるようにしています。

AITRASオーケストレーターを経由したスコアの把握

図3. AITRASオーケストレーターを経由したスコアの把握

また、AIフレンドリーというのは単に使い勝手を良くするだけでなく、AIが仮に間違った判断を実行しようとしても安全性が担保されるような設計も重要になります。これに関しては、例えば、AIエージェントによるクラスターのリソースアクセスに適切な権限管理を施して安全性を確保しています。具体的には、AITRASオーケストレーターにはAIエージェントからのリクエストに対して、Kubernetesのサービスアカウントを用いてAIエージェントが必要なリソースにのみアクセスできるように制限する機能を設けています。これにより、RBACを用いて意図しないリソースへのアクセスを防ぎ、システム全体の安全性を向上させることができます。

RBACによるAIエージェント処理の権限制御

図4. RBACによるAIエージェント処理の権限制御

3.3. GitOpsを経由したレビュー(人系)を含める最適化プロセス

AIエージェントが構成したリソース最適化を実際のマルチクラスター環境に適用する際は、GitOpsのプロセスを通じて人間のレビューを受けるように全体の系を構築することができます。
具体的には、AIエージェントが集約されたスコアをもとにクラスターの最適方針を策定した後、実際に適用する際には、AITRASオーケストレーター経由で変更内容をGitリポジトリにプッシュし、プルリクエストを作成する系を構築します。このプルリクエストは、運用チームのメンバーによってレビューされ、承認されることで初めて実行されます。これにより、AIエージェントの提案に対して人間の判断が加わり、より信頼性の高い最適化が実現します。

もちろん、AIエージェントの継続的な学習が進んだ場合にはこのプロセスは自動化されますが、それ以前の人とAIが協力する必要がある場合には、GitOpsの承認プロセスを通じて人間のレビューデータを蓄積することで、AIエージェントの学習に活用することも期待できます。

GitOpsによる運用データ蓄積と再学習のイメージ

図5. GitOpsによる運用データ蓄積と再学習のイメージ

4. AITRASオーケストレーターとAIエージェントによるAI-RAN基盤の自律運用の実現

次世代のAI-RANリソース最適化アプローチとして、AITRASオーケストレーターとAIエージェントの連携が重要な役割を果たします。AIエージェントは、Dynamic Scoring Frameworkを活用して多角的にリソース状況を把握し、最適化のための意思決定を行います。また、GitOpsのプロセスを通じて人間のレビューを受けることで、AIエージェントの提案に対して信頼性の高い判断が加わります。また、レビュー結果はAIエージェントの学習データに用いることも可能であり、今後の最適化プロセスの精度向上に活用することができます。これにより、AI-RANインフラの運用がより効率的かつ効果的に行われることが期待されます。

参考文献

[1] AI-RANを実現するAITRASオーケストレーターの仕組み: Dynamic Scoring Frameworkを用いたリソース最適化
[2] 通信業界向けの生成AI基盤モデル「Large Telecom Model」(LTM)を開発
[3] 通信業界向け生成AI基盤モデル「Large Telecom Model」のマルチAIエージェント基盤を構築、自律運用の検証を開始

Research Areas
研究概要