Weekly AWS アップデート情報 - 2026/3/23 ~Amazon EC2 Fleet が中断可能なキャパシティ予約をサポート~

2026年3月23日掲載

キービジュアル

皆さま、こんにちは。

Weekly AWSでは、毎週 AWS プロダクトのアップデート情報をお届けしています。

それでは、先週 (3/16~22) の主な AWS アップデート情報をお送りいたします。

目次

今週の注目アップデート

Amazon EC2 Fleet が中断可能なキャパシティ予約をサポート
Amazon EC2 Fleet が、中断可能なキャパシティ予約をサポートするようになりました。これにより、単一の EC2 Fleet 呼び出しで、起動テンプレートに中断可能なキャパシティ予約IDを指定してインスタンスをプロビジョニングできます。
お客さまは、未使用のオンデマンドキャパシティ予約を AWS Organization 内で中断可能な予約として一時的に利用可能にすることで、使用率の向上とコスト削減が可能です。EC2 Fleet を利用することで、これらの予約を簡単に消費できるようになります。
この機能は、全ての AWS 商用リージョンで利用可能です。

分析

Amazon S3 テーブルと Apache Iceberg マテリアライズドビューで権限設定が簡素化
AWS Glue Data Catalog が、Amazon S3 テーブルおよび Apache Iceberg マテリアライズドビューに対する AWS IAM ベースの認可をサポートするようになりました。IAM ベースの認可により、ストレージ、カタログ、クエリエンジンにわたる全ての必要な権限を単一の IAM ポリシーで定義できます。
この機能により、S3 テーブルやマテリアライズドビューを Amazon Athena、Amazon EMR、Amazon Redshift、AWS Glue などの AWS 分析サービスと簡単に統合できます。また、いつでも AWS Lake Formation をオプトインして、AWS Management Console、AWS CLI、API、AWS CloudFormation を使用してきめ細やかなアクセスコントロールを管理することも可能です。
この機能は、一部の AWS リージョンで利用可能です。

Amazon Redshift が複数の AWS リージョンで IAM Identity Center を使用したフェデレーション権限をサポート
Amazon Redshift のフェデレーション権限が、複数の AWS リージョンで AWS IAM Identity Center (IdC) とともにサポートされるようになりました。これにより、プライマリ AWS リージョンから追加のリージョンへ IdC を拡張し、パフォーマンスと信頼性を向上させることができます。
追加されたリージョンでは、既存の IdC のIDを使用して、テーブルや列レベルでの Redshift の詳細なアクセスコントロールの管理が簡素化されます。新しいリージョンで Redshift と Lake Formation の IdC アプリケーションを作成する際に、プライマリリージョンからIDを複製する必要はありません。これにより、既存のIDを使用して新しいリージョン内のデータウェアハウス間でデータをクエリできます。行レベル、列レベル、マスキング制御は自動的に適用され、詳細なアクセスコンプライアンスが実現します。また、これらの新しいリージョンでは、Amazon QuickSight や Amazon Redshift Query Editor などからシングルサインオンで Amazon Redshift にアクセスできます。

Amazon Redshift が、BIダッシュボードとETLワークロードで新しいクエリのパフォーマンスを最大7倍に向上
Amazon Redshift が、新しいクエリを最大7倍高速化することで、BIダッシュボードやETLワークロードのパフォーマンスを向上させました。これにより、ニアリアルタイム分析アプリケーションやBIダッシュボードなどで使用される低レイテンシーのSQLクエリの応答時間が大幅に改善されます。この改善は、追加コストなしで自動的に有効になります。
このパフォーマンス向上のために、Redshift は「composition」という新しい最適化技術をクエリコンパイルに導入しました。この技術は、クエリ実行のクリティカルパスからコンパイルを外し、バックグラウンドでコンパイルを進めながら即時実行を可能にします。これにより、新しいクエリも初回実行から高速なパフォーマンスを発揮します。
この最適化は、Amazon Redshift が稼働する全ての商用AWSリージョンにおいて、全てのプロビジョニング済みクラスターおよびサーバーレスワークグループでデフォルトで有効になっています。お客さま側での操作は不要で、無料で利用できます。

Amazon OpenSearch Service が OpenSearch バージョン 3.5 をサポート
Amazon OpenSearch Service で OpenSearch バージョン 3.5 が実行できるようになりました。OpenSearch 3.5 では、エージェント型AI機能、検索関連性ツール、可観測性機能が大幅に改善され、強力なエージェントアプリケーションの構築を支援します。
このリリースにより、エージェントの会話メモリが会話のコンテキストとツールの推論を永続ストレージにキャプチャーし、複数ターンにわたる会話で一貫性のある正確な応答を提供できるようになりました。また、コンテキスト管理機能は、自動的な切り捨てと要約によって大規模言語モデル(LLM)に送信する内容を最適化し、応答品質を維持しながらトークンコストを削減します。再設計されたノーコードのエージェントインターフェースも導入され、コードを書かずに高度なエージェントを構築できます。
検索品質のチューニングも高速化されました。LLMを活用した評価機能が検索結果を自動的に評価し、検索品質のトレンド追跡やリグレッションの早期発見を支援します。これらの機能は、Amazon OpenSearch Service が利用可能な全ての AWS リージョンで提供されます。

ビジネスアプリケーション

Amazon Connect の音声AIエージェントが新たに13言語をサポート
Amazon Connect の音声AIエージェントが、新たに13の言語をサポートし、対応言語は合計40のロケールになりました。
新たに追加された言語には、アラビア語(サウジアラビア)、チェコ語、デンマーク語、オランダ語(ベルギー)、英語(アイルランド、ニュージーランド、ウェールズ)、ドイツ語(スイス)、アイスランド語、ルーマニア語、スペイン語(メキシコ)、トルコ語、ウェールズ語が含まれます。
Amazon Connect のエージェント型セルフサービス機能により、AIエージェントは複数の言語で音声およびデジタルチャンネルを通じて、定型的および複雑な顧客サービスタスクを自動化できます。

Amazon Connect でエージェントがEメールを外部メールアドレスに転送可能に
Amazon Connect で、エージェントがエージェントワークスペースやコンタクトセンターパネルから直接、Eメールを外部のメールアドレスや配布リストに転送できるようになりました。これにより、バックオフィスチームや専門家などをシームレスに巻き込みつつ、エージェントはお客さまにとって一貫した連絡窓口であり続けることができます。転送後も、元のコンタクトの所有権と通信履歴はエージェントが保持します。この機能は、アジアパシフィック(東京)を含む複数のリージョンで利用可能です。

コンピューティング

Amazon EC2 C8gn インスタンスが東京などの追加リージョンで利用可能に
最新世代の AWS Graviton4 プロセッサを搭載した Amazon EC2 C8gn インスタンスが、アジアパシフィック(東京、ジャカルタ、ハイデラバード)、南米(サンパウロ)、欧州(チューリッヒ)の各AWSリージョンで利用可能になりました。
C8gn インスタンスは、Graviton3 ベースの Amazon EC2 C7gn インスタンスと比較して最大30%優れたコンピューティングパフォーマンスを提供します。第6世代の AWS Nitro Cards を搭載し、ネットワーク最適化 EC2 インスタンスの中で最も高い最大600Gbpsのネットワーク帯域幅を実現します。これにより、ネットワーク仮想アプライアンスやデータ分析、CPUベースのAI/ML推論といったネットワーク集約型ワークロードのパフォーマンスとスループットを向上させつつ、コストを最適化できます。
スケーラビリティ向上のため、最大48xlargeのインスタンスサイズ、最大384GiBのメモリ、Amazon Elastic Block Store (EBS) への最大60Gbpsの帯域幅を提供します。一部のインスタンスサイズでは Elastic Fabric Adapter (EFA) ネットワーキングをサポートしており、密結合クラスターのワークロードにおいて低レイテンシーとパフォーマンス向上を実現します。

Amazon EC2 C8a インスタンスがアジアパシフィック(東京)リージョンで利用可能に
コンピューティング最適化された Amazon EC2 C8a インスタンスが、アジアパシフィック(東京)リージョンで利用可能になりました。C8a インスタンスは、最大周波数4.5GHzの第5世代 AMD EPYC プロセッサー(旧コードネーム Turin)を搭載しており、C7a インスタンスと比較して最大30%高いパフォーマンスと最大19%優れたコストパフォーマンスを実現します。
C7a インスタンスよりもメモリ帯域幅が33%向上しており、レイテンシーに敏感なワークロードに最適です。また、GroovyJVM では最大57%高速化し、Javaベースのアプリケーションの応答時間を改善します。
AWS Nitro System 上に構築された C8a インスタンスは、2つのベアメタルサイズを含む12のサイズで提供され、バッチ処理、分散分析、HPC、広告配信、スケーラブルなマルチプレイヤーゲーム、ビデオエンコーディングなどの高性能コンピューティング集約型ワークロードに最適です。

AWS が NIXL と EFA をサポートし、大規模な分離型 LLM 推論を高速化
AWS は、Amazon EC2 上での大規模言語モデル (LLM) の分離型推論を高速化するため、Elastic Fabric Adapter (EFA) と NVIDIA Inference Xfer Library (NIXL) のサポートを発表しました。この統合により、KVキャッシュのスループット向上、トークン間レイテンシーの削減、KVキャッシュのメモリ使用率の最適化という3つの主要な改善を通じて、分離型推論の提供が強化されます。
NIXL と EFA の組み合わせは、プレフィルノードとデコードノード間の高スループットかつ低レイテンシーなKVキャッシュ転送を可能にし、さまざまなストレージ層間での効率的なKVキャッシュ移動を実現します。NIXLは、全てのEFA対応 EC2 インスタンスと相互運用可能であり、NVIDIA Dynamo, SGLang, vLLM などのフレームワークとネーティブに統合されます。これにより、選択した EC2 インスタンスとフレームワークとの柔軟な統合が可能となり、大規模で高性能な分離型推論を提供します。
このサポートは、全ての AWS リージョンにおいて、全てのEFA対応 EC2 インスタンスタイプで追加費用なしで利用可能です。

AWS Lambda がアベイラビリティーゾーンのメタデータをサポート
AWS Lambda は、実行環境内の新しいメタデータエンドポイントを通じて、アベイラビリティーゾーン (AZ) のメタデータを提供するようになりました。これにより、開発者は Lambda 関数が実行されている AZ の ID を特定できます。
この機能を利用することで、AZ を意識したルーティング決定(例えば、同じ AZ 内のエンドポイントを優先してレイテンシーを削減する)や、AZ 固有のフォールトインジェクションテストといった回復力パターンを実装することが可能になります。簡単な HTTP リクエストで AZ ID を取得できるため、カスタムソリューションは不要です。
この機能は、全ての Lambda ランタイム、コンテナイメージ、SnapStart、プロビジョンドコンカレンシーでサポートされており、Lambda が利用可能な全ての商用 AWS リージョンで追加費用なしで利用できます。

コンテナ

Amazon EKS が、Provisioned Control Plane クラスター向けの99.99%のサービスレベルアグリーメントと新しい 8XL スケーリングティアを発表
Amazon Elastic Kubernetes Service (Amazon EKS) は、Provisioned Control Plane で実行されるクラスターのサービスレベルアグリーメント (SLA) を、従来の99.95%から99.99%に引き上げました。また、新しいスケーリングティアとして「8XL」を導入しました。
Provisioned Control Plane は、コントロールプレーンの容量を事前にプロビジョニングする機能です。新しい99.99%のSLAは、ミッションクリティカルなワークロードに対してより厳格な可用性を約束します。新しい 8XL ティアは、4XL ティアの2倍の処理能力を持ち、大規模な AI/ML トレーニングやハイパフォーマンスコンピューティング (HPC) などのワークロードをサポートします。
これらの機能は、Amazon EKS Provisioned Control Plane が提供されている全ての AWS リージョンで利用可能です。

Amazon ECR のプルスルーキャッシュが Chainguard をサポート
Amazon Elastic Container Registry (Amazon ECR) のプルスルーキャッシュが、アップストリームソースとして Chainguard のレジストリをサポートするようになりました。このリリースにより、お客さまはプライベートな Chainguard イメージに対して Amazon ECR のセキュリティと可用性の恩恵を受けることができます。
ECR のプルスルーキャッシュ機能を使用すると、お客さまは追加のワークフローやツールを管理することなく、Chainguard イメージを Chainguard のレジストリと同期させ続けることができます。Amazon ECR のプルスルーキャッシュは頻繁なレジストリ同期をサポートし、Chainguard から取得したコンテナイメージを最新の状態に保つのに役立ちます。その後、お客さまはキャッシュされた Chainguard イメージに対して、イメージスキャンやライフサイクルポリシーなどの ECR 機能を利用できます。
Chainguard のプルスルーキャッシュは、Amazon ECR のプルスルーキャッシュがサポートされている全ての AWS リージョンで利用可能です。

データベース

Amazon Timestream for InfluxDB 3 が拡張マルチノードクラスター構成をサポート
Amazon Timestream for InfluxDB が、InfluxDB 3 Enterprise edition のマルチノードクラスター構成を拡張し、高い読み取りスループットと高可用性が求められる本番ワークロードに対応できるようになりました。
主な強化点は以下の通りです。
・ クラスターを最大15ノードまでスケール可能になりました。
・ 書き込み/読み取りノード、読み取り専用ノード、専用コンパクターノードを柔軟に組み合わせ、特定のワークロードパターンに最適化できます。
・ 全ての Enterprise クラスターでノードの追加・削除が可能になり、インフラ管理の柔軟性が向上しました。
・ Core edition から Enterprise edition へのアップグレードが可能になり、マルチノード機能や長期ストレージに不可欠な圧縮機能を利用できます。
この機能は、Amazon Timestream for InfluxDB が利用可能な全てのリージョンでサポートされています。

Amazon SimpleDB で、ドメインデータの Amazon S3 へのエクスポートが可能に
Amazon SimpleDB が、ドメインデータを標準JSON形式で Amazon S3 バケットに直接エクスポートする機能をサポートしました。エクスポートはバックグラウンドで実行され、データベースのパフォーマンスに影響を与えないため、ほかのシステムへのデータ移行やデータアーカイブ要件への対応が容易になります。
このエクスポートツールは、クロスリージョンおよびクロスアカウントのサポート、複数の暗号化オプション、柔軟な S3 バケット設定などの機能を提供します。主なユースケースには、長期的なアーカイブやコンプライアンス目的でのデータ移行が含まれます。ツールは「StartDomainExport」、「GetExport」、「ListExports」という3つの新しいAPIを提供し、24時間以内にドメイン当たり5回、アカウント当たり25回のエクスポートというレート制限が組み込まれています。
このツールの使用は無料ですが、標準のデータ転送料金が適用されます。このエクスポートツールは、Amazon SimpleDB が利用可能な全てのリージョンで利用できます。

Amazon RDS for SQL Server Developer Edition の機能強化
Amazon Relational Database Service (Amazon RDS) for SQL Server の SQL Server Developer Edition で、いくつかの機能強化が行われました。SQL Server Developer Edition は、Enterprise Edition の全機能を含み、開発・テストシステムとしての利用ではライセンス料が無料であるため、アプリケーションの構築とテストに最適な選択肢です。
今回のアップデートにより、以下の機能がサポートされるようになりました。
・ Additional Storage Volumes: Amazon RDS for SQL Server Developer Edition インスタンスに最大256TiBのストレージを追加でき、従来の4倍の容量を利用できます。
・ SQL Server Resource Governor: リソースプールとワークロードグループを定義してCPUとメモリの使用量を制御し、より現実的なパフォーマンステストを可能にします。
・ SQL Server 2019 サポート: SQL Server 2019 (CU32 GDR - 15.0.4455.2) がサポートされ、開発・テスト環境と本番環境の SQL Server バージョンを一致させることが容易になります。

Amazon RDS Custom for SQL Server が、新しいOSアップデートの表示とスケジュール機能を追加
Amazon RDS Custom for SQL Server で、RDS提供のエンジンバージョン (RPEV) に対する新しいOSのアップデートを表示およびスケジュールする機能が提供されるようになりました。RPEVは、SQL Server がプレインストールされた Amazon Machine Image (AMI) を提供します。
お客さまは、RDS Custom API を使用して、今後のアップデートの表示、即時適用、または次のメンテナンスウインドーでの適用をスケジュールできます。利用可能なOSアップデートは、「describe-pending-maintenance-actions」APIで確認したり、「RDS-EVENT-0230」をサブスクライブして通知を受け取ったりできます。アップデートの適用には「apply-pending-maintenance-action」APIを使用します。
この機能は、RDS Custom for SQL Server が利用可能な全ての AWS リージョンで提供されます。

Amazon Neptune で openCypher を使用した Amazon S3 からのデータ読み取りが可能に
Amazon Neptune が、openCypher クエリ内での Amazon S3 からのデータ読み取りをサポートするようになりました。新しい「neptune.read()」プロシージャを通じて、お客さまはデータを Neptune にロードする必要なく、S3 に保存された外部データと連携できます。
グラフ分析に Neptune を利用する組織は、この機能により、従来の複数ステップのワークフローを必要とせずに、S3 に保存されたデータを動的に組み込むことが可能になります。主なユースケースには、S3 データと既存のグラフ構造を組み合わせたリアルタイムのグラフ分析、外部データセットからの動的なノードとエッジの作成、外部参照データを必要とする複雑なグラフクエリなどがあります。このプロシージャは、標準および Neptune 固有の形式を含む包括的なデータ型をサポートし、呼び出し元の IAM 認証情報によってセキュリティが維持されます。
この機能は、Amazon Neptune Database が現在提供されている全てのリージョンで利用可能です。

開発者用ツール

Amazon Corretto 26 が一般提供開始
フィーチャーリリース(FR)バージョンである Amazon Corretto 26 が一般提供開始されました。Amazon Corretto は、無償でマルチプラットフォームに対応した、本番環境ですぐに使える OpenJDK のディストリビューションです。Corretto 26 は Linux、Windows、macOS 向けにダウンロード可能で、2026年10月までサポートされます。
主な新機能は以下の通りです。
・ HTTP/3 サポート: Javaアプリケーションで最新のHTTP/3プロトコルが利用可能になり、旧バージョンより高速かつ効率的になります。
・ AOTオブジェクトキャッシング: 一般的に使用されるオブジェクトを事前にキャッシュすることで、アプリケーションの起動を高速化します。
・ パターンマッチングの強化: 型や値のチェック時に、よりクリーンなコードを記述できるようになり、intやbooleanなどのプリミティブ型もサポートされました。
・ finalフィールドの厳格化: リフレクションを使用してfinalフィールドを変更するコードに対して警告を開始し、将来のリリースでfinalフィールドが真に不変になる準備をします。
・ 構造化並行性(プレビュー継続): 関連するタスクのグループを単一の作業単位として扱うAPIを導入し、エラー処理とキャンセルを合理化します。
・ Vector API(インキュベーター継続): 最新のCPU機能を活用できる高性能な数学演算のサポートを改善します。
・ 遅延定数(プレビュー継続): 不変データの初期化を実際に必要になるまで遅延させるAPIを提供します。
Amazon Corretto 26 は、Amazon によってオープンソースライセンスの下で配布されます。

機械学習

SageMaker Training Plans で、ワークロードを再設定することなく既存のキャパシティコミットメントの延長が可能に
SageMaker Training Plans で、既存のキャパシティコミットメントを延長する機能が追加されました。これにより、AIワークロードが想定より長引いた場合でも、ワークロードを再設定することなく、中断のないキャパシティアクセスが保証されます。プランの延長はAPIまたは SageMaker コンソール経由で、1日単位で最大14日間、または7日単位で最大182日間(26週間)まで可能です。SageMaker Training Plans は、最大64インスタンスのクラスターサイズでGPUキャパシティを予約できるサービスです。

Amazon SageMaker Unified Studio にカスタムメタデータフィルターが追加
Amazon SageMaker Unified Studio に、カスタムメタデータ検索フィルターが追加されました。これにより、お客さまは組織固有の属性(ビジネスリージョン、データ分類、研究名など)を使用してカタログの検索結果を絞り込むことができます。既存のキーワード検索やセマンティック検索に加えて、この機能により適切なアセットをより迅速に見付けることが可能になります。
お客さまは、カタログで利用可能な任意のカスタムメタデータフィールド(サンプルタイプや研究IDなど)に基づいてフィルターを追加できます。フィルターは文字列フィールドでは「contains」演算子を、数値フィールドでは「equals」、「greater than」、「less than」演算子をサポートしています。複数のフィルターを組み合わせることも可能で、選択したフィルターはブラウザーセッションをまたいで保持されます。
この機能は、Amazon SageMaker Unified Studio がサポートされている全ての AWS リージョンで利用可能です。

Amazon SageMaker Unified Studio がデータリネージの集約ビューをサポート
Amazon SageMaker Unified Studio は、データリネージの集約ビューを提供するようになりました。このビューは、データセットに寄与する全てのジョブを表示し、リネージグラフ全体にわたるデータ変換と依存関係の全体像を把握するのに役立ちます。これにより、データセットの上流ソースと下流コンシューマーを迅速に特定できます。
以前は特定時点のリネージグラフのみが表示されていましたが、新しい集約ビューではリネージグラフの複数レベルにわたる全体像を把握できます。このビューを利用することで、データセットに影響を与えるジョブの全範囲を理解し、全ての上流ソースと下流コンシューマーを特定することが可能です。
集約ビューは、IdCベースのドメイン向けの Amazon SageMaker Unified Studio でデフォルトのリネージビューとして利用できます。以前のビューには、「display in event timestamp order」オプションを切り替えることで変更可能です。また、新しい「QueryGraph」APIを使用してリネージグラフをクエリすることもできます。
この機能は、Amazon SageMaker Unified Studio が利用可能な全ての既存のリージョンで提供されます。

Amazon SageMaker HyperPod で、動的なクラスター利用のためのアイドルリソース共有が可能に
Amazon SageMaker HyperPod のタスクガバナンスにおいて、動的なリソース共有がサポートされるようになりました。これにより、チームは保証されたクオータを超えて、HyperPod クラスター内の未割り当ての計算能力を借りることが可能になります。管理者は、アクセラレータ、vCPU、メモリなどの特定のリソースタイプに対して借用制限を設定し、チーム間での公平な分配を確保できます。
このアイドルリソース共有機能は、未割り当てのクラスター容量を自動的に特定し、ベストエフォートでチームが借用できるようにします。HyperPod のタスクガバナンスはクラスターの状態を監視し、インスタンスやコンピューティングクオータポリシーが変更されると、借用可能なリソースを自動的に再計算するため、手動での設定は不要です。パーティション分割されたGPU構成を持つインスタンスを含む、準備完了でスケジュール可能な状態の適格なインスタンスが、借用可能なプールに貢献します。管理者は、パーセンテージベースの制限に加えて絶対的な借用制限も定義でき、コンピューティング使用率を最大化しながら、アイドル容量の分配をきめ細かく制御できます。
この機能は、EKS オーケストレーターを使用する Amazon SageMaker HyperPod クラスターで利用でき、アジアパシフィック(東京)を含む複数の AWS リージョンで提供されています。

Amazon Bedrock で NVIDIA Nemotron 3 Super が利用可能に
Amazon Bedrock が、NVIDIA Nemotron 3 Super のサポートを開始しました。これは、複雑なマルチエージェントアプリケーション向けに設計された、オープンなハイブリッド Mixture-of-Experts (MoE) モデルです。エージェントワークロード向けに構築されており、高速でコスト効率の高い推論を提供し、AIエージェントが複数ステップの長いタスクでもコンテキストを失わずに精度を維持できるようにします。
重み、データセット、レシピが完全にオープンであるため、簡単なカスタマイズと安全なデプロイが可能で、マルチエージェントワークフローや高度な推論アプリケーションの構築に適しています。お客さまは、Amazon Bedrock を通じて、インフラのプロビジョニング不要で、単一のフルマネージドAPIで Nemotron 3 Super にアクセスできます。Bedrock のサーバーレス推論や OpenAI API 仕様との互換性により、既存のワークフローへの統合が容易になります。
NVIDIA Nemotron 3 Super は、一部の AWS リージョンの Amazon Bedrock で利用可能です。

Amazon Bedrock で Minimax M2.5 と GLM 5 モデルが利用可能に
Amazon Bedrock が、GLM 5 および Minimax M2.5 モデルのサポートを追加し、お客さまのモデル選択肢を拡大しました。
GLM 5 は、複雑なシステムエンジニアリングや長期的なエージェントタスクに最適化された、最先端クラスの汎用大規模言語モデルです。複数ステップの推論、数学、高度なコーディング、ツール拡張ワークフローをサポートし、洗練されたエージェントやエンタープライズアプリケーションに適した長いコンテキストをサポートします。
MiniMax M2.5 は、現実世界の時間とコストの制約の下で、効率的に推論し、タスクを最適に分解し、複雑なワークフローを完了するために明示的にトレーニングされたエージェントネーティブの最先端モデルです。高い推論スループットとトークン効率の良い推論に焦点を当てた強化学習を組み合わせることで、主要なプロプライエタリな最先端モデルに匹敵するか、それ以上のタスク完了速度を達成します。
MiniMax M2.5 と GLM 5 は、一部の AWS リージョンの Amazon Bedrock で利用可能です。

Amazon Bedrock AgentCore Runtime でシェルコマンドの実行が可能に
Amazon Bedrock AgentCore Runtime が、シェルコマンドの実行をサポートするようになりました。新しいAPI「InvokeAgentRuntimeCommand」により、開発者は実行中の AgentCore Runtime セッション内で直接シェルコマンドを実行できます。これにより、コンテナ内にカスタムのコマンド実行ロジックを構築することなく、コマンドの送信、出力のリアルタイムストリーミング、終了コードの受信が可能になります。
この機能は、テスト実行や依存関係のインストールといった確定的操作をLLMによる推論と並行して行うワークフローを簡素化します。従来必要だった子プロセスの生成や出力のキャプチャーといった差別化されていない作業が不要になります。コマンドはエージェントセッションと同じ環境で実行され、エージェントの呼び出しをブロックしません。
この機能は、アジアパシフィック(東京)を含む14の AWS リージョンでサポートされています。

Amazon Bedrock AgentCore Runtime がリアルタイム双方向ストリーミング向けに WebRTC をサポート
Amazon Bedrock AgentCore Runtime は、クライアントとエージェント間のリアルタイム双方向ストリーミングのために WebRTC をサポートするようになりました。これは既存の WebSocket プロトコルのサポートに追加されるものです。WebRTC を使用することで、開発者はピアツーピアのUDPベースのトランスポートを利用して、音声やビデオを低遅延で双方向にストリーミングする音声エージェントを構築でき、自然なリアルタイムの会話体験が可能になります。
WebRTC は、低遅延が重要なリアルタイムメディア配信に最適化されています。この機能には TURN リレーが必要ですが、Amazon Kinesis Video Streams のマネージド TURN、サードパーティー製、または自己ホスト型のインフラを柔軟に選択できます。
この WebRTC サポートは、東京リージョンを含む14の AWS リージョンで利用可能です。

AWS Neuron が Amazon EKS での Dynamic Resource Allocation のサポートを発表
AWS は、Amazon Elastic Kubernetes Service (EKS) 向けの Neuron Dynamic Resource Allocation (DRA) ドライバーを発表しました。これにより、AWS Trainium ベースのインスタンスで、Kubernetes ネーティブのハードウェアを意識したスケジューリングが実現します。Neuron DRA ドライバーは、デバイスの属性を Kubernetes スケジューラーに直接公開することで、カスタム拡張なしでトポロジーを意識した配置決定を可能にします。
この機能は、インフラに関する懸念を ML ワークフローから分離します。インフラチームがデバイスのトポロジーやポリシーを定義した再利用可能なテンプレートを作成し、MLエンジニアはハードウェアの詳細を意識することなく、マニフェストでそのテンプレートを参照するだけでよくなります。これにより、一貫したデプロイが可能になり、複数のワークロードが同じノードを効率的に共有できます。
Neuron DRA ドライバーは、全ての AWS Trainium インスタンスタイプをサポートし、AWS Trainium が利用可能な全ての AWS リージョンで利用可能です。

マネジメントとガバナンス

Amazon CloudWatch で、組織全体の EC2 詳細モニターリングの自動有効化が可能に
Amazon CloudWatch で、AWS Organization 全体で Amazon Elastic Compute Cloud (EC2) の詳細モニターリングを自動的に有効化できるようになりました。お客さまは CloudWatch Ingestion で有効化ルールを作成することで、ルールスコープに一致する既存および新規に起動された EC2 インスタンスの詳細モニターリングを自動的に有効にできます。これにより、EC2 インスタンス全体で1分間隔の一貫したメトリクス収集が保証されます。
EC2 詳細モニターリングの有効化ルールは、組織全体、特定のアカウント、またはリソースタグに基づいてスコープを設定でき、EC2 インスタンス全体で設定を標準化できます。例えば、中央の DevOps チームは、「env:production」などの特定のタグを持つ EC2 インスタンスの詳細モニターリングを自動的にオンにするルールを作成し、Auto Scaling ポリシーがインスタンス使用率の変化に迅速に対応できるようにすることが可能です。
この CloudWatch の自動有効化機能は、全ての AWS 商用リージョンで利用できます。詳細モニターリングのメトリクスは、CloudWatch の料金に従って請求されます。

Amazon CloudWatch Logs で、HTTPベースのプロトコルを使用したログ取り込みが可能に
Amazon CloudWatch Logs が、ベアラートークンを使用したHTTPベースのプロトコルによるログ取り込みをサポートしました。このアップデートにより、AWS SDK の統合が困難なサードパーティー製ソフトウェアなどからもログを取り込めるようになります。
新しいエンドポイントとして以下がサポートされます。
・ HTTP Log Collector (HLC) Logs: JSON イベント向けで、既存ログパイプラインの移行に最適です。
・ ND-JSON Logs: 改行区切りのJSON向けで、大量のストリーミングや一括ログ取り込みに適しています。
・ Structured JSON Logs: 単一のJSONオブジェクトまたはオブジェクトの配列を送信します。
・ OpenTelemetry Logs: OTLP形式のログをJSONまたはProtobufエンコーディングで CloudWatch に送信します。
この機能を利用するには、AWS コンソールの CloudWatch 設定でAPIキーを生成し、意図しない取り込みを防ぐために各ロググループでベアラートークン認証を有効にする必要があります。
これらのエンドポイントは、米国東部(バージニア北部)、米国西部(北カリフォルニア)、米国西部(オレゴン)、および米国東部(オハイオ)の AWS リージョンで利用可能です。

AWS Config が75個の新しいマネージドルールをリリース
AWS Config が、セキュリティ、耐久性、運用などのさまざまなユースケースに対応する75個のマネージドルールを追加でリリースしました。これにより、AWS 環境のより多くのユースケースを統制できます。
このリリースにより、アカウントまたは組織全体でこれらのコントロールを有効にできます。例えば、AWS Amplify、Amazon SageMaker、Amazon Route 53 などにわたるセキュリティ体制を評価できます。さらに、Conformance Packs を活用してこれらの新しいコントロールをグループ化し、アカウント全体または組織全体にデプロイすることで、マルチアカウントのガバナンスを合理化できます。

メディアサービス

AWS Elemental MediaConnect が NDI® 入力をサポート
AWS Elemental MediaConnect が、ライブビデオソースとして NDI® (Network Device Interface) をサポートしました。これにより、放送局やライブプロダクションチームは、NDI ストリームを取り込み、SRT などのトランスポートストリーム出力に変換して下流へ配信できます。
この機能により、カスタムのインフラを必要とせずに、NDI ベースのプロダクション環境とクラウド配信ワークフローを連携させることが可能になります。例えば、EC2 インスタンス上の NDI Tools からのフィードを MediaConnect に取り込み、AWS Elemental MediaLive や AWS Elemental MediaPackage へとシームレスに渡すことができます。これにより、AWS クラウドからの NDI コンテンツの出力が簡素化されます。
NDI サポートは、MediaConnect が利用可能なほとんどのリージョンで提供されます。

移行と転送

AWS DataSync が全てのロケーションタイプで AWS Secrets Manager をサポート
AWS DataSync は、Hadoop Distributed File System (HDFS)、Amazon FSx for Windows File Server、Amazon FSx for NetApp ONTAP を含む全てのロケーションタイプで、認証情報管理に AWS Secrets Manager をサポートするようになりました。これにより、ユーザーは全てのデータ転送において、認証情報管理を一元化できます。
ユーザーは、独自の AWS KMS キーを使用して認証情報を暗号化したり、DataSync サービスとは独立してシークレットを更新したりすることが可能です。認証情報の管理方法として、ユーザーが管理するシークレットの ARN を提供する方法と、DataSync がシークレットを自動的に作成・管理する方法の2つがサポートされています。
この機能は、AWS DataSync が提供されているほとんどの AWS リージョンで利用可能です。

AWS Blu Insights が AWS Transform for mainframe refactor に
AWS Blu Insights の機能が AWS Transform の一部となり、「AWS Transform for mainframe refactor」として利用可能になりました。これにより、お客さまは AWS Transform コンソールからメインフレームのリファクタリングプロジェクトを開始できます。このアップデートにより、リファクター、リプラットフォーム、リイマジンという3つのメインフレームモダナイゼーションパターンが AWS Transform for mainframe 内に統合されます。
コード変換は、従来のコード行数ベースの料金モデルに代わり、無料で提供されるようになりました。また、Transformation Center へのアクセスに必須だった3レベルの認定要件が撤廃され、既存の AWS 認証情報を使用してコンソールから直接サービスにアクセスできるため、プロジェクトの検討が容易になっています。
AWS Transform for mainframe refactor は18の AWS リージョンで利用可能です。このサービスがまだ利用できないリージョンでは、引き続き AWS Mainframe Modernization コンソールを通じてアクセスできます。

セキュリティ、アイデンティティ、コンプライアンス

Amazon Inspector がエージェントレス EC2 スキャンを拡張し、Windows KB ベースの検出結果を導入
Amazon Inspector は、エージェントレス EC2 スキャンを拡張し、Windows OSの脆弱性スキャンをエージェントなしでサポートするようになりました。これにより、WordPress, Apache HTTP Server, Python パッケージ, Ruby gems といった、より広範なソフトウェアやアプリケーションの脆弱性を検出できます。
また、Windows OS の脆弱性に対して、ナレッジベース (KB) ベースの検出結果が導入されました。この機能は、単一の Microsoft パッチで対処される複数の CVE を1つの検出結果に統合するものです。各 KB 検出結果には、最も高いリスクスコアや関連する Microsoft KB 記事へのリンクが含まれるため、適用すべきパッチを容易に特定できます。
既存の CVE ベースの Windows OS 検出結果は自動的に KB ベースに移行されます。これらの機能は、Amazon Inspector が利用可能な全ての AWS リージョンで利用可能です。

AWS Security Agent がペネトレーションテストリポートのダウンロードをサポート
AWS Security Agent は、ペネトレーションテストリポートをダウンロードする機能を提供するようになりました。ユーザーは、リスクレベルやステータスなどの特定のフィルターに基づいてカスタマイズされたリポートを作成できます。
各リポートには、セキュリティ体制の概要を示すエグゼクティブサマリー、テスト範囲、手法、脆弱性情報を含む詳細な検出結果が含まれます。リポートはPDF形式でダウンロードでき、チーム間での共有が容易になります。この機能は、AWS Security Agent のオンデマンドペネトレーションテスト機能を強化し、テストにかかる時間を数週間から数時間に短縮します。

今週の Weekly AWS は、以上です。

最後までお読みいただき、ありがとうございました。

関連サービス

ソフトバンクはAWS アドバンストティアサービスパートナーです

「はじめてのAWS導入」から大規模なサービス基盤や基幹システムの構築まで、お客さまのご要望にあわせて最適なAWS環境の導入を支援します。

MSP(Managed Service Provider)サービスは、お客さまのパブリッククラウドの導入から運用までをトータルでご提供するマネージドサービスです。

おすすめの記事

条件に該当するページがございません