クラウド基盤における画像生成AIの比較：Azure AI Foundry 、Vertex AI 、Amazon Bedrockを比較してみた

2025年3月31日掲載

近年、画像生成AI技術は、クラウドコンピューティングの進化と密接に連携し、ビジネスにおける創造的表現の可能性を拡大しています。主要クラウドプロバイダーが提供する画像生成AIサービスのVertex AI (Imagen 3)、Azure AI Foundry (DALL-E 3)、Amazon Bedrock (Nova AI Canvas 1.0) に焦点を当て、それぞれ「画像生成AIの機能」、「同一プロンプトを与えた際のモデルごとの画像の特徴分析」、「価格」の観点から比較します。

各Studioの簡単な説明

Azure AI Foundry
Azure AI FoundryはMicrosoftが提供する企業向けAI統合プラットフォームです。DALL-E 3やChatGPTを含む1000以上のAIモデルを、ノーコードのAzure AI StudioまたはPython/C# SDKで柔軟に利用可能です。
Vertex AI
Google社が提供するAI開発プラットフォーム「Vertex AI」は、AIモデルの構築から運用までを統合的に管理できます。特徴的な画像生成AI「Imagen 3」は、実写レベルの高精細画像生成が可能です。
Amazon Bedrock
Amazon BedrockはAWSが提供する生成AIサービスです。Claude（Anthropic）、Stable Diffusion（Stability AI）、Nova AI Canvas 1.0など主要モデルをAPI経由で利用でき、「Bedrock Guardrails」で倫理制約を設定可能です。

画像生成AIの機能比較

比較項目	DALL-E 3	Imagen 3	Nova AI Canvas 1.0
画像生成方式	テキストプロンプト＋スタイル選択（Natural/Vivid）	テキストプロンプト＋プロンプト自動最適化	テキスト+画像参照+編集操作
解像度(1:1)	1024×1024	4096×4096	2048×2048
最大同時画像生成数	1	4	5
特徴的機能	プロンプト再利用	プロンプト自動最適化/ネガティブプロンプト	プロンプト強度調整(1.1-10.0)/シード値設定(0-858,993,459)

画像比較

それでは実際に画像を比較していきます。
左からDALL-E3、Imagen3、Nova AI Canvas 1.0になります。
またVertexAIでは英語のプロンプトしか受け付けていないためプロンプトは英語表記になります。

1. 非現実的要素の処理能力、スケール関係の理解を比較するために人間よりも大きい白い犬の画像を出力してみます。

プロンプト：A giant white dog, larger than a human, standing majestically in a lush green park. The dog is playfully interacting with a person, showcasing its size. Photorealistic style, bright natural lighting, full body view.

DALL-E3はアニメやファンタジー作品に近い画像です。
Imagen3は非常にリアルな犬の画像です。
Nova AI Canvas 1.0はアニメやリアルの中間の画像になりました。
どれも非常に魅力的な画像が生成されました。

2.ファンタジーイラストやコンセプトアートの分野でのモデルの性能を比較するためにファンタジー風の画像を出力してみます。

プロンプト：Create a dreamlike, ethereal illustration of a magical forest at twilight. Luminescent fireflies float among misty, twisted trees with glowing leaves. A mysterious figure in a flowing cloak stands on a mossy stone bridge over a shimmering stream. Moonlight filters through wispy clouds, casting an otherworldly glow on the scene. Use a soft, pastel color palette with touches of iridescent light to enhance the fantastical atmosphere.

どれも非常に幻想的なイラストになりました。
DALL-E 3では靄のかかっており、幻想的で神秘的な画像です。Imagen 3ではパステル調な色合いで童話的な画像です。Nova Ai Canvas 1.0では少しミステリアスな雰囲気を感じる画像です。

3.AIモデルの基本的な画像生成能力と創造性を比較するためにキャラクター作画としてオレンジ色のかわいいモンスターの画像を出力してみます。

プロンプト：3D render of a cute orange monster on a dark blue background, digital art

DALL-E 3はシンプルでコミカル、ポップな画像です。
Imagen3はリアルで可愛らしく毛並みが非常にリアルな画像です。
Nova AI Canvas 1.0はImagen3ほどリアルではないですが毛並みもリアルな印象があり、大きな目や鋭い歯でモンスターが非常に強調された画像になっております。
それぞれ異なる方向性でキャラクターが描かれています。

4.顔の特徴や肌の質感などの微細なディテールの処理能力を比較するために人物描写としてハンサムな老人男性の画像を出力してみます。

プロンプト：Create a portrait of a handsome old man with chiseled features. He has deep, soulful brown eyes, strong jawline, and perfectly styled dark hair with a slight tousled look. His skin is clear and lightly tanned. He's wearing a crisp white dress shirt with the top two buttons undone, revealing a hint of a toned chest. The man is smiling confidently, showing perfect white teeth. Capture him in soft, flattering lighting that accentuates his bone structure. The background should be slightly blurred, suggesting an upscale setting. Use a high-quality, photorealistic style that captures fine details like subtle facial hair and the texture of his skin.

どれもハンサムな老人男性が画像として出力されました。
DALL-E 3ではスタイリッシュでクール、
Imagen3ではリアルで自然、
Nova AI Canvas 1.0では温かみがあり、親しみやすい表情が特徴的です。

5.専門知識の応用能力、および複雑な指示に従う能力で比較するため間取り図の画像を出力してみます。

プロンプト：Create a top-down 2D floor plan of a modern 3-bedroom apartment. Use clean black lines on a white background to show walls, doors, and windows. Include:
- Open-plan living, dining, and kitchen area
- Master bedroom with ensuite bathroom and walk-in closet
- Two additional bedrooms
- One shared bathroom
- One separate toilet room
- Entrance hallway with built-in storage
- Balcony or terrace accessible from living area
Label each room and include basic furniture outlines. Show dimensions for each room and total square footage. Use architectural symbols for electrical outlets, light fixtures, and plumbing. Add a north arrow and scale bar. Style should resemble a professional architectural drawing, clean and precise.

DALL-E 3はモノクロで建築設計図のように正確で細かい線が描かれているため設計者向けと感じられ、
Imagen 3はカラーでわかりやすく各エリアが一目でわかり、利用者向けの印象を受けます。
Nova AI Canvas 1.0は立体的で家具や装飾品がリアルに描かれており、インテリアコーディネーターなどにおすすめだと思われます。

6.光の処理、複雑な都市風景の描写能力、特定のランドマークの認識精度などを比較するため、詳細な風景描写として夕暮れの東京スカイツリーの画像を出力してみました。

プロンプト：Tokyo Skytree at sunset. Orange sky in the background with surrounding skyscrapers. Car headlights glowing on the ground, city lights reflecting on the river surface.

それぞれ同じ夕暮れの東京スカイツリーでも異なる時間帯がや雰囲気を表現しており、
DALL-E 3は夕暮れの空が赤く染まり、スカイツリーの背景に夕暮れがあるため非常に印象的な様子が特徴的で、
Imagen 3は雲の細かい表現と広大な空が描かれている夕暮れと感じられます。
Nova AI Canvas 1.0は少し遅めの夕暮れで落ち着いた雰囲気を醸し出している印象を受けます。

7.モデルの写実性や細部の描写能力を比較するため写実的な風景描写として日の出の静かな山間の湖に煙突から煙が出る木造の小屋の画像を出力してみました。

プロンプト：A serene mountain lake at sunrise. The water is crystal clear, reflecting the surrounding snow-capped peaks and tall pine trees. A wooden cabin with smoke coming out of the chimney sits on the lakeshore, and a small wooden dock extends into the water. Soft morning light creates a golden glow over the scene.

DALL-E-3では朝日特有の暖かいオレンジ色の光が全体を包み込みつつも山頂に靄がかかっており幻想的な画像になっております。
Imagen3では朝日が全体を均等に照らす様子が自然で非常にリアルな画像になっております。
Nova AI Canvas 1.0では全体的に濃いオレンジ色の光でまさに日の出のタイミングを表している画像になっております。
どの画像も日の出の美しさを独自の視点で表現している印象を受けます。

8.モデルが食材の質感や色彩をどれだけリアルに描写できるかを比較するため食べ物の写実的表現としてスパゲッティのカルボナーラにワインを添えた画像を出力してみます。

プロンプト：A gourmet plate of spaghetti carbonara served on a white ceramic dish. The pasta is perfectly cooked, topped with crispy pancetta, grated parmesan cheese, and a sprinkle of fresh parsley. A glass of red wine sits next to the plate on a wooden table, with soft natural light coming from a nearby window

DALL-E-3ではパスタとワインをそれぞれ中央を避けて設置しており、パンチェッタの量が多いがパスタの量が少ないため一人前のカルボナーラと感じられ、
Imagen 3では中央にカルボナーラを設置し、パスタが高く盛られており、立体感があり一人前以上のカルボナーラの印象を受けます。
Nova AI Canvas 1.0ではカルボナーラを一番大きく描くことで強く強調しております。パスタを低く盛り付けることでパンチェッタの印象も強く表現が特徴的です。
どれも非常に美味しそうなカルボナーラです。

9.モデルが抽象的なテーマをどれだけ創造的に解釈できるかを評価するため抽象的なコンセプトの視覚化として時間という概念を抽象的に表現した作品の画像を出力してみます。

プロンプト：An abstract representation of the concept of 'time'. A large golden clock face is surrounded by swirling blue and purple clouds, with hourglasses floating in the air. The background fades into a gradient of black and white, symbolizing the transition between past and future.

DALL-E-3では金色の光の流れや青と紫、金色のコントラストにより非常に幻想的な雰囲気が特徴です。
Imagen 3では時計が中央に配置され、周囲の雲が放射状に広がっているため時計が強く強調されていると感じられ、
Nova AI Canvas 1.0では時計を大きく表現し、存在感が非常にあり、立体感が強く強調されている印象を受けます。
どの画像も時間の神秘性や流動性を独自の視点で表現していると感じられます。

価格比較

続いて価格についても触れてみたいと思います。
今回は東京リージョンで画像の解像度は1024×1024で1枚でかつWhite dogというプロンプトの場合になります。

比較項目	Azure AI Foundry	Vertex AI	Amazon Bedrock
画像生成（1024x1024）	$0.04/画像	$0.04/画像	$0.04/画像

※2025/3/21時点

まとめ

各社が提供する画像生成AIサービスにはそれぞれ特徴があり、異なる印象を受けました。DALL-E 3はファンタジー作品などの幻想的なイラストの画像生成が多く、Imagen 3は非常にリアルな画像生成が多かったです。Nova AI Canvas 1.0は3Dアニメやデジタルイラストに近い画像生成が多い印象を受けました。価格はほぼ同じですが、他のサービスと連携して使用する場合は料金体系が異なるため、自社のビジネスニーズに合わせて最適なサービスを選択することが重要です。

また、画像生成AIの技術は目覚ましく進化しており、以前と比較してプロンプト（テキストによる指示）に対する忠実度が著しく向上し、ユーザーの意図をより正確に反映した画像が生成されるようになってきたことに驚きました。

今後も進化していく技術に目が離せないです。

クラウド基盤における画像生成AIの比較：Azure AI Foundry 、Vertex AI 、Amazon Bedrockを比較してみた

各Studioの簡単な説明

画像生成AIの機能比較

画像比較

1. 非現実的要素の処理能力、スケール関係の理解を比較するために人間よりも大きい白い犬の画像を出力してみます。

2.ファンタジーイラストやコンセプトアートの分野でのモデルの性能を比較するためにファンタジー風の画像を出力してみます。

3.AIモデルの基本的な画像生成能力と創造性を比較するためにキャラクター作画としてオレンジ色のかわいいモンスターの画像を出力してみます。

4.顔の特徴や肌の質感などの微細なディテールの処理能力を比較するために人物描写としてハンサムな老人男性の画像を出力してみます。

5.専門知識の応用能力、および複雑な指示に従う能力で比較するため間取り図の画像を出力してみます。

6.光の処理、複雑な都市風景の描写能力、特定のランドマークの認識精度などを比較するため、詳細な風景描写として夕暮れの東京スカイツリーの画像を出力してみました。

7.モデルの写実性や細部の描写能力を比較するため写実的な風景描写として日の出の静かな山間の湖に煙突から煙が出る木造の小屋の画像を出力してみました。

8.モデルが食材の質感や色彩をどれだけリアルに描写できるかを比較するため食べ物の写実的表現としてスパゲッティのカルボナーラにワインを添えた画像を出力してみます。

9.モデルが抽象的なテーマをどれだけ創造的に解釈できるかを評価するため抽象的なコンセプトの視覚化として時間という概念を抽象的に表現した作品の画像を出力してみます。

価格比較

まとめ

関連サービス

Amazon Web Services (AWS)

Microsoft Azure

Google Cloud

MSPサービス

＼業務課題をデジタルで支援／

おすすめの記事

クラウド基盤における画像生成AIの比較：Azure AI Foundry 、Vertex AI 、Amazon Bedrockを比較してみた

各Studioの簡単な説明

画像生成AIの機能比較

画像比較

1. 非現実的要素の処理能力、スケール関係の理解を比較するために人間よりも大きい白い犬の画像を出力してみます。

2.ファンタジーイラストやコンセプトアートの分野でのモデルの性能を比較するためにファンタジー風の画像を出力してみます。

3.AIモデルの基本的な画像生成能力と創造性を比較するためにキャラクター作画としてオレンジ色のかわいいモンスターの画像を出力してみます。

4.顔の特徴や肌の質感などの微細なディテールの処理能力を比較するために人物描写としてハンサムな老人男性の画像を出力してみます。

5.専門知識の応用能力、および複雑な指示に従う能力で比較するため間取り図の画像を出力してみます。

6.光の処理、複雑な都市風景の描写能力、特定のランドマークの認識精度などを比較するため、詳細な風景描写として夕暮れの東京スカイツリーの画像を出力してみました。

7.モデルの写実性や細部の描写能力を比較するため写実的な風景描写として日の出の静かな山間の湖に煙突から煙が出る木造の小屋の画像を出力してみました。

8.モデルが食材の質感や色彩をどれだけリアルに描写できるかを比較するため食べ物の写実的表現としてスパゲッティのカルボナーラにワインを添えた画像を出力してみます。

9.モデルが抽象的なテーマをどれだけ創造的に解釈できるかを評価するため抽象的なコンセプトの視覚化として時間という概念を抽象的に表現した作品の画像を出力してみます。

価格比較

まとめ

関連サービス

Amazon Web Services (AWS)

Microsoft Azure

Google Cloud

MSPサービス

＼ 業務課題をデジタルで支援 ／

おすすめの記事

＼業務課題をデジタルで支援／