フォーム読み込み中
2025年5月30日に公開された Google Cloud Blog で、Vertex AI Studio から Web アプリを簡単にデプロイできる新機能が紹介されました。本記事では、その機能を用いて Cloud Run に学習済みモデルをデプロイし、実際に作成したアプリの性能を検証していきます。
Vertex AI Studio では「アプリとしてデプロイ」という機能を使うことで、簡単にチャットアプリを Cloud Run 上にデプロイすることができます。今回は、どういったアプリを作ることができ、どのように使用できるのかという点について、実際に触って確認していきます。
Vertex AI Studio は、生成AI モデルを活用したアプリケーション開発を支援するGoogle Cloud のサービスです。ユーザーはノーコードでプロンプトを試行錯誤できるだけでなく、必要に応じてPython SDK やAPI を利用し、システムへの統合や高度なカスタマイズも行えます。試作・検証から本番デプロイまでを一貫してサポートする点が特徴です。詳細は公式ドキュメント「Vertex AI Studio | Google Cloud」をご確認ください。
本記事では、Vertex AI Studio で Cloud Run にデプロイしたアプリにいくつかカスタマイズを加えた以下のアプリを使用します。
Vertex AI Studio から作成した直後のアプリとはレイアウトやモデル選択の有無など一部異なる点がありますが、カスタマイズを加えることでこのようなアプリを簡単にデプロイすることが可能です。
Vertex AI Studio で作成したアプリでどういったことができるのか、マルチモーダルの観点から音声ファイルと動画ファイルについて、その性能を検証していきます。
本記事ではモデルは Gemini 2.5 Pro を利用します。Gemini 2.5 Pro は、Google が提供する最新版の高性能マルチモーダル AI モデルです。テキストに加え、画像/音声/動画といった複数モダリティの入力を一括処理でき、数千ページ規模の長文処理にも対応する“超長コンテキストウィンドウ”と、強力な推論能力で論理的かつ精密なアウトプットを実現します。
今回はこちらの記事「【Looker x GenAI】Looker と生成 AI 連携によるデータ活用進化」をもとにNotebook LM の音声概要機能を使って生成した音声ファイルを使用して、書き起こしをしてみます。Notebook LM の音声概要機能について知りたい方はこちらの記事「【Google GenAI】NotebookLM 音声概要で簡単に資料のポッドキャストを作成!」もご覧ください。
音声ファイルを添付し、書き起こしをお願いしてみます。
20秒ほど待つと、返答結果が表示されました。
以下、返答結果の全文となっています。改行なども原文のままです。
はい、承知いたしました
。音声を会話形式で文字起こしします。
女性: こんにちは、ザ・ディープダイブです。えーと、今回はですね、共有いただいたソフトバンクさんのクラウドテクノロジーブログの記事、「ルッカーと生成AI連携によるデータ活用進化」。この生地をもとにデータ分析の未来を
ちょっと探っていきたいなと思ってます。特に、あの、Google Cloudのルッカー、これが生成AIと組むとどうなるのか、その核心に迫れればと。専門家じゃなくてもなんかデータがもっと身近に、もっとパワフルに使えるようになる、そういう変化みたいですね。では早速いき
ましょうか。まずあの、そもそもルッカーって何なんでしょう?記事には単なるBIツール以上ってありますけど、具体的にはどんな感じなんですか?
男性: ああ、はい。ルッカーはですね、まあ、Google Cloudのデータプラットフォームなんですが、もちろんデータの可視化も得意なんです。
でも、その本質はルックMLっていう言語を使ったセマンティックレイヤーにあるんですよ。
女性: セマンティックレイヤーですか?
男性: ええ。これは例えば、売上とか顧客数とか、そういうビジネスの指標の定義を組織の中でこう、完全に統一して一元管理する仕組み
なんです。
女性: ほう。
男性: これによって、誰が分析しても、まあ、同じ基準で数字を見れるので、データの信頼性がこうグッと上がるんですね。この共通言語があるからこそ、AIもデータをちゃんと正確に理解できる、というわけです。
女性:
なるほどなるほど。全員が同じものさしを持つみたいな、それが基盤になるんですね。
男性: そういうことです。
女性: じゃあそのルッカーに生成AIが加わると、具体的にはどんな魔法みたいなことが使えるようになるんですか?記事でいくつか紹介されてましたよね。
**男性
**: ええ。まず1つ目が、ルッカーエクスプローラーアシスタントですね。
女性: エクスプローラーアシスタント。
男性: はい。これはもうまさにデータとの対話を変える機能で、先月の店舗別売上トップ3は?とか、あるいはそれを商品カテゴリ
別で表示して、みたいな、ほんと普通の自然な言葉で質問するだけなんです。
女性: へえー!
男性: そうするとAIが裏で、まあ、SQLクエリを生成して、欲しいデータとかグラフとかをこうパッと表示してくれる。
女性: ああ、もう
普通の言葉でいいんですね。専門知識とかSQLとかそういうのいらずに。
男性: そうなんです。まるでデータに詳しい同僚に話しかける、そんな感覚に近いかもしれませんね。
女性: それは強力ですね。データを見るための、あの、技術的なハードルが一気に下がる感じですか
?
男性: まさにそういうことです。ただ、ちょっと気になったんですけど、曖昧な質問、例えば「好調な製品は?」みたいに聞いても大丈夫なんですかね?利益なのか数量なのか、AIは文脈を理解できるのかなと。
男性: ああ、良いご質問ですね。
そうですね、現状ではある程度こう明確な指示が必要な場面も、まあ、確かにあるとは思います。ただ、AIは、あの、どんどん進化してますし、それにルッカーのセマンティックレイヤーで指標がしっかり定義されていれば、売上とか利益とか、その言葉の意味は明確なので、混乱
は起きにくい構造にはなってますね。
女性: なるほど。定義がしっかりしてるからそこは大丈夫だと。
男性: ええ。むしろ、AIがデータの解釈まで助けてくれるのが次のクエリーインサイトという機能なんです。
女性: クエリーインサイト?データを
みるだけじゃなくて、意味を読み解くのを助ける?
男性: その通りなんです。グラフとか表が表示された後、生成AIがそのデータから読み取れる、まあ、重要なポイントですね。例えば、特定の地域で特定の年齢層の売上が伸びてるとか、週末にこの商品の
注文が集中してるみたいな、そういう洞察を文章で要約して提示してくれるんです。
女性: へえー、それは便利ですね。分析結果の「それで結局?」
男性: ええ、そうです、そうです。その「結局何が言えるの?」という部分をAIがこう掘って
くれるイメージです。
女性: はあはあ。
男性: これで、データから意味を見出すスピードがもう格段に上がると思います。
女性: データを見て意味を理解したら、次はまあ、行動ですよね。
男性: そうですね。
女性: 記事には
パーソナライズされたマーケティングへの応用も書かれてました。これはどういう仕組みなんですか?
男性: それが3つ目のプロモーション配信カスタムアクションというやつですね。
女性: カスタムアクション。
男性: はい。ルッカーで、まず特定の条件、例えば「過去半年
間に特定商品を買ったけど最近買ってないお客さん」みたいな感じで、ターゲット顧客を抽出します。
女性: うんうん。
男性: で、その顧客リストと、まあ、購買履歴なんかを生成AIに渡すんです。
女性: なるほど。
男性: そうするとAIはその
情報を元に、顧客一人一人に合わせて「〇〇様、以前ご購入の△△はいかがでしたか?今なら関連商品XXのキャンペーン中です」みたいな、かなりパーソナルなメッセージを自動で作ってくれるんですよ。
女性: うわー、すごい。
男性: しかもそれを
SlackとかLINEとか指定したツール経由で配信までできる。
女性: 分析からアクションまで一気通貫な感じですね。
男性: ええ。ワンツーワンマーケティングの効率化と、まあ、質の向上が期待できるかなと。
女性: これはすごいなあ
。一方で、データ分析の専門家、アナリスト自身を助ける機能というのはどうでしょう?何かありますか?
男性: はい、あります。ジェミニインルッカーというのがそれですね。
女性: ジェミニインルッカー。
男性: ええ。例えばあの、ルックMLっていうちょっと専門
的なコードの生成を補助したりとか、「こういう軸でこんな傾向が見たいんだけど」みたいに自然言語で指示すれば、それに合わせたカスタムのグラフ、ビジュアライゼーションって言いますけど、それを作成してくれたりします。
女性: ああ、それも助かりますね。
**男性
**: これによってアナリストは、まあ、定型的な作業からは解放されて、より高度な分析とか戦略的な思考に時間を使えるようになるということですね。
女性: なるほど。つまり、データを使う側も分析する側も両方でAIの恩恵を受けられると。
男性: そう
いうことになりますね。
女性: では、なぜ特にルッカーがこれほど生成AIとの連携に適しているんでしょうか?他にもBIツールは色々ありますけど。
男性: えーと、記事では主に3点挙げられてましたね。
女性: はい。
男性: まず、
やはり先ほどお話ししたセマンティックレイヤー、つまりルックMLによるデータ定義の一貫性とガバナンス。これが大きい。
女性: 一貫性とガバナンス。
男性: ええ。次に、ビッグクエリのようなGoogle Cloudの非常に強力なデータウェアハウスと連携して
、大量のデータをリアルタイムに扱えるアーキテクチャであること。
女性: リアルタイム性。
男性: そして最後に、やはりGoogle自身のサービスであるという点ですね。検索技術とか自然言語処理、そしてジェミニのような、もう最先端のAIモデルを最大限活用できるというその
エコシステムの強み。これが大きいと思います。
女性: なるほどなあ。セマンティックレイヤー、リアルタイム性、そしてGoogleのAI技術、ですか。よくわかりました。データへのアクセスがこう民主化されて、理解も早くなって、行動にも繋がりやすくなる。で、さらに分析業務も効率化
される。これはなんか、ビジネスの意思決定のプロセスそのものを大きく変える可能性があるように思いますね。
男性: まさにそう思います。ここで一つ皆さんにちょっと考えてみていただきたい問いがあるんですが。
女性: ほう。
男性: こうしてAIがデータ分析とか解釈をここまで助
けてくれるようになった時、私たち人間、特にデータ専門家のその独自の価値っていうのはこれからどこに見出されていくんでしょうかね?
女性: うーん、深い問いですね。AIと人間の役割分担というか。
男性: ええ。
女性: その答えを探していくのも、これ
からのデータ活用の、まあ、面白さなのかもしれないですね。というわけで今回は、ソフトバンクさんのブログ記事を元に、ルッカーと生成AIの連携が生み出す変化について掘り下げてきました。また次回お会いしましょう。
[BGM]
音声ファイルを聞いて確認してみたところ、漢字の変換ミスや不自然な改行など気になる点はあったものの、「こう、」や「あの、」などのつなぎの言葉も含めほぼ完璧に取得することができていました。
漢字の変換ミスや一部表示が「**男性**:」となってしまったりという点があるので、体裁を整えようとすると若干手を加える必要がありますが、簡易的な議事録を起こすのには十分な精度であると言えそうです。
続いて、動画ファイルの書き起こしをしてみます。今回は、Google Cloud の Vertex AI Search and Conversation で検索アプリを作成する手順について、弊社で収録した動画ファイルをもとに、マニュアル形式で出力してみます。収録した動画は音声を含んでいないものとなっています。画面上のクリックや入力内容を認識してマニュアルで出力することができるのかどうかについて、確認していきます。
それでは早速、動画ファイルを添付し、書き起こしをお願いしてみましょう。
25秒ほど待つと、返答結果が表示されました。
以下、返答結果の全文となっています。
はい、承知いたしました。
このチュートリアル動画
の内容を、順を追ってマニュアル形式で出力します。
Google Cloud Vertex AI Search and Conversation 検索アプリ作成マニュアル
このマニュアルでは、Google Cloud Platform上でVertex AI Search and Conversationを使用して、Cloud Storageのデータを基にした検索アプリを作成する手順を解説します。
ステップ1: Vertex AI Search and Conversation の有効化 (00:00 - 00:24)
00:01 Google Cloud コンソールの左上にあるナビゲーションメニュー(ハンバーガーアイコン)をクリックします。
**0
0:04** メニュー一覧を下にスクロールし、「検索と会話」を選択します。
3. 00:08 「Vertex AI Search and Conversation へようこそ」という画面が表示されます。
4. 00:09 利用規約を確認し、同意の
チェックボックスをオンにします。
5. 00:10 「CONTINUE AND ACTIVATE THE API」ボタンをクリックします。APIの有効化が完了するまで待ちます。
6. 00:20 「Vertex AI Search and Conversation へのオンボーディングが完了
しました」という通知が表示されたら、有効化は完了です。
ステップ2: アプリケーションの作成と設定 (00:24 - 00:52)
00:25 「アプリを作成する」画面で、作成するアプリケーションの種類を選択
します。ここでは「検索」の「選択」ボタンをクリックします。
2. 00:28 「アプリの設定」画面に移動します。
3. 00:33 「アプリ名」の欄に、作成する検索アプリの名前を入力します。(※動画では
入力が省略されていますが、通常はここで入力します)
4. 00:39 「会社名または組織名」の欄に、あなたの会社名または組織名を入力します。(動画では「ソフトバンク株式会社」と入力)
5. 00:51 設定
内容を確認し、「続行」ボタンをクリックします。
ステップ3: データストアの作成 (00:52 - 1:22)
00:52 データ設定画面で、「+ 新しいデータストアを作成」ボタンをクリックします。
00:53 「データソースを選択」画面が表示されます。「Cloud Storage」の「SELECT」ボタンをクリックします。
3. 00:56 「Cloud Storage のデータをインポート」画面で、インポートするフォルダを指定するため、「参照」ボタンをクリックします。
4. **
00:59** 検索対象のドキュメントが格納されているCloud Storageのバケットを選択し、右下の「選択」ボタンをクリックします。
5. 1:02 バケットのパスが入力されたことを確認し、「続行」ボタンをクリックします。
6.
1:04 「データストアの構成」画面で、「データストア名」に任意の名前を入力します.
7. 1:12 「作成」ボタンをクリックします。データストアの作成が完了するまで待ちます。
**ステップ4: アプリの完成 (
1:22 - 1:45)**
1:22 「データストアが正常に作成されました」という通知が表示され、作成したデータストアが一覧に追加されます。
1:23 作成したデータストアのラジオボタンを選択します。
1:25 「作成」ボタンをクリックします。
1:29 「アプリが正常に作成されました」という通知が表示され、検索アプリケーションの作成が完了します。自動的にプレビュー画面に遷移します。
以上で、検索アプリの作成は
完了です。
改行には若干の違和感がありますが、内容としてはかなり細かく、画面上のボタンや入力項目も認識できているようです。
実際に動画ファイルの内容と比較してみたところ、時折マウスポインタがうろうろしている場面があるのですが、そういった不要な部分は書くことなく、必要なポイントのみが正しく書き起こされていました。
本記事では、Vertex AI Studio から簡単に Cloud Run にデプロイする学習済みモデルを使って、音声や動画が書き起こせるのかを検証してみました。結果としては、音声、動画それぞれにおいて、ほぼ正確に認識できるということがわかりました。不自然な改行や誤変換などが一部見られましたが、内容の理解に影響するような問題はないといってもいいのではないでしょうか。
AI を活用することで議事録作成やマニュアル作成といった業務が不要になる時代がもう来ています。この記事を見て興味を持った方は、ぜひ Vertex AI の活用を検討してみてはいかがでしょうか。
Vertex AI を使って社内文書検索や自社の生成 AI システムを構築してみませんか?
ソフトバンクのエンジニアが構築をサポートします。
Vertex AI DIY プランでは、Vertex AI の RAG とマルチモーダルの2つの機能を使って生成AI活用をご体験いただけます。Google の生成 AI の導入を考えている方はもちろん、どのようなものか確認したい、ご自身で構築したいという方にもご活用いただけます。
本記事で紹介したアプリは、Vertex AI DIY プランのマルチモーダルをご契約いただくことで構築が可能です。手順書やオンラインサポートも用意しているので、GCP の利用料金だけで安心してアプリ開発を始めることができます。
Vertex AI を使って社内文書検索や自社の生成AIシステムを構築してみませんか?ソフトバンクのエンジニアが構築をサポートします。Vertex AI のRAGとマルチモーダルの2つの機能を使って生成AI活用を体験いただけます。Google の生成AIの導入を考えている方はもちろん、どのようなものか確認したい、ご自身で構築したいという方にもご活用いただけます。
Google Cloud は、Google サービスを支える信頼性に富んだクラウドサービスです。お客さまのニーズに合わせて利用が可能なコンピューティングサービスを提供します。またデータを活用して、価値を導き出すデータ分析や最先端の機械学習技術を搭載しています。
MSP(Managed Service Provider)サービスは、クラウド導入から運用・保守・監視・活用方法までをソフトバンクのエンジニアがトータルサポートします。お客さまの運用負荷を軽減し、クラウド利用を促進します。
条件に該当するページがございません