Gemini Liveを使ってGoogle Meetの文字起こし機能の精度検証 - 早口言葉も試してみた

2025年4月22日掲載

Google Vidsによる驚きの自動動画作成アプリを体験してみた!

皆さん、こんにちは。

Google Workspace 導入/技術支援チームです。
お客さまがGoogle Workspace (GWS)を導入する中で出てきた課題や、要望、お困り事などを解決するためのTIPS等について、私たちSEのGWS 利用方法を踏まえて発信しています。

先日、Google Meetの Take notes for me (自動メモ機能) が日本語でリリースされました。

Google Meetの文字起こし機能が日本語に対応し、その精度が注目されています。本記事では、最近テレビCMでもよく流れているGemini Liveを使ってGoogle Meetの文字起こし機能を検証しましたので、その精度や特徴を説明します。
※企業向けの Gemini では Gemini Liveは利用できませんのでコンシューマー版を使用しています

また、早口言葉をどこまで文字起こしできるかもチェックしてみました。Google Meet の文字起こしは「早口言葉」も正しく読み取れる確率が非常に高いことがわかりましたのであわせて紹介します。

目次

この記事では
  • Google Workspace の Google Meet の文字起こし精度の検証結果を報告しています
  • エンドユーザー向けの業務効率化手段です

Gemini Live 同士で会話してもらった

文字起こしの精度を検証するために、Gemini Liveを使用し漫才をしてもらいました。最初に以下の2つの内容をそれぞれのGemini Liveに伝えました。
※Gemini Live用のアカウントは2つ利用しています。

【ツッコミ役向け】
「あなたと漫才がしたいです。あなたはツッコミ役です。適切にツッコミを入れてください」

【ボケ役向け】
「あなたと漫才がしたいです。あなたはボケ役です。振られた話についてボケてください」

ぜひふたりのGemini Liveの会話をお楽しみください。
※いきなり音声が出ますので注意してください。

この会話の Google Meet での文字起こし結果は以下の通りです。

Meet の文字起こしの結果

途中でGemini Live001が変にカット・インしてきた部分は削られてしまいましたがそれ以外はすべて正確に文字起こしされていると思います。
はっきり発音すれば問題なく文字起こしできそうです。

ただ、一般的な会議で起こりそうな会話の重複が起きてしまうと文字起こしは行われなくなってしまうようです。

あとGemini Liveの会話は Gemini アプリ (チャットタイプのアプリ)上でログとして残りますが、そのログよりMeetの文字起こしのほうが正確でした。Gemini Live側は言葉の誤認識があったため会話が成立していない部分がありましたが、Google Meet はそのまま文字起こししているので違いが出ているのかなと思います。

余談ですが、Meet で録画と文字起こしを開始すると「ポローン」といった録画の開始音が鳴るのですが、Gemini Liveがその音を聞き取って、「録画と文字起こしを開始するのですね」と反応しました。Meet の録画開始音を認識していることに驚きました。

漫才の精度は低かったですが、文字起こしの精度は高い結果となったことがわかるのではないでしょうか。

早口言葉を試してみた

今度は人の言葉で下記の早口言葉をどこまで認識してもらえるかを試してみました。

「隣の客はよく柿食う客だ x 3回 + 隣の柿はよく客食う柿だ(ちょっと違うことを最後に含めるパターン)」

「赤パジャマ青パジャマ黃パジャマ x 3回 (途中で失敗するパターンのつもりが最初から間違えてたパターン)」

まずは録画データですMeet上のアイコンはGemini Liveになってますが人間が喋っています。

続いて文字起こし結果です。

早口言葉を文字起こしした結果

「。」の位置がおかしいのと、ちょっと変えて喋ったところ、間違えたところは正しく認識されなかったり、そもそも記録されなかったりしています。それでも正しく発音できた場所はほぼすべて間違いなく取得できています。ある程度よくある「言葉」については補正してくれているのではとも思える結果となりました。

まとめ

世の中には色々な文字起こしツールがあり、皆さんそれぞれ文字起こしの精度が気になっていると思います。Google Meetの文字起こし機能を活用することで、会議の効率化が期待できます。発音をはっきりさせる、会話の割り込みを避けるなどの点に注意することで、より正確な文字起こしが可能になると思います。

私はリモート会議での文字起こしのためにUdemyで発声のトレーニングを受けてみたこともあります。Google Meetを使い、発音をはっきりさせるだけで文字起こしがしっかりとできるのであれば、だいぶ工数削減になると思いますので皆さんもチャレンジしてみてはいかがでしょうか!

最後まで読んでいただきありがとうございました。

◆Google Workspaceに関することは、ぜひソフトバンクの窓口又は担当営業までご相談下さい

関連サービス

Google スプレッドシート、Gmail、Google カレンダー、Google Chat、Google ドライブ、Google Meet などのさまざまなサービスがあらゆる働き方に対応する業務効率化を実現します。

Google サービスを支える、信頼性に富んだクラウドサービスです。お客さまのニーズにあわせて利用可能なコンピューティングサービスに始まり、データから価値を導き出す情報分析や、最先端の機械学習技術が搭載されています。

MSP(Managed Service Provider)サービスは、お客さまのパブリッククラウドの導入から運用までをトータルでご提供するマネージドサービスです。

おすすめの記事

条件に該当するページがございません