SNSボタン
記事分割(js記載用)

生成AI、どのくらい理解していますか? 今のうちに知っておきたい生成AIの基本

生成AI、どのくらい理解していますか? 今のうちに知っておきたい生成AIの基本

今やさまざまな分野で活用が広がっているChatGPTなどの生成AI。ニュースなどでよく耳にするけれど、実は1回も使ったことがなく、どんなものなのかいまいち分かっていないという人も多いのではないでしょうか。今回は、意外と知らない人が多い生成AIの基礎知識や上手な付き合い方について、AIの専門家である小澤健祐さんにうかがいました。

小澤健祐さん

お話を聞いた人

日本最大のAI専門メディア「AINOW」編集長

小澤 健祐(おざわ・けんすけ)さん

1,000本以上のAI関連記事を執筆し、AIに関するトークセッションのモデレーターや登壇も多数。著書は『生成AI導入の教科書』。

意外と知らない人が多い!? そもそも「生成AI」ってどんなもの?

意外と知らない人が多い!?そもそも「生成AI」ってどんなもの?

ChatGPTに代表される「生成AI」ですが、何がどうすごいのか他人に説明できるくらいしっかり理解できているという人は少ないかと思います。そもそも、これまでのAIとはどういった点が違うのでしょうか。小澤さんにうかがいました。

生成AIとこれまでのAIの違いは「新しいものを作り出す」こと

小澤さん

「これまでのAIは識別系や予測系と言われ、画像認識や音声認識、需要予測などに活用されてきました。基本的に学習したデータをもとに、新しいデータのカテゴリを判別・分類したり、分析したりするためのAIです。これに対し生成AIとは言葉の通り、学習したデータをもとに新しいテキストや画像、音楽などを作り出すAIです」

“新しいものを作り出す” ことが生成AIとこれまでのAIとの大きな違いというわけですね。その用途や仕組みにも特徴はあるのでしょうか?

小澤さん

「特にChatGPTは大規模言語モデルが基盤として使われていることが大きな特徴です。従来のAIは特定の用途に特化してAIモデルを構築していました。一方、大規模言語モデルは汎用(はんよう)性が高く、さまざまな用途があるんです。ChatGPTのような対話型AIだけでなく、自然言語による指示をもとに画像を生成してくれるAIにも採用されていますよ。ただ、大規模言語モデルを使って目的にかなうコンテンツを制作するには、適切な命令をするプロンプトエンジニアリングの知識が必要です。さらに、大規模言語モデルを使った生成AIを企業が活用したり、ある用途に特化して使ったりする場合は、特定のデータでAIを強化するファインチューニングが重要です」

現在、生成AIと呼ばれるものすべてに、必ずしも大規模言語モデルが使われているわけではないそうです。生成AIはChatGPTの登場によって急に話題になった印象が強いかと思いますが、このあたりの背景はどうなのでしょうか。

小澤さん

「生成AIは突然現れたようなイメージを持ってる人が多いかと思いますが、2018年にGoogleが『Transformer』を発表してから4〜5年ほど、専門家の間ではさまざま研究が進み、論文も発表されてきました。その蓄積が社会に認知されるきっかけを作ったのが、ChatGPTです。チャット感覚で、どんなことにも答えてくれる。その柔軟性と親しみやすさが、一般の人の注目を集めました。今まで専門家のものだったAIを、ChatGPTが一気に一般的なものにしてくれたのです」

何に使うのか、いまいちイメージできない… 生成AIってどんな使い方をすればいいの?

小澤さん

「生成AIの中でも特にChatGPTはうまく使えば、文書や企画書の制作、校正などを効率化でき、時短になります。でも、私はそのような時短ツール的な使い方は本質的な使い方ではないと考えています。

ChatGPTがすごいのは『○○のすごさを教えて』と聞いたら『以下に分類できます』と箇条書きで論理構造をまとめてくれること。それをもとに自分のアイデアの足りない点を補足したり、頭の中を整理したりすることができます。ChatGPTは何かの答えを知るためではなく、答えがない問いに対して『自分はこう考えるけど、君はどう思う?』と、共に考えてくれるパートナーや相談相手として活用すべきだと思います。

生成AIについては虚偽の情報を生成するハルシネーションが指摘されていますが、そもそも答えがある問題にChatGPTを使うのが間違いだと思います。既存の知識にもとづく正しい答えが知りたい場合は、Google などの検索ツールを使えばよいのです。生成AIは正しい答えを知るためのツールではないという認識はもっと広がってほしいですね。

生成AIのメリットというとすぐに業務効率化や自動化などを考えてしまいがちですが、『答えがない問いを一緒に解決するパートナー』を得ることができる点が一番大きなメリットだと思います」

ChatGPTだけじゃない! さまざまな種類がある生成AI

ChatGPTだけじゃない!さまざまな種類がある生成AI

単なる便利ツールではなく、「答えがない問いを一緒に解決するパートナー」とも言える生成AIですが、実はさまざまな種類があります。上手に付き合っていくには適材適所が大事ということで、種類ごとの特徴と代表的なサービスについて見ていきましょう。

文章(テキスト)生成AI

大規模言語モデルを使った対話型AIで、テキストで入力した質問や要望(これをプロンプトと言います)を送信することで、AIが入力された内容を解析し、適切な回答を返してくれます。使用されている言語モデルによって精度は異なりますが、まるで人間が答えを返しているかのような高精度な回答をしてくれる点が大きな特長です。ただし、複数の情報源から組み合わせて回答するという特性上、出力された回答が必ずしも正しいわけではないので正誤を確かめることが大切です。

代表的なサービス
  • ChatGPT
  • Google Bard
  • Bing

画像生成AI

多くの画像を学習したAIモデルを使用していて、テキスト(プロンプト)で仕上がりのイメージを指示するとAIが自動的に絵やイラストなどの画像を生成してくれます。簡単にイラストなどの画像を作れますが、著作権侵害などのトラブルに発展するリスクもあるので、生成した画像の用途には注意しなければなりません。

アンテナ

「ひまわり畑の中に立つ近未来的な建物」というプロンプトを入力して作成した画像

代表的なサービス
  • DALL·E
  • Midjourney
  • Stable Diffusion

動画生成AI

画像生成AIの発展型とも言える生成AI。基本的な仕組みは画像生成AIと同じで、テキスト(プロンプト)で動画のイメージを入力すると、AIがそのイメージに沿った短い動画を生成してくれます。現時点では短い動画のみの生成にとどまっていますが、将来的には長尺の動画にも対応できるようになることが期待されています。

代表的なサービス
  • Runway
  • Pictory
  • Synthesia

音声生成AI

テキスト(プロンプト)や音声データを入力すると、AIがその特徴を学習し、新しい音声データを生成してくれます。単純にテキスト入力したものから音声を作り出すだけでなく、AIに1人の声を大量に学習させ、その人と全く同じ声質の音声を生成することも可能です。

代表的なサービス
  • Speechify
  • Murf.ai
  • Notevibes

音楽生成AI

音楽のジャンルやスタイルを選択し、テンポやキーなどを指定するとAIが自動的に楽曲を生成してくれます。基本的にはAIが楽譜などを学習し、それらのパターンを認識することにより、新しい音楽を生成するという仕組みです。人間が基本的な部分を作った音楽にAIがアレンジをしてくれるソフトがあったりと、楽曲の生成だけでなく、アシスタントとしての目的で使用できるものもあります。

代表的なサービス
  • Amper Music
  • Ecrett Music
  • Amadeus Code

小澤さん

「生成AIにはさまざまな種類がありますが、1番使われているのはやはり文章生成AIです。そもそも人間の思考は言語で成り立っていますし、ミーティングなどでの情報の共有も言語ですよね。人間は言語を通して人の会話も理解していますし、何かものを見るときも『車が走っている』と言語を通して理解しています。言語は人間の認知能力とか知能の奥深くにある、すごくベースになるものですよね。そういった意味で、やはりAIがテキストを生成してくれるというインパクトが1番大きくなっているという傾向があるかと思います」

生成AIは頼れるパートナー。付き合い方のコツと進化の行方

生成AIは頼れるパートナー。付き合い方のコツと今後のトレンドとは

今後、生成AIが仕事や暮らしの中でどんどん活用されるようになると、どう付き合っていくのかが重要になってきます。例えば、生成AIで作成したコンテンツを企業が広告などで使う場合は、著作権侵害などにならないかなど万全の注意が必要でしょう。生成AIをパートナーとする際に人間側に求められるスキルや、未来予想図などを小澤さんに聞きました。

今後は生成AIをマネジメントしていくスキルが求められる?

小澤さん

「どこまで生成AIに任せるのかを考える必要がありますし、さらに適切な指示をするだけでなく、できあがったものをチェックし、評価するスキルも求められます。繰り返しますが、生成AIは検索ツールの延長線上ではなくて『答えがない問い』を一緒に解いてくれるパートナーという認識を忘れないようにしましょう。なぜか生成AIに答えを求める人が多いのですが、企画書を作るのも、文章を作るのも、全部答えがないものですよね。生成AIをマネジメントして、適材適所で自分の業務にどんどんアプライしていくことがますます重要になるのかなと思います」

生成AIは何でも答えてくれるというイメージがありますが、何か苦手なことはあるのでしょうか。

小澤さん

「実は意外なことに、ChatGPTは数学の問題を解くことが苦手です。これは、膨大なデータを学習して回答を出すということに特化していて、数学的な論理性ではなくて文章の正しさを基準に評価をしてしまうからなんです。それ以外でも、今のところ個人や企業に特化した情報を適切に扱うことが苦手なので、そういったことに関する質問には回答がどうしても差し障りないものになりがちです。例えば、ChatGPTに『母親へのLINEの文面を考えて』と指示しても私の母親が誰かなどの詳細な情報を知らないから、どのようなLINEを送っていいのか分からないわけです。つまりパーソナライズ化されていないので、回答が一般論的なものになってしまうところは、一つのデメリットであるのかもしれないですね」

今後の生成AIの向かう先は?

小澤さん

「生成AIの向かう先としては大きく二つあります。一つはエージェント化です。エージェントとは、本人に代わってさまざまなタスクを代行してくれる支援機能で、すでにマイクロソフトは生成AIが検索やメール作成、アプリ操作を支援してくれる『Copilot(コパイロット)』をリリースしています。ChatGPTもさまざまなツールと連携し、ツールを使うときのサポートをしてくれるようになっています。このようなエージェント化は今後の中長期的な流れになっていくでしょう。

もう一つはドメイン特化です。先ほども触れましたがパーソナライズ化されていないというのは生成AIの大きなデメリットで、例えばChatGPTに営業資料を作ってもらっても過去の自社のデータを踏まえたものは生成されません。でも、今までの自社データを全て学習した生成AIがあれば、そういった企画書を作成することも可能になります。今後は特定の業務領域(ドメイン)に最適化した生成AIの実現が課題で、これが進めば企業での活用もさらに広がっていくでしょう」

小澤さんが期待する生成AIの未来の姿とは?

小澤さん

「今の生成AIはまだ某アニメの秘密道具のようなものだと思うんですね。ただ、これからは困っていたり、してほしかったりすることをいつの間にか勝手にやっておいてくれる。生成AIはそんな頼れるエージェントのような存在になっていくのではないかと思います」

今後も私たちの生活にどんどん広がっていくことが考えられる生成AI。ついつい便利な時短ツールや明確な答えをくれる検索ツールのように考えてしまいがちですが、小澤さんが言うように「答えがない問いを一緒に解いてもらうパートナー」と捉えてうまく共存していくことが重要となってくるのかもしれません。

(掲載日:2024年1月5日)
文:関川 隆
編集:エクスライト