【分かりやすく解説】生成AIと機械学習の基礎知識

2023年７月６日掲載

昨今、AI技術は急激に進化し、人々の生活の一部になりつつあります。中でもChatGPTの登場にともない、画像や文章などのデータを生成する「生成AI」が特に注目されており、広告やWebコンテンツ作成、さらには医療や製薬、金融など、さまざまな分野で利用されはじめています。本記事では、IT担当者の初心者の方やこれから生成AIについて学んでいきたい方に向けて、生成AIや機械学習、ディープラーニング、ベクトル化などの基礎知識や生成AIをより活用するための準備について簡単に解説します。

生成AI（ジェネレ―ティブAI）とは

「生成AI」とは、人工知能を使って新しいデータを生成する技術のことです。生成AIは、入力されたデータにもとづいてそのパターンを学習していき、新しいデータを生成することができます。生成できるデータには、文章、音声、画像など、さまざまな種類のものがあり、特に注目されている「言語生成AI（文書生成AI）」と「画像生成AI」の２つを紹介します。

言語生成AI（文書生成AI）とは

「言語生成AI」とは、文章（テキスト）を自動生成する人工知能技術のことです。言語処理という領域におけるタスクの一つが言語生成です。

例えば、最近話題になっているChatGPTで利用されているGPT（Generative Pre-trained Transformer ）というOpenAI社が開発しているAIモデルを使用することで、人間が書いたような自然な文章を生成することができます。

一般的に利用されることが多いChatGPTのWebページ

言語生成AIは、ニュース記事やWebページ、小説や会話ログなどから大量のデータを収集し、文法や語彙、文脈を学習し、その結果、自然な文章を実現しています。

言語生成AIを用いることで、自動翻訳や問い合わせ対応などのチャットボット、さらに、音声認識技術と組み合わせて議事録の作成などが可能で、幅広い活用が見込まれています。

画像生成AIとは

「画像生成AI」とは、画像を自動生成したり修正する人工知能技術のことです。

例えば、「晴れた日の山の画像」と入力すると実在しない山の風景画像を自動で生成することができます。また、元画像を変換してフィルタやエフェクトを追加することも可能です。大量の画像を学習させることで、より高度な画像生成が可能になります。

機械学習の基礎

機械学習とは、人間が行うような認識や推論、判断、意思決定などを自動化する技術のことです。

データを分析することでパターンを学習し、そのパターンに基づいて判断を行います。機械学習には主に教師あり学習、教師なし学習、強化学習の３つのタイプがあり、それぞれに深層学習（ディープラーニング）を活用することができます。

教師あり学習（Supervised Learning）
すでに分かっている正解のデータ（ラベル）を与えて学習することで、未知のデータを予測します。例えば、写真が犬か猫かを判別するAIや、出題された問題に対して答えを予測するものがあります。
教師なし学習（Unsupervised Learning）
正解を与えずに学習する方法です。データのパターンを自動的に抽出することで、グループ分けや特徴の発見を行います。例えば、似たような傾向を持つ情報のクラスタリングや異常検知などに利用されます。
強化学習（Reinforcement Learning）
反復行動とフィードバックによる試行錯誤を通じて、自ら最適な行動を学習する方法です。例えばいかに安全であるかを追求することで適切な行動を学ぶ、車の自動運転などが当てはまります。
深層学習（Deep Learning ディープラーニング）
脳神経回路をモデル化した「ニューラルネットワーク（NN）」と呼ばれる仕組みを利用して、データの特徴をより深く段階的（多層的）に自動で抽出する技術のことです。
単層でも学習することができますが、より複雑で多層的な学習を行うことで特徴を把握し、精度を上げることができます。

機械学習は、データのパターンを抽出し未知のデータの分類や予測をする技術ですが、その際、画像や文章データといった非構造化データの特徴を表現するためによく使われるのが、ベクトル化という手法です。ベクトル化することで、機械学習やディープラーニングで非構造化データを扱いやすくなり、高度な認識を行うことが可能になります。

言語のベクトル化

言語のベクトル化とは、日本語や英語などの自然言語の単語や文を数値（ベクトル）に変換する技術のことです。

言語は、人間にとっては意味を持つ文字列であり、さまざまな言葉や文法規則によって構成されていますが、コンピュータにとっては文字列の集合に過ぎません。そのため、言語を数値のベクトルで表現する必要があります。

言語のベクトル化には、いくつかの方法があり、主な手法としては「Bag of Words（BoW）」や「Word Embedding」などがあります。

BoW
文章内の単語の出現頻度をベクトル化する手法です。文章内での単語の出現回数を数値で表します。文章内に含まれる単語の出現頻度を用いるため、文書の分類や情報検索などに用いられます。
Word Embedding（単語の埋め込み。分散表現）
単語を潜在的な意味空間に埋め込む手法です。分かりやすく言うと、単語自体が持つ意味や関係性を数値化する手法です。類似する単語はベクトル空間内で近くにあるものと認識されます。word2vecは有名な方法の一つです。

これらを活用することで、単語の出現頻度から単語の重要度を判断したり、単語どうしの関係性から文章の意味を類推することができるようになります。

画像のベクトル化

画像のベクトル化とは、画像を形状と色の情報に分け数値（ベクトル）に変換する技術のことです。

画像を数学的に表現することで、画像が拡大・縮小しても画質が劣化しないようにできます。このため、広告、パンフレット、Webページ、商品パッケージ、建築図面など、さまざまな分野で活用されています。また、画像をベクトル化（数値データ）に変換しAIに学習させることで、新しい画像を生成するといったことが行えるようになります。

なお、ベクトル化した画像のことをベクタ画像やベクトル画像と言い、aiファイルやsvgファイルとして使われています。よく使われるjpegやpngファイルはラスタ※形式の画像です。

ラスタ：ピクセル（pixel）で構成されており画素ごとに色の情報を含みます。編集しやすいものの、高画質な画像はファイルサイズが大きくなり縮小すると画質が劣化してしまう場合があります。

生成AIをより業務で活用するために

既に提供されている生成AIを利用すればすぐに利用しはじめることはできますが、より業務活用するためには転移学習やプロンプトエンジニアリングを事前に行うことをおススメします。

転移学習を行う

生成AIを利用するためには、すでに提供会社でデータを学習させたAIモデルを使用することが一般的です。しかし、学習済みモデルをそのまま利用するだけでは、新規のデータに対応することが困難になってしまいます。そこで有効なのが転移学習です。

転移学習とは、別の領域で学習した知識（データ）を新しい領域でも使い回すことです。

転移学習によって新たな領域における大量のデータを収集する必要がなくなるだけでなく、学習効率が上がることで高い精度を出せるようになります。例えば、画像認識において犬と猫の画像を学習した後に猿を認識する場合、犬と猫の画像を学習した知識を再利用することで、より効率的な学習を行うことができます。

プロンプトエンジニアリングを行う

プロンプトエンジニアリングとは、生成AIに何を指示するかを決めるプロセスであり、AIが望ましい結果を出力するための技術のことです。

AIの出力（回答）を制御するためにテキストやコマンド（指示書、命令書）を設計します。例えば、言語生成AIの場合には、事前に文章のイメージや必要とする内容について指定したり、翻訳するときはどの言語に翻訳するか、どのような文脈にするかなど指定します。これらを行うことで下記が可能になります。

AIの出力がコントロールできるため、特定の目的にあわせた出力が得られる。
ユーザ（指示書の作成者）がAIの動作をシミュレーションしやすくなるため、時間が短縮される可能性がある。

プロンプトエンジニアリングではプロンプト設計が非常に重要であり、その精度がAIの出力に大きく影響します。そのため、精度を向上させるためには検討や改善を継続する必要があります。

まとめ

本記事では、生成AIや機械学習、ディープラーニングの基礎、生成AIを活用するための準備について解説してきました。生成AIは、現在のテクノロジーにおいて非常に重要な役割を果たしています。今後ますます発展していく生成AIの可能性を自分たちの分野で生かせるよう、情報収集や学習を積極的に行っていくことが大切です。

Azure OpenAI Serviceを使ってみた〜申請・利用方法〜

Azure OpenAI Serviceを使ってみた〜閉域接続方法～

Azure OpenAI Serviceを使ってみた〜AWSと閉域接続～

資料ダウンロード

条件に該当するページがございません

【分かりやすく解説】生成AIと機械学習の基礎知識