SNSボタン
記事分割(js記載用)

【LLM】~1分で分かるキーワード #161

【LLM】~1分で分かるキーワード #161

Large Language Modelの略称で、「大規模言語モデル」と訳される。大量のデータを学習した高度な言語モデルで、さまざまな自然言語処理タスクの処理に優れている

膨大なデータを学習し、さまざまな形式のテキスト情報を生成する技術

LLM(Large Language Model・大規模言語モデル)は、生成AIの一種であり大量のテキストデータを使用してトレーニングされ、自然言語処理のタスクに対する高度な言語理解能力を持つAIモデルのことです。また、脳の神経回路の仕組みを模倣して考案されたニューラルネットワークを用いているため、非常に多くのパラメータを持つことも特徴です。

自然言語処理とはコンピュータが日本語や英語などの言語を理解し処理するための分野で、LLMは膨大な量のテキストデータを学習することで自動翻訳や文章の作成、情報検索、ユーザーからの質問への応答など言語関連のタスクに対して優れたパフォーマンスを発揮します。Google の「BERT」やOpenAIの「GPT」などはLLMの代表例です。

ソフトバンクは、日本語に特化した国産の大規模言語モデルの研究開発と生成AIサービスの開発、販売、提供を目的とする「SB Intuitions」を設立。サービス提供開始に向けた取り組みを進めています。

LLMの関連情報

(掲載日:2023年11月20日)
文:ソフトバンクニュース編集部