目次INDEX
ソフトバンクのグループ会社であるSB Intuitions株式会社は今、国産の生成AIの研究開発に取り組んでいます。「国産」の生成AIが持つ意義とはどのようなものなのか、また日本でつくる日本語を使う人のための生成AIはどんな可能性を秘めているのか? SB Intuitionsの生成AI研究開発責任者に、ミッツ・マングローブさんが話を聞いてみました。
PROFILE
-
ミッツ・マングローブ
MITZ MANGROVEタレント・歌手
10代から20代にかけて約7年間をイギリス・ロンドンで過ごす。慶應義塾大学法学部政治学科を卒業後、英国ウェストミンスター大学コマーシャルミュージック学科へ留学し、音楽ビジネス全般を学ぶ。2000年にドラァグ・クイーンとしてデビュー。以来、ライブイベントやテレビ・ラジオ出演など、さまざまな芸能活動を展開。現在はコラム執筆、⼥装歌⼿3⼈による⾳楽グループ「星屑スキャット」として音楽活動など精力的に活動中。
SB Intuitions株式会社 取締役 兼 CRO
R&D本部 本部長
井尻 善久(いじり・よしひさ)
国産の生成AI開発者ってどんな人たち?
井尻さんは生成AIの開発者だとお聞きしました。でも私、生成AIがどのようなものなのかイマイチ分かっていないんです。そもそもAIって何の略でしたっけ…?
「Artificial Intelligence(アーティフィシャル・インテリジェンス)」の略語で、直訳すると人工知能という意味になります。生成AIだと最近は外国産のChatGPTなどが有名だと思うのですが、ミッツさんは実際に使われたことはありますか?
「ミッツ・マングローブ」と自分の名前を生成AIで調べてみたことがあるんですけど、全然違うイタリア人が出てきました(笑)
思っていたのと違う答えが出てきてしまうという「生成AIあるある」かもしれないですね(笑) AIの黎明(れいめい)期では「こういう場合にはこういうアクションをしてほしい」と人間の手でプログラミングして、機械ができることのパターンが増えていき、その組み合わせパターンが複雑になっていくことで、なんとなく賢い機械のように見えてくる… というような仕組みでした。
しかし、このやり方だと人間が想定するシナリオ以上にAIは賢くならない。そこで近年主流となっているのが、大量のデータをもとに機械が自分でデータの入出力の法則性を自動的に学習していく「機械学習」という手法です。
機械学習。聞いたことはあります。
こうした機械学習には大量のデータと非常に高性能かつ高価なコンピューターが必要になります。生成AIの基盤となる大規模言語モデル(LLM:Large Language Models)という技術があるのですが、このモデルにおいては新聞の朝刊でいうと5,000年分以上のデータが必要だとも言われています。これらAI開発に必要な大量のデータを収集し、機械学習に使える状態に整備することが私たちAI開発者の仕事の第一歩になります。
なかなか大変そうなお仕事ですけど…。SB Intuitionsの生成AI開発メンバーには他にどんな人たちが集まっているんですか?
メンバーの多くが修士・博士課程を修了して、国際的にも活躍しているような優秀な人材ばかりです。生成AIの開発ノウハウは日進月歩なので、日頃から最新の論文や膨大な量の技術文書に各メンバーが目を通し、チーム内で共有しながら研究開発に取り組んでいます。
自分なりのこだわりや知的好奇心が旺盛な人も多く、ある人はランチに対するこだわり、ある人は仏教に対する関心、ある人は将棋といった趣味など、自分が “沼っている” ものを互いに共有するようなカルチャーもありますね。パソコンとにらめっこするばかりではなく、楽しく活発な議論が頻繁に行われるようなにぎやかな職場環境です。
進化を続ける生成AI、私たちの生活をどう変える?
生成AIが今よりもっと進化していったとして、どんな分野やシチュエーションで活躍してくれるのでしょうか? なんとなく私は医療の分野での活躍を期待しているのですが。例えば、何らかの症例を入力したときに「ここが悪いんじゃないか」「ここを治せばいいんじゃないか」と即座に分析してくれるような、そんなツールができるんじゃないかとか。
恐らく今後5年以内くらいをめどに、ミッツさんがおっしゃったようなレベルのAIが登場する可能性はあります。ただ、生成AIはどのような教材(データ)を用意したか次第で、どういうことができるかも決まってきます。今はどの分野においても、前提となる常識レベルの知識を機械学習でAIに覚えさせようとしています。例えば、ミッツさんがおっしゃったような医療の分野だと、MRIやエックス線検査で取得したデータと、患者から聞き取ったデータなどを総合して、どのような診断を下すかという常識的な理解力をAIに学習させるような段階です。
さらに高性能なAIがこれから世の中に生まれたとして、私たちはその変化についていけるんでしょうか? 例えば、高性能な医療用AIが生まれたときに、患者さんはもちろん、現場にいるお医者さんや看護師さん、あるいは研究者といった人たちはその変化についていけるのかな… と。私だったら置いていかれてしまう気がして。
そこに関しては、私自身はあまり心配していません。例えば、スマートフォンが世の中に出てきたときに、その変化についていけなかった人が多かったかというと、意外とそうでもなかったと思うんです。いわゆるガラケーが一般的だった時代から、今はもうスマホが当たり前の時代になっていますし、数年くらいで多くの人々がスマホに徐々に適応していった。AIの進化とそれに対する人々の適応も、同じような流れになる気がしています。
私がひとつ気になっているのは、責任の所在です。AIがいくら進化したとしても、最終的な責任は必ず人間が取らなきゃいけないと思っていて。どんなに高性能なAIが出した回答であろうと、何か問題が起きたときに「これはAIがやったことです」では済まされないと思うので。
おっしゃる通りだと思います。現状ではどのようなデータを用いてAIが学習しているのか見えづらいですし、データを収集するにあたっての著作権周りの問題もあります。AIを社会的にどう活用していくのか、そしてその責任は最終的に誰が取るのかといったことも含めて、社会的な議論はもっと必要だと思いますし、SB Intuitionsとしても生成AIの透明性や正確性を担保するための取り組みには今後も力を入れていかなければいけないと感じています。
「だし巻き卵」の危機? 侘び寂びがわかる生成AIとは
そもそも生成AIに外国産と国産があること自体驚きだったのですが、外国産の生成AIが現状で数多くある中で、「国産」にこだわって生成AIを開発する意義はどんなところにあるのでしょうか?
例えば、公的機関や金融機関など高度なセキュリティが求められる領域・業種においては「国産である」という信頼性から、より安心して使ってもらえるかもしれません。また、外国産の生成AIと国産の生成AIの一番の違いは、AIが学習するデータ全体における日本語データが占める割合です。先ほど、ミッツさんのお名前を生成AIで調べたときに見当違いな回答が出てきたというお話がありましたが、日本語の学習データをしっかり学んだ国産の生成AIであれば、より正確な回答が得られるかもしれません。
じゃあ例えば、日本の季語であったり、「侘び寂び」のようなニュアンスが難しい表現であったりしても、国産の生成AIならくみ取ることができるんですか?
まさにそれを目指しています。例えば、一口に卵料理といってもスクランブルエッグや日本ならではの「だし巻き卵」などいろいろありますよね。料理にまつわる言葉も「飴色玉ねぎ」など日本独自の表現がいろいろあります。海外の生成AIばかりを利用していると、そのような日本的な単語や表現が将来的に使われなくなっていく懸念も考えられます。日本語や日本の文化を守るという観点からも、国産の生成AI開発は非常に重要になってくると言えます。
なるほど。日本独自の風情や味覚、色合いを表現するような言葉やニュアンスが難しい口語表現っていろいろありますものね。そういった日本らしい言葉がどんどん減ってしまうとなると、それは本当に寂しいことだと感じます。
われわれが普段から使っている日本語をデータとして取り込んでAIに学習させる過程においても、日本文化や日本語についてしっかり理解している人がデータの取捨選択を行うことが非常に重要になってきます。その過程がなければ、まさに懸念しているような「日本語が忘れ去られてしまう」事態が起こり得るからです。だからこそわれわれ開発メンバーも「日本の大事な言葉や文化を守っていかなければならない」という使命感を持って、日頃の研究開発に臨んでいます。
「好感度が上がった」というときに「高感度」と書いてる人をたまに見かけるんですけど、そういうのが私はすごく気になるんです。あと「ひとりぼっち」という単語を数字で「1人ぼっち」と表記しているのを見て、モヤモヤすることもあります。どちらかというと、ひらがなの方がポツンとしている印象が伝わるし、漢字で書くなら「独りぼっち」の方がしっくりきます。私の中では譲れないこだわりなのですが、周りからは面倒くさがられてしまって(笑)。でも、こういうことも含めて、大切にしていきたい日本語っていろいろあるな、と井尻さんの話を聞いて考えました。
AIを使う人間こそサボってはいけない
日本語や日本の文化を守る上でも、国産の生成AI開発が大切だということは分かりました。でもまだ「AIが進化・普及することで本当に私たちの生活は便利になるの?」という疑問は拭えないんです。井尻さんはどのように考えていますか?
私としては、煩わしくて不条理な仕事とか、人がやると危険な仕事とか、想像を絶する苦労があるような仕事とか、そういった仕事をAIに代替させたいという思いを強く持っています。そのような仕事の数々を機械に代替させながら、人類は進歩してきたと思うので。昔は掃除も全て手作業だったと思うのですが、ロボット掃除機が出てきて私たちの暮らしはより便利になりましたよね。そういうことが、これからどんどん起こるんじゃないかなとは思います。
でも、ロボット掃除機って私の部屋ではあまり使えませんでした。床にいろいろ物を置いてしまっているので、全然進んでくれなくて(笑)。ロボット掃除機って普段から部屋の片付けをサボっていない人のための道具なんだなって思いました。
同じようにAIがこれからも進化していく中で、人間が絶対にサボっちゃいけない部分があると思うんです。AIが賢くなるのと同時に、私たちも賢くなっていかないと、AIもバカになっていくんじゃないかなと。その上でもリテラシーや教育が、これからますます大事になってくると思います。あと、こうして対面で話しているとわかるんですけど、井尻さんは関西の出身でいらっしゃいますよね?
はい、その通りです。
やっぱり、方言やイントネーションなども含めて、実際のコミュニケーションの中で得られる情報っていろいろあるじゃないですか。会話だけじゃなくて文章でも、ある言葉をひらがなで書くのか、カタカナで書くのか、漢字で書くのか、あるいは語尾の表現などによっても受ける印象は変わってくる。そうした表現上の工夫や判断を行うのは、話し手であり、書き手であるわけで、私自身が文章を書くときもそのあたりはすごく気にします。見た目の美しさも含めて、文章もデザインだと私は思っているので。
何が言いたいかというと、生成AIがあるからといって「このシチュエーションのときには、こういう文章を送ればいいんだ」というような、そんな無責任で定型文的なコミュニケーションばかりになってほしくないという思いがあるんです。
それはまさにおっしゃる通りですね。ミッツさんがおっしゃっている「責任」という話にもつながりますが、結局いかにAIが進化したとしても、それを使いこなすのはあくまで人間であって、最終的には人間が手綱を握っておかなければならない。今日のお話を受けて、われわれも生成AIをより多くの人をサポートする有用な道具として、責任を持ってしっかり開発していきたいとあらためて思いました。
生成AIを作っているのはあくまでも人間。どうせなら、井尻さんたちのように日本の文化や日本語を大切にしている人たちに頑張って作ってもらいたいですね。