【イベントレポート】SB Tech Night #2 AI/ML/DL

【イベントレポート】SB Tech Night #2 AI/ML/DL

(2021年8月6日掲載)

2021年6月17日に、第2回「SB Tech Night」が開催されました。 「SB Tech Night」とは、ソフトバンクのエンジニアが、技術のアウトプットを自由にできる場所・輝ける場所を作りたいという思いではじまったイベントです。

目次

早速、今回のイベントのレポートしていきたいと思います。テーマは「AI/ML/DL」です。

イベント詳細

SB Tech Night #2 AI/ML/DL


まずは、問いかけからはじまりました。それがこちらです。

参加者の回答としては、「あまりイメージがない」という方が3割くらいという結果に。 オンラインならではの相互作用が発生する、アンケートを取り入れたイベント開始が印象に残りました。

それではイベントの登壇者の話を振り返ってみます。

GPTで遊んでみる

1人目のスピーカーはソフトバンクの山田 聡 氏。

「文章生成モデルGPT-2の面白さの片鱗を見てもらいたい」という山田氏のメッセージからスタートしました。 GPT-3のデモとして、英語で書いた文字をもとに、それをアプリ化するというものが披露されました。 アプリというと、これまでの常識からすると、人間がプログラミング言語を用いてコードを書き、それがアプリとなるのが当たり前でした。 しかし、英語を認識し、さらにアプリにまでするというのは驚きですね!プログラミングの自動化に可能性を感じます。

GPT-3はイーロンマスクも出資している非営利の研究組織が発表しているものです。 Transformerというモデルに大量のテキストデータを読み込ませています。

OpenAIが公開したGPT-2はあまりにも自然な文章を生成できることで、フェイクニュースの生成に使われる懸念も話題になったことがあります。 人間が書いた文章か、AIが書いた文章か、その判断ができなくなってくると、確かにフェイクニュースを書くことで利益につなげたい人からすると悪用したくなってくるでしょう。 そのような懸念もあって、OpenAIがコードを公開しなかったそうです。

実際に作成されたフェイク記事の紹介もありました。 「衝撃的な発見で、科学者はアンデス山脈の遠く離れた未踏の谷に住むユニコーンの群れを発見しました。研究者にとってもさらに驚くべきことは、ユニコーンが完璧な英語を話したという事実でした」 という、騙されそうな人がいてもおかしくないくらい、文章としてきちんと成立している内容となっています。

次に、有名人にインタビューしてその回答の続きをAIに作成させてみる例が紹介されました。 「AI は人類の敵なのでしょうか。〇〇さんはこう語ります。」という文章の〇〇に有名人の名前を入れ、文章生成させてみた結果の共有です。

1人目が孫 正義 氏の場合。

「人類の敵なのでしょうか」という問いに対して「AIやITについて人類の滅亡などと発言すれば世間の人が怒るのも無理はありません。」という、なんとなく本人が語りそうな文章になっていますね。
残りの2人は「うっせえわ」で一躍有名になったAdoさん、文化人類学者であり、「サピエンス全史」、「ホモ・デウス」で有名なユヴァル・ノア・ハラリさんがピックアップされていました。
Adoさんについては「AIは人間より頭がイイと思うのですが、人間の敵のように聞こえるのは私だけでしょうか?」とういそれらしき言葉を生成しています。
それぞれ、なんとなくそれっぽい、本人が言いそうな回答となっているのが面白くもあり、同時に怖いとも思いました。人を騙そうとすればいくらでも活用できそうなAIです。

画像処理クラウドサービスの実力比較検証

2人目のスピーカーはSBクラウドの山田 佑輔 氏です。

最初に画像処理クラウドサービスの紹介があり、AWS, Azure, GCP, Alibabaにおける、画像分析、動画分析の特徴が紹介されました。 AIモデルを作るにはいろいろなデータを作ることが必要です。各種クラウドサービスにはAPIが用意されているので、それらを調査し、比較していくことが今回のプレゼンのコンセプトでした。

AIについて、画像処理が一番汎用化が進んでいるという話がありました。 画像処理クラウドサービスの代表的なものとしては、AWS, Azure, GCP, Alibabaがあり、それぞれ、画像分析、カスタム画像分析、動画分析、カスタム動画分析の手法が異なります。

AWSは、物体とシーンの認識、顔認識などに対応しています。

AzureはOCRというテキスト抽出や画像の解釈、空間分析に対応しています。

GCPはオブジェクトの検出、有名な場所や製品ロゴの識別に対応しています。

Alibabaは14のカテゴリ、175のアルゴリズムを公開していて、用途に沿って細かくAPI化しています。 顔認識系であれば、顔写真を変化させたり、画像の中から人物の行動、特徴量を分析することが可能です。 ユーザーが使いたいシナリオを考え、使うAPIを選んだ上で使うという、他と比べて特殊なやり方になっています。

次に想定シナリオを共有した上での傾向分析をしてみる具体例の共有されました。今回はAlibabaだけの検証となっています。 左下のイメージ図にあるように、お店を歩いている人のファッション分析を通して、カメラで撮影したデータから性別、年齢、どういう商品を身に着けているのか、その特徴は何かなどを作ることを目的としています。

以下は処理の1つ目となる、人物、商品のセグメンテーションです。 画像のように、人物の画像をインプットデータとして、それを人物+服や服のみにセグメンテーション化することができます。 地面を消してくれたり、手を消したり、うまいことセグメンテーションしてくれています。精度が高いですね。

画像データはネット上にたくさんあります。クラウド化が進んだことによって、大量の画像データを学習データとして使うことでいろいろな画像処理が可能であることがわかり、可能性を感じるプレゼンでした。

Yahoo! JAPAN を支える レコメンデーションエンジン

3人目はヤフーの武田 悠佑 氏です。 レコメンデーションというのは「オススメ」という意味ですね。 インターネットを使ってると、Webサービス側から「オススメ」された経験があるのではないでしょうか。多くの人が無意識に見かけたことのあるものです。 アジェンダとして、以下の2つが出されました。

続いて、ヤフーにおける、レコメンデーション導入の課題が紹介されました。 100以上と多種多様なサービスの中で、汎用性の高いレコメンデーションエンジンというのは価値が高い物だと言えそうです。

各サービスのユーザー行動ログをレコメンデーションエンジンにインプットし処理することで、実際のレコメンデーション結果を出力するという流れになっています。

レコメンデーションエンジンの特徴は「利用シーンに合ったレコメンデーション」として2つに分けられます。
1つ目はItem to Itemという、アイテムに着目したレコメンデーションです。あるいは一緒に購入されている商品をレコメンデーションするというものです。
2つ目はUser to Itemという、ユーザーに着目したレコメンデーションです。あなたに「オススメ」なものを表示してくれます。
いずれもユーザーのニーズに応じたレコメンデーションを提供することができます。

レコメンデーションエンジンの実際の導入事例が紹介されました。 Yahoo! JAPANトップページ内にある「あなたにオススメの施設」に使われているそうです。 ネットサーフィンをしているとよく見かける「オススメ」ユーザー側からみても本当に「オススメ」されたものをクリックしたくなるかどうかという意味でも、精密さが重要となってくるでしょう。

オープンデータで作る感情分類器

続いて、ソフトバンクの佐藤 貴俊 氏による、感情分類器についての発表でした。 感情分析とは文章から感情を読み取る技術です。一般的な感情としては、ポジティブ、ネガティブ、ニュートラルの3種類に分類します。

感情分析は、商品に関する市場調査やアンケートの傾向分析などといった使い方があります。 以下では、いくつかサンプルとしてテキストをインプットし、その文章の感情を読み取ってみた例が紹介されました。

以下のサンプルでは、ツイート文章の感情を分類しています。 3つ目の文章は複数のトピックが扱われているために難易度が高い文章だと言えます。

以下はまとめのスライドです。 シンプルなツイートに対しては感情を分類する精度が高いことがわかったそうです。 しかし、複数のトピックが混ざると十分な精度とは言えないという結果となりました。 フリーな環境、オープンソース、オープンデータで作成できるという点には、可能性を感じます。

SNSのモニタリングに活用できるということで、自分のツイートや友達のツイート文章を分析してみても面白そうですね。

今すぐ使える人気AIレシピ紹介します

最後は、SBイノベンチャー / Axrossの鈴木 祥太 氏の登壇です。 タイトルに「レシピ」とあるように、これまでの登壇者たちをシェフに見立て「一流料理を堪能できた」とイベントを盛り上げるつかみの挨拶が素敵でした。 鈴木氏は、大学院で自然言語処理を学び、人工知能学会でも全国大会優勝するなど素晴らしい実績をお持ちです。

結論であるメッセージをシンプルにご紹介してくれました。「実践的なAI学習はAxross」

エンジニアどうしがコミュニティを通して学ぶことができるというのが実践的で面白いですね。 IT業界は変化も早いですから、一人だけで学習することはとても高いハードルとなります。みんなで協力しながら学び合う環境というのは貴重だと言えるでしょう。

Axrossの特徴として、「一連のAI開発の流れを追体験できる」ということが挙げられました。 料理を作るかのようにAI開発を行うことができるようになれると開発も楽しくできそうです。

教育と実務のギャップを埋める、まさに重要なポイントです。
ネット上には今たくさんの情報があふれています。プログラミング初心者が学習できる情報もたくさんあります。 しかし、そういった学習コンテンツと実際の会社の業務における応用活用がうまくリンクしていないケースがあるということでした。
これには共感するエンジニアも多いのではないでしょうか。 基礎ができたとしても、基礎と応用の間にもまたギャップがあり、それを埋めることは簡単ではありません。 このギャップこそが日本人のエンジニアに上級者が少ないことの原因の一端でもあるのではないでしょうか。
初心者と中級車、上級者の間にあるギャップを埋めることができるのがAxrossという、とても魅力的な紹介でしたね。

前の時間に登壇された、1人目の山田さん、4人目の佐藤さんのレシピもしっかり紹介され、他の方をティーアップするのがとても上手ですね。

今回は画像、テキスト、音声、データ分析、この4つのレシピをご紹介してくれました。 8月に開催する、AIハンズオンにてどのハンズオンを受けてみたいのか?そのアンケートを取る目的もあるということでした。

自然対話するSlackボットを作るレシピです。ボットはネットでよく見かけます。こういったボットも精度が上がればちょっとした話し相手にもなってくれそうです。

楽曲のムードを深層学習で分類するレシピです。楽曲の音の特徴量をもとに楽曲を分類することができます。

最後はCampfireでプロジェクトを分析して意思決定に活用するレシピの紹介がありました。

絵本をテーマにしたクラウドファンディングの金額、タイトル、説明文を考えてみる、という実験をしてくれました。

まとめ

今回のSB Tech Night #2では以下の5人の方にAI関連の技術的な話を含めて行っていただきました。それぞれどのような話だったのかをおさらいしてみます。

1.GPTで遊んでみる 山田 聡さん(ソフトバンク) 文章の自動生成に関するお話

2.画像処理クラウドサービスの実力比較検証 山田 佑輔さん(SBクラウド) 画像処理を使ったファッション分析の紹介

3.Yahoo! JAPANを支える レコメンデーションエンジン
武田 悠佑さん(ヤフー) ヤフーのトップページなどで見かけるオススメ表示を行うレコメンデーションエンジンについて

4.オープンデータで作る感情分類器 佐藤貴俊さん(ソフトバンク) 文章から人間の感情を分析する

5.今すぐ使える人気AIレシピ紹介します
鈴木 祥太さん(SBイノベンチャー / Axross) 初心者・中級者・上級者のギャップを埋めるAI学習のレシピ紹介

SB Tech Nightでは、今後も定期的にソフトバンクのエンジニアによる技術発信をおこなっていきます。 次回のSB Tech Night #3は、2021年8月6日(金)「MaaS Tech」がテーマです。 ご興味のある方は、ぜひご参加ください。