プレスリリース 2022年

国際会議「ECCV 2022」で論文が採択

~限られた教師データでの高精度なセマンティックセグメンテーション手法を提案~

2022年10月6日
ソフトバンク株式会社

ソフトバンク株式会社(以下「ソフトバンク」)は、2022年10月23日から27日まで開催されるコンピュータービジョン分野※1における国際会議「European Conference on Computer Vision 2022」(以下「ECCV 2022」)で、ソフトバンクのAI戦略室 R&D推進室に所属するデータサイエンティストの岡澤 淳郎(おかざわ・あつろう)による主著論文(以下「本論文」)が採択されましたのでお知らせします。

現在実用されているAI(人工知能)技術のほとんどは、AIの学習に大量の教師データを必要とするため、データの作成に多くのコストがかかります。限られた教師データを用いて高精度なAIモデルを実現する手段として、コンピュータービジョン分野では、Few-shot learning※2が昨今研究されていますが、教師データの少なさに起因して、特に類似した被写体を正しく認識できないという本質的な問題があります。本論文では、データ空間上での被写体同士の類似性に着目し、この本質的な問題を改善する限られた教師データでの高精度なセマンティックセグメンテーション※3手法を提案しています。本論文で提案する研究は今後、従来の大量データを前提としたAIでは実現できなかった新しい機能や、データ作成のコストの低減が要求される、あらゆる画像ソリューションでの活用が期待されます。

[注]
  1. ※1
    画像・動画データから多分野に応用できる人間並みの視覚能力の実現を目指す技術研究
  2. ※2
    学習時に存在していない未知の被写体に対して、数枚のデータのみを使って正確に予測を行えるようにすることを目指す手法
  3. ※3
    画像全体や画像の一部の検出ではなく、ピクセル(画素)一つ一つに対して示す意味をラベル付けしていく手法

ECCV 2022で採択された本論文の詳細は、下記の通りです。

タイトル

Interclass Prototype Relation for Few-Shot Segmentation
(和訳)Few-shotセグメンテーションのためのクラス間プロトタイプの関係

概要

本論文では、大量の教師データを利用する通常の深層学習におけるデータ空間と、Few-shot learningにおけるデータ空間の違いに着目する。通常の深層学習では、大量の教師データを使用することで認識対象となるターゲット被写体の多様な表現を可能にする。一方、Few-shot learningでは、限られた教師データしか用いないため、多様な表現ができず、データ空間上のどこまでがターゲット被写体か否かを識別する境界の決定が難しい(図)。ECCV 2022で採択された手法ではこの違いに着目し、ターゲット被写体とターゲットではない異なる被写体を、データ空間上で距離を遠ざけるようにしながらFew-shot learningする機構を導入したInterclass Prototype Relation Network(IPRNet)という新しいモデルを提案した。

(図)本論文で着目したデータ空間の違い

(図)本論文で着目したデータ空間の違い
(a)通常の深層学習におけるデータ空間 (b)Few-shot learningにおけるデータ空間

ECCVについて

European Conference on Computer Vision(ECCV)は、コンピュータービジョン分野のトップ会議として知られています。ECCVは隔年で開催されており、今回で17回目の開催となります。コンピュータービジョン分野において、Conference on Computer Vision and Pattern Recognition(CVPR)、International Conference on Computer Vision(ICCV)と並ぶ世界三大トップ会議として認識されています。

  • SoftBankおよびソフトバンクの名称、ロゴは、日本国およびその他の国におけるソフトバンクグループ株式会社の登録商標または商標です。
  • その他、このプレスリリースに記載されている会社名および製品・サービス名は、各社の登録商標または商標です。