CVPR2023から見るコンピュータビジョンの動向

2023年6月29日掲載

キービジュアル

こんにちは、SB-AI部の内海です。

今回は最新のコンピュータビジョンの動向を把握するために、2023年6月開催の「CVPR2023」に採択された2,359件の論文に対して出現単語を分析しました。(採択論文一覧はこちら )

 

目次

1. 人気ワードから見る動向

まずは、タイトルに出現する件数の多い順で単語のランキングを行います。以下がワードクラウドの図です。字の大きい単語ほど、タイトルでの出現件数が多いことを示しています。

CVPR2023における人気順のワードクラウド

次に、タイトルでの出現件数Top10のワードをヒストグラムで示します。図中の出現件数右にある括弧は、CVPR2022の出現件数に対する変化率を示しています。

CVPR2023における人気ワードTop10の出現件数のヒストグラム

この分析結果から、3Dモデリング、Segmentationタスクの2つの動向を整理します。

1.1. 3Dモデリング

人気1位となったワード「3D」をはじめ、6位の「Representation」、8位の「Field」、10位の「Point」は全て3Dモデリングに関連する単語です。「NeRF (Neural Radiance Fields)」や「点群表現(Point clouds representation)」をテーマにした論文が昨年に引き続き多く採択されています。

1.2. Segmentationタスク

昨年人気1位だった「detection」は3位に順位を落とし、「segmentation」が4位にランクアップしました。ピクセル単位のラベリングが必要なSegmentationタスクは、点群表現との親和性が高いため、3Dモデリングの進化に合わせて人気が高まっています。7位の「Semantic Segmentation」だけでなく、「Panoptic Segmention」をテーマにした論文も増加傾向にあります。

2. 急上昇ワードから見る動向

次に、タイトル出現件数の対昨年増加率の高い順でランキングを行います。以下がワードクラウドの図です。字の大きい単語ほど、昨年比の出現割合が増加していることを示しています。

CVPR2023における急上昇順のワードクラウド

そして、タイトル出現件数の対昨年増加率Top10のワードをグラフで示します。図中の増加率右にある括弧内は、CVPR2022とCVPR2023の出現件数の変化を示しています。

CVPR2023における急上昇ワードTop10の対昨年増加率のグラフ

この分析結果から、生成AI、Open-Vocabularyタスク、CNNアーキテクチャの3つの動向を整理します。

2.1. 生成AI

ランク1位の「prompting」、4位の「Diffusion」、8位の「text-to-image」は全て、生成AIに関する単語です。画像の生成だけでなく、3Dモデルや動画の生成・修正も高品質に行える技術論文がいくつも採択されています。

2.2.  Open-Vocabularyタスク

「Open-Vocabulary」という複合語が5位にランクインしています。この単語は「Open-Vocabulary Tracking」や「Open-Vocabulary Segmentation」のように、タスク名に係る形で使われます。これらは、学習されていない未知のラベルに対してもTrackingやSegmentationを行うことを目的としたタスクです。画像とテキストを同じ特徴量空間に埋め込む技術「CLIP (Connecting Text and Images)」(2021年にOpenAIが提案) をベースにした論文がいくつも採択されています。

2.3. CNNアーキテクチャ

急上昇ランク2位と9位に位置する「MAE(Masked Autoencoder)」は、「ViT(Vision Transformer)」のコア技術です。ViTは現在CNNに代わる主流のアーキテクチャとなっていますが、CVPR2023にてCNNアーキテクチャとMAEを統合した論文 ConvNeXt V2 が採択されました。これは、CNNベースアーキテクチャがViTベースアーキテクチャの精度に勝る可能性があることを示しています。今後CNNの人気が再燃するかもしれません。

3. まとめ

CVPR2023で採択された論文のタイトルを分析し、コンピュータビジョンの動向を整理しました。今年は3DモデリングやSegmentationタスクに加え、生成AIやOpen-Vocabularyタスク、CNNアーキテクチャに対して関心が集まりました。

おすすめの記事

条件に該当するページがございません