17:30-17:55|猫さんルーム
本セッションでは映像検索技術について、NIST主催映像解析ワークショップTRECVID2023の参加を通して取り組んだ技術研究の内容を紹介します。本技術はAIが人間のようにコンテンツの内容や意味を理解し、検索することを実現するものである。ここでは検索クエリ文と映像コンテンツの対応関係について、言語と映像の意味の概念を深層学習によりAIがモデル化し、意味に基づく検索を実現している。本セッションではこの技術の内容と、研究開発に至る背景やR&Dのチームビルディングやマネジメントについて紹介します。
堀 隆之(ほり たかゆき)
ソフトバンク株式会社
テクノロジーユニット サービス企画技術本部
テクニカルマイスター
ソフトバンク株式会社サービス企画技術本部にてAI技術の研究開発と事業化に向けた企画開発の業務に従事。最先端のAI技術を創出するためにR&Dチームを結成し、大学や研究機関との共同研究を実施。日本初の独自AI技術の創出に取り組み、事業化に繋げるプロジェクトを牽引。NIST主催映像解析ワークショップTRECVID2023のAVS(Ad-Hoc Video Search)部門にて世界一位の精度達成。ソフトバンクのAI分野(画像処理・パターン認識)のテクニカルマイスターに認定。早稲田大学招聘研究員。