プレスリリース 2025年

「生成AI開発加速に向けた新たなデータセットの
構築に関する調査」に係る事業を開始

2025年2月13日
ソフトバンク株式会社
株式会社マクロミル
Valright Advisory株式会社
日本トータルテレマーケティング株式会社

ソフトバンク株式会社(以下「ソフトバンク」)、株式会社マクロミル(以下「マクロミル」)、Valright Advisory株式会社および日本トータルテレマーケティング株式会社(以下「NTM」)は、経済産業省と国立研究開発法人新エネルギー・産業技術総合開発機構(以下「NEDO」)が実施する国内の生成AI(人工知能)の開発力の強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」における「生成AI開発加速に向けた新たなデータセットの構築に関する調査」に、2024年10月に採択され、この調査に係る事業を開始しますのでお知らせします(以下「本事業」)。

4社は本事業を通して、今後の日本における生成AIの開発の推進に貢献していきます。

1. 背景

生成AIは、グローバルレベルで今後の経済成長を牽引するテクノロジーと考えられています。生成AIの開発には大量かつ良質なデータが必要とされ、その確保が生成AIモデルの競争力を左右するといわれています。しかし、現在日本には生成AIに活用できる良質なデータが限られており、データセットの構築の効率的な手法が定まっていないなど数多くの課題があります。

本事業では、日本全体の生成AI開発を加速させることを目指して、AIやデータセットの構築・管理、セキュリティーなどに知見を持つ各者が連携し、データセットの構築、管理および提供に係る最適な手法を調査します。そして、この調査結果を基にガイドラインなどをまとめ、生成AIの開発を行うさまざまな企業がデータセットを活用できる環境づくりを目指します。

2. 事業の概要

本事業では、生成AI開発に向けたデータセットの構築、管理および提供の最適な手法を調査します。ニーズのヒアリングや実証などについては、業界をリードする国内の複数の大規模言語モデル(LLM)開発事業者と協力し、実用性の高い大規模なデータセットの構築(約3万人の調査参加者を対象とした100万件程度のQA対話データ)を目指します。また、調査結果を踏まえて、ガイドラインを整備する他、さまざまな事業創出の可能性についても検討していきます。

調査は下記の項目に沿って実施します。事業の実施期間は2025年10月までの予定です。

  1. (1)
    データセットの構築

    LLM開発事業者のニーズヒアリング、ロールプレイ型調査などによるデータ収集およびデータセットの構築など

  2. (2)
    データセットの管理・提供

    セキュリティーやプライバシーを配慮した安全かつ効率的な管理・運用体制の構築

  3. (3)
    データセットの利活用の実証

    生成AIの開発力強化に向けたプロジェクト「GENIAC」の参画企業や、ソフトバンクのグループ企業などと協力し、LLM開発における当該データセットの有効性および提供プロセスの実証を実施

  4. (4)
    事業化の検討

    調査後も継続的に活用するため、データセットの構築の領域におけるさまざまな事業創出の可能性を検討

  5. (5)
    リポートの作成

    データセットの構築や管理、提供に係るガイドラインをリポートとして作成および提出

各者のコメントは次の通りです。

  • 経済産業省 商務情報政策局 情報産業課 課長補佐 杉之尾 大介
    NEDO AI・ロボット部 チーム長 遠藤 勇徳
    経済産業省およびNEDOでは、国内の生成AI開発力強化に向けて、GENIACプロジェクトを立ち上げました。生成AIの開発加速に向けては、良質かつユニークなデータセットを構築・活用していくことが重要です。本事業によって、データ基盤が質的・量的に拡大し、国内の生成AIの高度化や利活用が進み、さらにデータ基盤にフィードバックがされるという好循環が生まれることを期待しています。
  • ソフトバンク株式会社 執行役員 デジタル社会基盤整備室 室長 丹波 廣寅
    高性能な生成AIの開発には良質なデータが必要です。弊社は本事業を通して、質と量をそろえ、安心して利用できるデータセットを構築する取り組みにチャレンジし、生成AIを活用した革新的なテクノロジーやサービスが日本中から生まれる未来を目指します。
  • 株式会社マクロミル 代表執行役社長CEO 佐々木 徹
    このたび、弊社が生成AIデータ構築調査事業を受託し、日本のAI技術発展に貢献できることを大変光栄に思います。今後も、データの力でさらなる社会価値を創出できるよう注力していきます。
  • Valright Advisory株式会社 代表取締役社長 川上 裕義
    本事業の参画を通じ、わが国の生成AI開発加速の基盤づくりに貢献できることを大変光栄に思っています。これまでのコンサルティング経験を生かし、本事業に貢献していきます。
  • 日本トータルテレマーケティング株式会社 デジタルイノベーション本部 本部長 谷 賢治
    弊社では、データセットの構築や管理・提供、利活用実証を通じ、生成AI開発加速に向けた新たなデータセットの構築・管理を担当します。この取り組みを通じ、生成AIの発展に資するデータ活用を推進し、社会に広く役立つデータ基盤の実現を目指します。
  • 【協力企業】株式会社AIST Solutions 事業プロデューサ 小川 宏高
    産総研グループでは、生成AIなどの最先端AI技術の研究開発力を強化するため、ABCI 3.0を整備、2025年1月に正式運用を開始しました。生成AIの開発を加速するには、計算能力と良質なデータセットの両方が不可欠です。本取組で構築されたデータセットが生成AIの進化に貢献し、ABCIもその一助となることを期待しています。
[注]
  • SoftBankおよびソフトバンクの名称、ロゴは、日本国およびその他の国におけるソフトバンクグループ株式会社の登録商標または商標です。
  • その他、このプレスリリースに記載されている会社名および製品・サービス名は、各社の登録商標または商標です。