Beyond AIで運営する高性能GPU「SANDBOX」を用いた2024年の取り組みまとめ

About the activity using Super Computer "SANDBOX", organized by Beyond AI Promotion Division

2024年12月22日掲載

キービジュアル

みなさまこんにちは、AI戦略室の馬田です。

この記事は、ソフトバンク アドベントカレンダー 2024の22日目になります!早いもので、今年もクリスマスまであと3日!アドベントカレンダーも後半に差し掛かっていますが、皆様今年もソフトバンクの記事を楽しんでいただけているでしょうか?

今年のアドベントカレンダーには、私の所属しているBeyond AIチームからはこの記事含めて2本の記事を掲載させていただきました。7日に公開した前半パートでは、Beyond AI研究推進機構の取り組みの一環として設立された「Brain Science × AI Community」について紹介していますので、ぜひこちらの記事もご覧ください。

(第一回記事:「Brain Science × AI コミュニティ」本格始動開始!!~Beyond AI研究推進機構での脳科学研究に対する2024年の取り組みを振り返る~

本記事ではBeyond AI推進課で運用しているSANDBOXを用いて進められている研究や、SANDBOXチームでの社内の取り組みについて、運営を担っているKhanさんにお話を聞いてまとめてみました!

今回お話を聞いた人

Carlos Enrique Gutierrez

Khan Md. Anwarus Salam
カーン ムハンマド アノワルス サラム

ソフトバンク株式会社 AI戦略室
Beyond AI 推進課

AIエンジニアとしてBeyond AI連携事業に携わり、AIの学術研究と実用的な応用の両方における橋渡しを担う。

BRAC大学 情報工学科(ダッカ・バングラデシュ)を卒業後来日。電気通信大学 情報理工学研究科の機械翻訳の研究を行い、修士課程/博士課程を修了。

東京のIBMリサーチでの研究科学者、バングラデシュにおけるGoogleの地域エンジニアリングコンサルタントとしてのキャリアを積んだのちにソフトバンクに入社した。

主な科学的関心領域は、生成AI、自然言語処理、意味解析、機械翻訳、機械学習等。

さて、本文に入る前に、ソフトバンクと国立大学法人東京大学(以下、東京大学)の産学連携プロジェクト「Beyond AI研究推進機構」についても紹介します。

Beyond AI研究推進機構

ソフトバンクと東京大学は2020年5月、世界最高レベルの人と知が集まる研究拠点として「Beyond AI研究推進機構」を立ち上げました。

この「Beyond AI 研究推進機構」では、AIの基盤技術研究とその他の学術領域との融合による新たな学術分野の創出や、社会課題・産業課題へのAIの活用を目指して、さまざまなテーマでの研究を推進しています。

これらの研究の成果は現在、ジョイントベンチャーの設立などによっていち早く社会実装・事業化されており、さらなるAI研究の発展とよりよい社会の実現に貢献しています。

それでは本題に入りましょう。

本記事では、SANDBOXがAI研究の進展にどのように貢献しているか、学術界と産業界の協力を促進する方法、そしてこれからの将来計画についてまとめています。

目次

1 - はじめに 〜Beyond AI SANDBOXとは〜

そもそも、Beyond AI SANDBOXとは何なのか、について説明させてください。

Beyond AI SANDBOX(以下SANDBOX)は、NVIDIAのDGXインフラストラクチャを用いたGPUサーバーです。

NVIDIAのA100 Tensor Core GPUを8基、64コアAMD Rome CPUを2基、2TBのRAMと240TB分のGen4 NVME SSDを搭載しており、日本でも有数の「スーパーコンピューター」となっています。

Beyond AI研究推進機構では、加入している研究者の方々にSANDBOXを利用頂くことで、並外れたAI計算能力を提供し、研究を強力に推進しているのです。

Sandboxの概要

図1:「SANDBOX」の概要

2 - ACCV学会でのコンテスト実施

Beyond AI推進課では、LLMコンソーシアムと協力して、ベトナム・ハノイで開催されたアジアコンピュータビジョン会議(ACCV 2024)で「LAVAワークショップチャレンジ」と題したコンテストを実施しました。

LLMコンソーシアム

LLMコンソーシアムは東京大学大学院 情報理工学系研究科の中山英樹教授の主導により、大規模言語モデル(Large Language Model; LLM)の研究と応用を推進するために新しく始動したBeyond AI研究推進機構のプロジェクトです。LLMを開発し社会統合する際に発生するクリティカルな課題を解決すべく以下のような取り組みを実施しています。

・基礎技術と応用の可能性を探るための定期的な勉強会とセミナーの開催
・ワークショップや技術指導を通じた共同プロジェクトの支援
・東京大学やソフトバンクからの言語データなどのリソースの共有を通じてイノベーションを推進

LLMコンソーシアムには鶴岡慶雅 教授、宮尾祐介 教授、谷中 瞳 准教授、Minh-Duc Vo 特任助教など、東京大学の中でも著名な研究者の方々にもジョイン頂いており、これらの取り組みを通して、LLMの倫理的かつ効果的な展開、普及に貢献することを目指しています。

LAVAワークショップチャレンジの内容は、データフローダイアグラム(DFD)やクラス図、ガントチャート、建物設計図などの複雑な視覚データを大規模視覚言語モデルで正確に解釈し理解する能力を向上させることです。このチャレンジにより、キュレーションされたデータセットと強固な評価フレームワークを使用してAIモデルのパフォーマンスを向上させることを目的としているのです。

Beyond AI推進課とLLMコンソーシアムはこのチャレンジのために、インターネットから収集された約3,000のサンプルを含む公開データセットに加え、ソフトバンクのTASUKI事業部に提供いただいた約1,100のサンプルを含む非公開データセットを、特別にベンチマークデータセットとして準備しました。

 

ワークショップには、日本、ベトナム、バングラデシュ、シンガポールなどの国々から12の国際チームが参加しました。

参加者は、このチャレンジで、入力データに関連する質問に答えることのできるモデルを続々と開発していました。特に、東京大学に所属する参加者には、計算支援としてSANDBOXのGPUを有効に活用したモデルを作成いただきました。

3 - コミュニティ/イベントの運営

ACCV学会への参加以外にもSANDBOXのコミュニティで様々な勉強会を実施したり、ポスター展示会に出展を行ったりしました

3-1 LLMコンソーシアムの勉強会:

LLMコンソーシアムは毎月、定期的に勉強会を開催しています。この勉強会では、最新の研究や技術のトピックについて深く掘り下げ、参加者同士の知識の共有と意見交換を実施しています。これにより、学術研究者と企業エンジニアとの協力が強化され、LLM技術の現実世界への応用に繋がるのです。これまで実施した勉強会を以下にまとめてみました!

LLMコンソーシアム勉強会の内容

図2:LLMコンソーシアム勉強会の内容

3-2 生成AI勉強会:

生成AIに関する最新の研究や応用技術について議論するために、定期的な勉強会が開催されています。このグループでは、生成AIの基本概念や実際の応用事例について学び、参加者同士の知見を深めることができました。こちらも、これまで実施した勉強会のタイトルを紹介します。

① 生成 AI の最新トレンドと課題(Latest Trends and challenges in Generative AI)(2月20日)

講演者: Dr. Khan Md. Anwarus Salam (ソフトバンク AI戦略室)

②「作って学ぶ日本語大規模言語モデル」の紹介(4月23日)

講演者: 加藤 公一氏 (ソフトバンク AI戦略室)

③ Conversational Personal Knowledge Extraction for Persona-Aware Dialogue Generation (ペルソナ認識対話生成のための会話型個人知識抽出)(9月3日)

講演者: 陳 宜珮氏 (東京大学 情報理工学系研究科 博士課程)

3-3 ポスター発表会の実施とSANDBOXでのポスター展示:

11月26日には、Beyond AI研究推進機構主催でポスター発表会を実施しました。各研究者からの研究ポスター発表はもちろん、ソフトバンクからもSANDBOX、Axross、およびLLMコンソーシアムをはじめとしたの共同取り組みや研究成果を紹介するため、ポスターを出展しました。

ポスター発表会

図3:ポスター発表会の様子

5 - SuperPODを活用する研究プロジェクト募集の実施

現在、Beyond AIでは、SANDBOXに次いでさらに新しいGPUサーバとして「SuperPOD」を導入しています。

Beyond AI推進課では、東京大学の研究者に対してSuperPODインフラを活用するためのプロジェクト提案を募集しています。プロジェクトの内容に関しては、AIに関する基礎研究はもちろん、実世界へのAIの応用を狙ったハイサイクル応用研究プロジェクトでも応募可能としています。

採択された場合は、NVIDIA DGX SuperPODへの無料アクセスとその環境設定およびトレーニングデータの準備だけでなく、プロジェクトごとに最大1000万円の資金提供も実施して研究プロジェクトを全力でバックアップする予定です。

先述のBeyond AIのポスター発表イベントでは、「SuperPODを活用して課題解決に挑戦する研究グループの公募について」という特別講演も行われ、ソフトバンクが関心を持つさまざまな研究トピックを研究者の皆様に紹介しました。

 

SuperPOD

図4:SuperPODを活用したプロジェクト募集についての講演の様子

6 - SANDBOXのこれからの活動と展望

最後に、Beyond AI SANDBOXの将来展望についてお話させてください。

SANDBOXでは、高速なデータ処理、リアルタイムAIアプリケーション、大規模な視覚言語モデル、生成AIの進展をサポートしてきました。これらの最先端の技術進歩と戦略的提携とを通じて、最終的には基礎研究と実用的応用の橋渡しも行うようにすることで、学術的なブレークスルーを迅速に実世界のソリューションへと応用できるようなイノベーションのエコシステムを目指しています。このエコシステムこそが、グローバルな影響力の拡大に繋がるのです。

Beyond AI推進課ではこれから、次世代のGPUや高度なストレージシステムを備えたインフラのアップグレードに向けて続々と投資を実施しつつ、これらの計算リソースを最新のAIフレームワークや高度なツールと統合していくことで、SANDBOXを通して創造性と効率性を育むシームレスな研究体験を研究者の皆様に提供していきます。

さらに、SANDBOXはAIガバナンス、安全性、公平性などの課題に取り組むため、グローバルなAIコンソーシアムや規制機関との連携も強化する予定です。

最先端技術への継続的な投資を通じて、SANDBOXは社会的利益のために変革的なAI技術を先導するイノベーションを支援していきます。

まとめ

今回はKhanさんにお話を聞いてみました。いかがでしたでしょうか。Beyond AI SANDBOXは、高性能な計算リソースの提供から、影響力のあるコミュニティイベントの開催に至るまで、イノベーションを育むハブとして機能しています。これからも更に計算資源に投資してより大規模な研究を行うということで、大変楽しみですね。

 

それではアドベントカレンダーもあと3日、次の記事にバトンを渡そうと思います!

また来年お会いしましょう!良いお年を〜〜

 

それでは、次回のソフトバンク アドベントカレンダーもお楽しみに!!!

本記事の著者

keisuke-mada

馬田 啓佑
まだ けいすけ

ソフトバンク株式会社
サイバーセキュリティ本部
(兼)AI戦略室 Beyond AI推進課
(兼)TU/IT統括 DE&Iテーマ別WG事務局

2022年度ソフトバンク新卒入社。本務ではサイバーセキュリティ本部に所属しつつ、2023年7月より社内副業制度にてAI戦略室/Beyond AI推進課、同11月よりDE&Iテーマ別WG事務局にも所属。

サイバーセキュリティの業務では、業務用携帯端末の設定や業務用PCの通信データなどに着目、「社内の情報漏洩防止の観点でのセキュリティ向上」を追求している。

兼務先となるBeyond AI推進課では、テックブログの投稿含めた広報推進や、東京大学の学生さん等に向けたイベント/グローバルインターンシップ企画を務めており、DE&I WG事務局では、ソフトバンクのエンジニアが「どのようなマイノリティ属性を持っていようと働きやすい環境」を目指し、各WGによる企画の実行支援や、DE&I推進室/人事本部との連携を担っている。

業務外で興味のある分野は、モビリティ分野の自動運転や自動操縦、IoT分野を用いた第一次/第二次産業のDX、地方活性化など。    

おすすめの記事

条件に該当するページがございません