フォーム読み込み中
AI活用を検討するうえで、「機械学習」はキーワードの一つ。
近年、「専門家でなくとも機械学習を活用するためのサービス」としてのMLaaS(Machine Learning αs α Service)が多く登場しており、主要クラウド事業者も同様のプロダクトをリリースしています。
その中でもAlibaba Cloudは、各社に先駆けてGUIによるモデル開発(ノンコーディング機械学習)機能を実装するなど、MLaaS領域の技術的なリーダーの立ち位置にあります。
今回はそんな先進的な技術を搭載し、そして今も進化を続けているAlibaba Cloudの機械学習プラットフォーム「PAI(Platform of Artificial Intelligence)」について解説します。
ソフトバンク株式会社
クラウドエンジニアリング本部 PaaSエンジニアリング統括部
大学時代から画像認識技術を研究。SIerや国産パブリッククラウドサービス事業者にて、設計・構築・プリセールス・サポート・新規サービス企画など幅広く経験し、インフラ歴は14年。 2018年にSBクラウドに参画し、AIチームを立ち上げ。以降、多くの企業へのAI導入プロジェクトを主導。
AI(Artificial Intelligence/人工知能)とは、言語理解や推論、学習などの人間の持ちうる知能を機械に持たせることを言います。特に”機械学習”は過去の事実(データ)から法則を見出す”学習”にフォーカスした技術体系です。
大量のデータを学習することで得られた法則を用いて、新しくインプットされるデータを分析・予測し、目的のアウトプットを自動的に出力する仕組み(=機械学習モデル、以下、「モデル」)を開発する、というのが大きな流れになります。
一方でこの機械学習をビジネスで活用するには、高度な数学と統計が不可欠です。ところがITエンジニアの多くはそのバックグラウンドを持っていません。
また、ハードウェアリソース確保のコストに課題もあります。データ量が増えるほどコストが嵩む一方で、十分なリソースを確保できなければ、学習や推論が追いつかなくなってしまいます。
さらに運用をはじめるにあたって、デプロイの構成を考える必要があります。データのフローや作成したモデルを動作させる環境など、さまざまな知識が必要になってきます。
これらの課題を解決するため、Alibaba Cloudでは2018年に「PAI(Machine Learning Platform for AI)」をリリースしました。クラウドサービスとして機械学習ツールを提供するMLaaSです。
PAIは、大きく3つの機能「PAI-Studio」「PAI-DSW」「PAI-EAS」で構成されます。これらがモデルの作成環境からデプロイ機能まで機械学習における主要な機能を備えているので、開発・運用にかかる専門知識や負担を大きく減らすことができ、AI活用でありがちな専門人材の調達・工数の問題を抱える企業に最適なプロダクトです。
〈PAIの機能構成〉
またハードウェアリソースの課題も、クラウドのメリットをフル活用することで解決できます。CPU・GPUといった計算リソースを柔軟にスケールさせて利用できるほか、Alibaba Cloudのデータ処理プラットフォームのMaxComputeとも連携でき、データストアにてETL処理が実行できます。これによりテラバイト、ペタバイトレベルの大容量データの分散処理が可能な機械学習環境が利用できます。
またGPUによる分散並列処理を要する深層学習については、アリババ独自開発のPluto(Caffeベース)のほかTensorFlowやPyTorch、MXNetなどの主要なフレームワークに対応しています。
ここからは、PAIの各主要機能について解説します。 PAI-Studioではモデルの作成ができます。モデル作成における各タスクをドラック&ドロップで操作するジョブダッシュボード機能を搭載しており、閲覧性と操作性を追求したGUIが大きな特長です。
〈ドラッグ&ドロップによるモデル作成〉
各タスクはインプット、アウトプット、データ前処理、特徴処理、トレーニング、モデル評価といった100個以上の機能に対応。アルゴリズムをモジュール化して最小限のパラメーターを設定することで、機械学習をコードレスにしています。
また、テンプレートとして「詐欺判定」や「EC向けレコメンド機能」などが用意されており、日々増え続けるこれらのテンプレを活用することで、容易にモデルの作成が可能で、これからモデルの開発をする企業や自社開発環境にとっては非常に嬉しい機能になっています。
〈100種類以上のテンプレートから選択可能〉
PAI-DSW (Data Science Workshop) はノートブック形式で開発が行える環境。深層学習など、さらに複雑なモデルの開発の場合、モデルのカスタマイズが多く必要で、より柔軟に開発を行えることが求められます。PAI-DSWでは、従来のやり方でさらにクラウドのメリットも使えてスムーズに開発が行える環境になります。
深層学習でよく使われるライブラリが揃っており、その他のライブラリも自由に追加することが可能です。また、SQLなども対応しているため、BigData開発をサポートしています。
CPUやGPUなどのリソースの性能や数を自由に変更でき、使用状況のモニタリング機能もついています。さらに従量課金制で使うこともできるため、コストを調整しながらフレキシブルに開発を行えます。
〈PAI-DSWのサンプル画面〉
モデルの開発ができたらPAI-EAS (Elastic Algorithm Service) を使ってデプロイします。PAI-EASは学習済みのモデルをリアルタイムにクエリして、推論結果が得られるように最適化されているサービスです。モデルのデプロイ環境の構築が不要となるので、学習環境と推論環境をまとめて管理できることが大きな特長です。
デプロイしたモデルの管理に役立つ機能も搭載しています。バージョン管理機能でサービスが進化していくと同時に更新されていくモデルの管理を行ったり、モデルの更新の際にダウンタイムを最小限にするための機能などもあり、さまざまな面でビジネスに機械学習の導入をやりやすくしてくれます。
クラウドサービスなので、もちろんリソースのオートスケーリングやモニタリング機能があります。ユーザからも管理者側からもサービスを継続的に使えるようになっています。
今回はAlibaba Cloudの機械学習プラットフォームPAIを、以下の主要機能ごとに簡単にご紹介しました。
さらにこれらの主要コンポーネントのほか、中国でβ版が公開されているPAI-AutoLearningでは、GUIでさらに広範囲な操作が実行でき、ワンストップで機械学習のモデルの開発とトレーニングが可能になってます。
条件に該当するページがございません