AIで高精度な需要予測を実現 ~分析ツールの導入プロセス事例~

AIで高精度な需要予測を実現 (2021年10月4日公開)

「AI」や「DX」など、ビジネスシーンではデジタルを活用した変革が求められています。しかし多くの顧客や商材を持つ企業の場合、膨大なデータを分析しきれていない、あるいは分析のために工数をかけている、分析の精度が安定しないなど課題があります。ソフトバンクも同様でした。
今回のブログでは、ソフトバンクがそれらの課題を解決するために導入したAIプラットフォーム「DataRobot」について、導入までのプロセスと改善結果を紹介します。

目次

コロナ禍での需要予測に必要な3つのこと

コロナ禍で緊急事態宣言が各地に発出されましたが、時期や地域によって内容ならびに効果は大きく異なります。あまりにも多くの要因が絡み合うため事態は複雑になっており、単純に「緊急事態宣言が発出された地域」としてフラグを立てて、エリアにおける販売需要を予測することは困難です。
刻一刻と変化する状況の中、予測精度を上げるためには次の3つが必要です。

1.高頻度の更新

外部環境は刻一刻と変化するため、月に1回程度の更新を前提に設計していると遅れてしまいます。最新データを常に取り込み続けることが必要です。

2.柔軟なアルゴリズム

特定の状況下でのみ高い精度を発揮する予測モデルよりも、環境要因も取り入れて柔軟に変化できるアルゴリズムを備えた予測モデルが求められています。

3.有用なデータ

最新データを取り込んで変化に対応しても、扱うデータの指標が間違っていては求めている結果は得られません。
安定的に高精度を維持するためには、常に有用なデータを指標としなくてはいけません。

ソフトバンクの課題は工数と精度

ソフトバンクではデータの分析チームが、携帯電話の週末販売予測レポートを商材の担当部署ごとに作成し、毎週配信しています。
その中で、大きく2つ課題がありました。

1.手作業による膨大な工数

販売予測は手作業で行っていたため時間がかかり、高頻度の更新や変化への柔軟な対応が難しい体制でした。

2.安定しない精度

属人的な予測であったため統一されたロジックがなく、扱うデータが異なる場合もあって精度がバラバラでした。

AIによる週末販売予測の実装を検討

2つの課題を解決するため、ソフトバンクはAIプラットフォーム「DataRobot」を導入。実装までのポイントは「スケジュールの締め切りを厳守すること」「特徴量を見極めるまで諦めないこと」でした。
「特徴量」とは、特徴を数値化したデータのことです。例えば「20代の貯金額」について分析したいのであれば、「年齢」「貯金額」が特徴量となります。
AIによる機械学習では、どの特徴量に着目してコンピュータに学習させるかを人が指定する必要があり、予測モデル作成においては重要な要素となります。

リリースまでの4つのプロセス

2019年4月にAI導入の検討を開始してから、2020年9月にリリースするまでの間、4つのプロセスがありました。

①2019年11月:データ収集と項目精査

実用化に向けて、まずは学習させるデータの収集方法についても見直しを図りました。精度を担保できる適正データ量を模索し、収集後も恒久的にメンテナンスが可能になるようにSQL(Structured Query Language)を作成し、データ収集の体制を整えました。
並行して、特徴量を精査する必要があります。正解が分からないため手作業時代を参考にせず、全てのデータを検証。AIに学習させて精度が上がればよし、上がらなければそのデータを削り、それを繰り返して項目の精査を進めました。

②2020年2月:予測モデル作成

扱うデータを決めた次は、予測モデルの作成になります。
ポイントは、「1」か「0」だけにしないことでした。例えば、10拠点のうち4拠点に当てはまるデータの場合、「1」か「0」かだけでは適切に表現できません。小数を導入して0.4と表現する必要があります。
このようにデータの適切なチューニングを繰り返すことで、2019年11月の取り組み当初の実績を0としたとき、そこから-25.0%乖離していた精度が、2月には-8.8%、3月には+7%となり安定しました。
しかしコロナ禍で販売下落し、4月には+45%、5月には+80%と乖離が大きくなり予測不能な事態に陥りました。

③2020年5月:特徴量を追加して精度向上

コロナ禍によって前例のない変化が起こり、これまで積み上げてきた特徴量や予測モデルが白紙に戻るほどの事態となりましたが、緊急事態宣言や時短営業の影響を特徴量として新しく追加してチューニング。7月には+1.9%、8月には-0.8%と、再び実績からの乖離が少なくなり、精度の高い状態に安定しました。

④2020年6月:RPA化によって工数削減

予測モデルが作成できるようになったので、次は工数削減へと着手。
手作業では、次の順番で1つの予測モデルにおいて作成と配信を行っていました。

最新実績抽出(作業時間:約6分)
→Excelで教師/予測データ(約8分)
→DataRobotでモデル/結果作成(約30分)
→Excelで予測結果レポートを作成(約15分)
→Gmailで部署へ配信(約6分)
→Slackで検証結果を報告(約8分)

精度を高く維持するため、各部署に対して別々の予測モデルを作成する必要があります。約73分かかる予測モデルの作成を、配信数×商材数で毎週92モデル作成しなくてはいけませんでした。全モデル作成に6,716時間かかるため、とても現実的ではありません。

そこでDataRobot社のAIエンジニアと協業し、Automation AnywhereやPython、VBA(Visual Basic for Applications)を取り入れ、予測モデルと結果の作成をRPA(Robotic Process Automation)で自動化を実現。特に時間のかかるモデル/結果作成は、ボタンを押すだけで一晩のうちにできるようになりました。

「DataRobot」導入によって一定のロジックで予測モデルを作成できるようになり、特徴量の精査・追加によって精度を向上させ、RPA化によって工数削減を実現。当初抱えていた課題をクリアした上で2020年9月にリリースし、現在も改善を続けながら運用しています。

ソフトバンクは独自の分析パッケージをご提供

ソフトバンクでは、自社での取り組みを通じて培った「DataRobot」による分析ノウハウをパッケージ化してご提供いたします。これにより「ターゲティング」や「需要予測」、「マーケティング効果測定」といった貴社のデータを生かしたAIのビジネス利活用が可能になります。
詳細はサービスページでご確認ください。

また、需要予測については、特に小売業界でも重要度が増しており、商品の品ぞろえや供給、返品の予測、店舗立地の最適化など、さまざまな側面で変化が必要です。
今何が起こっていて対応するためには何が必要なのか、ダウンロード資料でご確認ください。