Azure OpenAI Serviceの「On your data」で自社データを組み込んでみた

 

2023年7月27日掲載

Azure OpenAI Serviceの「Add your data」で自社データを組み込んでみた

2023年1月(ChatGPT対応は3月)から提供が開始されたAzure OpenAI Serviceを企業内で使う場合、セキュアな通信環境が求められます。

このブログでは、Azure OpenAI Serviceの機能を自社データと連携するする方法について複数回に分けて紹介していきます。

第1回の記事の今回はAzure OpenAI Serviceの「On your data」機能で自社データを組み込んでみました。

目次

1.背景

ChatGPTは、抽象的なものを生成することには非常に適しており、アイデア出しや壁打ちなどで活用する人はよく見かけます。しかし、具体的事象や決定的な事象について尋ねると「不正確で適当なことを、それっぽく、あたかもそれが正しいように」しか回答してくれません。このようにChatGPTの回答は不正確なことがあり、業務で広く活用すると、逆に業務の足枷になる懸念があります。

そのため、自社データを組み込んで正確性と実用性向上を目指す取り組みが注目されていましたが、実装にはAPIや複数のサービスを組み合わせたアプリ開発が必要でした。そこで登場したのがAzure OpenAI Service の「On your data機能」です。これは、自社データの組込みの難易度を格段に楽にしたものです。Azure等の他のサービスとシームレスに連携し、Azure OpenAI Serviceを強化してくれます。

2.On Your Dataとは

Azure OpenAIのモデルで独自のデータを使用することができる機能です。独自のデータを使用することで、より高速で正確なコミュニケーションを可能にする強力な会話型AIプラットフォームが使用できます。具体的には、独自のデータとGPTモデルを簡単に連携させることができ、GPTが知らない独自のデータを参照して回答を生成できるようになります。また、回答のソースを独自データに限定することもできるため、ChatGPTの活用の幅が大きく広がります。

3.検証作業

3.1想定ユースケース

今回、想定するケースはソフトバンク電話料金資料を参照しながら問い合わせに回答するChatGPTを作成します。ユーザが特定の料金について疑問を持った場合、ChatGPTを介して詳細な説明や解決策を提供することができ、ソフトバンクの電話料金に関する情報を効率的かつ正確に提供することができ、ユーザの疑問や問題解決に役立つチャットボットを実現することができます。

また、今回はAzure Blob Storageに規定類を格納しておき、質問をするとChatGPTで格納した規定類の中から関連する項目をAzure Cognitive Searchを使って検索し、検索結果を踏まえてユーザに回答するという構成としました。ちなみに、Azure Cognitive Search は、Microsoftが提供するクラウド検索サービスであり、API等を使ってアプリケーションに検索機能を組み込むことができるものです。

3.2検証の流れ

Azure Blob Storage、Azure Cognitive Search、Azure OpenAI Serviceなどのリソースを作成し、Azure Blob Storageへ検証用の電話料金資料をアップロードします。その後、Azure Cognitive Searchによって自動的にインデックスが作成されます。作成されたインデックスはChatGPTと連携してデプロイされ、質問をすることで動作確認を行います。

On your dataを使ってみた:従来の構成
On your dataを使ってみた:今回の構成

3.3検証データセット準備

まず、Azure Cognitive Searchのリソースを作成します。

On your data設定手順:Azure Cognitive Searchのリソース作成

次に、検証用データを準備し、Azureに保存します。Azureストレージアカウントを作成し、そこにコンテナを作成してデータを保存します。

On your data設定手順:コンテナ作成

その後、保存したデータをAzure Cognitive Searchに接続し、検索可能な状態にします。[Azure search]のStorage Accountsから作成したCognitive Searchのリソースを選択して接続します。

On your data設定手順:Cognitive Searchのリソース選択

3.4環境構築

3.4.1Azureアカウント準備

Azure OpenAIを利用するためには、まずAzureサブスクリプションが必要です。Azureサブスクリプションを作成するには、以下のリンクにアクセスして手順に従ってください。

Azure サブスクリプションの作成

3.4.2Azure OpenAI Serviceへのアクセス申請とリソースの作成

アクセス申請については以下のブログで詳しく説明しましたので、ご参照ください。

Azure OpenAI Serviceへのアクセスを申請する

Azureポータルにログインして、Azure OpenAIリソースを作成し、モデルをデプロイできます。具体的な手順については、以下のリンクを参照してください。

 Azure OpenAI を使用してリソースを作成し、モデルをデプロイする

3.4.3「On your data」の設定

以下のようにChatGPT プレイグラウンドで「Add a data source」ボタンを押して、データソースに「 Azure Cognitive Search 」を選択して、この前準備したインデックスを選択します。

On your data設定手順:ChatGPTプレイグラウンド画面
On your data設定手順:ChatGPTプレイグラウンド設定

3.5動作確認

プレイグラウンドでモデル「Limit responses to your data content」をチェックした上で、以下の質問してみます。

質問1「シンプルスタイル専用パケット定額サービスとは」

質問1について、回答になっています。

On your data設定手順:動作確認①

質問2「シンプルスタイル専用パケットの料金はなにがありますか」

質問2の回答は間違っています。出典を確認したところ、料金プランと金額を間違えました。

On your data設定手順:動作確認②

4.課題

今回の課題について整理します。

課題:

検索精度が悪い。検索精度 On your data経由でインデックスを作ると、contentフィールドの言語アナライザーが英語(デフォルト)になり、Cognitive Search自身の日本語の検索精度が少し悪い。

改善策:

‐公式データ準備ツールを使って言語アナライザーを日本語にする
‐プロンプト設計に工夫して、モデルに理解しやすい言葉で精度を上げる  

まとめ

以上で、Azure OpenAI Serviceの「On your data」機能を使って自社データをChatGPTに組み込んでみました。

手元のプライベートデータをChatGPTに組み込でみたい方は、ぜひお試しください。

最後までお読みいただき、ありがとうございました。

関連資料

「Azure OpenAI Service」ではじめる、ChatGPTとのシステム連携

Azure OpenAI Serviceの概要や料金、システム構成などをご紹介します。

関連サービス

Azure OpenAI Service

Azure OpenAI Serviceは、OpenAIのAIモデルをMicrosoft Azure上のセキュアな環境で利用できるサービスで、機械学習や自然言語処理などの高度な機能を提供します。簡単にAIを組み込み、スケーラブルなソリューションを構築し、効率的にビジネス価値を生み出すことができます。

Microsoft Azure

Microsoft Azureは、Microsoftが提供するパブリッククラウドプラットフォームです。コンピューティングからデータ保存、アプリケーションなどのリソースを、必要なときに必要な量だけ従量課金で利用することができます。

Amazon Web Service(AWS)

AWSは、柔軟性、拡張性、信頼性、セキュリティ性も高いクラウドサービスです。ソフトバンクではAWSを付加価値サービスも提供しており、利用からサポートまで一貫したサービスが受けられます。

OnePort マルチクラウドアクセス

AWS、Microsoft Azure、Google Cloud、ホワイトクラウド ASPIREなどの複数のクラウドに対応した閉域接続サービスです。オンデマンドな帯域変更や接続先追加を可能にします。

サービスをみる

TASUKI Annotation 生成AI用データ構造化サービス

社内データの構造化により、検索拡張生成(RAG)システムの回答精度の向上・改善支援を行い、業務で使えるデータを構築します。

関連セミナー・イベント

条件に該当するページがございません

おすすめの記事

条件に該当するページがございません