TASUKI Annotation 生成AI用データ構造化サービス TASUKI Annotation 生成AI用データ構造化サービス
TASUKI Annotation 生成AI用データ構造化サービス
「社内データ×ChatGPT」の改善支援

TASUKI Annotation
生成AI用データ構造化代行サービス

 

データ構造化を代行し、検索拡張生成(RAG)の検索精度の向上をご支援。さらに構造化代行によりリソース不足を解決し、企業のLLM活用を促進。

TASUKI Annotationができること

生成AI用データ構造化代行サービスは、
LLMに社内文書を参照させるRAGの検索精度向上のため、 データ構造化を代行するサービスです。

Point 1
RAG 構造化方法を提案

RAGへの高い知見により、回答精度を高めるデータ構造化方法を提案

Point 2
お客さま専任チームを編成

専門のAIエンジニアによるお客さま専任チームを素早く構成

Point 3
大規模プロジェクトにも対応

膨大な社内データの構造化も、大規模データ構造化体制で対応

  • LLM(Large Language Models、大規模言語モデル)は人工知能の一種で、自然言語処理(NLP)と呼ばれる分野で使用されます。テキストを読んだり生成したりする能力に長けています。

データ構造化支援でRAGの回答精度の向上を実現

RAG構築後に直面する課題に対して、TASUKI Annotationは解決に向けたサポートを提供します。
お気軽にご相談ください。

RAG構築後に直面する3つの課題

課題① 図表を含むドキュメントの検索精度が低い

図表は情報を視覚的に表現されている場合が多く、文字情報を欠損しているため回答に必要なドキュメントを正しく検索できない。
関連するドキュメントを検索できてもLLMが解釈できないデータ構造になっている。

CASE1

色・アイコンで意味を表現されている図は文字情報が欠落しており検索不可

トイレのアイコン

CASE2

視覚的に行と列の因果関係を表で表現しており、LLMが解釈できない

視覚的な表
arrow-gray

画像や図の視覚情報をテキストとして構造化
ドキュメントの検索精度&チャンクの質を向上し、LLMが解釈可能なデータを参照させることができる

画像や図表の情報をテキストで構造化

手動で全て構造化する工数は膨大になるため、
データの構造化を自動化したいが…

↓

課題② データの構造化を全て自動化することはできない

プログラムで読み込むと読み込み順が制御できず、取り散らかったテキストになってしまう。
LLMが解釈できないデータになってしまうため、最終的な回答精度も低くなる。

自動構造化だと想定外の順番・文字列で構造化してしまう場合がある
AIには理解できない

自動で全てを構造化するのは現状難しい
構造化のアプローチとしては、自動化と人力を組み合わせる必要がある

↓

課題③ 社内データ構造化の人材不足

データ構造化はリソース・コストがかかる

さまざまな形式のデータ

データ構造化の手法が
千差万別

さまざまなドキュメントを1つずつオーダーメイドで構造化する必要がある

大量のドキュメント

社内ドキュメントが膨大

大量のドキュメントファイルを構造化する必要がある

構造化と精度検証

データ構造化と精度検証を
繰り返す必要がある

実用利用可能なレベルの精度を目指すには検証を繰り返す必要がある

LLM活用の主幹部署にデータ構造化の依頼が集中
社内のLLM活用が進まないケースが多い

arrow-red

この課題をTASUKI Annotationが解決します。

AIエンジニアがRAGの改善をサポート。
RAGの回答精度向上のため、データ構造化方法のご提案から代行まで行います。

サービスの特長

社内データを構造化しRAGの回答精度を向上

どのように構造化したらよいか迷う画像・表データも、オーダーメイドの手法をご提案
LLMが正しく検索・解釈できるチャンクに構造化する手法を検討するところからご支援します。

例)人間が視覚的に理解しやすい図

画像による説明

プログラムが判断しやすい文章

文章による説明

例)人間が視覚的に理解しやすい図

複雑な表

マークダウン表

マークダウン表

構造化代行によりリソース不足を解消

AI開発プロジェクトの中で最も工数がかかるデータ準備・加工のフェーズをTASUKI Annotationがサポート。
プロジェクト全体の期間短縮と精度の向上を同時に実現します。

TASUKI Annotationを用いたRAGの構築フロー

データ準備からデータ構造化までをTASUKI Annotationがご支援します。

基盤構築

基盤構築

基盤チューニング

基盤チューニング

データ準備

TASUKI Annotationが対応します

精度検証

TASUKI Annotationが対応します

データ構造化

TASUKI Annotationが対応します

実運用

実運用

お客さま活用事例

損保ジャパン株式会社
知見をもったエンジニアのサポートで生成AI活用を実現

生成AIを利用したチャットシステムによる、問い合わせ業務の効率化を目指す損保ジャパン株式会社。社内データを基に「正しい回答」を得るためにはRAGの検索精度を向上させる必要がありましたが、知見をもったエンジニアのサポートにより、検索精度を大幅に向上させることができました。

RAGの構築後に直面する課題を解決します

図表を含むドキュメントの
検索精度が低い

精度が低い

どのように社内データを構造化すれば
回答精度が向上するか不明

回答精度の上げ方がわからない

社内データ構造化の人材不足
 

人材不足

導入効果の事例

ドキュメント検索精度

42%  向上

企業の工数

300時間 削減

お客さまに適したデータ構造化方法のご提案と代行で
大幅なRAGのドキュメント検索精度/回答精度の向上・工数の削減を実現します

よくある質問

Word、Excel、PDF、HTML等、さまざまな形式のデータを構造化することが可能です。

データの扱い(ポリシー)を摺合わせた上で、データ構造化の代行を行わせていただきます。
ソフトバンク社内のみで扱うか、作業パートナーでの構造化の選択肢がございますので打合せの中で明確に取り決めさせて頂きます。

可能です。ZoomやGoogle Meetなどのツールを使用し、オンラインでのお打ち合わせを実施させていただきます。
初回のご相談時もご発注後の定期的な打ち合わせもオンラインでの対応が可能です。

まずはお気軽にご相談ください

サービス仕様や導入のご相談・見積りなどはこちらからお問い合わせください。