TASUKI Annotationができること
生成AI用データ構造化代行サービスは、
LLM※に社内文書を参照させるRAGの検索精度向上のため、 データ構造化を代行するサービスです。
POINT1
POINT2
POINT3
LLM(Large Language Models、大規模言語モデル)は人工知能の一種で、自然言語処理(NLP)と呼ばれる分野で使用されます。テキストを読んだり生成したりする能力に長けています。
データ構造化支援でRAGの回答精度の向上を実現
RAG構築後に直面する課題に対して、TASUKI Annotationは解決に向けたサポートを提供します。
お気軽にご相談ください。
RAG構築後に直面する3つの課題
課題① 図表を含むドキュメントの検索精度が低い
図表は情報を視覚的に表現されている場合が多く、文字情報を欠損しているため回答に必要なドキュメントを正しく検索できない。
関連するドキュメントを検索できてもLLMが解釈できないデータ構造になっている。
CASE1
色・アイコンで意味を表現されている図は文字情報が欠落しており検索不可
CASE2
視覚的に行と列の因果関係を表で表現しており、LLMが解釈できない
画像や図の視覚情報をテキストとして構造化
ドキュメントの検索精度&チャンクの質を向上し、LLMが解釈可能なデータを参照させることができる
手動で全て構造化する工数は膨大になるため、
データの構造化を自動化したいが…
課題② データの構造化を全て自動化することはできない
プログラムで読み込むと読み込み順が制御できず、取り散らかったテキストになってしまう。
LLMが解釈できないデータになってしまうため、最終的な回答精度も低くなる。
自動で全てを構造化するのは現状難しい
構造化のアプローチとしては、自動化と人力を組み合わせる必要がある
課題③ 社内データ構造化の人材不足
データ構造化はリソース・コストがかかる
LLM活用の主幹部署にデ ータ構造化の依頼が集中 し
社内の LLM活用が進まない ケースが多い
この課題をTASUKI Annotationが解決します。
AIエンジニアがRAGの改善をサポート。
RAGの回答精度向上のため、データ構造化方法のご提案から代行まで行います。
サービスの特長
社内データを構造化しRAGの回答精度を向上
どのように構造化したらよいか迷う画像・表データも、オーダーメイドの手法をご提案。
LLMが正しく検索・解釈できるチャンクに構造化する手法を検討するところからご支援します。
構造化代行によりリソース不足を解消
AI開発プロジェクトの中で最も工数がかかる データ準備・加工 のフェーズをTASUKI Annotationがサポート。
プロジェクト全体の期間短縮と精度の向上を同時に実現します。
TASUKI Annotationを用いたRAGの構築フロー
データ準備からデータ構造化までをTASUKI Annotationがご支援します。
基盤構築
基盤チューニング
データ準備
精度検証
データ構造化
実運用
お客さま活用事例
損害保険ジャパン株式会社
生成AIを搭載したチャットシステムで社内問い合わせ業務の効率化
社内データを参照するためのRAGの検索精度向上が課題でしたが、生成AI用のデータ構造化サービス「TASUKI Annotation」を導入。AIエンジニアによるデータ構造化により、内部工数を削減しつつ検索精度を向上させることに成功しました。
RAGの構築後に直面する課題を解決します
導入効果の事例
ドキュメント検索精度
42% 向上
企業の工数
300時間 削減
お客さまに適したデータ構造化方法のご提案と代行で
大幅なRAGのドキュメント検索精度/回答精度の向上・工数の削減を実現します
よくある質問
ソフトバンク社内のみで扱うか、作業パートナーでの構造化の選択肢がございますので打合せの中で明確に取り決めさせて頂きます。
可能です。ZoomやGoogle Meetなどのツールを使用し、オンラインでのお打ち合わせを実施させていただきます。
初回のご相談時もご発注後の定期的な打ち合わせもオンラインでの対応が可能です。
まずはお気軽にご相談ください
新規導入のご相談、サービス仕様についてはこちらからお問い合わせください。