(2020年6月1日 掲載)
目次
AI自動翻訳の精度は高くないーーそんな常識も過去のものとなりつつあります。AI自動翻訳はスピード、精度ともに人間を超え、私たちがビジネスをする上で心強い味方へとなっています。
前回のコラム「翻訳スピード対決!AI自動翻訳「T-4OO」vs 人間」では、翻訳のスピードと精度について競いました。
今回は高い精度で翻訳が可能な「T-4OO」を支える技術について、詳しく、分かりやすく解説していきます。
特長
「T-4OO」を支える技術は
- 「各専門分野の情報を学習した共通データベース」 と
- 「企業ごとの翻訳データから学習した専用データベース」 の2種類に大きく分けられます。
それでは、それぞれの特長について確認していきましょう。
その1:各専門分野の情報を学習した共通データベース
「T-4OO」の1つ目の特長は、最大精度95%を誇る翻訳技術の高さです。プロの翻訳者に劣らない自動翻訳を可能にしているのが、過去の膨大な学習データを蓄積する共通データベース(以下、共通DB)とニューラルネットワーク技術により共通DBから学習する専用AIです。
共通DBには、開発元の株式会社ロゼッタ(以下、ロゼッタ社)が数十年に渡り収集した日本国内外の公的文書やガイドライン等が読み込まれています。これらの膨大なデータをAIが学習しています。
この学習データは、「法務」「医療」「金融」など2,000の詳細なカテゴリに分類されており、AIが各業界の専門知識や文脈に応じた単語の使い方を学習しているため、最適な自動翻訳を実現しています。
また、翻訳で必要とされる情報は常に変化しており、新たな語句も日常的に生み出されています。そのような状況に対応するために、ロゼッタ社は公的文書などの新しい情報を常にAIに読み込ませており、最新の世界情勢にも対応できるようにしています。
大量の情報をAIに読み込ませるだけでは、最適な翻訳は実現しません。同じ単語であっても文脈によって意味は多種多様に存在するからです。「T-4OO」では、産業分野による用語の意味の違いに着目し、カテゴリごとにどのような意味でよく使われるのかの傾向を計算しています。そのため、文脈単体での意味を考えるだけでなく、対象カテゴリの場合はどの意味で使われるのかも踏まえて翻訳を行い、高い精度を実現しています。
例えば、IT用語にもなっている「Cloud」を翻訳すると「雲」と日本語にされることがあります。「T-4OO」ではITに関する情報も数多く学習しているため、「雲」と訳されがちな「Cloud」も、IT分野の翻訳をする際には「クラウド」で訳出されます。
その2:企業ごとに翻訳データから学習した専用データベース
2つ目の特長は、セキュリティも担保されたプライベートな専用データベース(以下、専用DB)です。企業によって翻訳する文書は様々。それらの文書をAIが学習し、「T-4OO(Translation for Onsha Only)」のサービス名の由来となる「御社オンリー」のデータベースが構築されていきます。
専用DBの優れている点は、企業独自の言い回しや単語の使い方をDBに登録することで、それ以降の翻訳においては共通DBに加え、この専用DBからの学習結果が反映されるところです。これにより、企業ごとのオリジナルの翻訳が可能とされています。
また、この専用DBに登録された表現・言い回しがどのように翻訳結果に反映されているかが画面上で視覚的に分かるようになっています。専用DBにまだ登録されていない箇所を追加で登録することも可能で、これを繰り返すことで、より独自の専用DBが完成されていきます。
翻訳したデータや学習してきたデータの量が増えるにつれて、「T-4OO」に搭載されているAIもまた進化をしていきます。「T-4OO」の「自動学習」機能では、ユーザごとに好みの訳し分けを理解して翻訳します。わざわざ用語集を用意するなどの手間をかけずに、ユーザごとに蓄積された過去対訳から、多用する用語やフレーズをAIが自動的に分析し、翻訳結果に反映します。
またセキュリティ対策も整っており、個社ごとの専用DBが共有されることはありません。実際に翻訳した文書等についても2週間経過後にサーバから自動的に消去されるようになっています。さらにはオンラインで翻訳結果を即座に消去することも可能であり、サーバ上から情報が漏えいすることを防いでいます。
過去には他のクラウド翻訳サービスにて、文書が漏えいする事故がありましたが、「T-4OO」においてはセキュリティ対策が十分にされており、機密文書等も安心して翻訳することが可能です。
最後に
本コラムでは「T-4OO」の翻訳技術について解説しました。翻訳という業務はこれまで多大な労力と時間を必要とする仕事でした。「T-4OO」はそんな翻訳業務を少しでも効率的にし、翻訳のために縛られていた時間を他の業務に当てることを可能にしました。
働き方改革が必要とされる現代において、よりクリエイティブな働き方を実現するための一つに「T-4OO」があるのではないでしょうか。
次回は実際に「T-4OO」を使い、操作性や翻訳結果などをお伝えします。