手話と音声の円滑な相互コミュニケーションを。「SureTalk」開発者インタビュー

手話を話す人と快適にコミュニケーションできる「SureTalk」開発者インタビュー

自分と違う言葉を使う人とも気軽にコミュニケーションをしたい。近年の技術の高度化により、その願いが徐々に実現し、例えば外国語の自動翻訳機により外国語の理解が容易になってきています。それと同じように、手話を第一言語とする人と、手話を使わない人がストレスなく意思疎通できないか… そんな思いから開発された手話と音声による双方向コミュニケーションシステム「SureTalk(シュアトーク)」について、2017年の企画当初から携わってきた担当者にサービスについて聞きました。

田中 敬之さん

ソフトバンク株式会社 テクノロジーユニット サービス推進部 SureTalk課
田中 敬之(たなか・のりゆき)さん

ITインフラ事業会社で海底ケーブルの建設・保守に従事後、ソフトバンク(株)へ。
2017年からSureTalkのプロジェクトを立ち上げ、責任者として従事

画面上に手話や音声の内容をテキストで表示。場所も時間も制限なく利用可能なコミュニケーションツール

民間企業での障がい者雇用が進み、皆さんの職場でも何らかの障害を持つ仲間と一緒に働く機会があると思います。ソフトバンクでもさまざまな社員が活躍しており、中には聴覚障がいを持ち、手話を使う社員もいます。実際に働く現場では、手話の分からない社員が同席する会議で意思疎通がスムーズにできずにお互いがストレスを感じてしまったり、緊急時などに必要な情報を瞬時に受け取れず不便を感じたりと、コミュニケーション上の課題がありました。そこで、手話で表現するだけで、相手がその内容を理解できるようにと開発されたのがSureTalkです。

SureTalkは、手話と音声を使い、聴覚障がい者と健聴者がリアルタイムにコミュニケーションできるサービスです。パソコンやタブレットを介して利用するため、相手が遠方でも同じ場所にいても、意思疎通することができます。また、手話認識の精度を高めるために、ユーザーの手話を学習させる機能も備わっています。手話や音声からのテキスト変換や手話学習の機能には最先端のAI技術が使われており、手話認識や言語処理の課題に対応しています。


画面上に手話や音声の内容をテキストで表示。場所も時間も制限なく利用可能なコミュニケーションツール

手話を認識してテキスト変換する機能に加え、音声をテキスト化する機能があるのがSureTalkの特長です。聴覚障がい者も健聴者も同じサービスの中でコミュニケーションを完結できます。

手話で話した内容がどんどん認識され、テキスト表示

実際のデモの様子

実際にSureTalk利用の様子を見せてもらいました。手話で話しかける際は、ゆっくり・はっきりが基本とのことで、1つ1つの動作がはっきり見て取れました。最近よく会見のテレビ中継で目にする、同時通訳のような速さではなく、イメージは初心者向けの手話学習番組のスピードです。

話しかけた後のテキスト化までの時間はとても短く、数秒で正しい文章が表示されます。離れた場所にいる話者とのやりとりは違和感なく、パソコンやスマホのテキストチャットツールを使用しているときのようにスムーズな印象でした。

身体動作追跡の様子

また、デモ動画の裏側で行われている処理を見てみると、骨格で人の動きを追跡しているのが分かります。

手話認識や言語化は簡単なようで難しい。解決のために最先端のAI技術を導入

メイン機能となる会話は、手話をする人と話せる人がそれぞれSureTalkが使えるパソコンやタブレットを使います。端末のカメラに向かって手話で話しかけると、その動作から骨格や関節の特徴を抽出し、データベースと照合して何という単語か特定。特定された単語を自然言語処理によって①助詞を追加し、②語尾の活用変換をして自然な日本語にします。こうして処理された内容が、双方の端末上にテキスト表示されます。

テキストを見た相手は端末のマイクに向かってしゃべりかけると、話した順に音声を認識し、端末上にテキスト表示します。雑音や反響のある環境でも音声を認識することができ、将来的には話者を識別する機能も追加する予定です。

テキスト化された内容が意図しないものであった場合には、該当箇所を引用し、修正内容を新規投稿することで修正が可能です。

手話認識や言語化は簡単なようで難しい。それを実現した最先端のAI技術

田中さん

田中「SureTalkの手話認識は、単語ベースに分解して分析し、言語処理を行う点がユニークです。例えば、『窓口はどこにありますか』という文章を単語ベースに分解して登録しておきます。あとは、『トイレ』という単語が登録されていれば、『窓口』の部分を入れ替えるだけで『トイレはどこにありますか』と認識できるのです。1つ1つの場面に合わせた大量のフレーズを登録する必要がなくなりました」


登録機能は、人によって異なる手話動作でも認識できるよう、精度を高めるためのものです。手話の文章や単語のサンプル動画があるので、動きを確認し、カメラに向かってサンプルと同じ手話動作をして登録します。

手話認識や言語化は簡単なようで難しい。それを実現した最先端のAI技術

田中さん

田中「登録は、手話を学んだことがない方でも可能です。サンプル動画を見て動作をまねるので、登録作業をすることが学習につながる効果もありますので、興味のある方はぜひ試してみてください」

役所の窓口やその他一般的なやり取りを行うシーンに必要な単語はおよそ2,000語を想定しているとのこと。現在SureTalkで対応できる単語、文章はまだ少ないため今後増やしていく必要があり、最終的に1万語の単語登録を目指していくそうです。

SureTalkサービスが使用可能な端末とアプリケーション(2021/7/28現在)

①会話機能(手話・音声のテキスト変換)
※現在は一部の自治体での利用のみ
・パソコン Webブラウザー用アプリ
・iPad Webブラウザー用アプリ
②登録機能(手話動作の学習) ・パソコン Webブラウザー用アプリ
・iPhone 専用アプリ

一緒に働く仲間との会話を途切れさせたくない、という思いから発足した社会貢献プロジェクト

一緒に働く仲間との会話を途切れさせたくない、という思いから発足した社会貢献プロジェクト

SureTalkを開発した経緯を教えてください。

田中 2017年の秋に開催された新規事業アイデアコンテストで、一緒に働く手話利用者とのコミュニケーションに課題を感じていた2つのチームがサービスを提案し、優勝したことから企画・開発を始めました。10月から電気通信大学と基礎研究を開始し、エンジニアの確保やシステム構築の体制整備、サービス化の調整を行いました。

SureTalkは無償提供を前提にしており、経営会議で社会貢献事業としてサービス化を認めてもらえた際は本当にうれしかったですね。思い返せばさまざまなことがありましたが、私は諦めが悪いので(笑)ここまで続けてこられたのかなと思います。

電気通信大学の3つの研究室と共同研究していますね。

田中 われわれが実現したかったのは、スマホやタブレットのカメラで使える汎用性のあるサービスで、それを可能にする手話認識技術が必要でした。特殊な装備がなくても奥行きのある動きを捉えられるシンプルな手話認識技術、また、コミュニケーションツールの条件となる自然言語処理と音声認識技術のそれぞれを専門とする先生方が電気通信大学で研究されており、一緒に開発を始めました。

研究開発で特に難しかったのはどの点でしたか?

田中 大きく2つあり、1つ目は「手話認識」です。順次変換といって、手話で話した順に単語に変換していき、最後まで変換したところでそれが正しい日本語順か判断して入れ替える必要があります。単語を順番に並べていくことは単純なようで難しく、現在も試行錯誤しながら研究を続けています。

2つ目はその次のステップの自然言語処理です。並べた単語の間に助詞を入れたり、「~する」と「~たい」という単語から「~したい」と訳す、という語尾活用処理を行ったりして自然な文章にしますが、この処理は前文から推測するなどの深層学習や、ルールを適用させることで実現すべく、研究を重ねています。多くのパターンを学習させ、最終的に深層学習だけで処理するのが理想です。また、1つの手話に複数の意味があり、どれを選択するかも深層学習がポイントになります。文脈に沿った単語の特定は永遠の課題ですね。

あらゆる場面で使ってもらうために、1単語100人分の手話データを集めたい

あらゆる場面で使ってもらうために、1単語100人分の手話データを集めたい

さまざまな場面で、多くの方に使っていただきたいサービスですね。

田中 そうですね。現在はいくつかの自治体で導入いただいており、来庁者の利便性を高められる画期的な取り組みとして好意的に受け入れられています。もちろん課題もあり、手話認識の精度向上や単語の拡充、機能の充実化などの要望をいただいていますので、それぞれ対応していきたいと思います。

その他にはどんなサービスアップデートを計画していますか?

田中 まず音声を手話に変換する機能です。日常的に手話を使う方は、テキストを読むより手話を読み取る方が自然なため、必要な機能と考えています。また、手話コミュニケーションでは口の動きも重要なため、将来的には口話認識機能も実装したいです。

そして継続して、手話認識と、正しい日本語を作る自然言語処理の精度を上げていくことが重要です。1つの単語につき約100人分のデータを必要としています。そのためには、多くの方にSureTalkの登録機能で手話動画を登録していただきたいと思います。ぜひご協力いただけるとうれしいです。

「SureTalk」に自分の手話動画を登録してデータ収集に協力しよう
SureTalk

「SureTalk」でスムーズなコミュニケーションを実現するには、多くの人の手話のサンプルが必要です。手話動画の登録機能がiOS向けアプリとしてリリースされましたので、手話に少しでも興味のある人は試してみてくださいね。

「SureTalk」
のWebサイト

カンタン手話フレーズ集はこちらからご覧ください

(掲載日:2021年7月28日)
文:ソフトバンクニュース編集部

SDGsの達成に向けた、マテリアリティ「人・情報をつなぎ新しい感動を創出」

サステナビリティ

フトバンクは「すべてのモノ、情報、心がつながる世の中を」をコンセプトに、SDGsの達成に向けて6つのマテリアリティ(重要課題)を設定。そのうち、SDGsの目標4「質の高い教育をみんなに」を踏まえた「人・情報をつなぎ新しい感動を創出」では、ICTを活用した教育分野への貢献を通じ、新たなライフスタイルと生活基盤を充実させることを目指しています

リモートでも試してみたい。動きもかわいい(?)、カンタン手話フレーズ10選

リモートでも試してみたい。動きもかわいい(?)、カンタン手話フレーズ10選

オンライン会議をする際、
「音声機能が上手くいかず、音が出ない」
「声にエコーやハウリングがかかってしまう」
「議論が白熱して、発言のタイミングがわからない」
ような、“音の困りごと”はありませんか?

それ、視覚言語ともいわれる手話を活用することで、少しは解消されるかもしれません。

ソフトバンクは、AI手話通訳アプリ「SureTalk(シュアトーク)」を新しくリリース。その中でも、リモートワーク時にも役立つカンタンな手話フレーズを紹介していきます。

SureTalk

AIに手話を学習させることで、手話と音声の双方でコミュニケーションがとれるウェブツール

実践してくれた人

竹田結衣さん

ソフトバンク株式会社 SureTalk課
竹田 結衣(たけだ・ゆい)

筑波大学附属聴覚特別支援学校で手話言語を習得し、2016年にソフトバンクに入社。庶務やアカウント登録管理業務を行った後、SureTalk課に異動して、手話動画DB管理・メルマガ配信などを行う。

竹田「コロナ禍の今はマスク着用が当たり前になっています。聴覚障がいの方の多くは口の動きを頼りにコミュニケーションをしているため、マスクを着用している相手との会話が全く分からず、表情から気持ちを読み取ることが難しくなりました。

『マスクを取って』とお願いすると、周囲の人に非常識な行動だと思われてしまうかもと気にしてしまったり、病院やレストランなどで自分の名前を呼ばれてもマスクをしているため気付かなかったり… 落ち込むなど色々なことがありました。相手との接触回避や感染リスクを下げ、視覚的にわかりやすいコミュニケーション手段「手話」に少しでも興味を持ってもらえるとうれしいです」

試しに、固定電話→ガラケー→スマホの手話に挑戦してみてください!

手話フレーズの目次

【基本編】まずは押さえておきたい、シチュエーション別 手話フレーズ5選

幅広いシーンに使える基本編とリモートワーク中のオンライン会議で便利なリモート編に分けてご紹介。まずは、聴覚障がいの方がよく使う手話表現をベースに、健聴者にとって簡単で有用な手話を5個ずつ教えてもらいました。

基本編

① お疲れさま

竹田「顔出し会議の終了間際や飲み会の挨拶時に『お疲れさまです』という話し手の返答に対して、頭を下げて静かにコミュニケーションを取るのが多いと思います。ここでこの手話を使うと、よりインパクトのある表現ができます!」

② ありがとう

竹田「多くの方が知っている表現だと思います。お店などに行くと店員さんが急に表現してくることがあり『今手話を使ってくれた!』とうれしい気持ちになります。手だけですぐに気持ちを伝えられるなんて魔法みたいですね」

③ 大丈夫

竹田「右手で左から右へ動かしているので、眼球運動につながるかもしれません。この表現をするとき、手の動きや顔の表情の強弱を入れると、どの程度の大丈夫なのかという気持ちの表現が簡単にできちゃいます。失恋してショックな表情で大丈夫と使ったら、大丈夫じゃないだろ! とつっこまれます」

④ わかった

竹田「騒がしい場所で声が届いたかどうか相手にすぐに意思伝達ができます。また何らかのハプニングが起きて電車の中のようなガラス越しで会話することになってもこの動きが簡単な表現をいくつか覚えておいて損はないです」

⑤ わからない

竹田「これも『④ わかった』と同様で、騒がしい場所で声が届いたかどうかの場面などに使えます。カジュアルな会話の中でも使えたりオンライン会議の顔出しの時に相手の話を理解したかどうかのときにも使えるので、便利な表現ですよ」

(おまけ)イヌとネコ

竹田「この動き、目で見てわかりやすくないですか? 手話はイメージで表現している動きもあり、ジェスチャーをするときなどに使えます。学生時代、手話をよく知っているメンバーで伝言ゲームに参加したらスタッフから「手話以外の動きでお願いします」と言われたときがありました……」

実は身近なところで手話が流行る場合も

昨年映画化された某アニメや、某ドラマで話題になったダンスを手話ニュースで表現してTwitterで話題になるなど、実は身近なところに手話はあるんです。

【リモート編】オンライン会議で声が出せないときに便利な手話フレーズ5選

続いては、リモートワーク中のオンライン会議で便利なリモート編。「会議をさえぎってまで言うことでもないなあ」「どう感じているか伝えたいなあ」と思ったときに使いやすいですよ!

① トイレ

竹田「会議中に『どうしよう、おなかが痛くなってきた…トイレに行きたい』となることがありますよね。この手話は全員に一瞬で伝わるため、話し手から『どうぞどうぞ』と言ってくれるかもしれません」

② 聞こえる

竹田「話し手の『音が聞こえますか?』に対して、マイクオフの全員が手話で表現すると一目瞭然でわかります。これは2つの動きの組み合わせていて、『聞く』と『大丈夫』になっています。基本編③で『大丈夫』が出ましたね」

③ 聞こえない

竹田「『② 聞こえる』と同様で、話し手の『音が聞こえますか?』に対して、手話で表現すると本当に一目瞭然でわかります。耳のすぐ横で手の平を上下にひらひらさせた動きなので、手話をよく知らない人でも伝わる気がします」

④ そうそう

竹田「賛成や同意をするときに手話1つで相手に意思伝達ができます。うなずきも意識して入れると、より気持ちが伝わります。手話は視覚言語なので、こうやって一つずつ学んでいくと今までにない視野がきっと広がると思います」

⑤ 拍手

竹田「この表現を見ても、普通の拍手でも『拍手』だと伝わるのではと思う人がいると思います。例えば、発表会を想像してみてください。聴覚障がいの方は前の人が拍手しているかどうかわかりません。手をあげてヒラヒラすると前の人が拍手しているとわかり、声が出せない場面でも特に大人数が使うと画面がより華やかになり話し手もいい気分になるのではないでしょうか」

手話に少しでも興味を持ったら試してみたい「SureTalk」

AIに手話を学習させることで、手話と音声の双方でコミュニケーションがとれるウェブツール。AIが端末のビデオ通話から身体動作を追跡して、手話の特徴を抽出し、手話を認識してテキストへと変換します。

実は基礎スキルも向上する!? 奥深い手話の世界と学ぶメリット

実は基礎スキルも向上する!? 奥深い手話の世界と学ぶメリット

実は、空間認識力や日本語力も伸びやすいとされている「手話」。「SureTalk」の監修も行った手話通訳士の萩埜(はぎの)さんに最近の手話事情や学ぶメリットを教えてもらいました。

萩埜友美さん

社会福祉法人 東京聴覚障害者福祉事業協会 東京手話通訳等派遣センター 職員で手話通訳士の萩埜 友美(はぎの・ともみ)さん

中学のときの障がい者体験がきっかけで手話通訳士を目指すように。病院や役所、警察、裁判所などの窓口で手話を通じて、聴覚障がいの方へのサポートを行う。

さまざまな場面で通訳のお仕事をされることが多いのですね。

萩埜「現在の制度では自治体ごとに手話通訳者が派遣できる範囲が決まっていて、医療や福祉の場面の派遣が優先されてしまい、趣味や娯楽、学習塾の合宿などは手話通訳の派遣を認められないことが多い。

また、企業さんによっては『手話通訳ってボランティアでしょ』と思い込まれているところも多く、ソフトバンクさんのように企業の責任で手話通訳の費用負担をしてくださるケースは実はまだ多くない。ダイバーシティの観点で、雇用している社員への情報保障に対して企業が責任をもっていただけるような風潮になればうれしいですね」

なるほど。ここ最近、テレビのニュースでも手話通訳士の方を見かけるようになりましたが何がきっかけなのでしょうか?

萩埜「ニュース番組などで話し手の脇のワイプに手話通訳がいますよね? 実は、東日本大震災がきっかけで、耳が聴こえない人にもきちんと情報を伝えるべきという要望が受け入れられました。そこから、平日の午前と午後に行っている官房長官記者会見に手話通訳が配置されるようになりました。特に、安倍首相が緊急事態宣言をした際、民放各局が一挙に手話通訳者を映しました。そこが、一般の方にも認知される大きなきっかけになったと思いますね」

そもそも、手話はどのように生まれたのでしょうか?

萩埜「いろいろな諸説があるため、確実なことは言えないのですが、日本の場合は明治11年、京都に聾(ろう)学校が設立され、ろう者のコミュニティができた。これまでは家族だけで通じる身振りに近い表現でコミュニケーションをとっていた方たちが、当事者の集団を形成していく中でコミュニケーション手段としての手話を作っていったと言われています。その後、各地でろう学校が立ち始め、同じような動きが起きた。その後、当事者組織である全日本ろうあ連盟が全国共通で通じる手話を考案し、全国に普及したという流れになりますね」

手話を学ぶと、言語力や空間認識力などの基礎スキルの向上にも効果的と小耳にはさみましたが本当でしょうか?

萩埜「はい、手話は言語なので、英語や中国語などを学ぶことと似ていますね。また、手話は視覚言語でもあるので、表情がとても重要なんです。例えば、“寒い”と伝えるとき、無表情だと寒さが伝わらないですよね? なので、手話を学んでいくと、表情筋が豊かになる効果も期待できるかもしれません」

今回、「SureTalk」の監修を担当してみて、このサービスについてどう感じましたか?

萩埜「利用者や内容によって向き・不向きはあると思いますが、耳が聴こえる人と聴こえない人の情報格差を埋める上でも、ダイバーシティの観点でも非常にいいと思いました。会話の内容をもらさずに聞きながら手話で翻訳するには、15分~30分くらいが限界と言われており、それ以上通訳を続けると通訳の質が下がります。また、通訳者の健康にも影響が及んでしまうため、長時間のご依頼の場合は複数の手話通訳者が派遣されます。AIを活用するメリットとしては、疲労を感じないし、単語の表現を間違えることはありません。長時間対応も可能ですよね」

AIの活用で円滑に会話ができる「SureTalk」
いつでもどこでも手話と音声で会話ができる「SureTalk」

「SureTalk」は、AIに手話を学習させることで、手話と音声の双方向で会話ができるコミュニケーションツールです。カメラ付き端末で読み取った身体の動作をAIが追跡して、手話の特徴を抽出し、認識した手話をテキストに変換します。 手話動画データを蓄積することで認識精度が高まります。「SureTalk」には、手話動画を登録する機能があります。手話に少しでも興味のある方は、ぜひ試してみてくださいね。

「SureTalk」
のWebサイト

開発者インタビューはこちらからご覧ください

(掲載日:2021年7月28日)
文:ソフトバンクニュース編集部

SDGsの達成に向けた、マテリアリティ「人・情報をつなぎ新しい感動を創出」

サステナビリティ

フトバンクは「すべてのモノ、情報、心がつながる世の中を」をコンセプトに、SDGsの達成に向けて6つのマテリアリティ(重要課題)を設定。そのうち、SDGsの目標4「質の高い教育をみんなに」を踏まえた「人・情報をつなぎ新しい感動を創出」では、ICTを活用した教育分野への貢献を通じ、新たなライフスタイルと生活基盤を充実させることを目指しています