他人には聞けないICTの“いま”(第50回)

「言葉の壁はなくなる?」NICT隅田氏に聞く

このエントリーをはてなブックマークに追加
Evernoteに保存
印刷

 「自動翻訳」は日本と世界の架け橋となる新たなコミュニケーションツールになり得るか。国立研究開発法人情報通信研究機構(NICT)フェローの隅田英一郎氏に話を聞きました。

<目次>
「人の脳を模した自動翻訳」で高い翻訳精度に
自動翻訳で世界に向けて「真の開国」が実現
翻訳データの寄付でみんなが得する「翻訳バンク」
「逆翻訳」で簡単チェック
日本から英語教育がなくなる日が来る?

「人の脳を模した自動翻訳」で高い翻訳精度に

 日本と世界をつなぐコミュニケーションツールに、コンピュータによってさまざまな言語を翻訳する「自動翻訳」があります。

 自動翻訳はあまり翻訳精度の高くない1980年代から販売されてきたので、自動翻訳の有用性を疑問視する人も多いかもしれません。

 しかし、国立研究開発法人情報通信研究機構(NICT)フェローであり一般社団法人アジア太平洋機械翻訳協会(AAMT)会長の隅田英一郎氏によると、2016年ごろにニューラル翻訳(NMT)と呼ばれる手法が採用されて以降、自動翻訳の精度が急速に上がっているとのことです。

 「NMTとは、人の脳を模したニューラルネットを使って大量の翻訳データを学習し、翻訳精度を高めていく技術で、それ以前の手法に比べて非常に高精度になっています。日英の自動翻訳はTOEICで900点台の英作文能力を示しており、もはや多数の日本人の英語力を凌駕する水準です」(隅田氏)

 1文1文の翻訳ではなく、その1文の前の文を踏まえて訳文を決定する「文脈処理」の性能も向上しているといいます。

 「文脈処理とは、複数の文章から関係性やつながりを推察し、指示語や省略された単語を補完する技術です。NMTの登場によって精度・有用性が向上しています」(隅田氏)

文脈処理の例。左の原文の日本語の2行目、4行目は主語が省略された同じ文ですが、翻訳文ではそれぞれの文脈を踏まえ主語を補って正しい英語になっているのがわかります

自動翻訳で世界に向けて「真の開国」が実現

 翻訳精度が向上したこともあり、自動翻訳はビジネスでの活用が活発化しています。特に、コロナ禍をきっかけとしたオンライン会議の普及は、自動翻訳にとって好機であると隅田氏は言います。

 「コロナ禍により、企業の内外でオンライン会議が一般的になりました。国際会議もリアルからオンラインへと変わってきています。従来の国際会議では海外出張が必須でしたが、今ではインターネット環境さえあれば自国から会議に参加できます。オンライン会議が浸透してきた今、まさに自動翻訳普及の好機だと捉えています。なぜなら、オンライン会議では音声が無意識のうちにデータ化され、そこに自動翻訳が抵抗なく導入できるからです」(隅田氏)

 従来のface-to-faceの会議では、外国人とコミュニケーションを取るには、高いコストを払って通訳を雇うか、ぎこちないながらも自分で英語をしゃべるかしか選択肢がありませんでした。しかし、オンライン会議では音声がデータ化されているので、自動翻訳を活用するのが自然になり、通訳を雇う必要がなくなります。

 自動翻訳の活用はオンライン会議にとどまりません。自動翻訳は「海外との情報のやり取りに制限がある状況」を打破できます。

 「例えば、証券取引所での企業情報開示は10%ほどしか英語に翻訳されておらず情報の発信は限定的です。逆に、外電ニュースについても5%ほどしか日本語に翻訳されておらず情報の受信も限定的です。情報の流通が自由にスムーズにできているとは言えない状況であり、言い換えると、日本はいまだ情報について実質的に“鎖国中”なのです」(隅田氏)

 なぜこのような事態に陥っているかというと、従来の自動翻訳は翻訳精度が低く導入が進まなかった結果、人手の翻訳に頼ることになり、そうすると費用が高額になるため絞り込みが必要になっているのです。現在では、高精度に翻訳できる自動翻訳システムが安く簡単に使えるようになっているため、これらを活用すれば状況が一変します。

 「翻訳されていない文章を自動翻訳すれば世界と情報のやり取りが活発になり、経済・社会活動のグローバル化が促進されます」(隅田氏)

 自動翻訳は、在留外国人への言語サポートという課題に対しても有効な解決策になります。現在、多くの外国人が日本で暮らしていますが、彼らの日常を支える言語サポートは十分でないのが実情です。

 「先進国における在留外国人は人口比の平均10%ほどですが、日本ではまだ3%ほどです。言い換えると、日本でも今後3倍ぐらいまで外国人数が伸びる余地があります。在留外国人の増加も念頭におき、言語対応の問題を早急に解決すべきなのです」(隅田氏)

翻訳データの寄付でみんなが得する「翻訳バンク」

 今後さまざまなシーンへの導入が期待される自動翻訳の多分野化・高精度化を支える取り組みとしてNICTでは「翻訳バンク」という活動を実施しています。

 「自動翻訳システムを作る際には、翻訳元となるデータと翻訳されたデータの対からなら翻訳データを用意し、ディープラーニング(深層学習)を使って学習させます。これらの翻訳データについて、質が高ければ高いほど、量が多ければ多いほど、高精度な自動翻訳システムが作成できるのです」(隅田氏)

 一般的には、Web上にある翻訳データを利用しますが、これらには質の低いデータも混じっているため、誤訳が増えてしまいます。翻訳バンクでは、いろいろな企業と提携し、各社が過去に翻訳した原文と翻訳文からなる質の高い翻訳データを寄付してもらうことによって、精度向上を図っています。

 「翻訳データを寄付していただくと、まず汎用的な自動翻訳の守備範囲を広げ、かつ翻訳精度を上げるのに使います。さらに、別に専用の高精度の自動翻訳システムを構築できます。つまり、質の高い翻訳データを提供する企業が増えれば増えるほど、おのずと翻訳精度が向上し、提供企業はその精度が上がったシステムを使えるようになります。このように、提供企業と翻訳バンクとの間でWin-Winの関係を築いているのです。翻訳バンクは日英だけでなくさまざまな言語に対応しています」(隅田氏)

継続的な翻訳データの提供で、より効率的に精度が向上

 翻訳バンクは、医薬品の分野でも良い実績を残していると隅田氏は語ります。

 「日本で医薬品を販売するには、治験を実施しなくてはなりません。そのための文書を日本語で提出するので自動翻訳は必須です。イギリスの製薬会社・アストラゼネカでは、翻訳バンクに同社の翻訳データを寄付し、医薬品専用の高精度自動翻訳システムを構築。通常1カ月かかる治験関連文書の翻訳期間を2週間に短縮することに成功しました」(隅田氏)

 続けて隅田氏は「翻訳バンクに翻訳データを寄付する製薬会社が増えますと、おのずと翻訳精度も向上するため、業界全体で、翻訳がより効率的になります」と述べています。

「逆翻訳」で簡単チェック

 自動翻訳の利用について禁止事項があります。それは自動翻訳が常に正しいと信じることです。

 「自動翻訳は誤訳します。現在の精度は9割程度なので、翻訳結果を鵜呑みにせず、誤訳があるかもしれないと考え、チェックを行うのが必須です。中学・高校レベルの英語スキルがある人が翻訳結果を一度チェックし、修正することで良い翻訳が得られます」(隅田氏)

 「翻訳結果をいちいちチェックするのは面倒だ」と考える方も中にはいるでしょう。そんな悩みに応えるソリューションとして「逆翻訳」があります。「逆翻訳」はNICTの多言語音声翻訳スマートフォンアプリ「ボイストラ」などいろいろな自動翻訳ソフトウェアで提供されています。

 「音声で入力した原文Aを即時に翻訳し、同時に翻訳文Bを再度日本語に翻訳し直した文Cを表示します。するとスマートフォン上にはAとCという2つの日本語文が並びます。この2つを比較して、ほぼ同じ意味なら翻訳文は問題ないと考えられます。もし内容が違っていたら、日本語を言い換えればよいのです。日本語なら難しいことではないでしょうし、翻訳も瞬時に行われるので、やり直しのストレスもほぼありません」(隅田氏)

「ボイストラ」の画面イメージ。逆翻訳で翻訳文が正しいかを簡単に判断できます

日本から英語教育がなくなる日が来る?

 自動翻訳の技術革新が加速度的に進んでいます。同時通訳システムの実現を目的とした国家プロジェクトも動き出していると隅田氏は語ります。

 「2020年3月に総務大臣より、同時通訳システムを作る国家プロジェクト『グローバルコミュニケーション計画2025』が発表されました。2025年までに端末やアプリによる同時通訳システムを社会実装する計画です(第1弾)。その後2030年を目途にシビアなネゴーシェーションにも使えるところまでレベルアップする計画です(第2弾)」(隅田氏)

 このように国を挙げて同時通訳システムの社会実装を目指しているとのことですが、その背後で3Dプリンタの普及や電池の長寿命化、さらには5Gをはじめとした移動通信システムなど周辺技術の進化がサポートしていると隅田氏は言います。

 「周辺技術に急激な進化により、近未来的な翻訳デバイスも作れるようになりました。例えば、メガネ型やブレスレット型といったウェアラブルデバイス、シースルーパネル型など、その形状は多岐にわたります。近い将来、当たり前の技術として自動翻訳エンジンが、さまざまなデバイスに搭載されるでしょう。世界進出を検討しているならば、自動翻訳に早めに慣れておくにこしたことありません」(隅田氏)

国立研究開発法人情報通信研究機構(NICT)フェロー
一般社団法人アジア太平洋機械翻訳協会(AAMT)会長
隅田英一郎氏

 同時通訳システムの開発が進むことで、まるでマンガやアニメの世界で登場するような翻訳デバイスが、日常で使われる未来もそう遠くはないでしょう。これは極論ですが、上述のような近未来的な翻訳デバイスが一般化することで、もしかすると、日本から英語教育がなくなる日が訪れるかもしれません。なぜなら、日本人が英語を使いこなせるようになるまでには、膨大な時間とコストがかかるためです。

 「アメリカの国務省が発表したデータによると、アメリカ人が日本語を使いこなせるまでに2200時間以上の勉強時間が必要だと言われております。逆に日本人が英語を覚えるときにも同様の勉強時間が必要になります。しかし、中学・高校の勉強時間を合わせても約1000時間です。半分にも満たないので、日本人の大半が英語を使いこなせないのは当然です。残りの1200時間を補うために、語学学校に通うとすると相当なコストと時間がかかります。自動翻訳を使うと決めれば、1200時間の投資は不要になります」(隅田氏)

<インタビュイープロフィール>
隅田英一郎(すみた えいいちろう) 
日本アイ・ビー・エム、ATRを経て国立研究開発法人情報通信研究機構(https://astrec.nict.go.jp/)へ。2016年から同フェロー。2017年から総務省と連携し自動翻訳の高精度化のために「翻訳バンク(https://h-bank.nict.go.jp/)」を運営。音声翻訳の国家プロジェクト(https://www.soumu.go.jp/menu_news/s-news/01tsushin03_02000298.html)を推進。2018年から一般社団法人アジア太平洋機械翻訳協会(https://aamt.info/)会長を兼務。

このエントリーをはてなブックマークに追加
Evernoteに保存
印刷

連載記事一覧

「ビジネスの最適解」をお届けします 無料ダウンロード資料


メルマガ登録


「人材不足」を働き方改革で乗り越える


教育機関向け特集


自治体向け特集


イベント・セミナー情報


ICTコンサルティングセンタ

ページトップへ

close