blog.鶯梭庵

二〇一七年 師走 卅日 土曜日

ニューラルネットワークとディープラーニングで翻訳はどうなる・その4 [/language]

この記事は書かれてから1年以上経過しています。内容が古くなっている可能性があります。コメントの受付は終了しました。

その3から続く。

自動車の自動運転には、いくつかのレベルがある。現在、公道を走る自動車ではレベル2(部分的な自動運転)までが実用化されており、2018 年にレベル3(特定の条件下での自動運転)を実現した自動車が販売されるという。レベル3までは、人間のドライバーが運転の責任を持つ。機械で対応できるうちは機械が人間の代わりに運転してくれるが、人間は常に運転状況を監視して、機械で対応できなくなったらすぐに運転を換わらなければならない。言ってみれば、機械は人間の運転を支援するにとどまる。

レベル4になると、特定の条件下で機械が運転の責任を持つ。人間は何もしない。現状では、鉱山などのような極めて限定された状況に対応できるシステムが実用化されている。レベル5は完全な自動運転であり、あらゆる条件下で機械が運転する。この実現はだいぶ先になるだろう。

さて、この自動運転のレベルを翻訳に当てはめてみよう。現在多くの翻訳者が使っている翻訳支援ツール(CAT ツール)も、一種の自動翻訳をする。具体的には、入力された原文に対して過去の翻訳のデータベースを検索し、完全に一致する原文があったら、それに対応する訳文を出力する。しかし、原文が文レベルで同一であっても異なる文脈では別に訳さなければならない場合があるので、本来は機械が出力した訳文を人間の翻訳者が逐一チェックしなければならない。原文が同一という条件があることも考え合わせれば、CAT ツールを使用した翻訳はレベル3に相当すると言えるだろう。

実際の翻訳の現場では、原文が過去の原文と完全に一致している場合に、人間の翻訳者が全く作業しないことがある。だからといってレベル4が実現されているとは言えない。人間の作業を省略するのは、訳文が多少不自然になることがあってもかまわないからコストを削減しようということだ。一方、自動車の運転では、不自然な運転は命にかかわる。不自然な運転でもよいからドライバーの負担を軽減しようというのでは、実用化されたとはいえない。

ニューラルネットワーク翻訳を含めたいわゆる自動翻訳でも、現状では訳文の品質が保証されないので、業務としての翻訳では機械に翻訳を任せることはない。機械が訳した訳文を人間の翻訳者が直している。この修正作業を「ポストエディット」と呼ぶ。これにより品質が保証されるが、訳文に責任を持つのは翻訳者だから、自動運転のレベルで言えばやはりレベル3になる。

とはいえ、ニューラルネットワークを使った場合、分野を限定すれば十分な量のデータを集めて十分な学習をさせることができ、人間が何もしなくても済むような品質が得られる場合がある。たとえば Microsoft のサポートサイトでは、以前から人間が翻訳したページと機械が翻訳したページが混在していたが、Microsoft がニューラル機械翻訳を採用した後で機械翻訳されたページは、人間が訳したページとほとんど遜色がない。Microsoft の製品のサポートという限定された分野ではあるが、人間の介入を必要としないという点で、レベル4の自動翻訳が実現されていると言ってよいだろう。

では、レベル5の自動翻訳、すなわちあらゆる分野に対応できる汎用翻訳エンジンはできるだろうか。これまで述べてきたように、不可能とは言わないとしても、極めて難しい。Google 翻訳などは汎用翻訳エンジンを目指しているのかもしれないが、現状の品質は、自動運転で言えばあちこちで交通事故が起こるようなレベルだ。機械翻訳の訳文をそのまま使える場面は、自分が理解できない言語の文章があって、大まかでもよいから意味を知りたいというときに限られる。自分が書いた文章を他言語話者に読んでもらうためには使えない。

その5に続く。

[このカテゴリをまとめて読む。] [最新の記事を読む。]

RSS feed

カテゴリ

[/language] (98)
[/links] (254)
[/mac] (114)
[/music] (36)
[/origami] (406)
[/this_blog/ajax] (7)
[/this_blog/blosxom] (4)
[/this_blog/history] (12)
[/this_blog/perl] (9)

最新記事

パスワードについてのあなたの常識はもはや非常識かもしれない・その1 [/links]
ニューラルネットワークとディープラーニングで翻訳はどうなる・その5 [/language]
◇ ニューラルネットワークとディープラーニングで翻訳はどうなる・その4 [/language]
HTTPS 対応 [/links]
ひらがな・カタカナ学習ウェブアプリ [/links]
日本語の「た」と英語の過去形 [/language]
ORI-REVO で回転楕円体を折る・その2 [/origami]
ORI-REVO で回転楕円体を折る・その1 [/origami]
折り紙建築 [/origami]
折鶴に松図小柄 [/origami]
改訂版・たぶん、ほとんどの人は viewport meta タグの指定をまちがえてる・その6 [/links]
改訂版・たぶん、ほとんどの人は viewport meta タグの指定をまちがえてる・その5 [/links]
改訂版・たぶん、ほとんどの人は viewport meta タグの指定をまちがえてる・その4 [/links]
改訂版・たぶん、ほとんどの人は viewport meta タグの指定をまちがえてる・その3 [/links]
改訂版・たぶん、ほとんどの人は viewport meta タグの指定をまちがえてる・その2 [/links]

羽鳥 公士郎