blog.鶯梭庵

二〇一三年 水無月 卅日 日曜日

SDL Trados Studio で LaTeX ソースファイルを翻訳したい・その1 [/language]

この記事は書かれてから1年以上経過しています。内容が古くなっている可能性があります。コメントの受付は終了しました。

私は現在、ある書籍の翻訳を手がけている。原文のソースファイルは LaTeX で書かれており、このソースファイルは著者から受け取っている。納品は LaTeX ソースファイルと PDF ファイルということになっている。

私はこれまで、主に産業翻訳の仕事をしてきたので、ソースファイルは HTML だったり XML だったり Microsoft Office の文書だったりする。このようなファイルを翻訳する際によく使われる翻訳支援ソフトに、SDL Trados Studio がある。値段が高いソフトウェアだが、これがないと仕事にならないことも多いので、私も所有している。そこで、Trados Studio を使って LaTeX ファイルを翻訳したいと思った。

Trados Studio は、デフォルトでは LaTeX に対応していない。しかし、新しいファイルタイプを作成することができる。作成できるタイプの中に「正規表現区切り形式テキスト」があったので、これでどうにかできないかと、今日一日あれこれいじってみた。

で、結論としては、LaTeX に対応させるのは難しいものの、ソースファイルに前処理を施せば、何とかなりそうだ。

問題は、改行の取り扱いだ。LaTeX では、英文中の改行は空白文字に変換されるので、文の途中で改行することがある。一方、Trados Studio では、原則として改行は文の切れ目になる。だから、本来は1つの文であるものが Trados Studio ではいくつかの文に分かれてしまう。そうすると、原文と訳文を一対一に対応させることができない。

Trados Studio で、改行で文を切らないようにすることも可能だ。そのためには、翻訳対象個所の開始パターンと終了パターンを正規表現で指定し、改行文字をタグに置き換えるように設定すればよい。ソースファイルがスタンドアローンであれば、開始パターンを \\begin\{document\}、終了パターンを \\end\{document\} とすることが考えられる。しかし、今回は章ごとに別々のソースファイルになっているので、この方法は使えない。

開始パターンがファイルの冒頭にマッチし、終了パターンがファイルの末尾にマッチすればよいのだが、いろいろな正規表現を試してみても、どうにもうまくゆかない。また、仮にうまくいったとしても、先ほどとは逆に、本来は2つの文であるものが Trados Studio では1つになってしまうことがあるだろうから、うまくない。

そのため、改行を Trados Studio で処理するのはあきらめて、Trados Studio に読み込ませる前に、テキストエディタで文中の改行を空白に変換することにした。正規表現で一括置換すれば、それほど手間ではない。

Trados Studio はプレーンテキストにはもちろん対応しているので、文中の改行さえ処理してしまえば、テキストファイルの拡張子に tex を追加するだけで、LaTeX ソースファイルを Trados Studio で扱うことができるようになる。ひとまずこの状態で翻訳を進めることもできるが、せっかく Trados Studio を使うのだから、LaTeX のコマンドをタグとして認識させたい。その設定については後ほど

[この記事だけを読む。] [最新の記事を読む。]

二〇一二年 霜月 四日 日曜日

ソフトウェアのローカライズ・その2 [/language]

この記事は書かれてから1年以上経過しています。内容が古くなっている可能性があります。コメントの受付は終了しました。

その1から続く。

コストの安い翻訳といえば、機械翻訳だ。Google などのオンラインサービスなら、無料で翻訳できる。もっとも、機密性があるような文章であれば、クラウドを使った翻訳サービスを利用する訳にはゆかないが、有料のクローズドな翻訳サービスでも、人間が訳すよりもずいぶん安い。

しかし、機械翻訳が役に立つ場面は、現状では限られている。自分が読む文章を訳させるのであれば、機械翻訳はかなり役に立つようになった。例えば、私がベトナム語のウェブサイトを見て、そこに何が書かれているか知りたいと思えば、機械翻訳が有効だ。

ところが、人に読ませる文章を訳させるとなると、機械翻訳はまだ力不足だ。日本語のウェブサイトの英語版や中国語版を機械翻訳で生成するというサービスがあって、それを使用していたサイトの誤訳がひどいというので話題になったことがある。そのサイトは、今では機械翻訳である旨の注意書きを表示している(その注意書きの英文もひどいのだが、それは別の話)。

そこで最近は、翻訳者に対して、原文を一から訳すのではなく、機械翻訳にかけた訳文を修正するという仕事を依頼することが増えてきているようだ。私のところにも依頼がきたことがある。半分翻訳済みだから、ということなのか、作業料金が例えば翻訳の半分程度なのだが、機械翻訳の訳文が使い物にならないため、作業量は半分にはならない。訳文を修正するより自分で訳した方が速いこともしばしばなので、訳文の良し悪しを判断する手間がかかる分、一から翻訳するより多くの時間がかかることすらある。それで料金が半分では、とても割にあわない。そのため、私は機械翻訳の修正は断ることにしている。

機械翻訳については、日本の特殊事情があるのかもしれない。欧米語同士や日本語と韓国語など、互いに似た言語間であれば、機械翻訳の訳文はかなり読める。一般に、ソフトウェアのローカライズでは、いったん英語に訳して、そこから各国語に訳すことが多い。ドイツ語やフランス語なら、機械翻訳の修正は、本当に翻訳の半分の手間で済むのかもしれない。しかし、英語と日本語のように言語間の距離が大きくなると、機械翻訳を挟んでも手間が半分にならない。アメリカ人にとって習得が難しい言語のランキングがいくつかあるが、日本語はほぼすべてで最上位に位置している。人間にとって習得が難しいなら、機械にとって翻訳が難しいのも道理だ。

とはいえ、発注側としたら、ドイツ語やフランス語の翻訳者に比べて日本語や韓国語の翻訳者に2倍の翻訳料を払うということも難しいだろう。機械翻訳のおかげで、ドイツ語やフランス語へのローカライズのコストが従来の半分になるとしたら、日本語もその値段で済ませようとするだろう。ところが、日本語では、コストを下げればその分品質が下がらざるを得ない。

つまり、世界的に機械翻訳が浸透すればするほど、日本語の訳文の品質が全体的に下がるという、皮肉な事態が起きているのかもしれない。

[この記事だけを読む。] [最新の記事を読む。]

二〇一二年 神無月 廿日 土曜日

ソフトウェアのローカライズ・その1 [/language]

この記事は書かれてから1年以上経過しています。内容が古くなっている可能性があります。コメントの受付は終了しました。

先月から今年いっぱいの契約で、とあるソフトウェア会社に勤務している。この機会に、自宅の Windows 環境をアップデートしようと思った。最近 MacBook Air を買ったところなので、VMware Fusion を使って Windows 7 を動かすことにした。VMware Fusion のインストールが終わり、いざ Windows をインストールしようとしたときに、ひどい誤訳に出くわした。

新規仮想マシンを作成する際、「この仮想マシンをインストールするオペレーティング システムを選択してください。」と表示される。仮想マシンはインストールするものではないと思うが、普通に考えれば、「仮想マシンをインストールするオペレーティング システム」とは、ホスト OS のことだろう。私の場合は Mac OS X 10.7 になる。ところが、これを選択して次の画面に進むと、ホスト OS ではなくゲスト OS が Mac OS X 10.7 になってしまう。

英語版の UI を表示させてみると、"Select the operating system you will install in this virtual machine." となっている。これなら、ゲスト OS を選択してくださいという意味になる。正しい日本語訳は「この仮想マシンにインストールするオペレーティング システムを選択してください。」でなければならない。わずか1文字の違いであるが、意味は正反対だ。

このような誤訳は、訳の品質が高いとか低いとかいう以前の、あってはならない誤訳だ。誤訳がこれ1つなら、翻訳者も人の子だからたまには間違えるといって済ませられるかもしれないが、VMware Fusion の日本語版にある不適切な訳は、これだけではない。まして、そのような訳が翻訳会社のチェックをすり抜け、さらに発注元のチェックもすり抜けるというのは、考えられない。

考えられないことを私が目にしたのは、これが最初ではない。Apple の製品でも、App Store を使って iPhoto をアップデートしようとしたときに、日本語として意味をなさないエラーメッセージが表示されたことがある。どうやら、先に OS をアップデートしないと iPhoto をアップデートできないと言いたかったようなのだが、メッセージを読んだだけでは、なぜ iPhoto をアップデートできないのかさっぱり分からなかった。

このようなことが起きている直接の原因は、ソフトウェア会社がローカライズにかける予算を削っていることだ。VMware や Apple のような大規模な企業であれば、各国に法人があるが、翻訳を発注する権限がどんどん本社に移っているようだ。本社の発注担当者は、翻訳先の言語を解さないので、翻訳の品質を判断できない。そのため、安ければ安いほどよいと考えがちで、翻訳をできるだけ安くしようという圧力が各所にかかることになる。

ハードウェアを中国で組み立てることでコストを下げるのと同じ感覚で、各国語への翻訳を中国の翻訳会社に発注することも多い。しかし、米国本社が中国の翻訳会社に日本語訳を発注すれば、発注先のチェックも発注元のチェックもおぼつかないものになることは避けられない。そうなれば、翻訳者のミスがそのまま製品に反映されてしまう。さらに、低い翻訳料で受注する翻訳会社は、翻訳者への支払いも少ない。安いものは質が悪いのは世の常で、翻訳も例外ではない。

その2へ続く。

[この記事だけを読む。] [最新の記事を読む。]

二〇一二年 水無月 一日 金曜日

ハイタッチと high touch [/language]

この記事は書かれてから1年以上経過しています。内容が古くなっている可能性があります。コメントの受付は終了しました。

昨日、マーケティング資料を翻訳していて "high touch" という言葉を見かけた。

日本語で「ハイタッチ」というと、スポーツなどでチームメイトや仲間と手を挙げてタッチすることを指す場合が多いが、これは英語では "high touch" とは言わずに "high five" と言う。この場合の "five" は、指が5本ということで、high five は、本来は片手でのタッチを意味する。両手でのタッチも high five と言うことがあるが、"high ten" とも言う。

では "high touch" は何かと言うと、"high tech" の対義語で、生身の人間によるきめ細やかな人間らしい応対を指す。電話の応対やら商品の売買やらサービスの提供やらがどんどん自動化されると、便利な反面、あらゆるものが画一化されてしまう。自動化によって効率が上がればよいが、あまり自動化をすすめると、サービスの質が低下したりして、かえって効率が悪くなる。ハイテクがどんなに進んでも、必ず人間臭い要素を残す必要がある。それが high touch だ。

なお、high touch という言葉は、John Naisbitt 氏によるベストセラー『Megatrends』で初めて使われた造語だそうだ。

[この記事だけを読む。] [最新の記事を読む。]

二〇一二年 如月 十日 金曜日

家庭用灌漑設備 [/language]

この記事は書かれてから1年以上経過しています。内容が古くなっている可能性があります。コメントの受付は終了しました。

最近、翻訳チェックをする機会がほとんどなくなったので、誤訳を見つける機会も少なくなったが、消費者向け電子機器に関する記事を翻訳しているときに、誤訳を見つけた。

その記事に "irrigation system" が言及されている。この部分は、関連する過去の記事からの引用なのだが、この過去の記事の日本語訳では、これを「洗浄システム」と訳していた。

irrigation は通常、「灌漑」と訳す。また、医学用語で「潅注」や「洗滌」と訳すこともある。しかし、この記事の文脈では、一般家庭で使うシステムであることが明らかなので、いずれの訳語も適切ではない。辞書に載っている訳語がどれも使えないということは、翻訳をしているとよくあることだ。

過去の記事を訳した人は、家庭で灌漑をすることはあり得ないと思って、「洗滌」からの類推で「洗浄システム」と訳したのだろうが、「洗滌」は手術している部位や傷口などを洗うことなので、irrigation が「洗浄」の意味だとしたら、洗う対象は、食器や壁ではなく、傷口に限定される。だから、家庭に洗浄システムがあるということも、やはりあり得ない。これは誤訳だ。

日本人、とくに大都市圏に住んでいる人にとっては、「家庭」と「灌漑」という概念はまったく結びつかないかもしれない。しかし、米国人にとっては、家庭で灌漑といえば、庭に水を撒くことだということがすぐに分かる。米国には広い庭が多いので、水を撒くにも灌漑システムが必要なのだ。日本人でも、Google の画像検索で "home irrigation" と検索してみれば、すぐに分かる。

とはいえ、家庭用の設備で「灌漑システム」というのは大げさすぎるから、「散水システム」や「撒水システム」などが適当だろう。(ちなみに、「散水」は「さんすい」と読むが、「撒水」は「さっすい」と読むのが正しいそうだ。)

たまたま最近読んだ、千野栄一著『外国語上達法』という本で、外国語を上達させるために必要な項目の最後の1つとして「レアリア」が挙げられていた。レアリアというのは、背景となる文化的・歴史的事実といった意味だが、これは、外国語の上達のために必要であるだけでなく、あるいはそれ以上に、翻訳にとっても必要だ。日本の家の中はだいぶ西洋化されているので、家庭用電子機器の翻訳でレアリアが問題となることはほとんどないが、庭の広さとなると、日本と米国では全然違う。


[この記事だけを読む。] [最新の記事を読む。]

[もっと古い 5 件の記事を読む] [もっと新しい 5 件の記事を読む]

RSS feed

カテゴリ

[/language] (98)
[/links] (254)
[/mac] (114)
[/music] (36)
[/origami] (406)
[/this_blog/ajax] (7)
[/this_blog/blosxom] (4)
[/this_blog/history] (12)
[/this_blog/perl] (9)

最新記事

パスワードについてのあなたの常識はもはや非常識かもしれない・その1 [/links]
ニューラルネットワークとディープラーニングで翻訳はどうなる・その5 [/language]
ニューラルネットワークとディープラーニングで翻訳はどうなる・その4 [/language]
HTTPS 対応 [/links]
ひらがな・カタカナ学習ウェブアプリ [/links]
日本語の「た」と英語の過去形 [/language]
ORI-REVO で回転楕円体を折る・その2 [/origami]
ORI-REVO で回転楕円体を折る・その1 [/origami]
折り紙建築 [/origami]
折鶴に松図小柄 [/origami]
改訂版・たぶん、ほとんどの人は viewport meta タグの指定をまちがえてる・その6 [/links]
改訂版・たぶん、ほとんどの人は viewport meta タグの指定をまちがえてる・その5 [/links]
改訂版・たぶん、ほとんどの人は viewport meta タグの指定をまちがえてる・その4 [/links]
改訂版・たぶん、ほとんどの人は viewport meta タグの指定をまちがえてる・その3 [/links]
改訂版・たぶん、ほとんどの人は viewport meta タグの指定をまちがえてる・その2 [/links]

羽鳥 公士郎