blog.鶯梭庵

二〇一三年 水無月 卅日 日曜日

SDL Trados Studio で LaTeX ソースファイルを翻訳したい・その1 [/language]

この記事は書かれてから1年以上経過しています。内容が古くなっている可能性があります。コメントの受付は終了しました。

私は現在、ある書籍の翻訳を手がけている。原文のソースファイルは LaTeX で書かれており、このソースファイルは著者から受け取っている。納品は LaTeX ソースファイルと PDF ファイルということになっている。

私はこれまで、主に産業翻訳の仕事をしてきたので、ソースファイルは HTML だったり XML だったり Microsoft Office の文書だったりする。このようなファイルを翻訳する際によく使われる翻訳支援ソフトに、SDL Trados Studio がある。値段が高いソフトウェアだが、これがないと仕事にならないことも多いので、私も所有している。そこで、Trados Studio を使って LaTeX ファイルを翻訳したいと思った。

Trados Studio は、デフォルトでは LaTeX に対応していない。しかし、新しいファイルタイプを作成することができる。作成できるタイプの中に「正規表現区切り形式テキスト」があったので、これでどうにかできないかと、今日一日あれこれいじってみた。

で、結論としては、LaTeX に対応させるのは難しいものの、ソースファイルに前処理を施せば、何とかなりそうだ。

問題は、改行の取り扱いだ。LaTeX では、英文中の改行は空白文字に変換されるので、文の途中で改行することがある。一方、Trados Studio では、原則として改行は文の切れ目になる。だから、本来は1つの文であるものが Trados Studio ではいくつかの文に分かれてしまう。そうすると、原文と訳文を一対一に対応させることができない。

Trados Studio で、改行で文を切らないようにすることも可能だ。そのためには、翻訳対象個所の開始パターンと終了パターンを正規表現で指定し、改行文字をタグに置き換えるように設定すればよい。ソースファイルがスタンドアローンであれば、開始パターンを \\begin\{document\}、終了パターンを \\end\{document\} とすることが考えられる。しかし、今回は章ごとに別々のソースファイルになっているので、この方法は使えない。

開始パターンがファイルの冒頭にマッチし、終了パターンがファイルの末尾にマッチすればよいのだが、いろいろな正規表現を試してみても、どうにもうまくゆかない。また、仮にうまくいったとしても、先ほどとは逆に、本来は2つの文であるものが Trados Studio では1つになってしまうことがあるだろうから、うまくない。

そのため、改行を Trados Studio で処理するのはあきらめて、Trados Studio に読み込ませる前に、テキストエディタで文中の改行を空白に変換することにした。正規表現で一括置換すれば、それほど手間ではない。

Trados Studio はプレーンテキストにはもちろん対応しているので、文中の改行さえ処理してしまえば、テキストファイルの拡張子に tex を追加するだけで、LaTeX ソースファイルを Trados Studio で扱うことができるようになる。ひとまずこの状態で翻訳を進めることもできるが、せっかく Trados Studio を使うのだから、LaTeX のコマンドをタグとして認識させたい。その設定については後ほど

[このカテゴリをまとめて読む。] [最新の記事を読む。]

RSS feed

カテゴリ

[/language] (98)
[/links] (254)
[/mac] (114)
[/music] (36)
[/origami] (406)
[/this_blog/ajax] (7)
[/this_blog/blosxom] (4)
[/this_blog/history] (12)
[/this_blog/perl] (9)

最新記事

パスワードについてのあなたの常識はもはや非常識かもしれない・その1 [/links]
ニューラルネットワークとディープラーニングで翻訳はどうなる・その5 [/language]
ニューラルネットワークとディープラーニングで翻訳はどうなる・その4 [/language]
HTTPS 対応 [/links]
ひらがな・カタカナ学習ウェブアプリ [/links]
日本語の「た」と英語の過去形 [/language]
ORI-REVO で回転楕円体を折る・その2 [/origami]
ORI-REVO で回転楕円体を折る・その1 [/origami]
折り紙建築 [/origami]
折鶴に松図小柄 [/origami]
改訂版・たぶん、ほとんどの人は viewport meta タグの指定をまちがえてる・その6 [/links]
改訂版・たぶん、ほとんどの人は viewport meta タグの指定をまちがえてる・その5 [/links]
改訂版・たぶん、ほとんどの人は viewport meta タグの指定をまちがえてる・その4 [/links]
改訂版・たぶん、ほとんどの人は viewport meta タグの指定をまちがえてる・その3 [/links]
改訂版・たぶん、ほとんどの人は viewport meta タグの指定をまちがえてる・その2 [/links]

羽鳥 公士郎