blog.鶯梭庵

二〇〇五年 睦月 十九日 水曜日

Encode と Jcode [/this_blog/perl]

1月16日の記事「アクセスログの referer を見る」で、文字コードを変換するのに Encode モジュールを使ったが、実際使ってみると、判定に失敗する場合が多い。Perl 5.8.x Unicode関連によると、Jcode、Encode のメンテナの弾さん曰く「Guessを使う場合の心得。1. 出来れば使わない 2. 以下略」ということなので、使わないことにした。

referer をデコードするサブルーチンを、Jcode モジュールを使って書き直すと、こうなる。


use Jcode;

my $referer = shift @_ or return 'n/a';

$referer =~ tr/+/ /;

$referer =~ s/%([a-f\d]{2})/pack 'H2', $1/egi;

jcode $referer;


最後の行は、Jcode->new($referer); と書いても同じ。オブジェクトの中では、文字列は EUC で格納されていて、オブジェクトが評価されると、その文字列が返る。

なお、Jcode モジュールは標準ではインストールされていないので、必要ならインストールすること。

[この記事にコメントを書く。] [このカテゴリをまとめて読む。] [最新の記事を読む。]

RSS feed

最近のツイート

カテゴリ

[/language] (73)
[/links] (205)
[/mac] (97)
[/music] (36)
[/origami] (374)
[/this_blog/ajax] (7)
[/this_blog/blosxom] (4)
[/this_blog/history] (12)
[/this_blog/perl] (9)

最新記事

検察の「暴走」・その1 [/links]
Weekend Japanology に出演 [/origami]
算数における掛け算について [/links]
「折り紙公理」の形式化・その6 [/origami]
「折り紙公理」の形式化・その5 [/origami]
折り紙ティーセット [/origami]
「折り紙公理」の形式化・その4 [/origami]
「折り紙公理」の形式化・その3 [/origami]
ジョセフ・ウーさんのインスタレーション [/origami]
「折り紙公理」の形式化・その2 [/origami]
「折り紙公理」の形式化・その1 [/origami]
Ear-igami [/origami]
ファスナー [/language]
ハーフカットと折り紙 [/origami]
吉澤展開催中 [/origami]

羽鳥 公士郎