Perlの文字コード変換の話 其の壱

スクリプト記述時に推奨される文字コード

perldocより
http://perldoc.jp/docs/perl/5.8.1/utf8.pod

このプラグマは、そもそも、互換性のための工夫です。 Perl 5.6未満のバージョンでは、ソースコード中の恣意的なバイト列を許していました。ですが、将来、ソーステキストに、UTF-8 エンコーディングを標準化したいと思っています。

ここから、新規にPerlスクリプトを記述する場合には、utf-8で書くことが推奨されている。

○ use utf8 プラグマ

スクリプトutf-8で記述した場合、use utf8プラグマを用いてPerlUTF-8スクリプト
書かれていることを教える必要があります。

ただし、perldocにもあるように、互換性のための工夫としてこのプラグマが用いられている
ため、将来的には(UTF-8が標準ソースフォーマットになったとき)必要が無くなる(らしい)

「プログラミング Perl vol.1」(p.474) によれば、

utf8プラグマは、本来は互換性の仕組みであり、パーサがリテラルと識別子についてUTF-8を認識
するようにするものである。またこれを使って、より実験的なUnicodeサポート機能のいくつかを
有効にすることも出来る。われわれの長期的な目標は、utf8プラグマをno-opにすることである。

とある。