Вот тут еще есть небольшая дискуссия о том что использовать в Perl — utf8 или utf-8
http://stackoverflow.com/questions/18109154/what-string-should-be-used-to-specify-encoding-in-perl-pod-utf8-utf-8-or/ On Thursday, May 22, 2014, Victor Efimov <[email protected]> wrote: > Возможно это баг/упущение в докции, им бы следовало советовать > :encoding(utf-8) (через дефис) > > т.к. в другом места написано: > > === > Got that? As of Perl 5.8.7, "UTF-8" means UTF-8 in its current sense, > which is conservative and strict and security-conscious, whereas > "utf8" means UTF-8 in its former sense, which was liberal and loose > and lax > === > > и действительно: > > === > use Encode; > use Data::Dumper; > use open qw/:std :encoding(utf8)/; > print "\x{FFFF_FFFF}"; > __END__ > Code point 0xFFFFFFFF is not Unicode, may not be portable at 4.pl line 4. > ������� > === > > === > use Encode; > use Data::Dumper; > use open qw/:std :encoding(utf-8)/; > print "\x{FFFF_FFFF}"; > __END__ > Code point 0xFFFFFFFF is not Unicode, may not be portable at 3.pl line 4. > "\x{ffffffff}" does not map to utf8. > \x{FFFFFFFF} > === > > впрочем это на вывод данных, а на ввод что-то пока не могу > воспроизвести различие. > > > > 22 мая 2014 г., 16:02 пользователь Иван Бессарабов > <[email protected]<javascript:;>> > написал: > > OMG. Еще и такая тонкость =( > > > > Спасибо, Антон. Записал себе поразбиратся с этим > > https://github.com/bessarabov/bessarabov_blog/issues/5 > > > > 2014-05-22 15:53 GMT+04:00 Anton Yuzhaninov <[email protected]<javascript:;> > >: > >> On 05/22/14 15:33, Иван Бессарабов wrote: > >>> > >>> Я некоторое время назад разбирался с unicode и как результат этих > >>> разбирательств написал пост — > >>> https://ivan.bessarabov.ru/blog/perl-unicode > >>> > >>> В посте как раз разбирается что такое use utf8 и говорится про use > open. > >> > >> > >> Стоило бы ещё написать, что > >> use open qw(:utf8); > >> и > >> use open qw(:encoding(utf8)); > >> это не одно и тоже. > >> в perldoc PerlIO пишут: > >> > >> Note that this layer does not validate byte sequences. For reading > >> input, using ":encoding(utf8)" instead of bare ":utf8" is strongly > >> recommended. > >> > >> -- > >> Moscow.pm mailing list > >> [email protected] <javascript:;> | http://moscow.pm.org > > -- > > Moscow.pm mailing list > > [email protected] <javascript:;> | http://moscow.pm.org > -- > Moscow.pm mailing list > [email protected] <javascript:;> | http://moscow.pm.org >
-- Moscow.pm mailing list [email protected] | http://moscow.pm.org
