On Wed, 17 Apr 2002, Autrijus Tang wrote:
> On Tue, Apr 16, 2002 at 10:35:36AM +0900, Dan Kogai wrote:
> > http://www.dan.co.jp/~dankogai/bleedperl/
> Wonderful. I learned quite a bit Japanese just by reading the Kanji
> (I wonder if Kogai-san can similarily read .tw and .cn, and which
> is the easier one. Probably the Simplified version?)
To me TW version is much easier to 'understand' (well,
I know the answer :-) ) than CN version :-) CN version has too many
simplified characters I have to 'decipher' :-)
> Some nitpicks to .kr and .jp: .kr had a verbatim English paragraph
> near the beginning of article, which seems redundant to me. Also,
> both refer to the FOO encoding, which might or might not be intentional.
Those are my mistakes. I've already sent a revised version with them
fixed and additional links to Perl sites in Korea to Dan. I should have
sent it here as well. :-) Attached is another revision with some fixes.
Cheers,
Jungshik
If you read this file _as_is_, just ignore the funny characters you
see. It is written in the POD format (see perlpod manpage) which is
specially designed to be readable as is.
This file is in Korean encoded in EUC-KR.
�� ������ perldoc�� �Ἥ ���� �ʰ� ���� ���� ��쿡�� �� �κ���
������ ǥ���ϱ� ���� ���� =head, =item, 'L' ���� �����Ͻʽÿ�.
�� ������ ���� perldoc�� ���� �ʰ� ������ �дµ� �� ������
���� POD �������� ¥�� �ֽ��ϴ�. �� �ڼ��� ���� perlpod
�Ŵ����� �����Ͻʽÿ�.
=head1 NAME
perlko - Perl�� �ѱ��� ���ڵ�
=head1 DESCRIPTION
Perl�� ���迡 ���� ���� ȯ���մϴ� !
Perl�� 5.8.0�Ǻ��� �����ڵ�/ISO 10646�� ���� �������� ������ �մϴ�.
�����ڵ� ������ ��ȯ���� �������� ����� ���� ��������
�����ڵ� ������ ���� �־��� ���ݵ� �θ� ���̰� �ִ� ������ ���ڵ���
�����մϴ�. �����ڵ�� �� ���迡�� ���̴� ��� �� ���� ǥ�� ü�� -
������ ��ƾ ���ĺ�, Ű�� ���ĺ�, ���� ���ĺ�, �ε��� ���� �ƽþ���
���� �迭 ��ũ��Ʈ, �ƶ� ����, ���긮 ����, �������� ����, �ѱ����� �ѱ�,
�Ϻ����� ����, �Ϲ� �ε���� ǥ�� ü�� ��- �����ϴ� ���� ��ǥ�� �ϰ�
�ֱ� ������ ������ ���̴� �� ��� �� ���� ���� � ü�迡 ������
���� ���հ� ���ڵ��� ��� �����ϰ� �ֽ��ϴ�.
Perl�� ���������� �����ڵ带 ���� ǥ���� ���� ����մϴ�. ���� ��ü������
���ϸ� Perl ��ũ��Ʈ �ȿ��� UTF-8 ���ڿ��� �� �� �ְ�,
���� �Լ��� ������(���� ���, ���Խ�, index, substr)�� ����Ʈ ����
��� �����ڵ� ���� ������ �����մϴ�. (�� �ڼ��� ����
perlunicode �Ŵ����� �����Ͻʽÿ�.) �����ڵ尡 �θ� ���DZ� ����
�θ� ���̰� �־���, ������ �θ� ���̰� �ִ� ����/�� �� ���ڵ�����
������� �ϰ� �̵� ���ڵ����� �� �����Ϳ� ������ �ٷ�� ���� ���� ����
'Encode'�� �������ϴ�. �������� 'Encode'�� �Ἥ ������ ���ڵ� ������
��ȯ�� ���� �� �� �ֽ��ϴ�.
'Encode'�� ������ ���� �ѱ��� ���ڵ��� �����մϴ�.
=over 4
=item euc-kr
US-ASCII�� KS X 1001�� ���� ���� ��Ƽ����Ʈ ���ڵ� (���� �ϼ����̶��
�Ҹ�.) KS X 2901�� RFC 1557 ����.
=item cp949
MS-Windows 9x/ME���� ���̴� Ȯ�� �ϼ���. euc-kr�� 8,822����
�ѱ� ������ ���� ����. alias�� uhc, windows-949, x-windows-949,
ks_c_5601-1987. �� ������ �̸��� �������� ���� �̸�������, Microsoft
��ǰ���� CP949�� �ǹ̷� ���̰� ����.
=item johab
KS X 1001:1998 �η� 3���� ������ ������. ���� �����丮�� cp949��
���������� US-ASCII�� KS X 1001�� 8,822���� �ѱ� ������ ���� ����.
���ڵ� ����� ���� �ٸ�.
=item iso-2022-kr
RFC 1557���� ������ �ѱ��� ���ͳ� ���� ��ȯ�� ���ڵ����� US-ASCII��
KS X 1001�� �����丮�� �ϴ� ������ euc-kr�� ������ ���ڵ� ����� �ٸ�.
1997-8�� ����� �������� �� �̻� ���� ��ȯ�� ������ ����.
=item ksc5601-raw
KS X 1001(KS C 5601)�� GL(��, MSB�� 0���� �� ���) �� ������ ����
���ڵ�. US-ASCII�� �������� �ʰ� �ܵ����� ���̴� ���� X11 ��� �۲�
���ڵ� (ksc5601.1987-0. '0'�� GL�� �ǹ���.)���� ���̴� ���� �����ϰ���
���� ����. KS C 5601�� 1997�� KS X 1001�� �̸��� �ٲپ���. 1998��� ��
���� (����ȭ ��ȣ�� ��� ��ǥ ��ȣ)�� ��������.
=back
�� ���� ��� ������ �Ʒ��� ���Դϴ�.
���� ���, euc-kr ���ڵ����� �� ������ UTF-8�� ��ȯ�Ϸ��� ������
���� �ϸ� �˴ϴ�.
perl -Mencoding=euc-kr,STDOUT,utf8 -pe1 < file.euckr > file.utf8
����ȯ�� ������ ���� �� �� �ֽ��ϴ�.
perl -Mencoding=utf8,STDOUT,euc-kr -pe1 < file.utf8 > file.euckr
�̷� ��ȯ�� ���� �����ϰ� �� �� �ֵ��� Encode ����� �Ἥ
�����ϰ� Perl�θ� ���� piconv�� Perl�� ��� �ֽ��ϴ�.
�� �̸����� �� �� �ֵ��� piconv�� Unix�� �ִ� iconv��
�� �� ���Դϴ�. �� ������ �Ʒ��� �����ϴ�.
piconv -f euc-kr -t utf8 < file.euckr > file.utf8
piconv -f utf8 -t euc-kr < file.utf8 > file.euckr
��, 'PerlIO::encoding' ����� �Ἥ �ѱ��� ���ڵ��� ���鼭 ���� ����
(����Ʈ ������ �ƴ϶�) ó���� ���� �� �� �ֽ��ϴ�.
#!/path/to/perl
use encoding 'euc-kr', STDIN => 'euc-kr',
STDOUT-> 'euc-kr', STDERR=>'euc-kr';
print length("����"); # 2 (ū ����ǥ�� ���� ���� ó���� ����)
print length('����'); # 4 (���� ����ǥ�� ����Ʈ ���� ó���� ����)
print index("�Ѱ�, �뵿��", "��"); # -1 ('��'�� ����)
print index('�Ѱ�, �뵿��', '��'); # 7 (8��°�� 9��° ����Ʈ�� '��'��
�ڵ尪�� ��ġ��.)
=head2 �� �ڼ��� �˰� ������...
Perl�� ��ġ�ϸ� ����� �ڼ��� ������ ���� ���� ����, �� ������ ����
Perl ���� �� �ƴ϶� �����ڵ� ����, Encode�� ���� � ���� ����
��� �� �ֽ��ϴ�. ���� �� ������ ���� ��� ����� ���� �ֽ��ϴ�.
=head2 Perl ���� �ڷ�
������ ����� ���� �ܿ��� ������ ���� �ڷᰡ �ֽ��ϴ�. �� ����� ����
������ ���� �ƴϰ� �Ϻ� ��ǥ���� �� ���� ���Դϴ�.
=over 4
=item L<http://www.perl.com/>
O'Reilly�� Perl �� ������
=item L<http://www.cpan.org/>
Comprehensive Perl Archive Network
=item L<http://lists.perl.org/>
Perl ���ϸ� ����Ʈ. ���� ����Ʈ ���
perl-unicode���� 'Encode'�� ���� ������.
=back
=head2 Perl�� �� ���� �����ϴµ� ������ �� �� �ִ� �ѱ��� ���� ����Ʈ
=over 4
=item L<http://www.perl.or.kr/>
Perl �ѱ� ����� ����
=item L<news:han.comp.lang.perl/>
�ѱ��� Perl ���� ��
=item L<http://seoul.pm.org/>
Perl ���� (����)
=item L<http://www.perlmania.or.kr/>
Home for Korean Perlmanias
=item L<http://www.oreilly.co.kr/perl/>
O'Reilly���� ���� �ѱ��� Perl ���� ���
=item L<http://www.perlschool.net/>
Perl ���� ���� �� �ҽ�, �ֱ� ����, ���� �ؿ� ����Ʈ ��ũ
=item L<http://www.perl.co.kr>
Perl�� ���õ� CGI, DB, ���� � ���� ���� �� ���� ����
=back
=head2 �����ڵ� �� �ѱ��� ���ڵ� ���� �ڷ�
=over 4
=item L<http://www.unicode.org/>
�����ڵ� ���ҽþ�.
=item L<http://std.dkuug.dk/JTC1/SC2/WG2>
�⺻������ Unicode�� ���� ISO ǥ���� ISO/IEC 10646 UCS(Universal
Character Set)�� ����� ISO/IEC JTC1/SC2/WG2�� �� ������.
=item L<http://jshin.net/faq/qa8.html>
�ѱ��� ���� ���� �� ���ڵ��� ���� �ȳ�.
=item L<htp://www.cl.cam.ac.uk/~mgk25/unicode.html>
���н�/���������� �����ڵ�� UTF-8 ��뿡 ���� ������(FAQ)
=item L<http://kldp.org/Translations/html/UTF8-Unicode-KLDP/UTF8-Unicode-KLDP.html>
���н�/���������� �����ڵ�� UTF-8 ��뿡 ���� ������(FAQ)�� �ѱ��� ����
=back
=head1 SEE ALSO
L<Encode>, L<Encode::KR>, L<encoding>, L<perluniintro>, L<perlunicode>
=head1 AUTHORS
Jarkko Hietaniemi E<lt>[EMAIL PROTECTED]<gt>
������ E<lt>[EMAIL PROTECTED]<gt>
=cut