On Wed, 17 Apr 2002, Autrijus Tang wrote:

> On Tue, Apr 16, 2002 at 10:35:36AM +0900, Dan Kogai wrote:
> > http://www.dan.co.jp/~dankogai/bleedperl/

> Wonderful. I learned quite a bit Japanese just by reading the Kanji

> (I wonder if Kogai-san can similarily read .tw and .cn, and which
>  is the easier one. Probably the Simplified version?)

  To me TW version is much easier to 'understand' (well,
I know the answer :-) ) than CN version :-) CN version has too many
simplified characters I have to 'decipher' :-)

> Some nitpicks to .kr and .jp: .kr had a verbatim English paragraph
> near the beginning of article, which seems redundant to me. Also,
> both refer to the FOO encoding, which might or might not be intentional.

  Those are my mistakes.  I've already sent a revised version with them
fixed and  additional links to Perl sites in  Korea to Dan. I should have
sent it here as well. :-) Attached is another revision with some fixes.

   Cheers,

   Jungshik
If you read this file _as_is_, just ignore the funny characters you
see. It is written in the POD format (see perlpod manpage) which is
specially designed to be readable as is.

This file is in Korean encoded in EUC-KR. 

�� ������ perldoc�� �Ἥ ���� �ʰ� ���� ���� ��쿡�� �� �κ���
������ ǥ���ϱ� ���� ���� =head, =item, 'L' ���� �����Ͻʽÿ�.
�� ������ ���� perldoc�� ���� �ʰ� ������ �дµ� �� ������
���� POD �������� ¥�� �ֽ��ϴ�.  �� �ڼ��� ���� perlpod
�Ŵ����� �����Ͻʽÿ�. 


=head1 NAME

perlko - Perl�� �ѱ��� ���ڵ�

=head1 DESCRIPTION

Perl�� ���迡 ���� ���� ȯ���մϴ� !


Perl�� 5.8.0�Ǻ��� �����ڵ�/ISO 10646�� ���� �������� ������ �մϴ�.
�����ڵ� ������ ��ȯ���� �������� ����� ���� ��������
�����ڵ� ������ ���� �־��� ���ݵ� �θ� ���̰� �ִ� ������ ���ڵ���
�����մϴ�.  �����ڵ�� �� ���迡�� ���̴� ��� �� ���� ǥ�� ü�� -
������ ��ƾ ���ĺ�, Ű�� ���ĺ�, �׸��� ���ĺ�, �ε��� ���� �ƽþ���
���� �迭 ��ũ��Ʈ, �ƶ� ����, ���긮 ����, �������� ����, �ѱ����� �ѱ�,
�Ϻ����� ����, �Ϲ� �ε���� ǥ�� ü�� ��- �����ϴ� ���� ��ǥ�� �ϰ�
�ֱ� ������ ������ ���̴�  �� ��� �� ���� �׸��� � ü�迡 ������
���� ���հ� ���ڵ��� ��� �����ϰ� �ֽ��ϴ�.


Perl�� ���������� �����ڵ带 ���� ǥ���� ���� ����մϴ�. ���� ��ü������
���ϸ� Perl ��ũ��Ʈ �ȿ���  UTF-8 ���ڿ��� �� �� �ְ�, 
���� �Լ��� ������(���� ���, ���Խ�, index, substr)�� ����Ʈ ����
��� �����ڵ� ���� ������ �����մϴ�. (�� �ڼ��� ���� 
perlunicode �Ŵ����� �����Ͻʽÿ�.) �����ڵ尡 �θ� ���޵DZ� ����
�θ� ���̰� �־���, ������ �θ� ���̰� �ִ� ����/�� �� ���ڵ�����
������� �ϰ� �̵� ���ڵ����� �� �����Ϳ� ������ �ٷ�� ���� ���� ����
'Encode'��  �������ϴ�. �������� 'Encode'��  �Ἥ ������ ���ڵ� ������
��ȯ�� ���� �� �� �ֽ��ϴ�.

'Encode'�� ������ ���� �ѱ��� ���ڵ��� �����մϴ�.

=over 4

=item euc-kr 

  US-ASCII�� KS X 1001�� ���� ���� ��Ƽ����Ʈ ���ڵ� (���� �ϼ����̶��
  �Ҹ�.) KS X 2901�� RFC 1557 ����.

=item  cp949     

        MS-Windows 9x/ME���� ���̴� Ȯ�� �ϼ���.  euc-kr�� 8,822����
        �ѱ� ������ ���� ����.  alias�� uhc, windows-949, x-windows-949,
        ks_c_5601-1987. �� ������ �̸��� �������� ���� �̸�������, Microsoft
        ��ǰ���� CP949�� �ǹ̷� ���̰� ����.

=item  johab          

        KS X 1001:1998 �η� 3���� ������ ������.  ���� �����丮�� cp949��
        ���������� US-ASCII��  KS X 1001�� 8,822���� �ѱ� ������ ���� ����.
        ���ڵ� ����� ���� �ٸ�. 

=item iso-2022-kr     

        RFC 1557���� ������ �ѱ��� ���ͳ� ���� ��ȯ�� ���ڵ����� US-ASCII��
        KS X 1001�� �����丮�� �ϴ� ������ euc-kr�� ������ ���ڵ� ����� �ٸ�.
        1997-8�� ����� �������� �� �̻� ���� ��ȯ�� ������ ����.

=item  ksc5601-raw     

        KS X 1001(KS C 5601)�� GL(��, MSB�� 0���� �� ���) �� ������ ����
        ���ڵ�. US-ASCII�� �������� �ʰ� �ܵ����� ���̴� ���� X11 ��� �۲�
        ���ڵ� (ksc5601.1987-0. '0'�� GL�� �ǹ���.)���� ���̴� ���� �����ϰ���
        ���� ����. KS C 5601�� 1997�� KS X 1001�� �̸��� �ٲپ���.  1998�⿡��  ��
        ���� (����ȭ ��ȣ�� ��� ��ǥ ��ȣ)�� ��������.

=back

 �� ���� ��� ������ �Ʒ��� ���Դϴ�. 

���� ���, euc-kr ���ڵ����� �� ������ UTF-8�� ��ȯ�Ϸ��� ������
���� �ϸ� �˴ϴ�. 


    perl -Mencoding=euc-kr,STDOUT,utf8 -pe1  < file.euckr > file.utf8

����ȯ�� ������ ���� �� �� �ֽ��ϴ�. 

    perl -Mencoding=utf8,STDOUT,euc-kr -pe1  < file.utf8  > file.euckr

  �̷� ��ȯ�� ���� �����ϰ� �� �� �ֵ��� Encode ����� �Ἥ 
�����ϰ� Perl�θ� ���� piconv�� Perl�� ��� �ֽ��ϴ�.
�� �̸����� �� �� �ֵ��� piconv�� Unix�� �ִ� iconv��
�𵨷� �� ���Դϴ�. �� ������ �Ʒ��� �����ϴ�.

   piconv -f euc-kr -t utf8 < file.euckr > file.utf8
   piconv -f utf8 -t euc-kr < file.utf8 > file.euckr

  ��, 'PerlIO::encoding' ����� �Ἥ �ѱ��� ���ڵ��� ���鼭 ���� ����
(����Ʈ ������ �ƴ϶�) ó���� ���� �� �� �ֽ��ϴ�.

  #!/path/to/perl 

  use encoding 'euc-kr', STDIN => 'euc-kr',
                         STDOUT-> 'euc-kr', STDERR=>'euc-kr';

  print length("����");        # 2  (ū ����ǥ�� ���� ���� ó���� ����)
  print length('����');        # 4  (���� ����ǥ�� ����Ʈ ���� ó���� ����)
  print index("�Ѱ�, �뵿��", "��");   # -1 ('��'�� ����)
  print index('�Ѱ�, �뵿��', '��');   # 7 (8��°�� 9��° ����Ʈ�� '��'��
                                            �ڵ尪�� ��ġ��.)


=head2 �� �ڼ��� �˰� ������...

  Perl�� ��ġ�ϸ�  ����� �ڼ��� ������ ���� ���� ����, �� ������ ����
Perl ���� �� �ƴ϶� �����ڵ� ����, Encode�� ���� � ���� ����
��� �� �ֽ��ϴ�.  ���� �� ������ ���� ��� ����� ���� �ֽ��ϴ�.


=head2 Perl ���� �ڷ�

������ �����  ���� �ܿ��� ������ ���� �ڷᰡ �ֽ��ϴ�. �� ����� ����
������ ���� �ƴϰ� �Ϻ� ��ǥ���� �͸� ���� ���Դϴ�.

=over 4

=item L<http://www.perl.com/>           

   O'Reilly�� Perl �� ������ 

=item L<http://www.cpan.org/>

        Comprehensive Perl Archive Network

=item L<http://lists.perl.org/> 

  Perl ���ϸ� ����Ʈ. ���� ����Ʈ ���
  perl-unicode���� 'Encode'�� ���� ������.

=back

=head2 Perl�� �� ���� �����ϴµ� ������ �� �� �ִ� �ѱ��� ���� ����Ʈ

=over 4

=item L<http://www.perl.or.kr/>

  Perl �ѱ� ����� ���� 

=item L<news:han.comp.lang.perl/>

  �ѱ��� Perl ���� �׷�

=item L<http://seoul.pm.org/>

  Perl ���� (����)

=item L<http://www.perlmania.or.kr/>

  Home for Korean Perlmanias

=item L<http://www.oreilly.co.kr/perl/>
  
  O'Reilly���� ���� �ѱ��� Perl ���� ���

=item L<http://www.perlschool.net/>

  Perl ���� ���� �� �ҽ�, �ֱ� ����, ���� �ؿ� ����Ʈ ��ũ 

=item L<http://www.perl.co.kr>

  Perl�� ���õ� CGI, DB, ���� � ����  ���� �� ���� ����

=back 

=head2 �����ڵ� �� �ѱ��� ���ڵ� ���� �ڷ�

=over 4

=item L<http://www.unicode.org/>

  �����ڵ� ���ҽþ�.  

=item L<http://std.dkuug.dk/JTC1/SC2/WG2>

�⺻������ Unicode�� ���� ISO ǥ����  ISO/IEC 10646 UCS(Universal
Character Set)�� �����  ISO/IEC JTC1/SC2/WG2�� �� ������. 

=item L<http://jshin.net/faq/qa8.html>

  �ѱ��� ���� ���� �� ���ڵ��� ���� �ȳ�.

=item L<htp://www.cl.cam.ac.uk/~mgk25/unicode.html>

  ���н�/���������� �����ڵ�� UTF-8 ��뿡 ���� ������(FAQ)

=item L<http://kldp.org/Translations/html/UTF8-Unicode-KLDP/UTF8-Unicode-KLDP.html>

  ���н�/���������� �����ڵ�� UTF-8 ��뿡 ���� ������(FAQ)��  �ѱ��� ����

=back

=head1 SEE ALSO

L<Encode>, L<Encode::KR>, L<encoding>, L<perluniintro>, L<perlunicode>


=head1 AUTHORS

Jarkko Hietaniemi E<lt>[EMAIL PROTECTED]<gt>
������ E<lt>[EMAIL PROTECTED]<gt>

=cut

Reply via email to