daiです。

On Tue, Jul 05, 2011 at 05:30:14PM +0900, Etsushi Kato wrote:
> > 先日、Debian パッケージの英文を査読に出した際、
> > uim について説明する必要があったのですが、
> > そちらで指摘を受けたのでご連絡します。
> 
> いろいろとありがとうございます。
> http://code.google.com/p/uim/ にある記述も、色々と直したり更新したり
> しないとだめですね…
> 
> > * uim-pinyin
> >
> > http://lists.debian.org/debian-l10n-english/2011/06/msg00068.html
> >
> >> > http://code.google.com/p/uim/wiki/WhatsUIM
> >> >> Chinese
> >> >>    New Pinyin (Simplified)
> >> >>    Pinyin (Unicode)
> >> >>    Pinyin (Traditional)
> >>
> >> Yes, but that's under "What Languages and Input modules can I use with
> >> uim?".  And they obviously aren't claiming that Pinyin and Pinyin are
> >> two different input modules... I'm going to assume that this is
> >> managing to combine the usual languages/scripts confusion with an
> >> extra layer of blurring between scripts and encodings!
> >
> > 言語/文字/エンコーディングに混乱があると言われていますが、
> > 実際のところ New Pinyin (Simplified), Pinyin (Unicode),
> > Pinyin (Traditional) というのは何が違うのでしょうか?
> > それぞれの実体が py, pyunihan, pinyin-big5 だとはわかったのですが...。
> 
> この3つに関しては単にテーブルが違うということしか実は知りません。
> 
> 文字コードはすべて UTF-8 なので、エンコーディングの話はここでは
> 関係ないと思います。簡体字 (Simplified Chinese) 向け、繁体字 (Traditional
>  Chinese) 向け、Unicode 表に基づくもの、という意味なのではないかと
> 推測します…

それが、異なる意味(向け、向け、基づく)を同列に並べている(混乱している)、
と言われている部分かなと思います。

> とりあえず、
>  * py: m17n-lib の zh-py.mim テーブル (Chinese input method with Pinyin sequence)
>  * pyunihan: kanji extracted from Unihan-4.0.1d3b.txt, a work in
> progress file from <http://www.unicode.org/Public/4.0-Update1/>
>  * pinyin-big5: XCIN Project http://xcin.linux.org.tw/cin/big5/pinyin.cin
> が元になっていると書いてありますので

では、先のリストは次のようにルールの元を追加しておくのはどうでしょうか?

- py (Simplified, rule from zh-py.mim in m17n-lib)
- pyunihan (Simplified, rule from Unicode 4.0-Update1)
- pinyin-big5 (Traditional, rule from XCIN Project http://xcin.linux.org.tw/)

pyunihan は Simplified でいいんでしょうか?
はたまた Simplified/Traditional?
-- 
Regards,
        dai

GPG Fingerprint = 0B29 D88E 42E6 B765 B8D8 EA50 7839 619D D439 668E

Attachment: signature.asc
Description: Digital signature

メールによる返信