Hideyuki SHIRAI (白井秀行) wrote:
> egg-anthy の UTF-8 対応をしました。

> http://ko.meadowy.net/~shirai/diary/20070419.html
> を読んでくださいませ。
ども、ありがとうございます。
色々な文字が出てるのを見ると楽しいです。

> P.S.
> 逆変換の実験をしていて気づいたのですが、EUC-JP で表現できない文
> 字を Anthy に突っ込んでも逆変換してくれないのですね。
平仮名や記号で構成されている文は逆変換しないというルールでやっていて、
EUC-JPで表現できない時は〓(ゲタ)になるので記号扱いというオチでした。

EUC-JPに変換して文字コードが0xa1??, 0xa2??の時に記号という
扱いにしてたのですが、UCSでどの文字が記号かマジメに考えるのは
手間なので、とりあえず下記のパッチで逃げておこうと検討しています。

--- /tmp/anthy-8819/src-diclib/xchar.c  2007-03-01 22:19:18.000000000 +0900
+++ xchar.c     2007-04-20 11:26:59.000000000 +0900
@@ -286,7 +286,13 @@
 static int
 is_symbol(xchar xc)
 {
+  if (xc == UCS_GETA) {
+    return 1;
+  }
   xc = anthy_ucs_to_euc(xc);
+  if (xc == EUC_GETA) {
+    return 0;
+  }
   if ((xc & 0xff00) == 0xa100) {
     return 1;
   }




-- 
--
 CHAOS AND CHANCE!
  Yusuke TABATA

_______________________________________________
Anthy-dev mailing list
Anthy-dev@lists.sourceforge.jp
http://lists.sourceforge.jp/mailman/listinfo/anthy-dev

メールによる返信