部首合成変換を行うためのIMとして、uim-bushuconvを作ってみました。 https://github.com/deton/uim-bushuconv
uim-tutcodeの高機能な部首合成変換を、 漢字直接入力以外のIMで使えるようにするのを目的に作りました。 # uim-tutcodeのラッパーとして作っています。 以下の特徴があります。 - 複数の部首を指定することで、漢字候補の絞り込みが可能 - 漢字の一部を部首として使って合成可能 入力された漢字を分解した部首の集合から合成可能な漢字を候補として表示します。 部首の引き算も可能。 + 漢字の合成に使う部首をクリップボードやセレクションやカーソル前から取得可能 + カーソル前の文字のUnicodeコードポイントや漢字集合 (jisx0208,jisx0213,jisx0212等)を表示する機能あり + 画数ごとの部首リストから選択(部首の読み方がわからなくてもOK) - ユーザ辞書により、ユーザ独自の部首合成を登録可能 + 漢字の確定前に、annotationで漢字集合(jisx0208,jisx0213-1,jisx0213-2, jisx0212等)を確認可能 + JIS第3・第4水準(JIS X 0213)とJIS補助漢字(JIS X 0212)と一部のUnicodeに対応 ただし、uim-1.8.2では、部首合成変換辞書に長い行があるため、 UTF-8文字の途中までしか読み込まれずエラーが発生するので、 JIS補助漢字を含む辞書は使えません。 # -はuim-tutcodeの対話的な部首合成変換機能の特徴。 # +はuim-bushuconvの特徴(uim-tutcodeには無し)。 * コマンドラインツール 主に、部首合成変換辞書やannotationファイル作成時に必要になったので作成。 + tools/uimsh-bushuconv.scm: 部首合成変換 + tools/uimsh-kanjiset.scm: 漢字集合(jisx0208,jisx0213,jisx0212等)の判定 + tools/uimsh-ucs.scm: UnicodeコードポイントのU+XXXXX表記の置換 + tools/uimsh-rk.scm: ローマ字かな変換 * 関連: uimsh-tutctool uim-tutcodeの一部機能を、コマンドラインから使えるようにする uim-shスクリプトを作成しました。 https://github.com/deton/uimsh-tutctool このスクリプトのbushucand機能が、上のuimsh-bushuconvに相当します。 違いは、EUC-JPとUTF-8な点と、uimsh-bushuconvの方がJIS X 0213も含む 部首合成変換辞書を使っている点です。 以下の機能があります。 + bushuconv: 部首合成変換 + bushucand: 部首合成変換候補を表示 + tutchelp: uim-tutcodeでの文字の打ち方のヘルプを表示 + kanji2seq: 漢字をuim-tutcodeキーシーケンスに変換 + seq2kanji: uim-tutcodeキーシーケンスを漢字に変換 + kcodeucs: Unicodeコードポイント(U+XXXX)に対応するEUC-JP文字を出力 + kuten: 区点番号に対応するEUC-JP文字を出力 scm側のIM機能を、uim-shから使うためのスタブを使っています。 IMのscm部分のテストをしたい場合などに参考になるかもしれません。 -- 木原 英人 / KIHARA, Hideto / de...@m1.interq.or.jp http://www1.interq.or.jp/~deton/ -- Google Groups "uim-ja" group uim-ja@googlegroups.com http://groups.google.com/group/uim-ja/about