内海です。
次のような作業を行いました。
1. 大量の単語に対して goo ブログ内でのヒット数を付加する。
対象とした単語は次の通りです。
全体では約 375,000 語になります。
a. alt-cannadic の単語
動詞と形容詞は終止形で検索しています。
ただし特殊な活用のものは語幹のみで検索していることが
あります。
b. SKK L 辞書の名詞
c. その他の名詞
d. その他の動詞
e. 人名
2. 得られた結果を利用して Anthy 用の辞書を作成し、
実際に Anthy に組み込んだパッケージを作る。
ファイルはこちらです。
http://www.geocities.jp/ep3797/anthy_dict_01.html
思ったよりはいい具合に変換できているので、
最初からこれを土台に辞書を作れていれば楽だったなあ
という気が少しします。:-)
細かいことは README に書きました。
--------------------------------------
New Design Yahoo! JAPAN 2008/01/01
http://pr.mail.yahoo.co.jp/newdesign/
_______________________________________________
Anthy-dev mailing list
[email protected]
http://lists.sourceforge.jp/mailman/listinfo/anthy-dev