2010/5/29 NIIBE Yutaka:
> [Anthy-dev 3470] の主張(繰り返すことで賢くなる)は、現在の実装においてホ
> ントなんでしょうか?
(賢くなるかどうかは別として)情報が集積されるためには、
(0) 最初のコーパス関連が空の anthy.dic-0 があるとする
(1) proccorpus が anthy.dic-0 を使って parsed_data-0 を生成
calctrans が parsed_data-0 を使って corpus_info,weak_words を生成
次の anthy.dic-1 を作る
(2) proccorpus が anthy.dic-1 を使って parsed_data-1 を生成
calctrans が parsed_data-0 と parsed_data-1 を使って
corpus_info,weak_words を生成
次の anthy.dic-2 を作る
とここまでは 9100h の update_params2 はあっているとして、次からの段階は、
(3) proccorpus が anthy.dic-2 を使って parsed_data-2 を生成
calctrans が parsed_data-0 と parsed_data-1 および parsed_data-2 を使って
^^^^^^^^^^^^^
corpus_info,weak_words を生成
次の anthy.dic-3 を作る
[...]
(N) proccorpus が anthy.dic-{N-1} を使って parsed_data-{N-1} を生成し、
calctrans が parsed_data-0.. parsed_data-{N-1} の全部を使って
^^^^^^^^^^^
corpus_info,weak_words を生成
次の anthy-dic-{N} を作る
じゃないでしょうか。
これを試してみるとして、正しいかどうかはおいておいて、「こっちの方が良い」か
どうかを判断するのには、どうしたらいいでしょう。
--
_______________________________________________
Anthy-dev mailing list
[email protected]
http://lists.sourceforge.jp/mailman/listinfo/anthy-dev