奥野です。

> (1) サンプルから取り出せる結論の強さはサンプルの量に線形には比例
>     しないため、そのうちサンプル集めの苦労が割に合わなくなる。

サンプルを(半)自動的に集める方法が必要そうですね。
ただ、著作権とかの判断は確かに微妙ですが…
とりあえず非親告罪化には反対しておきましょう(笑)

> (3) サンプルが多くなると、より進んだ方法を使って結論を出すことが
>     できる。ただし、その方法を使うのは割と面倒な場合がある。

たとえば単語自体を素性とすると、
各単語を含む例文がそれぞれ10個くらい必要だったり?
他の素性との組み合わせも考えるともっと増える??

まとまりのないメールですみません。

--
奥野 陽

_______________________________________________
Anthy-dev mailing list
Anthy-dev@lists.sourceforge.jp
http://lists.sourceforge.jp/mailman/listinfo/anthy-dev

Reply via email to