depgraph の機能についてですが、(暖かい目で)これでなにがしたかったかをま
とめてみると、下記のようだと思います。
(必ずしも現在の実装でこれは達成されていないので、その点は誤解なきよう。)
(1) 与えられた文字列に対し、付属語を認識する。
(2) 付属語を含む文節について文法上の属性を付与する。
属性については、H, C, S がサポートされている。
H は文節の(先頭の)品詞、C は付属語の終端の活用形、
S は(今のところ)下記で定義されるもの。
DEP_NONE /* 付属語なし */
DEP_FUZOKUGO /* 付属語一般 */
DEP_KAKUJOSHI /* 格助詞 */
DEP_RENYOU /* 連用 */
DEP_RENTAI /* 連体 */
DEP_END /* 終端 */
DEP_RAW /* 名詞単独 */
(3) 付属語の認識に際しては考えられるすべての可能性を列挙し、、
anthy_commit_word_list が呼ばれる。
同一の文字列であっても異なる属性であれば、すべて登録される。
上記のような感じになっていますが、ここをきちんとサポートするには、NFA
のシミュレータ/デバッガがあると良いかもしれません。一般的には、こういう
のを作るときには、ルールのセットに対して、文字列を与えて、認識されるか
/されないかなどをデバッグできる環境が必要と考えるかと思います。
これに対しての僕の意見は、属性の付与の部分は削って、付属語を認識する所
だけをちゃんと作るのが良いと考えています。
--
_______________________________________________
Anthy-dev mailing list
[email protected]
http://lists.sourceforge.jp/mailman/listinfo/anthy-dev