Hey Guys  

I know, that may not be the normal use case, but my java knowledge is limited 
and a command line call would be the easiest way to integrate the OpenNLP 
capabilities into the project, so bear with me :)

$ cat input.txt  
Sein Song "Nightcall" hat den Film "Drive" mit Ryan Gosling erst so richtig 
bekannt gemacht. Wir haben uns mit Vincent Belorgey, besser bekannt als 
Kavinsky, über sein Debütalbum, seine Musik und die 80er Jahre unterhalten.

$ bin/opennlp SimpleTokenizer < input.txt  
Sein Song " Nightcall " hat den Film " Drive " mit Ryan Gosling erst so richtig 
bekannt gemacht . Wir haben uns mit Vincent Belorgey , besser bekannt als 
Kavinsky , ?? ber sein Deb ?? talbum , seine Musik und die 80 er Jahre 
unterhalten .
Average: 166.7 sent/s  
Total: 1 sent

Runtime: 0.006s  

Is my console misconfigured? The Input maybe not correct encoded? Or does it 
just not work?™ Of course i can work around that and create somehow a matching 
for those words originally containing Umlauts .. but, if it would be possible 
to avoid that? (:

While screening the web .. i found 
https://issues.apache.org/jira/browse/OPENNLP-172 but i'm not sure how that may 
or may not be related to me problem.

Thanks in advance
Stefan


Reply via email to