Maybe you should try first Cogroo. It is based on OpenNLP and was also trained with Bosque: https://github.com/cogroo/cogroo4/wiki/API-CoGrOO-4
If you like to go directly with OpenNLP: Documents: https://opennlp.apache.org/documentation.html Ready to use models: http://opennlp.sourceforge.net/models-1.5/ 2017-04-18 17:26 GMT-03:00 Ricardo <[email protected]>: > Hi William, > > The corpus that I want to use is called "Bosque". (link below) > > What I need is to parse law text written in Portuguese. I have to find out > if this model is good enough for my task or if I need to build my own > model. > > Based on the following links, do i need to convert some file or there is a > ready to use model? > > Thanks for your help ! > > Ricardo Silva > > http://www.linguateca.pt/Floresta/levantamento.html > > > > > > > > > > > *CGD*, formato dependencial: BosqueCP.cgd > <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_7.4_cgd.txt>, > BosqueCF.cgd > <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_7.4_cgd.txt> Última > modificação: 14 de setembro de 2006, > versão 7.4 Bosque_CP_7.5_cgde_2203216.gz > <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_7.5_cgde_2203216.gz > >, > Bosque_CF_7.5_cgde_2203216.gz > <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_7.5_cgde_2203216.gz > > > Última > modificação: 22 de março de 2016, versão 7.5 AD, árvores deitadas, formato > de estrutura sintagmática: BosqueCP.ad > <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_8.0.ad.txt>, > BosqueCF.ad > <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_8.0.ad.txt> Última > modificação do conteúdo: 6 de outubro de 2008, versão 8.0 CoNNL, formato > obtido de conversão direta do formato CGD para > CONLL: Bosque_CP_7.4.conll.gz > <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_7.4.conll.gz>, > Bosque_CF_7.4.conll.gz > <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_7.4.conll.gz>, > Bosque_CP_7.5_cgde_22032016.conll.gz > <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_ > 7.5_cgde_22032016.conll.gz>,Bosque_CF_7.5_cgde_22032016.conll.gz > <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_ > 7.5_cgde_22032016.conll.gz> > CGDE > em Universal dependencies > <http://universaldependencies.org/u/overview/syntax.html> em formato > CoNLL: bosque_CP.udep.conll.gz > <http://www.linguateca.pt/Floresta/ficheiros/bosque_CP.udep.conll.gz>, > bosque_CF.udep.conll.gz > <http://www.linguateca.pt/Floresta/ficheiros/bosque_CF.udep.conll.gz> > Última > modificação do conteúdo: 22 de março de 2016, versão 7.5 * > > > Em seg, 17 de abr de 2017 às 02:35, William Colen <[email protected] > > > escreveu: > > > Can you be more specific? > > We support Arvores Deitadas format. Can you point to the corpus your are > > trying to use and to OpenNLP tool you are going to train? > > > > Thank you > > William Colen > > > > 2017-04-16 18:21 GMT-03:00 Ricardo <[email protected]>: > > > > > Hi, > > > > > > Do I need to convert a CONLL format model file like what I found at > > > Linguateca? > > > http://www.linguateca.pt/Floresta/levantamento.html > > > > > > Thanks > > > > > > Ricardo > > > > > >
