Maybe you should try first Cogroo. It is based on OpenNLP and was also
trained with Bosque:
https://github.com/cogroo/cogroo4/wiki/API-CoGrOO-4

If you like to go directly with OpenNLP:
Documents: https://opennlp.apache.org/documentation.html
Ready to use models: http://opennlp.sourceforge.net/models-1.5/



2017-04-18 17:26 GMT-03:00 Ricardo <[email protected]>:

> Hi William,
>
> The corpus that I want to use is called "Bosque". (link below)
>
> What I need is to parse law text written in Portuguese. I have to find out
> if this model is good enough for my task or if I need to build my own
> model.
>
> Based on the following links, do i need to convert some file or there is a
> ready to use model?
>
> Thanks for your help !
>
> Ricardo Silva
>
> http://www.linguateca.pt/Floresta/levantamento.html
>
>
>
>
>
>
>
>
>
>
> *CGD*, formato dependencial: BosqueCP.cgd
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_7.4_cgd.txt>,
> BosqueCF.cgd
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_7.4_cgd.txt> Última
> modificação: 14 de setembro de 2006,
> versão 7.4 Bosque_CP_7.5_cgde_2203216.gz
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_7.5_cgde_2203216.gz
> >,
> Bosque_CF_7.5_cgde_2203216.gz
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_7.5_cgde_2203216.gz
> >
> Última
> modificação: 22 de março de 2016, versão 7.5 AD, árvores deitadas, formato
> de estrutura sintagmática: BosqueCP.ad
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_8.0.ad.txt>,
> BosqueCF.ad
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_8.0.ad.txt> Última
> modificação do conteúdo: 6 de outubro de 2008, versão 8.0 CoNNL, formato
> obtido de conversão direta do formato CGD para
> CONLL: Bosque_CP_7.4.conll.gz
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_7.4.conll.gz>,
> Bosque_CF_7.4.conll.gz
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_7.4.conll.gz>,
> Bosque_CP_7.5_cgde_22032016.conll.gz
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CP_
> 7.5_cgde_22032016.conll.gz>,Bosque_CF_7.5_cgde_22032016.conll.gz
> <http://www.linguateca.pt/Floresta/ficheiros/Bosque_CF_
> 7.5_cgde_22032016.conll.gz>
> CGDE
> em Universal dependencies
> <http://universaldependencies.org/u/overview/syntax.html> em formato
> CoNLL: bosque_CP.udep.conll.gz
> <http://www.linguateca.pt/Floresta/ficheiros/bosque_CP.udep.conll.gz>,
> bosque_CF.udep.conll.gz
> <http://www.linguateca.pt/Floresta/ficheiros/bosque_CF.udep.conll.gz>
> Última
> modificação do conteúdo: 22 de março de 2016, versão 7.5  *
>
>
> Em seg, 17 de abr de 2017 às 02:35, William Colen <[email protected]
> >
> escreveu:
>
> > Can you be more specific?
> > We support Arvores Deitadas format. Can you point to the corpus your are
> > trying to use and to OpenNLP tool you are going to train?
> >
> > Thank you
> > William Colen
> >
> > 2017-04-16 18:21 GMT-03:00 Ricardo <[email protected]>:
> >
> > > Hi,
> > >
> > > Do I need to convert a CONLL format model file like what I found at
> > > Linguateca?
> > > http://www.linguateca.pt/Floresta/levantamento.html
> > >
> > > Thanks
> > >
> > > Ricardo
> > >
> >
>

Reply via email to