Aprofitant els mateixos scripts, he generat noms i adjectius del castellà a
partir del diccionari del corrector LanguageTool. Ací teniu els resultats:

https://github.com/jaumeortola/spanish-dict-tools/tree/maste
r/results/apertium

        en Apertium -> en LT (i sense paradigma)
adjectius:    6343 -> 18549 (383)
noms:         17513 -> 49452 (810)

Diferències:
https://github.com/jaumeortola/spanish-dict-tools/tree/master/tests-apertium

En les diferències es veuen petits errors en un diccionari i en l'altre, i
petites diferències de flexió.

En castellà, però, no faig jo mateix la flexió amb regles, cosa que en
català ens dóna un nivell de comprovació 'extra'.

En altres idiomes es pot fer igual, i hi ha bons diccionaris disponibles.
Per a la gent que treballa en francès-català, anglès-català, això pot ser
molt útil per a ajudar-los a introduir i verificar paraules noves. També
podem afegir-hi la creació de paradigmes que no existeixen.

Si concretem com ho volem usar, amb quines entrades i quines eixides i per
a quins idiomes, puc preparar scripts que siguen utilitzables fàcilment per
a qualsevol persona.

Salutacions,
Jaume Ortolà



El dia 9 de juny de 2017 a les 14:04, Jaume Ortolà i Font <
jaumeort...@gmail.com> ha escrit:

> Bon dia,
>
> Ací teniu les diferències entre el diccionari d'Apertium i el de
> Softcatalà en noms i adjectius:
>
> https://github.com/Softcatala/catalan-dict-tools/blob/master
> /tests-apertium/check-apertium-adj.txt
> https://github.com/Softcatala/catalan-dict-tools/blob/master
> /tests-apertium/check-apertium-nom.txt
>
> En adjectius:
> - Hi ha alguns errors en Apertium: azoïca, babau (falta babaua), biònices,
> convexs, endogenes, licies, nadives (per nadiues), nates (per nades),
> nucleïques, pertinaça, ronces (de ronc), submisses, trocaïques.
> - Falten alguns plurals en Apertium: bruscos, cancellerescos,
> caricaturescos, etc.
> - Hi ha diferents interpretacions d'alguns adjectius que poden ser
> invariants o no i algun altre detall.
>
> En noms:
> - Hi ha uns quants noms en el diccionari de Softcatalà que tenen dos lemes
> (masc. i fem.) que podrien estar en un sol lema. Això ho hem anat canviant,
> però encara en queden. Ho acabaré de canviar.
> - Errors en Apertium: afixs, alfalsos (pl. erroni d'alfals), annexs,
> baixs, bleixs, besllum [ha de ser fem. no masc.], burofaxs [crec que només
> pot ser burofaxos], burís [per burins], cadella [està amb cadell, però
> haurien de ser lemes separats], capricios [pl. incorrecte], carabiner
> [falta el femení], cartutxs, centelleigs [falta centellejos], comissos [és
> comisos, encara que existeix el verb decomissar], contrarellotge [falta el
> pl.], crucifixs, còrtex [falta el plural còrtexs], daltabaixs, detectiu
> [falta el fem. detectiva], dibuixs, verís [per verins], àntrax [falta el
> pl. àntraxs]...
> - Plurals diferents: aerocistos, amiloplastos... (són poc freqüents, però
> em pareix que són possibles), congostos, agostos, arrestos [són possibles
> les dues formes -sts, -stos]
> - Falta accentuació valenciana en Apertium (que s'ha afegit recentment):
> canapè, cupè.
>
> M'he quedat en la lletra D dels noms. Quan elimine els dobles lemes (masc.
> fem.) en el meu diccionari serà més fàcil veure les diferències.
>
> La solució dels errors en Apertium és tan senzilla com canviar el
> paradigma pel que he calculat jo on es considere oportú.
>
> Salutacions,
> Jaume Ortolà
>
>
------------------------------------------------------------------------------
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot
_______________________________________________
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala

Reply via email to