No he pogut contestar en aquest fil fins avui, perdoneu. No és per falta
d'interès en el tema.
Personalment, no hi veig cap problema en afegir munts de paraules noves als
diccionaris d'Apertium. Per a mi, com més millor. Augmentarem la cobertura
i és més fàcil de treballar alhora de buscar paraules que falten en els
diccionaris bilingües. Tot i això, entenc que és prioritari depurar els
errors que es puguin trobar al diccionari.
Per al traductor de català-francès, ens aniria molt i molt bé ampliar el
diccionari francès, si es pogués fer una llista de paraules franceses amb
paradigmes. Estem ara ampliant el diccionari bilingüe i això implica
carregar força paraules noves en el diccionari francès. Tot això que ens
estalviaríem. No tinc gaire idea, però, de la feinada que implica amb els
scripts actuals fer una feina semblant per al francès (i ara mateix estic
massa embolicat en el català-sard per poder-hi dedicar una estona).
Cordialment,
Hèctor
El dia 10 de juny de 2017 a les 11:20, Jaume Ortolà i Font <
jaumeort...@gmail.com> ha escrit:
> Aprofitant els mateixos scripts, he generat noms i adjectius del castellà
> a partir del diccionari del corrector LanguageTool. Ací teniu els resultats:
>
> https://github.com/jaumeortola/spanish-dict-tools/tree/maste
> r/results/apertium
>
> en Apertium -> en LT (i sense paradigma)
> adjectius: 6343 -> 18549 (383)
> noms: 17513 -> 49452 (810)
>
> Diferències:
> https://github.com/jaumeortola/spanish-dict-tools/tree/maste
> r/tests-apertium
>
> En les diferències es veuen petits errors en un diccionari i en l'altre, i
> petites diferències de flexió.
>
> En castellà, però, no faig jo mateix la flexió amb regles, cosa que en
> català ens dóna un nivell de comprovació 'extra'.
>
> En altres idiomes es pot fer igual, i hi ha bons diccionaris disponibles.
> Per a la gent que treballa en francès-català, anglès-català, això pot ser
> molt útil per a ajudar-los a introduir i verificar paraules noves. També
> podem afegir-hi la creació de paradigmes que no existeixen.
>
> Si concretem com ho volem usar, amb quines entrades i quines eixides i per
> a quins idiomes, puc preparar scripts que siguen utilitzables fàcilment per
> a qualsevol persona.
>
> Salutacions,
> Jaume Ortolà
>
>
>
> El dia 9 de juny de 2017 a les 14:04, Jaume Ortolà i Font <
> jaumeort...@gmail.com> ha escrit:
>
>> Bon dia,
>>
>> Ací teniu les diferències entre el diccionari d'Apertium i el de
>> Softcatalà en noms i adjectius:
>>
>> https://github.com/Softcatala/catalan-dict-tools/blob/master
>> /tests-apertium/check-apertium-adj.txt
>> https://github.com/Softcatala/catalan-dict-tools/blob/master
>> /tests-apertium/check-apertium-nom.txt
>>
>> En adjectius:
>> - Hi ha alguns errors en Apertium: azoïca, babau (falta babaua),
>> biònices, convexs, endogenes, licies, nadives (per nadiues), nates (per
>> nades), nucleïques, pertinaça, ronces (de ronc), submisses, trocaïques.
>> - Falten alguns plurals en Apertium: bruscos, cancellerescos,
>> caricaturescos, etc.
>> - Hi ha diferents interpretacions d'alguns adjectius que poden ser
>> invariants o no i algun altre detall.
>>
>> En noms:
>> - Hi ha uns quants noms en el diccionari de Softcatalà que tenen dos
>> lemes (masc. i fem.) que podrien estar en un sol lema. Això ho hem anat
>> canviant, però encara en queden. Ho acabaré de canviar.
>> - Errors en Apertium: afixs, alfalsos (pl. erroni d'alfals), annexs,
>> baixs, bleixs, besllum [ha de ser fem. no masc.], burofaxs [crec que només
>> pot ser burofaxos], burís [per burins], cadella [està amb cadell, però
>> haurien de ser lemes separats], capricios [pl. incorrecte], carabiner
>> [falta el femení], cartutxs, centelleigs [falta centellejos], comissos [és
>> comisos, encara que existeix el verb decomissar], contrarellotge [falta el
>> pl.], crucifixs, còrtex [falta el plural còrtexs], daltabaixs, detectiu
>> [falta el fem. detectiva], dibuixs, verís [per verins], àntrax [falta el
>> pl. àntraxs]...
>> - Plurals diferents: aerocistos, amiloplastos... (són poc freqüents, però
>> em pareix que són possibles), congostos, agostos, arrestos [són possibles
>> les dues formes -sts, -stos]
>> - Falta accentuació valenciana en Apertium (que s'ha afegit recentment):
>> canapè, cupè.
>>
>> M'he quedat en la lletra D dels noms. Quan elimine els dobles lemes
>> (masc. fem.) en el meu diccionari serà més fàcil veure les diferències.
>>
>> La solució dels errors en Apertium és tan senzilla com canviar el
>> paradigma pel que he calculat jo on es considere oportú.
>>
>> Salutacions,
>> Jaume Ortolà
>>
>>
>
------------------------------------------------------------------------------
Check out the vibrant tech community on one of the world's most
engaging tech sites, Slashdot.org! http://sdm.link/slashdot
_______________________________________________
Apertium-catala mailing list
Apertium-catala@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-catala