Re: [Apertium-stuff] GSoC

2020-03-31 Thread ILAKIAN ilakian
Thank you sir

On Wed, 1 Apr 2020, 4:30 a.m. Bernard Chardonneau, 
wrote:

> Ça permet de simplifier à la fois les dictionnaires bilingues et les
> règles de transfert.
>
> Par exemple dans la paire apertium-fr-es qui n'utilise pas cette
> possibilité,
> on a pour l'ajjectif "technique" 3 lignes dans le dictionnaire bilingue :
>
> techniquetécnico n="adj"/>
> techniquetécnico n="adj"/>
> techniquetécnico n="adj"/>
>
> Dans la paire apertium-fra-por, après que j'ai refait le système d'accord
> entre les mots, une ligne suffit :
>
>techniquetécnico n="adj"/>
>
> Et c'est le mêm système pour apertium-epo-fra
>
>teknika  technique n="adj"/>
>
> Maintenant, comment on l'utilise dans les règles de transfert ?
>
> Le principe de base est que l'article (déterminant), le nom et l'adjectif
> s'il y en
> a un ont tous le même genre et le même nombre.
>
> Dans le cas portugais vers français, la règle générale pour accorder 
>  
> sera :
> - prendre le nombre du déterminant de la langue source (jamais d'erreur si
> bien
>   orthographié)
> - prendre le genre du nom dans la langue cible
> - généreravec les genres et nombres sélectionnés.
>
> Dans le cas de l'espéranto, même principe pour le genre, mais on prendra le
> nombre du nom dans la langue source.
>
> Il peut y avoir des cas particuliers pour le genre, par exemple avec
> "artiste"
> lorsque le français est la langue cible. Dans ce cas, on cherchera un
> genre du
> coté de la langue source.
>
> Mais au final, la même règle de transfert et une ligne unique par mot dans
> le
> dictionnaire bilingue suffira.
>
> Ce qui marche pour une traduction qui aboutit à :
> Un vélo vert et une voiture verte
> doit fonctionner aussi bien pour :
> - Un vélo rouge et une voiture rouge
> - Un livre technique et une notice technique.
>
> Mais pour ça, il faut accepter à la génération les genres  et  et pas
> seulement le genre 
>
> verda biciklo kaj verda aŭto
> ana
> ^verda/verda$ ^biciklo/biciklo$ ^kaj/kaj$
> ^verda/verda$ ^aŭto/aŭto$
> prob
> ^verda$ ^biciklo$ ^kaj$
> ^verda$ ^aŭto$
> pretransf
> ^verda$ ^biciklo$ ^kaj$
> ^verda$ ^aŭto$
> t0x
> ^un$ ^biciklo$ ^verda$
> ^kaj$
> ^un$ ^aŭto$ ^verda$
> t1x
> ^un$ ^vélo$ ^vert$ ^et$
> ^un$ ^auto$ ^vert$
> gen
> un vélo vert et une auto verte
> pgen
> un vélo vert et une auto verte
>
> ruĝa biciklo kaj ruĝa aŭto
> ana
> ^ruĝa/ruĝa$ ^biciklo/biciklo$ ^kaj/kaj$
> ^ruĝa/ruĝa$ ^aŭto/aŭto$
> prob
> ^ruĝa$ ^biciklo$ ^kaj$
> ^ruĝa$ ^aŭto$
> pretransf
> ^ruĝa$ ^biciklo$ ^kaj$
> ^ruĝa$ ^aŭto$
> t0x
> ^un$ ^biciklo$ ^ruĝa$ ^kaj$
> ^un$ ^aŭto$ ^ruĝa$
> t1x
> ^un$ ^vélo$ ^rouge$ ^et$
> ^un$ ^auto$ ^rouge$
> gen
> un vélo rouge et une auto rouge
> pgen
> un vélo rouge et une auto rouge
>
> Avec une seule ligne à la syntaxe simple dans le dictionnaire bilingue, le
> même principe de traduction marche avec les 2 couleurs. Mais ça suppose que
> les genres  et  soient acceptés à la génération.
>
> Idem pour :
>
> La kato kaj la muso
> ana
> ^La/La$ ^kato/kato$ ^kaj/kaj$
> ^la/la$ ^muso/muso$
> prob + pretransf + t0x
> ^La$ ^kato$ ^kaj$
> ^la$ ^muso$
> t1x
> ^Le$ ^chat$ ^et$
> ^le$ ^souris$
> gen
> ~Le chat et ~la souris
> pgen
> Le chat et la souris
>
>
> La katoj kaj la musoj
> ana
> ^La/La$ ^katoj/kato$ ^kaj/kaj$
> ^la/la$ ^musoj/muso$
> prob + pretransf + t0x
> ^La$ ^kato$ ^kaj$
> ^la$ ^muso$
> t1x
> ^Le$ ^chat$ ^et$
> ^le$ ^souris$
> gen
> ~Les chats et ~les souris
> pgen
> Les chats et les souris
>
> Si pour générer "souris", on accepte les nombres  et  et pas
> seulement , une seule ligne suffit dans le dictionnaire bilingue
> et ça évite de traiter un cas particulier lors du transfert.
>
>
>
> > Date: Mon, 30 Mar 2020 21:08:41 +0300
> > From: Hèctor Alòs i Font 
> > To: "[apertium-stuff]" 
> > Reply-To: apertium-stuff@lists.sourceforge.net
> > Subject: Re: [Apertium-stuff] GSoC
> > Pièce(s) jointes(s) probable(s)>
> > Salut Bernard,
> >
> > Je ne comprends pas pourquoi faudrait-il changer les paradigmes
> > académique__adj, mois__n et fois__n comme tu le dis. Je n'ai jamais
> > rencontré aucun problème avec ces définitions. Elles sont aussi standards
> > dans Apertium dans d'autres langues romaines. Peux-tu donner des
> exemples ?
> > Ce qui, par contre, me pose parfois des problèmes ce sont les paradigmes
> > anglais__adj et affectueu/x__adj, mais très rarement.
> >
> > Hèctor
> >
> >
> > Missatge de Bernard Chardonneau  del dia dg., 29 de
> > març 2020 a les 0:52:
> >
> > > My point of view now.
> > >
> > > ()
> > >
> > > When a paradigm analyzes a word with gender mf or number sp, add RL
> > > lines to accept also generation with gender m ou f or number sg or pl.
> > >
> > > 2 examples of paradigms to change :
> > >
> > > In apertium-fra.fra.metadix we find :
> > >
> > > 
> > >  s  n="pl"/>
> > > n="sg"/>
> > > 
> > >
> > > 
> > > n="sp"/>
> > > 
> > >
> > > 
> > > n="sp"/>
> > > 
> > >
> > > A better form present (and neces

Re: [Apertium-stuff] GSoC

2020-03-31 Thread Bernard Chardonneau
Ça permet de simplifier à la fois les dictionnaires bilingues et les règles de 
transfert.

Par exemple dans la paire apertium-fr-es qui n'utilise pas cette possibilité,
on a pour l'ajjectif "technique" 3 lignes dans le dictionnaire bilingue :

techniquetécnico
techniquetécnico
techniquetécnico

Dans la paire apertium-fra-por, après que j'ai refait le système d'accord
entre les mots, une ligne suffit :

   techniquetécnico

Et c'est le mêm système pour apertium-epo-fra

   teknika  technique

Maintenant, comment on l'utilise dans les règles de transfert ?

Le principe de base est que l'article (déterminant), le nom et l'adjectif s'il 
y en
a un ont tous le même genre et le même nombre.

Dans le cas portugais vers français, la règle générale pour accorder   

sera :
- prendre le nombre du déterminant de la langue source (jamais d'erreur si bien
  orthographié)
- prendre le genre du nom dans la langue cible
- généreravec les genres et nombres sélectionnés.

Dans le cas de l'espéranto, même principe pour le genre, mais on prendra le
nombre du nom dans la langue source.

Il peut y avoir des cas particuliers pour le genre, par exemple avec "artiste"
lorsque le français est la langue cible. Dans ce cas, on cherchera un genre du
coté de la langue source.

Mais au final, la même règle de transfert et une ligne unique par mot dans le
dictionnaire bilingue suffira.

Ce qui marche pour une traduction qui aboutit à :
Un vélo vert et une voiture verte
doit fonctionner aussi bien pour :
- Un vélo rouge et une voiture rouge
- Un livre technique et une notice technique.

Mais pour ça, il faut accepter à la génération les genres  et  et pas
seulement le genre 

verda biciklo kaj verda aŭto
ana
^verda/verda$ ^biciklo/biciklo$ ^kaj/kaj$
^verda/verda$ ^aŭto/aŭto$
prob
^verda$ ^biciklo$ ^kaj$
^verda$ ^aŭto$
pretransf
^verda$ ^biciklo$ ^kaj$
^verda$ ^aŭto$
t0x
^un$ ^biciklo$ ^verda$ ^kaj$
^un$ ^aŭto$ ^verda$
t1x
^un$ ^vélo$ ^vert$ ^et$
^un$ ^auto$ ^vert$
gen
un vélo vert et une auto verte
pgen
un vélo vert et une auto verte

ruĝa biciklo kaj ruĝa aŭto
ana
^ruĝa/ruĝa$ ^biciklo/biciklo$ ^kaj/kaj$
^ruĝa/ruĝa$ ^aŭto/aŭto$
prob
^ruĝa$ ^biciklo$ ^kaj$
^ruĝa$ ^aŭto$
pretransf
^ruĝa$ ^biciklo$ ^kaj$
^ruĝa$ ^aŭto$
t0x
^un$ ^biciklo$ ^ruĝa$ ^kaj$
^un$ ^aŭto$ ^ruĝa$
t1x
^un$ ^vélo$ ^rouge$ ^et$
^un$ ^auto$ ^rouge$
gen
un vélo rouge et une auto rouge
pgen
un vélo rouge et une auto rouge

Avec une seule ligne à la syntaxe simple dans le dictionnaire bilingue, le
même principe de traduction marche avec les 2 couleurs. Mais ça suppose que
les genres  et  soient acceptés à la génération.

Idem pour :

La kato kaj la muso
ana
^La/La$ ^kato/kato$ ^kaj/kaj$
^la/la$ ^muso/muso$
prob + pretransf + t0x
^La$ ^kato$ ^kaj$
^la$ ^muso$
t1x
^Le$ ^chat$ ^et$
^le$ ^souris$
gen
~Le chat et ~la souris
pgen
Le chat et la souris


La katoj kaj la musoj
ana
^La/La$ ^katoj/kato$ ^kaj/kaj$
^la/la$ ^musoj/muso$
prob + pretransf + t0x
^La$ ^kato$ ^kaj$
^la$ ^muso$
t1x
^Le$ ^chat$ ^et$
^le$ ^souris$
gen
~Les chats et ~les souris
pgen
Les chats et les souris

Si pour générer "souris", on accepte les nombres  et  et pas
seulement , une seule ligne suffit dans le dictionnaire bilingue
et ça évite de traiter un cas particulier lors du transfert.



> Date: Mon, 30 Mar 2020 21:08:41 +0300
> From: Hèctor Alòs i Font 
> To: "[apertium-stuff]" 
> Reply-To: apertium-stuff@lists.sourceforge.net
> Subject: Re: [Apertium-stuff] GSoC
> Pièce(s) jointes(s) probable(s)>
> Salut Bernard,
>
> Je ne comprends pas pourquoi faudrait-il changer les paradigmes
> académique__adj, mois__n et fois__n comme tu le dis. Je n'ai jamais
> rencontré aucun problème avec ces définitions. Elles sont aussi standards
> dans Apertium dans d'autres langues romaines. Peux-tu donner des exemples ?
> Ce qui, par contre, me pose parfois des problèmes ce sont les paradigmes
> anglais__adj et affectueu/x__adj, mais très rarement.
>
> Hèctor
>
>
> Missatge de Bernard Chardonneau  del dia dg., 29 de
> març 2020 a les 0:52:
>
> > My point of view now.
> >
> > ()
> >
> > When a paradigm analyzes a word with gender mf or number sp, add RL
> > lines to accept also generation with gender m ou f or number sg or pl.
> >
> > 2 examples of paradigms to change :
> >
> > In apertium-fra.fra.metadix we find :
> >
> > 
> >  s  > n="pl"/>
> > > n="sg"/>
> > 
> >
> > 
> > > n="sp"/>
> > 
> >
> > 
> > > n="sp"/>
> > 
> >
> > A better form present (and necessary) in apertium-epo-fra (and 
> > apertium-fra-por) is :
> >
> > 
> >  > n="sg"/>
> >   s  > n="pl"/>
> >  > n="sg"/>
> >   s  > n="pl"/>
> >  > n="sg"/>
> >   s  > n="pl"/>
> > 
> >
> >  > > n="sp"/>
> >  > n="sg"/>
> >  > n="pl"/>
> > 
> >
> >  > > n="sp"/>
> >

Re: [Apertium-stuff] GSOC2020-English-Swahili pair

2020-03-31 Thread Sevilay Bayatlı
Hi Eden,

I have reviewed your proposal, it looks fine.

best,
Sevilay


On Tue, Mar 31, 2020 at 4:43 PM Eden Grace  wrote:

> Hi all,
> I wrote a proposal to create a usable version for the Swahili-English pair
> here.
> 
> Any feedback/suggestion/question will be greatly appreciated.
> Also, here  is my PR
> for the Swahili-English bilingual dictionary and Swahili's transducer is
> here .
>
> Thanks
> Eden
> ___
> Apertium-stuff mailing list
> Apertium-stuff@lists.sourceforge.net
> https://lists.sourceforge.net/lists/listinfo/apertium-stuff
>
___
Apertium-stuff mailing list
Apertium-stuff@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-stuff


[Apertium-stuff] GSoC 2020 Final Proposal

2020-03-31 Thread TEJASVI CHEBROLU
Hello Everyone,

My final GSoC proposal  "Adopt an Unreleased Language Pair: Hindi - Telugu" is 
up on the Apertium Wiki. The link is 
http://wiki.apertium.org/wiki/Chebrolutejasvi/GSOC_2020_proposal:_Hindi-Telugu.
Any last-minute suggestions or comments would be greatly appreciated.

Regards,
Tejasvi Chebrolu
___
Apertium-stuff mailing list
Apertium-stuff@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-stuff


[Apertium-stuff] GSOC2020-English-Swahili pair

2020-03-31 Thread Eden Grace
Hi all,
I wrote a proposal to create a usable version for the Swahili-English pair
here.

Any feedback/suggestion/question will be greatly appreciated.
Also, here  is my PR
for the Swahili-English bilingual dictionary and Swahili's transducer is
here .

Thanks
Eden
___
Apertium-stuff mailing list
Apertium-stuff@lists.sourceforge.net
https://lists.sourceforge.net/lists/listinfo/apertium-stuff