Pour continuer le sujet de la variabilité des noms selon le contexte, le
français (ou les langues romanes et germaniques) restent (en apparence
seulement) encore des cas simples.

Mais si vous regardez les autres langues cela se complique sérieusement :
- les langues slaves déclinent tous les nom propres
- les langues celtiques (breton ou irlandais par exemple) et sémitiques
(arabe par exemple) pratiquent *aussi* la mutation des initiales selon les
mots qui les précèdent et des règles complexes de phonologie.
- les langues sémitiques (arabe ou hébreu) ne notent pas toujours les
voyelles (points diacritiques) n'importe où dans les mots, ou peuvent n'en
écrire qu'une partie ou bien toutes (ce n'est pas le cas de toutes les
langues en écriture arabe, qui ont introduit des lettres à part entière
pour les voyelles en systématisant ces voyelles et en ajoutant quelques
lettres au besoin)
- ces mêmes langues peuvent noter aussi la cantillation (optionnelle, comme
si on pouvait noter en français contextuellement avec un accent particulier
les voyelles longues, ou les syllabes emphasées d'un stress, ou d'une
intonation particulière, marquant l'intention de l'auteur selon le
contexte, au lieu d'utiliser des termes supplémentaires).
- les langues "asiatiques" ne marquent pas systématiquement le genre, le
nombre, la déclinaison, le temps ou la fonction, que ce soit par des
adverbes, articles, déclinaisons, mais par agglutination de morphèmes, qui
se contractent souvent par mutation aussi dans la racine ! Un exemple
européen est la langue finnoise.
- les mutations ne concernent pas toujours uniquement l'initiale mais aussi
phonologiquement (selon des règles parfois complexes) des éléments au
milieu de la racine (un exemple existe en français dans les mutations
internes des racines des verbes du fait de la conjugaison : des accents ou
lettres apparaissent ou disparaissent selon le temps, le mode, ou la
personne, mais aussi dans les termes dérivés des noms propres comme les
gentilés qui sont bourrés souvent de mutations, quand ils ne vont pas
chercher leur racine dans un autre terme ou dans une autre langue!).

On peut croire qu'on peut laisser de côte les gentilés (dont la séparation
est claire dans les langues romanes ou germaniques) mais c'est souvent
difficile dans les autres langues où ils sont formés par les types de
dérivation précédents (par exemple par agglutination et mutations).

De fait, il est important dans OSM de pouvoir savoir dans quelle langue les
"name=*" sont écrits, et aussi avoir une idée de ce qui constitue dedans
des termes ou morphèmes génériques (communs) ou propres (car les règles de
dérivation sont alors très différentes et propres à chaque langue
identifiée).

Le 30 novembre 2012 15:26, Philippe Verdy <verd...@wanadoo.fr> a écrit :

> Il y a malgré tout moyen de faire un compromis si vous voulez garder la
> capitale dans la base partout: d'abord le problème ne français ne concerne
> que les mots « Le » ou « Les » écrits en tête. Dans la plupart des cas ce
> sont bien articles, ils sont donc contractables.
>
> Dans les autres cas rares, ce sont des exceptions qui peuvent être marqués
> spécialement pour dire que ce ne sont pas des articles mais des noms
> propres, donc que d'une part ce n'est pas une capitale typographique, mais
> bien une majuscule invariable (name:fr:invariable_case=yes). Cela pourrait
> concerner d'autres noms propres que les toponymes.
>
> Pour ne pas faire d'autres exceptions, on a choisi de garder les articles
> devant les noms de cours d'eau. Cependant ces articles ne font pas partie
> de l'odonyme lui-même : la minuscule s'impose. On reconnait alors ces
> articles à condition qu'on sache que c'est bien du français.
>
> D'autre part il faut savoir dans quelle langue est effectivement écrit le
> nom par défaut (name=*) : on n'est pas obligé de le dire dans tous les
> name=* si l'objet désigné est dans un pays ou une région dont on connait la
> langue officielle (ce name devrait être dans cette langue). Cela se
> complique dans les pays ou régions qui ont plusieurs langues co-officielles
> (par exemple les communautés autonomes espagnoles, ou la région de
> Bruxelles-Capitale, ou même la Région wallone où l'allemand est aussi
> coofficiel dans une partie, la distinction linguistique ne se faisant pas
> au niveau des régions administratives en Belgique, mais au niveau des
> communautés linguistiques).
>
> Pour indiquer la/les langues officielles dans une région (administrative
> ou autre entité politique dans OSM), on peut indiquer cette langue, ou ces
> langues dans un tag. Si un lieu fait partie de plusieurs régions
> adminsitratives ou autres entités poltiiques, toutes les langues indiquées
> sont coofficielles (ou ont un statut régional réconnu). A la suite de quoi
> on se retrouve avec un name=* qui peut n'être alors que dans l'une de ces
> langues ou plusieurs de celles-ci.
> Si les règles orthographiques, grammaticales, ou autres ne permettent pas
> de décider comment appliquer une règle, on n'a pas d'autre choix que de
> détailler les noms de ces langues avec leurs propres règles, et on ne
> dérivera pas le name=* par défaut qui reste dans une langue ambiguë..
>
>
>
>
> Le 30 novembre 2012 14:37, Philippe Verdy <verd...@wanadoo.fr> a écrit :
>
> Très bien, il mentionne « l’article initial s’il n’est pas contracté avec
>> à ou de » et suppose qu'on puisse reconnaitre qu'il s'agit d'un article
>> (cela oblige à en garder la trace dans une base de données.
>>
>> Et le CNIG se place dans le cadre de la « composition », ce qui de fait
>> exclue le cas « base de données » qui doit préserver cette différence d'une
>> façon ou d'une autre. La base de données a bien vocation à garder les
>> différences lexicales, ce n'est pas le contexte de la composition dont
>> parle le CNIG.
>>
>>
>>
>> Le 30 novembre 2012 14:31, Plop76 <vaujani...@free.fr> a écrit :
>>
>> Dans son message précédent, Philippe Verdy a écrit :
>>>
>>>  Pourquoi veux-tu que OSM se limite aux cartes ? OSM c'est une base de
>>>> données, pas une carte. Les cartes c'est du domaine du rendu.
>>>>
>>>> OSM a bien d'autres usages comme la possibilité d'utiliser la base comme
>>>> source d'informations pour composer toutes sortes de documents avec des
>>>> inclusions dans le texte d'une partie de ces données, avec des liens
>>>> hypertextes possibles vers des rendus cartographiques très divers, ou
>>>> pas
>>>> de carte du tout, par exemple dans des tableaux de données, où le nom ne
>>>> sera pas non plus nécessairement le premier élément affiché dans une
>>>> cellule).
>>>>
>>>> Bref le CNIG ne touche qu'au rendu des cartes, rien d'autre.
>>>>
>>>
>>> Ils s'occupent de "l'information géographique" :D
>>> Ils font justement la distinction entre les cartes (où la majuscule est
>>> de toute façon due au début de phrase) et le cas général.
>>>
>>> Pour le cas général, ils recommandent :
>>>
>>> «Dans un toponyme (quel que soit son mode de composition), ou dans un
>>> nom de
>>> territoire politique ou administratif composé par jonction par des
>>> traits d’union,
>>> prennent la majuscule :
>>> [...]
>>> -  l’article initial s’il n’est pas contracté avec à ou de le précédant
>>> (La Rochelle, Le Puy,
>>> Le Havre, la municipalité du Touquet et non de Le Touquet, aller au Mans
>>> et non à Le Mans
>>> [DAF, « le »] au lieudit « La Fourche », « Le Cheval mort » [DAF, «
>>> lieudit »]).
>>> »
>>>
>>> Et concernant l'IGN :
>>>
>>> «Ainsi, dans les toponymes officieux, l’IGN et le SHOM omettent
>>> actuellement les traits d’union et l’IGN la majuscule à l’article
>>> initial. Cette exception s’apparente à l’usage de signes typographiques
>>> comme la couleur des caractères, la police italique ou le corps
>>> des caractères»
>>>
>>> ;-)
>>>
>>>
>>>
>>>
>>>
>>> ______________________________**_________________
>>> Talk-fr mailing list
>>> Talk-fr@openstreetmap.org
>>> http://lists.openstreetmap.**org/listinfo/talk-fr<http://lists.openstreetmap.org/listinfo/talk-fr>
>>>
>>
>>
>
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr

Reply via email to