Le 25/11/2020 à 10:32, Rpnpif via Talk-fr a écrit :
Le 24/11/2020 à 20:37, Jean-Marc Liotier a écrit :
On 11/24/20 6:22 PM, Frédéric Rodrigo wrote:
Ce n'est pas aussi facile que ça pour faire une emprise mondiale. Il est nécessaire d'écrire des adaptateurs pour chaque langue ou pays pour traiter les particularités.

Je découvre donc:

- La phonemicization: https://github.com/addok/addok-fr/blob/master/addok_fr/utils.py

- Les particularités Françaises: https://github.com/addok/addok-france/blob/master/addok_france/utils.py

On comprend vite qu'il sera compliqué d'accepter une recherche sans connaître dans quel zone administrative et linguistique elle s'inscrit...

La « phonemicization » ressemble à une sorte de phonétisation simplifiée, non ?

Pourquoi n'avoir pas pris de bibliothèques de phonétisation qui sont beaucoup plus complètes et plus adaptables à la zone de recherche, comme celles des moteurs de recherche ?
Trop lourdes ?


Oui, librairie souvent lourdes et souvent très anglophones. Le but n'est pas non plus d'obtenir une traduction phonétique, mais une simplification pour ajouter du flou à la recherche.

On floute à l'aide de quelques regexp très rapides, on cherche dans l'index, puis on trie en comparant les libellés non floutés.


--
Christian Quest - OpenStreetMap France


_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr

Répondre à