Cedric Marfil a écrit :
> J'ai ici un exemple qui utilise le type 'Link' pour gérer l'indexation,
> par contre, je ne sais pas comment récupérer l'encodage du feed qui me
> parvient. J'ai pour l'instant inscrit en dur dans le code un
> s.encode('utf-8') pour gérer l'encodage de la chaîne Unicode qui me
> parvient, mais n'est-il pas possible de récupérer l'encodage dans le feed ?

Si le feed de portal_rss fournit directement des objets unicode (et non pas des
str) alors il ne sert à rien de connaitre l'encodage du flux initial. Il faut
juste encoder le resultat en latin9 (==iso-8859-15) (ou plutot en
portal.default_charset qui vaut 'iso-8859-15' par défaut).

Products.CPSUtil.text fournit un fallback spécial pour convertir les caractéres
windows cp 1251 en leur equivalent pur lation9. Pour l'utiliser il suffit juste
de faire:

unicode_feed_element.encode('iso-8859-15', 'latin9_fallback')

-- 
Olivier

_______________________________________________
cps-users-fr 
Adresse de la liste : [email protected]
Gestion de l'abonnement : <http://lists.nuxeo.com/mailman/listinfo/cps-users-fr>

Répondre à