Creo que vienen en UTF-8, asi que a la hora de leerlos: paginaHtml = new BufferedReader(new InputStreamReader(u.openStream(), "UTF-8"));
Pasarle el charset como segundo parámetro al InputStreamReader (ahora mismo no se si le gustará más "UTF-8" o "utf8") y para escribirlo: pw = new PrintWriter(new OutputStreamWriter(fichero, "UTF-8")); Espero que te sirva. De todas formas, si vas a leer y escribir directamente sin leer nada, mejor que uses BufferedInputStream y BufferedOutputStream directamente, olvidandote de los charsets. El lun, 16-02-2009 a las 23:40 +0100, Iván Sánchez Ortega escribió: > El Lunes, 16 de Febrero de 2009, konan1986 escribió: > > Pues la verdad es que no lo sé..lo unico que hago es lo que pongo de > > codigo..no sé muy bien como tratar el texto de las formas que dices..como > > podria ponerlo?? y cual deberia usar? > > Depende del parser de XML que uses... Fíjate si en la cabecera de tu XML va > un > <?xml encoding='UTF-8'?> o algo por el estilo. Mira si tu párser de XML > reconoce esa etiqueta, y/o le puedes forzar una codificación (no sé cómo se > hace en Java). > > Todo lo que viene de OSM debería ser UTF-8 bien formado, salvo error. > > En el peor de los casos, creo que podrías usar "tidy" para pasar los > caracteres no-ascii a entidades de XML, pero ahora mismo no sé cómo se haría. > > > > _______________________________________________ > Talk-es mailing list > Talk-es@openstreetmap.org > http://lists.openstreetmap.org/listinfo/talk-es _______________________________________________ Talk-es mailing list Talk-es@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-es