Paula, si te salen esos símbolos extraños en lugar de acentos (u otros
caracteres especiales) es porque el editor que usas te está mostrando el
contenido del fichero como codificado en ANSI, probablemente porque no esté
capacitado para trabajar con codificación utf-8, cosa bastante común a día
de hoy en muchos editores, aunque parezca mentira.

Para observar esta situación un poco más "en vivo" prueba a bajarte el
Notepad++ [1] que te permite cambiar "al vuelo" la codificación del archivo.
Al abrir el editor con un archivo en blanco, vete a la opción del menú
'Formato -> Codificar en UTF-8'. Ahora escribe alguna palabra en el editor,
que contenga un acento. Comprobarás que se ve correctamente. En estos
momentos el archivo está codificado (internamente) en UTF-8 con el Byte
Order Mark incluido [2]. Si cambias ahora la codificación, mediante la opcón
del menú 'Formato -> Codificar en ANSI', verás que los caracteres con acento
han sido sustituidos por los "caracteres extraños" que tú escribes para que
se vea bien en el navegador. En estos momentos el archivo SIGUE codificado
en UTF-8 SIN BOM [2], pero el editor lo muestra como si los datos fueran
ANSI. Si, finalmente, cambiamos de nuevo la codificación, con
'Formato->Mostrar como UTF-8 (sin BOM)' volvemos a ver todo correcto, ya que
el editor vuelve a interpretar el contenido del archivo como con
codificación UTF-8, (aunque en este caso no incluye el BOM).

¿Por qué pasa esto?. Muy sencillo, en la codificación ANSI los editores
utilizan los 8bits de cada byte para representar todo el conjunto de
caracteres locales, incluyendo aquellos que llevan acentos y marcas
especiales (evidentemente se hace necesario prescindir de caracteres de
otros países debido a las limitaciones de 256 caracteres de la tabla de 8
bits). En cambio, en la codificación UTF-8 se utiliza una cantidad de bytes
variable (de 1 a 4) para cada grupo de símbolos. Los 7 primeros bits de cada
byte representan la tabla de caracteres ASCII (el cual no tiene acentos), si
queremos acceder a los caracteres del segundo grupo (los acentos, po
ejemplo) se utilizarían ya los 8bits del byte + 1 byte adicional (de ahí que
si vemos una letra con acento en UTF-8, al pasar a visualizarlo en ANSI
vemos dos caracteres, puesto que utiliza dos bytes); si quisiéramos mostrar
caracteres asiáticos, cirílicos,... ya tendríamos que usar 3 o 4 bytes.

Espero que este galimatías te/os haya resuelto las dudas sobre la
codificación UTF-8 ;)

[1] http://notepad-plus.sourceforge.net/es/site.htm
[2] Grupo de bytes, al inicio del archivo Unicode, que indica el orden en el
que irán los bytes que codifican cada carácter. En archivos UTF-8 se hace
innecesario y, además, es conveniente DESACTIVARLO porque los navegadores
podrían tender a interpretar esos caracteres como parte del código xHTML.

Un saludo, David Merino Ogando.



On 3/23/06, Paula Portilla - Punto y Pixel <[EMAIL PROTECTED]> wrote:
>
> DJ-Dom escribió:
> > ¿Y cual es el problema?...
> >
> > Se supone que tanto "oración" como "oraci&oacute;n" deben ser válido con
> > utf-8...¿ o no?
> >
> Hola a todos,
> justo iba escribir un mensaje para que me aclararais dudas sobre UTF-8.
> Tengo varias webs que quiero codificarlas de esta forma, y la verdad es
> que me estoy liando cada vez más según leo manuales o tutoriales...
>
> Yo pensaba lo que dice DJ-Dom arriba, que podía escribir tranquilamente
> "oración", así tal cual, peor me encuentro que para que me lo vea
> correcto el firefox debo escribir: "oración"
>
> ¿Tengo que escribir todos mis textos así o es que estoy haciendo algo mal?
> Además de poner el meta adecuado, he comprobado que mi instalación de
> apache tenga UTF-8, y he leído que en firefox, mirando la información de
> página también te dice como se ha servido, y siempre me dice que es UTF-8.
>
> Sinceramente me estoy volviendo loca con esto.
>
> ¿Alguien me puede confirmar que si yo escribo "oración" UTF-8 lo muestra
> tal cual? Así por lo menos tengo un punto de partida. :-/
>
> Saludos y gracias
>
> Paula
> _______________________________________________
> Lista de distribución Ovillo
> Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org
> Puedes modificar tus datos o desuscribirte en la siguiente dirección:
> http://ovillo.org/mailman/listinfo/ovillo
>
_______________________________________________
Lista de distribución Ovillo
Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org
Puedes modificar tus datos o desuscribirte en la siguiente dirección: 
http://ovillo.org/mailman/listinfo/ovillo

Responder a