Hola, Tae. Ignoro la diferencia de rendimiento de mysql entre usar una
codificación u otra. Dices que conoces UTF-8, así que lo que cuento a
continuación lo dirijo a quien lo desconozca:

Mi recomendación es que mires al futuro y uses el juego de caracteres UTF-8.

En cuanto al almacenamiento, un texto con caracteres del ASCII original de
7bits ocupa lo mismo tanto en ISO 8859-1 (Latin-1) como en utf-8: un byte
por carácter. Es más, si el archivo utf-8 no incluye la marca BOM, entonces
son iguales. Cuando añades caracteres como la ñ, las vocales acentuadas y
otros símbolos fuera del ASCII estándar, entonces el archivo codificado en
uft-8 es mayor que el codificado en Latin-1.

Para el cotejamiento de la base de datos, elige utf_spanish_ci. El
cotejamiento no tiene nada que ver con la representación interna de los
caracteres, sino con la ordenación. Al establecer el cotejamiento en
español, estás diciendo a mysql que la 'ñ' está entre la 'n' y la 'o', y que
la 'á' (con tilde) es equivalente a la 'a' (sin tilde) en vez de estar
después de la 'z' (como sucedería con un cotejamiento diferente).

Ten especial cuidado en editar en UTF-8 sin el BOM. El BOM o Byte Order
Mark, en el caso de UTF-8 sólo sirve para indicar que el fichero está en
unicode. Es una secuencia de tres bytes al principio del documento (EF BB
BF) y es especialmente problemático con las aplicaciones que no entienden
unicode. Por ejemplo, la función header() de php no funcionaría.

Hay varias incidencias que te pueden frustrar cuando trabajes UTF-8. Por
ejemplo, si el servidor web está configurado para enviar en la cabecera http
la codificación entonces el navegador hará caso omiso a la meta etiqueta
indicada en el código html (esto es, si tú escribes en tu código que la
codificación es UTF-8 y el servidor web indica que es Latin-1, el navegador
creerá al servidor). Otro fallo muy común es indicar utf-8 en mysql y en la
metaetiqueta del código html, pero guardar el archivo con formato ANSI en
vez de utf-8. Es como usar un traductor de inglés para traducir un texto
escrito en francés.

Lo mejor es que agarres el toro por lo cuernos y codifiques en utf-8. Así
estarás preparado para cuando tengas que trabajar en unicode. Si tienes
algún tropiezo siempre puedes usar esta lista.

Saludos.


2009/4/18 Tae Sandoval Murgan <taeci...@gmail.com>

> Gracias a ambos por las respuestas :) Conozco bien las capacidades de
> UTF-8 ya que tambié es la codificación de mi SO (Arch Linux). La
> pregunta va más por el lado de si vale la pena usarlo para una web que
> usará cuando mucho 2 idiomas y no recibirá trackbacks o similares.
> Quizás sí, quizás la sobrecarga del servidor y el espacio en disco no
> sea mucho mayor que la utilizada por ISO-8859. O quizás en lugar de
> usar utf-unicode-ci sea más conveniente utf-spanish-ci o spanish2-ci.
> _______________________________________________
> Lista de distribución Ovillo
> Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org
> Puedes modificar tus datos o desuscribirte en la siguiente dirección:
> http://lists.ovillo.org/mailman/listinfo/ovillo
>
_______________________________________________
Lista de distribución Ovillo
Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org
Puedes modificar tus datos o desuscribirte en la siguiente dirección: 
http://lists.ovillo.org/mailman/listinfo/ovillo

Responder a