Hola, Tae. Ignoro la diferencia de rendimiento de mysql entre usar una codificación u otra. Dices que conoces UTF-8, así que lo que cuento a continuación lo dirijo a quien lo desconozca:
Mi recomendación es que mires al futuro y uses el juego de caracteres UTF-8. En cuanto al almacenamiento, un texto con caracteres del ASCII original de 7bits ocupa lo mismo tanto en ISO 8859-1 (Latin-1) como en utf-8: un byte por carácter. Es más, si el archivo utf-8 no incluye la marca BOM, entonces son iguales. Cuando añades caracteres como la ñ, las vocales acentuadas y otros símbolos fuera del ASCII estándar, entonces el archivo codificado en uft-8 es mayor que el codificado en Latin-1. Para el cotejamiento de la base de datos, elige utf_spanish_ci. El cotejamiento no tiene nada que ver con la representación interna de los caracteres, sino con la ordenación. Al establecer el cotejamiento en español, estás diciendo a mysql que la 'ñ' está entre la 'n' y la 'o', y que la 'á' (con tilde) es equivalente a la 'a' (sin tilde) en vez de estar después de la 'z' (como sucedería con un cotejamiento diferente). Ten especial cuidado en editar en UTF-8 sin el BOM. El BOM o Byte Order Mark, en el caso de UTF-8 sólo sirve para indicar que el fichero está en unicode. Es una secuencia de tres bytes al principio del documento (EF BB BF) y es especialmente problemático con las aplicaciones que no entienden unicode. Por ejemplo, la función header() de php no funcionaría. Hay varias incidencias que te pueden frustrar cuando trabajes UTF-8. Por ejemplo, si el servidor web está configurado para enviar en la cabecera http la codificación entonces el navegador hará caso omiso a la meta etiqueta indicada en el código html (esto es, si tú escribes en tu código que la codificación es UTF-8 y el servidor web indica que es Latin-1, el navegador creerá al servidor). Otro fallo muy común es indicar utf-8 en mysql y en la metaetiqueta del código html, pero guardar el archivo con formato ANSI en vez de utf-8. Es como usar un traductor de inglés para traducir un texto escrito en francés. Lo mejor es que agarres el toro por lo cuernos y codifiques en utf-8. Así estarás preparado para cuando tengas que trabajar en unicode. Si tienes algún tropiezo siempre puedes usar esta lista. Saludos. 2009/4/18 Tae Sandoval Murgan <taeci...@gmail.com> > Gracias a ambos por las respuestas :) Conozco bien las capacidades de > UTF-8 ya que tambié es la codificación de mi SO (Arch Linux). La > pregunta va más por el lado de si vale la pena usarlo para una web que > usará cuando mucho 2 idiomas y no recibirá trackbacks o similares. > Quizás sí, quizás la sobrecarga del servidor y el espacio en disco no > sea mucho mayor que la utilizada por ISO-8859. O quizás en lugar de > usar utf-unicode-ci sea más conveniente utf-spanish-ci o spanish2-ci. > _______________________________________________ > Lista de distribución Ovillo > Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org > Puedes modificar tus datos o desuscribirte en la siguiente dirección: > http://lists.ovillo.org/mailman/listinfo/ovillo > _______________________________________________ Lista de distribución Ovillo Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org Puedes modificar tus datos o desuscribirte en la siguiente dirección: http://lists.ovillo.org/mailman/listinfo/ovillo