On 21.04.06 11:54:48, Gerhard Wolfstieg wrote: > Bjoern Schliessmann am Thu, 20 Apr 2006 20:50:10 +0200: > > Thilo Engelbracht wrote: > > > > > Content-Type: text/plain; charset=unknown-8bit > > > > Doofe Frage am Rande: Was ist das eigentlich für ein Charset? > > Hallo, > > auf die Gefahr hin, daß bei solchen Fragen es immer welche gibt, die bei > der Beantwortung zurecht Ungenauigkeiten bemängeln,
Na dann wollen wir mal ;-) > sind Char(acter)Sets > Definitionen für die Belegung von Tabellen mit Buchstaben und anderen > Zeichen. ASCII ist eine solche Definition, bei der z. B. am 49. Platz > (Index 48) die Ziffer Null hingehört. Soweit richtig (wobei ich jetzt nicht nachschaue ob index48 == "0" ist). > ISO-8859-15 ist eine Variation > davon mit dem Euro-Zeichen, Das ist aber grob falsch, ISO-8859-15 ist eine Variation von ISO-8859-1, wobei das Waehrungszeichen durch das € Symbol ausgetauscht wurde. ISO-8859-1 ist aber bereits eine Erweiterung von ASCII, waehrend ASCII naemlich nur 7 Bit verwendet nutzt ISO-8859-1 8 Bit und kann deswegen mehr Zeichen darstellen. Dieser Umstand spielt dann naemlich beim folgenden eine Rolle. > utf8 sind Charsets mit zum Teil mehr als 8 > Bits für die Unterscheidung der (Plätze für) Zeichen. Etwas besser formuliert waere: utf8 ist ein Charset bei dem alle Zeichen aus mindestens 8 Bit bestehen, einige aber aus 16 oder sogar 24 Bit (32 weiss ich grad nicht aus dem FF). Das besondere an UTF-8 ist das er in den ersten 128 Zeichen exakt mit ASCII uebereinstimmt, deswegen bekommt man ja beim Mischen von ISO-8859-1 und utf-8 Probleme mit Umlauten und anderen Zeichen die oberhalb von 127 liegen (in ISO-8859-1) Andreas -- Your goose is cooked. (Your current chick is burned up too!) -- Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/ Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED] mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)