<[EMAIL PROTECTED]> wrote on 01.05.04: > Du meintest am 01.05.04 um 19:11 Uhr:
[...] Schon richtig, man mu� abw�gen, was sinnvoll ist, welche Anspr�che man an das Programm hat und wieviel Aufwand man betreiben kann und will. Hilfreich ist so ein Tool auch, wenn es nicht alle theoretisch oder nur selten vorkommenden F�lle abdeckt. Aber das hier ... >> Es mu� ja auch den Zeichensatz der HTML-Mail im Content-Tag >> auswerten k�nnen (statt "ü" kann dort ja auch einfach ein >> 8bit-Zeichen stehen), und UTF-7/8-f�hig sollte es nat�rlich auch >> sein... > Man kann jedes kleine Tool so weit ausbauen, bis es ein > schwerf�lliger Bolide ist, der jede Eventualit�t abzufangen trachtet ... halte ich nicht f�r eine unwahrscheinliche Eventualit�t, sondern 8bit-Zeichen in HTML kommen tagt�glich und permanent vor. Zumindest in Webseiten, HTML-Mails habe ich mir nie genau angesehen (solange es englische UCE ist, werden 8bit-Zeichen wieder seltener sein). Und da ist man jetzt an der kritischen Stelle: Der Aufwand steigt proportional mit der Anzahl der zu unterst�tzenden Zielzeichens�tze. Das l�uft dann schon fast auf eine Art 'recode' hinaus. Das hat mich auch bei den Tools gewundert, die ich mir auf die Schnelle besorgt hatte: Bei keinem wurde ein Wort dazu gesagt, in welchen Zielzeichensatz �berhaupt konvertiert wird bzw. wie man das beeinflussen k�nnte. Das Zusammenspiel mit XP mu� man nochmal genauer unter die Lupe nehmen. Klar ist, da� XP bei Multiparts den Zeichensatz im Content-Type:-Header des jeweiligen Nachrichtenteils auswertet, aber nat�rlich nicht einen evtl. im HTML-Body deklarierten Zeichensatz (und ich wei� auch nicht, ob da sowas �berhaupt vorkommen kann, da mu� man mal ein paar "vern�nftig" gebaute HTML-Mails checken). Deine Art der Einbindung hab' ich mir auch noch nicht n�her angesehen, aber ich nehme mal an, da� eine Charset-Konvertierung seitens XP an der Stelle evtl. schon stattgefunden hat. Wenn da kein Zeichensatz im Content-Type: deklariert ist (was bei HTML-Mails die Regel zu sein scheint), dann sind die 8bit-Zeichen also evtl. schon "kaputt". Ich hab' das im Moment auch nicht so aus dem Kopf pr�sent. Das nur mal als ein paar unvollst�ndige Hinweise, was man noch untersuchen sollte. [Nicht alle Tags entfernen?] >> ----------8<---------- >> <a href="http://www.yol3.us/cs/lz/">Start now!</a><br> >> ----------8<---------- [...] >> Auch sowas auszuwerten und entsprechend aufbereitet darzustellen, >> ist nicht trivial. > M�glich; ich w�rde sagen, es ist trivial, aber aufwendig und u. U. > auch kompliziert. Ok, oder so. :) Michael ------------------------------------------------------------------------ FreeXP Support-Mailingliste [EMAIL PROTECTED] http://www.freexp.de/cgi-bin/mailman/listinfo/support-list
