<[EMAIL PROTECTED]> wrote on 01.05.04:

> Du meintest am 01.05.04 um 19:11 Uhr:

[...]

Schon richtig, man mu� abw�gen, was sinnvoll ist, welche Anspr�che man
an das Programm hat und wieviel Aufwand man betreiben kann und will.

Hilfreich ist so ein Tool auch, wenn es nicht alle theoretisch oder nur
selten vorkommenden F�lle abdeckt.

Aber das hier ...

>> Es mu� ja auch den Zeichensatz der HTML-Mail im Content-Tag
>> auswerten k�nnen (statt "&uuml;" kann dort ja auch einfach ein
>> 8bit-Zeichen stehen), und UTF-7/8-f�hig sollte es nat�rlich auch
>> sein...

> Man kann jedes kleine Tool so weit ausbauen, bis es ein
> schwerf�lliger Bolide ist, der jede Eventualit�t abzufangen trachtet

... halte ich nicht f�r eine unwahrscheinliche Eventualit�t, sondern
8bit-Zeichen in HTML kommen tagt�glich und permanent vor.  Zumindest in
Webseiten, HTML-Mails habe ich mir nie genau angesehen (solange es
englische UCE ist, werden 8bit-Zeichen wieder seltener sein).

Und da ist man jetzt an der kritischen Stelle: Der Aufwand steigt
proportional mit der Anzahl der zu unterst�tzenden Zielzeichens�tze.   
Das l�uft dann schon fast auf eine Art 'recode' hinaus.

Das hat mich auch bei den Tools gewundert, die ich mir auf die Schnelle
besorgt hatte: Bei keinem wurde ein Wort dazu gesagt, in welchen
Zielzeichensatz �berhaupt konvertiert wird bzw. wie man das beeinflussen
k�nnte.

Das Zusammenspiel mit XP mu� man nochmal genauer unter die Lupe nehmen.   
Klar ist, da� XP bei Multiparts den Zeichensatz im Content-Type:-Header
des jeweiligen Nachrichtenteils auswertet, aber nat�rlich nicht einen
evtl. im HTML-Body deklarierten Zeichensatz (und ich wei� auch nicht, ob
da sowas �berhaupt vorkommen kann, da mu� man mal ein paar "vern�nftig"
gebaute HTML-Mails checken).

Deine Art der Einbindung hab' ich mir auch noch nicht n�her angesehen,
aber ich nehme mal an, da� eine Charset-Konvertierung seitens XP an der
Stelle evtl. schon stattgefunden hat.  Wenn da kein Zeichensatz im
Content-Type: deklariert ist (was bei HTML-Mails die Regel zu sein
scheint), dann sind die 8bit-Zeichen also evtl. schon "kaputt".  Ich
hab' das im Moment auch nicht so aus dem Kopf pr�sent.

Das nur mal als ein paar unvollst�ndige Hinweise, was man noch
untersuchen sollte.


[Nicht alle Tags entfernen?]
>> ----------8<----------
>> <a href="http://www.yol3.us/cs/lz/";>Start now!</a><br>
>> ----------8<----------

[...]

>> Auch sowas auszuwerten und entsprechend aufbereitet darzustellen,
>> ist nicht trivial.

> M�glich; ich w�rde sagen, es ist trivial, aber aufwendig und u. U.
> auch kompliziert.

Ok, oder so. :)


        Michael
------------------------------------------------------------------------
FreeXP Support-Mailingliste
[EMAIL PROTECTED]
http://www.freexp.de/cgi-bin/mailman/listinfo/support-list

Antwort per Email an