Jörg Schmidt wrote:

> Hallo,
> 
> Mathias Bauer schrieb:
>> > (mir ist klar das das RTF auf gewisse MS-Spezialitäten
>> verzichtet und
>> > deshalb den Austausch verbessern sollte,
>> Wie kommst du darauf?
> 
> eigentlich weil ich es annahm, mich aber zugegeben jetzt in der Lage
> befinde auf die Schnelle kein Beispiel zu finden was meine Annahme
> belegt, wo Du sie hinterfragst.
> 
> Allerdings gibt es dann doch eine deduktive Schlussfolgerung:
> wenn RTF und DOC 'exakt das gleiche Format' sind (bezüglich der Inhalte
> die sie speichern können), dürften doch unsere Probleme hinsichtlich
> 100%ig funktionierender doc-Filter nur von geringerem Umfang sein. Warum
> sind sie es nicht?

Weil beide Filter von verschiedenen Entwicklern zu verschiedenen Zeiten
entwickelt wurden, die diese Erkenntnis damals wohl nicht besaßen. Wir
werden das aber ändern. In nicht allzu ferner Zukunft werden alle drei
Word-Formate (rtf,doc,docx) über den gleichen Importer laufen. Nur die
Tokenizer sind unterschiedlich. Die Importqualität sollte also (minus
Bugs ;-) gleich sein. Wenn wir nicht durch das docx-Format gezwungen
wären, Mannjahre zu verpulvern, wäre der RTF-Filter schon längst auf Stand.

> Diese Frage zielt nicht dahin anzudeuten die doc-Filter seien schlecht,
> ganz und garnicht, nur wir wissen beide das die nicht 100%ig
> funktionierenden doc-Filter ein wesentliches Problem für die Verbreitung
> von OOo sind - falls ich wirklich wörtlich annehmen soll das RTF und DOC
> 'exakt das gleiche Format' sind, frage ich mich warum diese Situation
> besteht(*), es sei denn RTF wäre weitaus properitärer als ich das bisher
> annahm.

Es ist zu 100% proprietär. Word verwendet RTF sogar als Austauschformat
für externe Filter. RTF ist eine 1:1-Abbildung von dem, was Word im
Speicher hat (genauso wie doc). Der Hauptunterschied ist, dass man RTF
(ähnlich wie XML) etwas besser lesen kann, weil man es als Textdatei
laden kann.

> Umfasst jedoch RTF inhaltlich alles was doc umfasst besteht auf
> theoretischer Ebene die Chance für 100%ige Filter für doc. Ist Letzteres
> so?

Nein. Selbst wenn man das andere Format buchstabengetreu kennt, gibt es
immer noch genug Dinge, die man erst versteht, wenn man den Source code
liest (bzw. durch Testen herausfindet aka "Reverse Engineering", was
gemeint ist). Das sind nicht nur die berüchtigten Flags a la "den Text
bitte behandeln wie Word 95", sondern einiges mehr.

Und selbst wenn alles perfekt definiert ist, wirst du bei allen
hinreichend komplexen Applikationen (Word und Writer dürften das sein)
100% nur erreichen, wenn beide Applikationen exakt das gleiche interne
Modell verwenden.

Ciao,
Mathias

-- 
Mathias Bauer (mba) - Project Lead OpenOffice.org Writer
OpenOffice.org Engineering at Sun: http://blogs.sun.com/GullFOSS
Please don't reply to "[EMAIL PROTECTED]".
I use it for the OOo lists and only rarely read other mails sent to it.

---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]

Reply via email to