Re: Universaler Textkonverter?
On 25.Aug 2004 - 00:45:05, Peter Holm wrote: > On Tue, 24 Aug 2004 22:10:15 +0200, Andreas Pakulat <[EMAIL PROTECTED]> > wrote: > ja, die kenn ich, ich suche nach einem Alleskönner. Das ist aber nicht die Idee bei GNU/Linux, denn wir wollen moeglichst kleine feine Tools die genau 1 Aufgabe sehr gut erledigen und die ausserdem kombinierbar sind. Und ein wrapper um die verschiedenen Konverter zu basteln sollte kein so grosses Problem sein. > Ich bin einfach nur einigermassen entsetzt darüber, dass es trotz der > geballten Intelligenz, die heutzutage in den Unis und sonstigen > IT-Zentralen herumsitzt, immer noch so ein Chaos in Sachen Text und > Formatierung existiert. Docbook, Openoffice, Abiword, proprietäre > Formate, Wiki Markup, Xhtml, teX, pdf... und alle zueinander nur > begrenzt kompatibel. Grausam. Wirklich peinlich für die ganze IT > Branche. Es braucht einfach keiner, wenn ich ein Word-Dokument kriege oeffne ich das mit OOo und bearbeite es, drucke es aus oder konvertiere es eventuell noch in ein pdf. Wenn ich den Text in eine ascii-Datei haben will mache ich dass dann mittels Copy&Paste. Bei HTML ist das natuerlich nicht ganz so einfach, aber es ist ja auch kein problem mal fix html2txt einzutippen. > Mir ist klar, dass genau deshalb XML existiert. Aber das gibt es nun > schon eine ganze Weile, und wo ist er jetzt, der universale > Textkonverter? Müsste doch eigentlich schon fertig sein. Also OOo's Format ist XML und docbook kann man doch auch in XML umwandeln (oder irre ich mich da grad?), damit hast du doch alles was du brauchst oder? Was du nun vielleicht noch brauchst ist ein xml2xml converter der die eine in die andere DTD/XML-Schema uebersetzt. > Es ist doch eine ungeheure Verschwendung von Energie und Potential, > dass sich jeder einzelne User erneut durch dieses Chaos von > Textformaten und deren Konvertierung prügeln muss, und letztlich keine > wirklich befriedigende Lösung zu finden ist... wie sinnvoll könnten > die Menschen Ihre zeit nutzen... ?? Das verstehe ich nciht so ganz, die wenigsten User wollen aus einem *doc den Text rausholen und kriegen es nciht per Copy&Paste hin. docbook wird ja wohl von Doku-Schreibern benutzt und die kennen die noetigen Tools wohl auch. Was pdf angeht: Das will man i.A. nur ausdrucken oder am Bildschirm betrachten, und fuer Textpassagen gibts wiederum Copy&Paste. > Also, Informatikstudenten dieser Welt, es gibt wirklich noch Lorbeeren > zu ernten!!! Nicht wirklich, die Tools existieren soweit schon, alles was man braucht ist ein Wrapper der allgemeine Optionen "uebersetzt" fuer das jeweilige Tool. > Musste jetzt nur mal etwas herumstänkern. Hatte gerade wieder was mit > Textformaten zu tun und stosse immer wieder darauf, wie grausam > primitiv die Computertechnik heutzutage noch ist in sehr fundamentalen > Bereichen... man kann nur hoffen, dass Open Source die Entwicklung > beschleunigen wird... Beschreib doch mal das Problem. Andreas -- I've run DOOM more in the last few days than I have the last few months. I just love debugging ;-) (Linus Torvalds) -- Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/ Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED] mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)
Re: Universaler Textkonverter?
Am Dienstag 24 August 2004 19:44 schrieb Peter Holm: > Hi, > > gibt es einen universalen Textkonverter? Für "alle" Formate? Zumindest > die wichtigsten, inkl. swx, pdf, html, xhtml, docbook, doc, etc. ??? Hi, vielleicht kannst du openoffice, das die meisten formate kann, per command line dazu bewegen, statt zu starten, eine konversion durchzuführen? --> man oowriter außerdem konnte ich die folgenden tools per apt-cache search finden -- ansonsten such mal mit google nach "doc2sxw" oder "rtftohtml" usw. catdoc - MS-Word to TeX or plain text converter linuxdoc-tools - SGML converters for the LinuxDoc DTD only. sgmltools-lite - convert DocBook SGML source into HTML using DSSSL trang - Multi-format XML schema converter based on RELAX NG txt2html - Text to HTML converter wpd2sxw - WordPerfect to OpenOffice.org converter tth - TeX/LaTeX to HTML converter xmlto - XML-to-any converter wp2x - WordPerfect 5.x to whatever converter axkit-language-htmldoc - AxKit module for converting XHTML into PDF using HTMLDOC debiandoc2dbxml - DebianDoc to DocBook XML converter unrtf - RTF to other formats converter a2ps - GNU a2ps - 'Anything to PostScript' converter and pretty-printer Mit google findest du sicher noch mehr... Gruß rUdi
Re: Universaler Textkonverter?
On Tue, 24 Aug 2004 22:10:15 +0200, Andreas Pakulat <[EMAIL PROTECTED]> wrote: >Hmm, also weder pdf noch doc oder swx sind Texte, sie enthalten Text. Stimmt! 100% korrekt! >Willst du diesen extrahieren? Dafuer gibts AFAIK Tools, frag doch >Google mal nach pdf2txt oder doc2txt ja, die kenn ich, ich suche nach einem Alleskönner. >Mit apt-cache search docbook findest du bestimmt was zu docbook und >auch um daraus html oder pdf oder sonstwas zu erzeugen. Ja klar findet man auch für docbook was, aber eben nur für docbook. >Du solltest auch daran denken dass manche der Konvertierungen >verlustbehaftet sind, d.h. du verlierst eventuell Schriften oder >Formatierungen. Ja, das ist auch ein ganz, ganz grosses Problem. Ich hab mich vielleicht nicht korrekt ausgedrückt, bzw. hätte UNIVERSAL betonen sollen. Ich bin einfach nur einigermassen entsetzt darüber, dass es trotz der geballten Intelligenz, die heutzutage in den Unis und sonstigen IT-Zentralen herumsitzt, immer noch so ein Chaos in Sachen Text und Formatierung existiert. Docbook, Openoffice, Abiword, proprietäre Formate, Wiki Markup, Xhtml, teX, pdf... und alle zueinander nur begrenzt kompatibel. Grausam. Wirklich peinlich für die ganze IT Branche. Mir ist klar, dass genau deshalb XML existiert. Aber das gibt es nun schon eine ganze Weile, und wo ist er jetzt, der universale Textkonverter? Müsste doch eigentlich schon fertig sein. Es ist doch eine ungeheure Verschwendung von Energie und Potential, dass sich jeder einzelne User erneut durch dieses Chaos von Textformaten und deren Konvertierung prügeln muss, und letztlich keine wirklich befriedigende Lösung zu finden ist... wie sinnvoll könnten die Menschen Ihre zeit nutzen... Also, Informatikstudenten dieser Welt, es gibt wirklich noch Lorbeeren zu ernten!!! Musste jetzt nur mal etwas herumstänkern. Hatte gerade wieder was mit Textformaten zu tun und stosse immer wieder darauf, wie grausam primitiv die Computertechnik heutzutage noch ist in sehr fundamentalen Bereichen... man kann nur hoffen, dass Open Source die Entwicklung beschleunigen wird... Dennoch: sollte es den universalen Text-FORMAT-Konverter doch geben und ich hab ihn bisher verpasst, bitte nochmal melden. Wenn das ansonsten ein gelangweiltes Programmiergenie lesen sollte, das gerade nicht weiss, was es tun soll, bitte mach schon mal ein Projekt bei sf.net auf... ;) Peter -- Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/ Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED] mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)
Re: Universaler Textkonverter?
On 24.Aug 2004 - 19:44:02, Peter Holm wrote: > Hi, > > gibt es einen universalen Textkonverter? Für "alle" Formate? Zumindest > die wichtigsten, inkl. swx, pdf, html, xhtml, docbook, doc, etc. ??? > > ür die Kommandozeile? Oder als Library? Oder beides? Hmm, also weder pdf noch doc oder swx sind Texte, sie enthalten Text. Willst du diesen extrahieren? Dafuer gibts AFAIK Tools, frag doch Google mal nach pdf2txt oder doc2txt Mit apt-cache search docbook findest du bestimmt was zu docbook und auch um daraus html oder pdf oder sonstwas zu erzeugen. Du solltest auch daran denken dass manche der Konvertierungen verlustbehaftet sind, d.h. du verlierst eventuell Schriften oder Formatierungen. Andreas -- What no spouse of a writer can ever understand is that a writer is working when he's staring out the window. -- Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/ Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED] mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)
Universaler Textkonverter?
Hi, gibt es einen universalen Textkonverter? Für "alle" Formate? Zumindest die wichtigsten, inkl. swx, pdf, html, xhtml, docbook, doc, etc. ??? ür die Kommandozeile? Oder als Library? Oder beides? Danke! Peter -- Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/ Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED] mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)