Michael Gattinger writes: > Am 22.04.2011 13:12, schrieb Karl Köckemann: > > Soeben verlief die Suche nach einem Konverter von MediaWiki-Markup zu Text > > erfolgreich. > > > > Mit dem unter GNU-Lizenz stehenden Programm läßt sich aus dem > > Wikipedia-XML-Dump ein Korups erstellen: > > http://medialab.di.unipi.it/wiki/Wikipedia_Extractor > > könntest du mir bitte mal so 10 MB Ergebnis per E-Mail zukommen lassen?
Sowohl den modifizierten Quelltext, als auch die ersten 10 MB des Ergebnisses sind zugesandt. Was schon einmal auffällt: Aufzählungen müssen noch entfernt werden und auch auf {{...}} folgende Kommata mit Leerstelle. Mit netten Grüßen Karl