Re: [de-dev] Hunspell Wörterbücher

2006-07-22 Diskussionsfäden Andre Schnabel

Hi,

Guido Ostkamp schrieb:

...
Ergo mußte es also noch unveröffentlichte Quellen geben. Und da ich davon 
ausging, daß alles, was in OOo verwendet wird, als open-source erhältlich 
sein muß und abgelegt ist, dachte ich, das Projekt hätte das getrennt 
gespeichert.


Nun scheint es aber, wenn ich Dich richtig verstanden habe, so zu sein, 
daß hier (noch) closed Source Bestandteile verwendet worden sind, mit 
anderen Worten, ich kann leider nichts machen.
  


Einzig und allein kann dir das wohl Björn Jacke beantworten. Wir 
übernehmen 1:1 seine Wörterbücher (übrigens nicht aufgrund der GPL 
sondern aufgrund seiner Erleubnis, diese Wörterbücher in Programmen, die 
ODF als Standardformat verwenden, einsetzen zu dürfen).


Allerdings hat Björn seine Wörterbücher auch unter GPL lizenziert. Wenn 
Du der Meinung bist, es fehlen Quellcodes, solltest du ihn fragen, wo 
diese sind. Aufgrund der Lizenz ist er verpflichtet, diese zur Verfügung 
zu stellen.


André

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [de-dev] Hunspell Wörterbücher

2006-07-21 Diskussionsfäden Guido Ostkamp
Hallo Andre, *,

 Nein, die Wörterbücher stehen nicht im cvs, sie werden extern gepflegt.

genau das habe ich befürchtet. Offenbar steht nur das Ergebnis (=Compilat) 
drin (zumindest im Sourcecode-Tarball auf der PrOOo-Box).

 Björn *ist* der Autor der Hunspell-Wörterbücher. Ich finde bei ihm auch genau 
 die Hunspell-Wörterbücher, die mit OOo geliefert werden:
 http://j3e.de/hunspell/

An dieser Stelle stehen die wohl Compilate, wie sie dann später von OOo 
benutzt werden. Die kann man aber nicht mehr zurückverwandeln, denn es 
sind keine bloßen Wortlisten.

 im neuesten ispell-Snapshot sind auch verweise auf hunspell drin 
 http://j3e.de/ispell/igerman98/dict/igerman98-snapshot20051113.tar.bz2

 wobei ich nicht verstehe, was Quellen für das Wörterbuch sein sollen.

Aus diesen igerman-tarballs, die die Quellen enthalten, werden durch 
Makefile Aufruf (was eine ganze Toolchain anwirft) dann Compilate 
erzeugt, d.h. die Endfassungen für aspell, myspell, hunspell usw.

Die Quellen sind Dateien wie etwa diese hier ...

abkuerz2.txt   elektronik.txt marken.txt  vornamen.txt
abkuerzpunkt.txt   end-compound.txt   marker  vornamen2.txt
abkuerzungen.txt   fixwords.txt.old   mathematik.txt  worte-a.txt
adjektive-a.txtfranzoesisch.txt   medizin.txt worte-n.txt
adjektive-n.txtgeografie.txt  namen.txt   worte-neu.txt
adjektive.txt  geografie2.txt namen2.txt  worte-zusammen.txt
alphabeta.txt  helvetismen-de_ch.txt  orgabk.txt  worte.txt
anglizismen-a.txt  infoabk.txtroemisch.txtworte2.txt
anglizismen-n.txt  informatik.txt seltenes.txtzahlen-ordinal.txt
anglizismen.txtklein-a.txttechnik.txt zahlen.txt
austriazismen.txt  klein-comp.txt typos   zusammen-gross.txt
blacklist  klein-n.txtverben-a.txtzusammen-klein.txt
compeng.txtklein.txt  verben-n.txt
compound.txt   latein.txt verben.txt

... die nach Kategorien etc. aufgeteilt sind. Außerdem gibt es Endungen 
auf -a.txt für alte Rechtschreibung und -n.txt für neue 
Rechtschreibung neben Spezialformen für den österreichischen Sprachraum 
usw.

Da ich im Usenet zwar Tips erhielt, wie ich ein schon existierendes 
myspell-Wörterbuch mit nur der alten deutscher Rechtschreibung 
installieren könnte, gleichzeitig aber darauf hingewiesen wurde, dies sei 
schon lange nicht mehr upgedated worden, wollte ich mir eine top neue 
Version mit nur alter deutscher Rechtschreibung selbst basteln (die 
aktuellen Kombi-Wörterbücher bringen mir nichts, denn die lassen die neue 
deutsche Rechtschreibung durch, und die will ich nicht haben).

Bei den Experimenten mit den dort downloadbaren Ständen hat sich aber 
gezeigt. daß die erzeugten Wörterbuch-Dateien deutlich kleiner waren als 
die in OOo enthaltenen.

Ergo mußte es also noch unveröffentlichte Quellen geben. Und da ich davon 
ausging, daß alles, was in OOo verwendet wird, als open-source erhältlich 
sein muß und abgelegt ist, dachte ich, das Projekt hätte das getrennt 
gespeichert.

Nun scheint es aber, wenn ich Dich richtig verstanden habe, so zu sein, 
daß hier (noch) closed Source Bestandteile verwendet worden sind, mit 
anderen Worten, ich kann leider nichts machen.

Gruß,

Guido
-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]

Re: [de-dev] Hunspell Wörterbücher

2006-07-20 Diskussionsfäden Erich Christian

Hi Guido

Guido Ostkamp schrieb:

Weiß jemand, wo ich die Sourcen der deutschen Wörterbücher von OOo 2.0.3 
finde?


Keine Ahnung, aber als ichs noch wusste, hab ichs mir runtergeladen - 
kann dir also hunspell_UNO_1.1.2_OOo_2.0_Windows.zip schicken, wenns 
dringend (und für win) ist.


liebe Grüße
erich

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [de-dev] Hunspell Wörterbücher

2006-07-20 Diskussionsfäden Jens Nürnberger

Hallo Guido,

Weiß jemand, wo ich die Sourcen der deutschen Wörterbücher von OOo 2.0.3 finde? 


Eventuell hier:
http://sourceforge.net/project/showfiles.php?group_id=143754package_id=157912
(unter der Annahme das Erich seine Datei aktuell ist - nicht falsch 
verstehen *g*)


Gruss Jens

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]



Re: [de-dev] Hunspell Wörterbücher

2006-07-20 Diskussionsfäden Guido Ostkamp

Hallo Jens und Erich und *,

Weiß jemand, wo ich die Sourcen der deutschen Wörterbücher von OOo 
2.0.3 finde?


Eventuell hier: 
http://sourceforge.net/project/showfiles.php?group_id=143754package_id=157912 
(unter der Annahme das Erich seine Datei aktuell ist - nicht falsch 
verstehen *g*)


danke, aber Ihr habt mich falsch verstanden. Ich suche weder eine 
compilierte Hunspell Library (DLL) oder die Sourcen des Hunspell Moduls, 
sondern die des Wörterbuches, d.h. dessen Einträge.


Theoretisch gibt es das unter http://j3e.de/ispell/igerman98/dict, aus 
der Distribution werden dann sozusagen die Dateien de_DE.dic usw. durch 
eine Art Compilierung erzeugt.


Nur ... die Sourcen dort sind alt und was daraus entsteht ist volumenmäßig 
nicht identisch mit dem was OOo (compiliert) mitliefert (die OOo Files 
sind deutlich größer).


Den Autor habe ich schon gefragt, aber leider nur die Info erhalten, daß 
ispell/igerman98 z.Zt. eine Baustelle wäre und nicht veröffentlicht 
werden könnte.


Da bei in OOo in den Files nur steht, daß die OOo Version auf den o.g. 
Dingen aufbaut, dachte ich, OOo hätte vielleicht eine eigene, d.h. 
weiterentwickelte Version. Die müßte dann aber irgendwo im CVS etc. 
stehen.


Und diese Location suche ich, wenn es sie gibt. Vielleicht wurde aber auch 
nur eine private Version des Autors übernommen (was mich aber etwas 
wundern würde).


Gruß,

Guido
-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]

Re: [de-dev] Hunspell Wörterbücher

2006-07-20 Diskussionsfäden Andre Schnabel

Hi,

Guido Ostkamp schrieb:


Theoretisch gibt es das unter http://j3e.de/ispell/igerman98/dict, 
aus der Distribution werden dann sozusagen die Dateien de_DE.dic 
usw. durch eine Art Compilierung erzeugt.


Nur ... die Sourcen dort sind alt und was daraus entsteht ist 
volumenmäßig nicht identisch mit dem was OOo (compiliert) mitliefert 
(die OOo Files sind deutlich größer).


Den Autor habe ich schon gefragt, aber leider nur die Info erhalten, 
daß ispell/igerman98 z.Zt. eine Baustelle wäre und nicht 
veröffentlicht werden könnte.


Da bei in OOo in den Files nur steht, daß die OOo Version auf den o.g. 
Dingen aufbaut, dachte ich, OOo hätte vielleicht eine eigene, d.h. 
weiterentwickelte Version. Die müßte dann aber irgendwo im CVS etc. 
stehen.

Nein, die Wörterbücher stehen nicht im cvs, sie werden extern gepflegt.




Und diese Location suche ich, wenn es sie gibt. Vielleicht wurde aber 
auch nur eine private Version des Autors übernommen (was mich aber 
etwas wundern würde).


Björn *ist* der Autor der Hunspell-Wörterbücher. Ich finde bei ihm auch 
genau die Hunspell-Wörterbücher, die mit OOo geliefert werden:

http://j3e.de/hunspell/

im neuesten ispell-Snapshot sind auch verweise auf hunspell drin
http://j3e.de/ispell/igerman98/dict/igerman98-snapshot20051113.tar.bz2

wobei ich nicht verstehe, was  Quellen für das Wörterbuch sein sollen.

André

-
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]