Christian Lohmaier wrote:
2008/8/29 Thomas Barth <[EMAIL PROTECTED]>:
Hi,
es geht um das Wort Sportplatz, dass als Beispiel für "compound words"
gelten soll. Da in der Manpage zu Hunspell nichts zu der Erweiterung j
steht,

Klar steht da nix zur Erweiterung "j", weil man die Namen für die
Regeln ja beliebig selbst wählen kann. Wenn Du das schon nicht
verstanden hast, dann gehe zurück zu "Los", ziehe keine 400 DM ein,...


Auf diesen Mist kannst du gerne in Zukunft verzichten.


muss ich hier noch einmal fragen. Das in Thunderbird mitgelieferte
Wörterbuch kennt auch kein j, welches für 0/xoc, -/zocf oder -/cz steht.

Hier: OOo-Liste, also sind die OOo-Wörtebücher maßgeblich. Was in den
Thunderbirdwörtebüchern steht interessiert mich nicht.
Wenn das Thunderbird keine Regel mit Namen/Bezeichner "j" nutzt,
braucht die natürlich auch nirgends drinstehen.


Man Junge, dann muss das auch in dem Handbuch erklärt werden!!! Ich denke, Thunderbird und OpenOffice orientieren sich an Hunspell! Also sind die Definitionen von Hunspell _maßgeblich_. Das Handbuch erinnert aber mehr an einer Sammlung von Notizen, die für die am Projekt beteiligten Entwickler gedacht sind. So, woher wissen die OpenOffice-Leute, dass es diesen Bezeichner gibt, wenn es nicht im Handbuch erwähnt wird?

Im ersten Fall wird nach Sportplatz gesucht und bei Sport gibt es
entsprechende Wandlungen, die darauf hindeuten, dass es mit einem anderen
Wortstamm verbunden werden kann. Ist es richtig, dass ich dann alle Wörter
aus dem Wörterbuch zusammenstellen muss, die eine ähnliche Erweiterung
haben, um sie dann für einen Vergleich mit "Sport" kombinieren zu können?
Dies würde ja jedesmal ein Durchlaufen des gesamten Wörterbuches bedeuten.

Mit "Erweiterung" hat das nix zu tun. Wörter kann man nur mit anderen
Wörtern verbinden, die das auch erlauben - und dann auch nur wenn das
Wort an der richtigen Stelle landet (Am Anfang, in der Mitte, am Ende)
- sprich: Wenn die Affix-Regeln es erlauben.


Du kannst leider nicht so gut erklären. Wenn jemand etwas nicht versteht, musst du dich immer zuerst fragen, habe ich es gut genug erklärt oder sind die Dokumentationen ordentlich geschrieben.


* Buchwort: Sport, Suchwort: Sportplatz Extension (5):Smij
fx: S
Wortwandlung: Sports (.)
fx: m
fx: i
fx: j
Wortwandlung: Sport0/xoc (.)
Wortwandlung: Sport-/zocf (.)
Wortwandlung: Sport-/cz (.)

Keine Ahnung, was das für eine Darstellung sein soll. Entweder du

Denken hilft. Buchwort Sport ist ein Wörterbucheintrag. Smij dürfte dir als Erweiterung wohl bekannt sein. Daraus ergeben sich Wortwandlungen. Ganz einfach. Betrachte es als Pseudocode einer Schleife.

gibts konkret die Wörterbucheinträge und die dazugehörigen
affix-Regeln an, oder besser: Gehe eine Stufe in der Entwicklung
zurück, nutze Wörterbücher/Spellchecker die das noch nicht kannten.


Nein! Wie kannst du es überbrigens wagen, dich aufgrund deines Mehrwissens in diesem Bereich über andere zu stellen? So etwas macht man nicht, ist aber typisch deutsch, deshalb nehme ich dir es nicht ganz so übel. Stell dies bitte sofort ein, wenn du daran interessiert bist, dass ich deine Antworten lese.


Sport und Platz dürfen demnach am Anfang, in der Mitte oder am Ende stehen,
also Platzsport und Sportplatz?

nicht im OOo-Wörterbuch.
Platz/ox (o=ONLYINCOMPOUND, x=COMPOUNDBEGIN) - Sportplatz wäre also
nicht als Kombination von "Sport" (ebenfalls /ox) und "Platz" möglich,
aber dafür steht "Sportplatz" auch als eigener Eintrag im Wörterbuch.
(bezieht sich alles auf die Wörterbücher, so wie sie mit der 2.4.1
ausgeliefert werden)

Aber auch in den 3er Wörterbüchern wäre das nicht erlaubt. Offenbar
ignorierst Du, daß mache Regeln Prefix und manche Regel Suffix Regeln
sind.


Da der Prefix-Kram überflüssig ist, extrahiere ich beim Laden des Wörterbuches alle Prefix-Angaben, so dass sich das Wörterbuch um ein paar tausend Einträge vergrößert. Denn ich habe keine Lust, ein Wort in beide Richtungen zu überprüfen. Beispiel unkonkret. Steht so nicht im Wörterbuch, ergibt sich aber erst durch die Erweiterungen bei konkret.

MB-Ram-Verbrauch vs. Komplexität. Speicher gibt es genug und solange die Suche nach einem Wort unter 5 ms bleibt, bin ich damit zufrieden. Das Wörterbuch in Thunderbird hat sogar 9 MB und kommt daher ohne "Schnickschnack" aus! Daran hatte ich mich zuerst orientiert, wollte mir aber noch das Wörterbuch von OpenOffice ansehen, um dann sagen zu können, was für meine Applikation besser ist.

Viele Grüße,
Thomas Barth



---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]

Antwort per Email an