Hoi allen,
In het bestand http://www.xs4all.nl/~simonbr/020705_prop.zip vind je de
voorstellen voor het bijwerken van de spellingcontrolebestanden.
Er zitten twee bestanden in. Het ene bevat de woorden die ik heb nagelopen
en zonder meer in de spellingcontrole wil overnemen. Kritiek en correcties
zijn natuurlijk welkom.
Het tweede bestand bevat een beperkt aantal woorden die m.i. niet in de
woordenlijst thuishoren, en een groter aantal woorden waarover overleg
gewenst is.
Waar het natuurlijk vooral om gaat is dat we met een zo compact mogelijke
woordenlijst zoveel mogelijk het woordgebruik van de gemiddelde
OOo-gebruiker te pakken hebben. We zullen dus moeten inschatten welke
woorden vaak of juist zelden in een OOo-document zullen voorkomen.
Het gaat in het tweede bestand o.a. om
- woorden die niet correct zijn gespeld of geen Nederlands zijn
- jargon
dit zijn woorden die slechts voor selecte groepjes OOo-gebruikers van
belang zijn (zoals chemische, medische, plantkundige termen, en woorden die
in Google geen of slechts enkele resultaten opleveren)
Als aannemelijk wordt dat woorden toch algemeen gangbaar zijn, dan kunnen
we ze alsnog opnemen.
- eigennamen
Tot nu toe zijn in principe geen eigennamen opgenomen, omdat dan algauw het
einde zoek is. Algemene voor- en achternamen zijn er gewoon veel te veel.
Voor namen van bekende personen (vooral als de juiste spelling niet voor de
hand ligt) zou het wel handig zijn, maar het is steeds de vraag hoe
houdbaar die bekendheid is. Het zou zonde zijn om de hoofdwoordenlijst te
vervuilen met namen die na verloop van tijd door vrijwel niemand meer
worden gebruikt.
We kunnen overwegen om wel eigennamen op te nemen, maar dan moeten er goede
criteria voor worden geformuleerd.
- plaatsnamen en geografische aanduidingen
Ook hier geldt dat snel het hek van de dam is. Tot nu toe is min of meer
aangehouden: namen van onafhankelijke staten, hoofdsteden daarvan, andere
Europese steden vanaf een bepaalde grootte (een half miljoen of zo),
provinciehoofdsteden van Nederland en Belgiƫ, ...
De relevantie van geografische namen hangt echter van veel meer factoren
af, zo zal er meer behoefte zijn aan namen van een aantal deelstaten van de
VS dan aan die van een onafhankelijk eilandrijkje ergens in de Stille Oceaan.
- merknamen
Deze zijn tot nu toe niet in de woordenlijst opgenomen. Ongeveer dezelfde
argumenten als bij eigennamen zijn van toepassing.
- woorden die niet bruikbaar zijn voor de spellingcontrole van OOo
Van alles dat leestekens of spaties bevat heeft het momenteel geen zin om
ze in de woordenlijst op te nemen. Voorbeelden: non-profitsector, d.w.z.,
's avonds, Den Bosch
Het punt is dat de zogenaamde break iterator van OOo de zinnen opdeelt in
"woorden" die dan aan de spellingcontrolemodule worden aangeboden.
Je kunt wel smokkelen door bijvoorbeeld "non", "profitsector", Gravenhage,
... op te nemen, maar ideaal is het niet.
Een structurele oplossing zal echter aardig wat voeten in de aarde hebben
(ik ben nog moed aan het verzamelen :)
Het is wellicht de moeite waard om woorden van bepaalde categorieƫn
(eigennamen, merknamen, etc) wel apart te verzamelen. We zouden daar dan
aanvullende woordenlijsten van kunnen maken, of naast de
standaardwoordenlijst een uitgebreide woordenlijst kunnen aanbieden. Als je
niet alles zomaar bij elkaar hebt gegooid kun je die dan flexibel
samenstellen.
Discussie over dit onderwerp op de mailinglist [EMAIL PROTECTED]
Je moet hierop zijn aangemeld, dit kan door een lege email te sturen naar
[EMAIL PROTECTED]
Vriendelijke groet,
Simon Brouwer.
>>> nl.openoffice.org <<<
---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]