Hoi allen,

In het bestand http://www.xs4all.nl/~simonbr/020705_prop.zip vind je de voorstellen voor het bijwerken van de spellingcontrolebestanden.

Er zitten twee bestanden in. Het ene bevat de woorden die ik heb nagelopen en zonder meer in de spellingcontrole wil overnemen. Kritiek en correcties zijn natuurlijk welkom.

Het tweede bestand bevat een beperkt aantal woorden die m.i. niet in de woordenlijst thuishoren, en een groter aantal woorden waarover overleg gewenst is.

Waar het natuurlijk vooral om gaat is dat we met een zo compact mogelijke woordenlijst zoveel mogelijk het woordgebruik van de gemiddelde OOo-gebruiker te pakken hebben. We zullen dus moeten inschatten welke woorden vaak of juist zelden in een OOo-document zullen voorkomen.

Het gaat in het tweede bestand o.a. om

- woorden die niet correct zijn gespeld of geen Nederlands zijn


- jargon

dit zijn woorden die slechts voor selecte groepjes OOo-gebruikers van belang zijn (zoals chemische, medische, plantkundige termen, en woorden die in Google geen of slechts enkele resultaten opleveren)

Als aannemelijk wordt dat woorden toch algemeen gangbaar zijn, dan kunnen we ze alsnog opnemen.


- eigennamen

Tot nu toe zijn in principe geen eigennamen opgenomen, omdat dan algauw het einde zoek is. Algemene voor- en achternamen zijn er gewoon veel te veel. Voor namen van bekende personen (vooral als de juiste spelling niet voor de hand ligt) zou het wel handig zijn, maar het is steeds de vraag hoe houdbaar die bekendheid is. Het zou zonde zijn om de hoofdwoordenlijst te vervuilen met namen die na verloop van tijd door vrijwel niemand meer worden gebruikt. We kunnen overwegen om wel eigennamen op te nemen, maar dan moeten er goede criteria voor worden geformuleerd.

- plaatsnamen en geografische aanduidingen

Ook hier geldt dat snel het hek van de dam is. Tot nu toe is min of meer aangehouden: namen van onafhankelijke staten, hoofdsteden daarvan, andere Europese steden vanaf een bepaalde grootte (een half miljoen of zo), provinciehoofdsteden van Nederland en Belgiƫ, ... De relevantie van geografische namen hangt echter van veel meer factoren af, zo zal er meer behoefte zijn aan namen van een aantal deelstaten van de VS dan aan die van een onafhankelijk eilandrijkje ergens in de Stille Oceaan.

- merknamen

Deze zijn tot nu toe niet in de woordenlijst opgenomen. Ongeveer dezelfde argumenten als bij eigennamen zijn van toepassing.

- woorden die niet bruikbaar zijn voor de spellingcontrole van OOo

Van alles dat leestekens of spaties bevat heeft het momenteel geen zin om ze in de woordenlijst op te nemen. Voorbeelden: non-profitsector, d.w.z., 's avonds, Den Bosch Het punt is dat de zogenaamde break iterator van OOo de zinnen opdeelt in "woorden" die dan aan de spellingcontrolemodule worden aangeboden. Je kunt wel smokkelen door bijvoorbeeld "non", "profitsector", Gravenhage, ... op te nemen, maar ideaal is het niet. Een structurele oplossing zal echter aardig wat voeten in de aarde hebben (ik ben nog moed aan het verzamelen :)


Het is wellicht de moeite waard om woorden van bepaalde categorieƫn (eigennamen, merknamen, etc) wel apart te verzamelen. We zouden daar dan aanvullende woordenlijsten van kunnen maken, of naast de standaardwoordenlijst een uitgebreide woordenlijst kunnen aanbieden. Als je niet alles zomaar bij elkaar hebt gegooid kun je die dan flexibel samenstellen.

Discussie over dit onderwerp op de mailinglist [EMAIL PROTECTED]
Je moet hierop zijn aangemeld, dit kan door een lege email te sturen naar
[EMAIL PROTECTED]


Vriendelijke groet,
Simon Brouwer.

>>> nl.openoffice.org <<<


---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]

Antwoord per e-mail aan