WikiWoordenboek:Gewenste lemma's

Uit WikiWoordenboek

Wereldwijd gezien is het doel van Wiktionary om alle woorden uit alle talen te beschrijven in alle talen. Als Nederlandstalig onderdeel van Wiktionary is het doel van WikiWoordenboek: de beschrijving van alle woorden uit alle talen in het Nederlands. Deze pagina werkt uit wat we met daarmee in de praktijk bedoelen.

Lemma's[bewerken]

WikiWoordenboek bestaat hoofdzakelijk uit pagina's, ingedeeld in secties per taal, waarin "woorden" uit die taal worden beschreven. Er zijn twee redenen om "woorden" tussen aanhalingstekens te zetten.

  1. Behalve gewone woorden, beschrijft WikiWoordenboek ook afzonderlijke tekens of frasen die uit meer woorden bestaan.
  2. Bij de beschrijving kennen we een uitgebreide en een beperkte variant.
    1. Bij trefwoorden staan de betekenissen, met links naar verbogen vormen en verwante woorden in dezelfde taal en bij woorden in het Nederlands is er vaak ook een blok met vertalingen. Bij werkwoorden is de onbepaalde wijs het trefwoord, bij zelfstandige naamwoorden het enkelvoud en bij bijvoeglijke naamwoorden de onverbogen stellende trap; in talen met een verbuiging naar woordgeslacht, gaat het als regel om de mannelijke vorm.
    2. Het kan ook gaan om woordvormen, die beknopter zijn en voor de betekenissen weer teruglinken naar het trefwoord. Voorbeelden zijn de vervoegingen van werkwoorden, meervoudsvormen en trappen van vergelijking, vormen voor andere woordgeslachten en verouderde spellingen.

De term lemma wordt gebruikt voor de beschrijving van een "woord" in een bepaalde taal. Dat kan dus ook een teken of een frase zijn. En het kan zowel gaan om een trefwoord of om een woordvorm. Deze pagina beschrijft zo eigenlijk welke lemma's in WikiWoordenboek horen.

Beschrijving[bewerken]

Omdat het om beschrijving gaat, beperkt WikiWoordenboek zich tot talen die kunnen worden geschreven. Soms is de schrijfwijze officieel vastgesteld: dan beschrijven we vanaf dat tijdstip alleen de vorm(en) uit die spelling. In talen of perioden zonder officiële spelling volgen we de schrijfwijze(n) uit betrouwbare bronnen, zoals degelijke woordenboeken, zie hieronder onder Woorden Dit maakt het beter mogelijk om de informatie op WikiWoordenboek in andere bronnen na te gaan.

De lemma's hebben betrekking op woorden: welke vormen ze aannemen, welke betekenissen ze hebben, hoe ze gebruikt worden en hoe ze zijn ontstaan. Het is uitdrukkelijk niet de bedoeling om de omschrijving van een betekenis uit te breiden tot de beschrijving van een onderwerp: daarvoor zijn zusterprojecten als Wikipedia en Wikibooks beter geschikt.

Alle talen[bewerken]

Er bestaat een enorme variatie aan talen die meer of minder van elkaar verschillen. Bij het beschrijven van die diversiteit ontkom je niet aan afbakening van verschillende talen, maar over elke afbakening is discussie mogelijk. Om wereldwijde samenwerking mogelijk te maken, is er een internationale standaard ISO 639-3 met een onderverdeling in ongeveer 8.000 verschillende talen met een eigen taalcode. Deze standaard wordt regelmatig bijgewerkt.

Deze standaard omvat ook sommige kunsttalen die in gebruik zijn en een behoorlijke documentatie hebben.

Gebieden[bewerken]

Binnen de standaard ISO 639-3 bestaan ook tientallen codes voor een macrotaal, een taal die wordt beschreven als gemeenschappelijke voertaal voor sprekers van een groep verwante talen. Soms is een macrotaal gebruikt vooruitlopend op een definitieve onderverdeling van een groep talen of het aanwijzen van een standaardtaal daarbinnen. In dat geval kan het zinvol zijn de code voor macrotaal niet te gebruiken of te vervangen door die standaardtaal. Dit vereist wel voldoende kennis van de talen in kwestie.

Als het nodig is om aan te geven dat bepaalde woorden of betekenissen alleen in een bepaald gebied gangbaar zijn, kan dat worden aangegeven met een globale indicatie daarvan, bijvoorbeeld (VS).

Tijdvakken[bewerken]

De indeling volgens [[WikiWoordenboek:|ISO639]] vormt de basis voor de beschrijving van woorden in WikiWoordenboek. Deze indeling omvat ook historische talen, zoals Oudgrieks en Middelnederlands. Dit betekent omgekeerd dat De Nederlands (nld) niet alleen het hedendaags Nederlands, maar al het Nederlands vanaf de 16e eeuw omvat. Dit leidt er soms toe dat de beschrijving op WikiWoordenboek verschilt van woordenlijst.org of Van Dale's Groot woordenboek van de Nederlandse taal.

In sommige gevallen bestaat er een contextlabel om aan te geven dat een woord alleen in een bepaalde periode is gebruikt, zoals {{Vroegnieuwnederlands}}.

Als een woord iets beschrijft dat niet meer voorkomt en daardoor niet meer gangbaar is, kan het label {{historisch|<ISO>}} aan die betekenis worden toegevoegd.

Als het nodig is om aan te geven dat een bepaalde betekenis van woord niet meer gangbaar is omdat daarvoor nu een ander woord wordt gebruikt, kan dat worden aangegeven met {{verouderd}}. In dat geval wordt onder het kopje {{-syn-}} vermeld welk woord nu in die betekenis wordt gebruikt.

Als een woord een andere spelling heeft gekregen, wordt dat aangegeven met {{oudeschrijfwijze}}

Vanuit de talen binnen één taalfamilie is het soms mogelijk woorden te uit de oerversie van die taal te reconstrueren. Deze woorden beginnen altijd met een asterisk (*) om aan te geven dat het om een reconstructie gaat. De taalcode wordt in dit geval ontleend aan de drielettercode uit ISO 639-5 gevolgd door -pro. Hierbij hoort altijd een bronvermelding te worden gegeven; het is daarnaast van belang dat voor een gereconstrueerde taal alleen bronnen worden gebruikt die dezelfde uitgangspunten gebruiken.

Alle woorden[bewerken]

Een woord is een tekenreeks waaraan in een taal een of meer betekenissen worden toegekend.

Tekens[bewerken]

Om praktische redenen beperkt WikiWoordenboek zich tot reeksen bestaand uit tekens die zijn vastgelegd in de Unicode-standaard. Deze omvat tegenwoordig een groot aantal schriftsoorten en bijvoorbeeld ook Chinese karakters, spijkerschrift en hiërogliefen.

De kortste tekenreeks met een betekenis is natuurlijk een enkel teken. In principe kan elk teken dat binnen de Unicode-standaard is vastgelegd op WikiWoordenboek als symbool {{-symbool-}} in het universeel taalgebruik (qtu) worden beschreven.

Woorden[bewerken]

Mensen bedenken voortdurend nieuwe woorden. Een woord wordt pas echt een onderdeel van een taal, wanneer iemand het zonder verdere uitleg kan gebruiken in communicatie met een onbekende die dezelfde taal spreekt. Dit hoeft geen willekeurige onbekende te zijn: WikiWoordenboek bevat ook woorden die mensen binnen een bepaald vakgebied gebruiken. Maar woorden die alleen in kleine kring gangbaar zijn, horen (nog) niet tot de taal.

Er zijn twee manieren om vast te stellen of een woord voldoende gangbaar is om het in WikiWoordenboek op te nemen.

1. Het woord staat in een betrouwbaar woordenboek voor die taal.
Dit kunnen ook gespecialiseerd woordenboeken of woordenlijsten voor een bepaald vakgebied in die taal zijn, zolang ze taalkundig aansluiten bij de meer algemene betrouwbare woordenboeken.
Soms berust de vermelding in een woordenboek op een abuis of is het scherts of een bewijs tegen plagiaat. Zolang dat niet is aangetoond, wordt aangenomen dat het woord voldoende gangbaar is voor opname in WikiWoordenboek.
2. Het woord wordt in minstens drie verschillende publicaties in verzorgd taalgebruik onafhankelijk van elkaar in een gewone zin gebruikt.
"Gebruik in een gewone zin" wil zeggen: in een lopende volzin, zonder uitleg van de betekenis in dezelfde tekst en zonder dat typografisch wordt aangegeven dat het om een vreemd woord gaat.
"Onafhankelijk van elkaar" wil zeggen dat het echt om drie verschillende voorbeelden van het gebruik gaat, dus niet om teksten die van dezelfde auteur komen, gebaseerd zijn op hetzelfde persbericht of verwijzen naar hetzelfde incident.
"publicaties in verzorgd taalgebruik" zijn bronnen die serieus geredigeerd worden, zodat aannemelijk is dat erover de formulering is nagedacht.
Bij woorden die volgens dit criterium in WikiWoordenboek worden opgenomen, horen altijd een of meer vindplaatsen met citaat te worden vermeld. Voor die vindplaatsen is het criterium zelf niet van toepassing: het kan voor de lezer handig zijn om een zin te gebruiken waarin de betekenis wél wordt uitgelegd.

Als een woord wordt opgenomen, kunnen ook alle grammaticaal correcte verbuigingen van het woord opgenomen, tenzij er een betrouwbare bron die een of meer vormen uitsluit (in welk geval je ook kunt stellen dat die vormen grammaticaal niet correct zijn). Bij gegronde twijfel over de gangbaarheid, kan die op de pagina waarop de vorm staat worden aangegeven. De lezer is daarmee beter geholpen dan met het weglaten van het lemma.

Frasen[bewerken]

Een reeks woorden met een bepaalde betekenis die niet zonder meer is af te leiden uit de betekenis van de afzonderlijke woorden, kan worden meegenomen bij de beschrijving van het belangrijkste woord uit de reeks. Het is ook mogelijk om de frase als geheel te beschrijven en daarheen te verwijzen vanaf de woorden die onderdeel van de reeks zijn. Dit verdient de voorkeur naarmate er meer informatie over de frase te geven is.

Er zijn ook frasen die op zichzelf goed begrijpelijk zijn, maar die de kenmerkende manier vormen om iets in die taal te zeggen. Ook deze kunnen afzonderlijk worden beschreven.