WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek

Ga naar: navigatie, zoeken

Inhoud

[bewerken] De voortgang van WikiWoordenboek

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

[bewerken] Statistieken elders

[bewerken] Het huidige bestand van WikiWoordenboek

Totaal aantal lemma's: 60.220

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voorgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle paginas, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

[bewerken] Ons bestand naar brontaal

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.

Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord
Nederlands 25035 9125 1435 2094 602
Engels 4264 1999 308 480 69
Duits 2698 696 90 55 13
Turks 2527 366 35 19 0
Spaans 2544 1229 141 265 13
Frans 2210 764 76 59 14
Russisch 1636 389 112 73 83
Zweeds 1482 484 55 154 11
Italiaans 1309 419 45 7 12
Vietnamees 1230 0 0 0 0
Noors 1186 437 60 69 32
Limburgs 1105 567 59 298 59
Latijn 1099 409 24 162 27
Nynorsk 1040 404 55 63 33
Pools 811 220 0 14 0
Afrikaans 723 276 10 12 31
Portugees 711 301 15 0 3
Grieks 633 230 14 0 6
Esperanto 615 415 18 73 2
Perzisch 562 161 7 10 9
Indonesisch 589 356 48 9 8
Tsjechisch 560 31 0 0 0
Fins 525 54 2 0 0
Hongaars 519 8 12 0 1
Iers 541 173 28 0 0
Oekraïens 498 0 0 0 0
Mandarijn 509 0 0 0 0
Deens 441 87 0 0 2
Slowaaks 411 1 35 3 0
Angelsaksisch 410 1 0 0 0
Welsh 388 148 0 0 0
Japans 434 152 0 0 0
Papiamento 400 129 10 24 2
Catalaans 361 80 0 0 0
Roemeens 357 69 0 7 0
Occitaans 304 74 1 0 0
IJslands 472 202 0 1 0
Chinees 269 0 0 0 0
Estisch 285 0 0 0 0
Bretons 281 79 0 0 0
Fries 259 17 0 0 0
Koerdisch 242 1 0 3 0
Bulgaars 231 2 0 0 1
Hindi 267 6 0 4 0
Quechua 202 0 0 0 0
Litouws 187 14 0 0 0
Koreaans 179 0 0 0 0
Armeens 177 8 0 8 0
Hebreeuws 174 0 0 0 0
Servokroatisch 144 0 0 0 0
Kabylisch 136 18 0 0 0
Tataars 125 7 0 0 0
Taroko 105 0 0 0 0
Albanees 103 0 0 0 0
Swahili 112 0 0 0 0
Azeri 100 0 0 0 0
Krim-Tataars 100 14 3 0 2
Xhosa 99 26 0 4 0
Malayalam 97 0 0 0 0
Aragonees 101 0 0 0 0
Lezgi 81 2 0 0 0
Minangkabaus 71 40 12 0 0
Oudgrieks 59 13 0 8 0
Persoonlijke instellingen