WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek
Naar navigatie springen Jump to search

De voortgang van WikiWoordenboek[bewerken]

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

Statistieken elders[bewerken]

Het huidige bestand van WikiWoordenboek[bewerken]

Totaal aantal lemma's: 670.665

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voortgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle pagina's, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

Ons bestand naar brontaal[bewerken]

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.

Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord Werkwoords-
vorm
Nederlands 316687 60900 11237 8770 1524 72224
Spaans 195254 12495 2384 4225 359 182125
Frans 23990 5119 916 2219 172 14134
Noors 15376 2986 687 780 222 2221
Nynorsk 12256 2595 535 1049 188 1655
Engels 10670 6464 1074 1340 230 1287
Turks 8983 3515 590 544 104 238
Deens 7570 1090 175 198 55 1557
Duits 5923 3266 525 415 104 347
Tsjechisch 5877 2074 2885 698 231 391
Zweeds 5018 1246 173 433 74 458
IJslands 4325 783 97 138 32 113
Russisch 3204 1381 188 150 139 94
Italiaans 2856 1710 143 115 65 9
Indonesisch 2676 1632 294 293 50 0
Afrikaans 2517 1388 261 257 113 125
Latijn 1999 792 161 211 88 373
Pennsylvania-Duits 1803 854 44 107 56 112
Catalaans 1499 514 122 654 16 631
Vietnamees 1486 704 232 317 51 0
Limburgs 1444 825 82 337 64 34
Portugees 1401 900 72 134 7 1
Slowaaks 1395 508 510 10 32 3
Japans 1389 1051 53 176 24 0
Esperanto 1320 676 72 213 15 0
Hongaars 1193 591 84 102 27 4
Pools 1114 784 77 26 10 0
Grieks 1099 657 52 20 9 0
Bulgaars 1043 403 17 28 4 62
Lets 959 192 6 3 172 0
Nedersaksisch 918 535 29 68 28 0
Welsh 901 622 90 32 5 0
Fins 857 557 27 28 12 0
Perzisch 767 438 18 26 10 7
Iers 746 527 41 24 6 2
Xhosa 729 208 8 39 10 29
Oekraïens 692 471 31 27 2 0
Bretons 669 314 54 71 1 0
Kroatisch 636 319 6 0 0 0
Quechua 634 292 46 79 14 12
Fries 612 386 23 18 18 0
Koerdisch 611 368 15 29 2 122
Mandarijn 596 380 64 100 19 0
Roemeens 594 344 17 33 11 0
Oudnoords 577 239 26 197 5 5
Arabisch 577 325 46 59 4 0
Hindi 563 318 41 58 6 0
Faeröers 534 201 118 51 8 0
Papiamento 531 394 27 63 12 0
Occitaans 527 280 10 26 2 0
Estisch 477 262 9 0 1 0
Chinees 471 336 2 3 2 0
Luxemburgs 457 136 20 15 11 1
Angelsaksisch 456 387 8 7 3 0
Oudgrieks 430 268 7 16 8 0