WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek
Ga naar: navigatie, zoeken

De voortgang van WikiWoordenboek[bewerken]

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

Statistieken elders[bewerken]

Het huidige bestand van WikiWoordenboek[bewerken]

Totaal aantal lemma's: 654.719

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voortgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle pagina's, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

Ons bestand naar brontaal[bewerken]

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.

Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord Werkwoords-
vorm
Nederlands 307203 58092 11009 8504 1499 70378
Spaans 195251 12491 2384 4225 359 182125
Frans 19285 3006 419 494 69 14093
Noors 15015 2956 680 774 221 2208
Nynorsk 12124 2571 532 1043 188 1651
Engels 10633 6438 1072 1337 229 1287
Turks 8974 3506 590 544 104 238
Deens 7485 1070 174 197 54 1556
Duits 5827 3213 521 410 103 341
Tsjechisch 5110 1952 2854 129 145 91
Zweeds 4956 1227 173 433 73 458
IJslands 4132 763 96 137 32 113
Russisch 3186 1365 188 149 139 94
Italiaans 2843 1702 142 113 65 9
Indonesisch 2668 1625 294 293 50 0
Afrikaans 2508 1380 261 257 113 125
Latijn 1977 789 157 205 88 361
Pennsylvania-Duits 1775 843 44 97 56 101
Catalaans 1488 503 122 654 16 631
Vietnamees 1474 692 232 317 51 0
Limburgs 1439 820 82 337 64 34
Portugees 1386 888 72 134 7 1
Japans 1368 1035 53 176 24 0
Slowaaks 1356 495 504 10 18 3
Esperanto 1309 665 72 213 15 0
Hongaars 1180 577 84 102 27 4
Pools 1102 772 77 26 10 0
Grieks 1089 648 52 20 9 0
Bulgaars 1029 391 17 28 4 62
Lets 948 181 6 3 172 0
Nedersaksisch 910 530 29 68 28 0
Welsh 893 614 90 32 5 0
Fins 844 544 27 28 12 0
Perzisch 754 426 18 26 10 7
Iers 738 521 41 24 6 2
Xhosa 727 208 8 39 10 29
Oekraïens 679 458 31 27 2 0
Bretons 658 303 54 71 1 0
Quechua 630 288 46 79 14 12
Kroatisch 624 308 6 0 0 0
Fries 604 378 23 18 18 0
Mandarijn 596 380 64 100 19 0
Koerdisch 604 361 15 29 2 122
Roemeens 583 333 17 33 11 0
Oudnoords 565 237 25 197 5 2
Hindi 559 314 41 58 6 0
Arabisch 564 312 46 59 4 0
Papiamento 529 392 26 63 12 0
Occitaans 522 275 10 26 2 0
Faeröers 527 194 118 51 8 0
Angelsaksisch 455 386 8 7 3 0
Estisch 466 251 9 0 1 0
Chinees 459 324 2 3 2 0
Luxemburgs 449 128 20 15 11 1
Oudgrieks 430 268 7 16 8 0