WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek
Ga naar: navigatie, zoeken

De voortgang van WikiWoordenboek[bewerken]

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

Statistieken elders[bewerken]

Het huidige bestand van WikiWoordenboek[bewerken]

Totaal aantal lemma's: 577.621

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voortgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle pagina's, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

Ons bestand naar brontaal[bewerken]

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.


Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord Werkwoords-
vorm
Nederlands 242850 49462 9636 7005 1372 54245
Spaans 195160 12473 2382 4225 359 182074
Frans 18992 2926 406 478 65 14087
Noors 13513 2767 669 772 221 2157
Nynorsk 11308 2393 522 1036 190 1610
Engels 10176 6286 1018 1311 223 1253
Turks 8480 3445 588 544 103 238
Deens 6722 948 163 167 52 1470
Duits 5721 3150 518 394 102 328
Zweeds 4275 1144 167 436 71 385
Tsjechisch 4210 1632 2314 78 141 42
IJslands 3690 714 93 136 27 100
Russisch 3064 1265 187 149 139 94
Indonesisch 2617 1596 294 293 50 0
Afrikaans 2435 1335 259 253 110 125
Italiaans 1989 1297 102 103 21 9
Latijn 1852 749 139 196 84 271
Pennsylvania-Duits 1668 808 42 87 53 81
Vietnamees 1425 664 232 317 51 0
Catalaans 1426 464 122 654 16 631
Limburgs 1394 786 77 337 64 34
Portugees 1335 857 72 133 7 1
Hongaars 1131 548 84 102 27 4
Slowaaks 1096 393 408 10 17 3
Pools 1041 734 77 26 10 0
Grieks 1037 613 52 20 9 0
Esperanto 1023 622 72 105 15 0
Bulgaars 971 352 17 27 4 62
Japans 874 734 5 29 0 0
Welsh 851 590 90 32 5 0
Lets 839 148 6 3 172 0
Fins 781 503 27 28 12 0
Xhosa 713 198 8 39 10 29
Iers 696 492 41 24 6 2
Perzisch 693 381 18 26 10 7
Oekraïens 619 418 31 27 2 0
Bretons 610 277 54 71 1 0
Quechua 606 274 46 79 14 12
Mandarijn 594 380 64 98 19 0
Koerdisch 576 344 15 29 2 122
Fries 570 358 23 18 18 0
Kroatisch 564 269 6 0 0 0
Oudnoords 549 226 25 196 4 0
Roemeens 526 298 17 33 11 0
Papiamento 517 384 26 63 12 0
Hindi 516 284 41 58 6 0
Arabisch 505 270 46 59 4 0
Faeröers 488 186 118 51 8 0
Occitaans 480 251 10 26 2 0
Angelsaksisch 446 383 8 7 3 0
Oudgrieks 426 266 7 16 8 0
Estisch 411 215 9 0 1 0