WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek
Ga naar: navigatie, zoeken

De voortgang van WikiWoordenboek[bewerken]

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

Statistieken elders[bewerken]

Het huidige bestand van WikiWoordenboek[bewerken]

Totaal aantal lemma's: 633.609

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voortgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle pagina's, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

Ons bestand naar brontaal[bewerken]

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.

Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord Werkwoords-
vorm
Nederlands 293657 54664 10617 8115 1464 65637
Spaans 195170 12478 2384 4225 359 182073
Frans 19199 2966 414 481 65 14090
Noors 14685 2886 677 773 221 2201
Nynorsk 11970 2519 532 1044 188 1651
Engels 10403 6348 1027 1322 225 1270
Turks 8482 3445 588 544 103 238
Deens 7409 1034 173 196 54 1554
Duits 5739 3159 521 395 103 328
Tsjechisch 4840 1826 2718 129 143 91
Zweeds 4663 1172 170 436 72 404
IJslands 3697 715 93 136 27 100
Russisch 3064 1265 187 149 139 94
Italiaans 2790 1667 142 113 65 9
Indonesisch 2625 1598 294 293 50 0
Afrikaans 2463 1350 259 255 111 125
Latijn 1900 756 153 187 86 336
Pennsylvania-Duits 1766 837 43 95 55 100
Catalaans 1431 464 122 654 16 631
Vietnamees 1430 664 232 317 51 0
Limburgs 1403 790 77 337 64 34
Portugees 1340 858 72 134 7 1
Esperanto 1258 632 72 213 15 0
Japans 1319 1004 53 176 24 0
Slowaaks 1226 435 467 10 17 3
Hongaars 1139 552 84 102 27 4
Pools 1048 736 77 26 10 0
Grieks 1041 617 52 20 9 0
Bulgaars 973 352 17 28 4 62
Lets 902 149 6 3 172 0
Welsh 855 590 90 32 5 0
Fins 785 503 27 28 12 0
Xhosa 715 198 8 39 10 29
Iers 700 492 41 24 6 2
Perzisch 696 383 18 26 10 7
Oekraïens 620 418 31 27 2 0
Bretons 615 277 54 71 1 0
Quechua 609 274 46 79 14 12
Mandarijn 596 380 64 100 19 0
Koerdisch 578 344 15 29 2 122
Fries 577 361 23 18 18 0
Kroatisch 569 269 6 0 0 0
Oudnoords 564 236 25 197 5 0
Roemeens 540 307 17 33 11 0
Papiamento 520 384 26 63 12 0
Hindi 517 284 41 58 6 0
Arabisch 506 270 46 59 4 0
Faeröers 498 188 118 51 8 0
Occitaans 484 251 10 26 2 0
Angelsaksisch 447 383 8 7 3 0
Oudgrieks 429 267 7 16 8 0
Estisch 413 215 9 0 1 0