WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek
Ga naar: navigatie, zoeken

De voortgang van WikiWoordenboek[bewerken]

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

Statistieken elders[bewerken]

Het huidige bestand van WikiWoordenboek[bewerken]

Totaal aantal lemma's: 526.583

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voortgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle pagina's, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

Ons bestand naar brontaal[bewerken]

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.


Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord Werkwoords-
vorm
Spaans 195050 12387 2381 4225 359 182056
Nederlands 194628 46393 8295 6604 1334 53075
Frans 18874 2879 393 478 58 14083
Noors 12683 2700 640 765 220 2116
Nynorsk 10964 2340 508 1028 187 1589
Engels 10061 6228 1003 1302 221 1236
Turks 8479 3444 588 544 103 238
Deens 6529 931 163 167 52 1467
Duits 5657 3123 514 391 100 305
Zweeds 4127 1133 167 436 72 382
IJslands 3681 713 93 135 26 100
Tsjechisch 3370 1403 1695 78 133 38
Russisch 3062 1264 187 149 139 94
Indonesisch 2608 1590 294 293 50 0
Afrikaans 2433 1335 259 253 110 125
Italiaans 1983 1295 102 103 20 9
Latijn 1836 743 138 191 84 264
Pennsylvania-Duits 1595 779 41 80 48 59
Vietnamees 1423 664 232 317 51 0
Catalaans 1422 464 122 654 16 631
Limburgs 1395 786 77 338 64 34
Portugees 1330 857 72 133 7 1
Hongaars 1131 548 84 102 27 4
Pools 1039 734 77 26 10 0
Grieks 1037 613 52 20 9 0
Esperanto 976 592 68 96 15 0
Bulgaars 965 351 17 27 4 62
Japans 872 733 5 29 0 0
Welsh 847 589 90 32 5 0
Slowaaks 947 352 344 10 17 3
Fins 774 501 27 27 12 0
Xhosa 711 198 8 38 10 25
Iers 691 491 41 23 6 1
Perzisch 692 381 18 26 10 7
Oekraïens 619 418 31 27 2 0
Bretons 607 277 54 71 1 0
Quechua 605 274 46 79 14 12
Mandarijn 593 380 64 98 19 0
Koerdisch 574 344 15 29 2 122
Fries 566 357 23 18 18 0
Kroatisch 560 268 6 0 0 0
Oudnoords 548 226 25 196 4 0
Roemeens 522 298 17 33 11 0
Papiamento 515 384 26 63 12 0
Hindi 514 284 41 58 6 0
Arabisch 503 269 46 59 4 0
Faeröers 487 186 118 51 8 0
Occitaans 477 251 10 26 2 0
Angelsaksisch 444 383 8 7 3 0
Oudgrieks 424 266 7 16 8 0
Estisch 409 215 9 0 1 0