WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek
Ga naar: navigatie, zoeken

De voortgang van WikiWoordenboek[bewerken]

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

Statistieken elders[bewerken]

Het huidige bestand van WikiWoordenboek[bewerken]

Totaal aantal lemma's: 499.231

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voortgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle pagina's, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

Ons bestand naar brontaal[bewerken]

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.


Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord Werkwoords-
vorm
Spaans 194625 11959 2380 4225 359 182052
Nederlands 169636 45580 8121 6517 1309 52891
Frans 18862 2874 392 478 57 14083
Noors 12479 2678 629 762 216 2117
Nynorsk 10847 2322 506 1022 186 1589
Engels 10015 6209 1001 1288 220 1223
Turks 8477 3444 588 544 103 238
Deens 6518 931 163 167 51 1467
Duits 5608 3106 511 390 99 305
Zweeds 4002 1125 168 435 71 379
IJslands 3113 668 90 134 26 97
Russisch 3059 1264 187 149 139 94
Tsjechisch 2883 1207 1395 77 130 37
Afrikaans 2428 1335 259 252 110 123
Indonesisch 2328 1589 294 293 50 0
Italiaans 1978 1295 101 103 20 9
Latijn 1827 739 137 191 84 264
Pennsylvania-Duits 1559 765 42 80 46 59
Catalaans 1423 465 122 654 16 631
Vietnamees 1421 664 232 317 51 0
Limburgs 1392 785 77 338 64 34
Portugees 1331 858 72 133 7 1
Hongaars 1130 549 84 102 27 4
Pools 1039 735 77 26 10 0
Grieks 1034 613 52 20 9 0
Esperanto 976 591 68 96 15 0
Japans 871 733 5 29 0 0
Welsh 846 589 90 32 5 0
Slowaaks 810 306 303 10 16 3
Fins 776 504 27 27 12 0
Xhosa 711 198 8 38 10 25
Iers 691 491 41 23 6 1
Perzisch 690 381 18 26 10 7
Oekraïens 619 419 31 27 2 0
Bretons 607 277 54 71 1 0
Quechua 606 275 46 79 14 12
Mandarijn 591 380 64 98 19 0
Koerdisch 574 344 15 29 2 122
Fries 565 357 23 18 18 0
Kroatisch 560 268 6 0 0 0
Oudnoords 538 226 25 195 4 0
Roemeens 521 299 17 33 11 0
Hindi 513 284 41 58 6 0
Papiamento 515 383 26 63 12 0
Arabisch 501 269 46 59 4 0
Faeröers 477 186 118 51 8 0
Occitaans 477 251 10 26 2 0
Angelsaksisch 444 383 8 7 3 0
Bulgaars 509 335 5 25 3 4
Oudgrieks 424 266 7 16 8 0
Estisch 410 215 9 0 1 0
Chinees 392 279 2 3 2 0
Litouws 362 224 2 3 2 0
Baskisch 348 211 29 6 3 0
Atjehs 347 175 1 0 0 0
Koreaans 339 249 2 3 1 0
Moksja 326 197 36 64 7 0
Surinaams 305 94 38 64 5 0
Armeens 292 182 3 8 0 7
Hebreeuws 285 189 4 1 1 0
Erzja 274 136 37 61 7 0