WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek
Ga naar: navigatie, zoeken

De voortgang van WikiWoordenboek[bewerken]

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

Statistieken elders[bewerken]

Het huidige bestand van WikiWoordenboek[bewerken]

Totaal aantal lemma's: 439.385

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voortgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle pagina's, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

Ons bestand naar brontaal[bewerken]

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.


Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord Werkwoords-
vorm
Spaans 173022 10907 2364 4226 360 161467
Nederlands 136857 42888 6794 6217 1268 50726
Frans 18816 2859 389 483 57 14083
Noors 12185 2604 616 755 213 2092
Nynorsk 10629 2259 497 1008 182 1568
Engels 9911 6150 994 1284 220 1192
Turks 8457 3433 585 543 103 238
Deens 6440 923 159 165 48 1463
Duits 5602 3103 511 389 99 305
Russisch 3059 1263 187 149 139 94
Zweeds 2746 1009 157 413 62 336
Afrikaans 2427 1332 259 252 110 123
Indonesisch 2328 1589 294 293 50 0
Tsjechisch 2028 820 931 42 123 0
Italiaans 1976 1294 101 102 20 9
Latijn 1816 730 137 191 84 264
Catalaans 1423 464 122 654 16 631
Vietnamees 1421 664 232 317 51 0
Limburgs 1391 784 77 338 64 34
Portugees 1328 858 71 132 7 1
Hongaars 1129 547 84 102 27 4
Pools 1039 735 77 26 10 0
Grieks 1032 612 51 20 9 0
Esperanto 977 593 68 96 15 0
IJslands 972 527 71 108 14 21
Japans 871 733 5 29 0 0
Welsh 846 589 90 32 5 0
Pennsylvania-Duits 1091 509 24 80 35 59
Fins 771 503 26 27 11 0
Xhosa 711 198 8 38 10 25
Slowaaks 706 265 257 10 14 3
Iers 691 491 41 23 6 1
Perzisch 690 381 18 26 10 7
Oekraïens 617 419 31 27 2 0
Bretons 607 276 54 71 1 0
Quechua 606 275 46 79 14 12
Mandarijn 591 380 64 98 19 0
Koerdisch 574 344 15 29 2 122
Fries 564 356 23 18 18 0
Kroatisch 560 268 6 0 0 0
Roemeens 521 299 17 33 11 0
Hindi 513 284 41 58 6 0
Papiamento 504 376 26 63 12 0
Arabisch 501 268 46 59 4 0
Oudnoors 488 217 25 195 4 5
Occitaans 477 251 10 26 2 0
Faeröers 475 186 118 51 8 0
Angelsaksisch 444 382 8 7 3 0
Oudgrieks 424 266 7 16 8 0
Estisch 410 215 9 0 1 0
Bulgaars 408 288 6 17 4 0
Chinees 392 278 2 3 2 0
Litouws 361 224 2 3 1 0
Baskisch 348 210 29 6 3 0
Koreaans 339 249 2 3 1 0
Moksja 326 197 36 64 7 0
Surinaams 305 94 38 64 5 0
Armeens 292 181 3 8 0 7
Hebreeuws 285 189 4 1 1 0
Erzja 274 136 37 61 7 0