WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek
Ga naar: navigatie, zoeken

De voortgang van WikiWoordenboek[bewerken]

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

Statistieken elders[bewerken]

Het huidige bestand van WikiWoordenboek[bewerken]

Totaal aantal lemma's: 440.888

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voortgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle pagina's, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

Ons bestand naar brontaal[bewerken]

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.


Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord Werkwoords-
vorm
Spaans 173276 11164 2365 4226 360 161467
Nederlands 137555 43066 6856 6301 1279 50752
Frans 18817 2860 389 483 57 14083
Noors 12241 2622 616 759 214 2094
Nynorsk 10656 2270 497 1014 183 1569
Engels 9914 6152 994 1284 220 1193
Turks 8457 3433 585 543 103 238
Deens 6440 923 159 165 48 1463
Duits 5603 3103 511 389 99 305
Russisch 3059 1263 187 149 139 94
Zweeds 2746 1009 157 413 62 336
Afrikaans 2427 1332 259 252 110 123
Indonesisch 2328 1589 294 293 50 0
Tsjechisch 2128 885 959 53 124 12
Italiaans 1976 1294 101 102 20 9
Latijn 1816 730 137 191 84 264
Pennsylvania-Duits 1523 744 40 80 45 59
Catalaans 1423 464 122 654 16 631
Vietnamees 1421 664 232 317 51 0
Limburgs 1391 784 77 338 64 34
Portugees 1328 858 71 132 7 1
Hongaars 1129 547 84 102 27 4
Pools 1039 735 77 26 10 0
Grieks 1032 612 51 20 9 0
Esperanto 976 591 68 96 15 0
IJslands 972 527 71 108 14 21
Japans 871 733 5 29 0 0
Welsh 846 589 90 32 5 0
Fins 771 503 26 27 11 0
Slowaaks 721 276 258 10 14 3
Xhosa 711 198 8 38 10 25
Iers 691 491 41 23 6 1
Perzisch 690 381 18 26 10 7
Oekraïens 617 419 31 27 2 0
Bretons 607 276 54 71 1 0
Quechua 606 275 46 79 14 12
Mandarijn 591 380 64 98 19 0
Koerdisch 574 344 15 29 2 122
Fries 564 356 23 18 18 0
Kroatisch 560 268 6 0 0 0
Roemeens 521 299 17 33 11 0
Hindi 513 284 41 58 6 0
Papiamento 504 376 26 63 12 0
Arabisch 501 268 46 59 4 0
Oudnoors 488 217 25 195 4 5
Occitaans 477 251 10 26 2 0
Faeröers 475 186 118 51 8 0
Angelsaksisch 444 382 8 7 3 0
Oudgrieks 424 266 7 16 8 0
Estisch 410 215 9 0 1 0
Bulgaars 408 288 6 17 4 0
Chinees 392 278 2 3 2 0
Litouws 362 224 2 3 2 0
Baskisch 348 210 29 6 3 0
Atjehs 347 175 1 0 0 0
Koreaans 339 249 2 3 1 0
Moksja 326 197 36 64 7 0
Surinaams 305 94 38 64 5 0
Armeens 292 181 3 8 0 7
Hebreeuws 285 189 4 1 1 0
Erzja 274 136 37 61 7 0