WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek
Naar navigatie springen Naar zoeken springen

De voortgang van WikiWoordenboek[bewerken]

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

Statistieken elders[bewerken]

Het huidige bestand van WikiWoordenboek[bewerken]

Totaal aantal lemma's: 685.722

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voortgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle pagina's, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

Ons bestand naar brontaal[bewerken]

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.

Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord Werkwoords-
vorm
Nederlands 327190 64162 11537 9029 1563 72978
Spaans 195255 12495 2384 4225 359 182125
Frans 24899 5128 916 2222 173 14135
Noors 15517 3001 692 768 224 2229
Nynorsk 12311 2604 536 1049 188 1665
Engels 10848 6537 1080 1348 235 1291
Turks 8984 3515 590 544 104 238
Deens 7594 1094 176 197 55 1560
Tsjechisch 6532 2157 2894 1197 361 634
Duits 7006 3281 526 419 104 347
Zweeds 5022 1249 173 433 75 458
IJslands 4450 791 97 138 32 113
Russisch 3285 1384 188 150 139 94
Italiaans 3758 1721 143 115 65 9
Indonesisch 2677 1633 294 293 50 0
Afrikaans 2518 1389 261 257 113 125
Latijn 2003 796 161 211 88 373
Pennsylvania-Duits 1810 852 44 111 56 117
Catalaans 1500 515 122 654 16 631
Vietnamees 1486 704 232 317 51 0
Limburgs 1444 825 82 337 65 34
Slowaaks 1411 511 514 12 40 4
Portugees 1410 904 74 134 7 1
Japans 1390 1052 53 176 24 0
Esperanto 1322 677 72 213 15 0
Nedersaksisch 1227 738 47 85 46 1
Hongaars 1198 593 84 105 27 4
Pools 1123 790 77 26 10 0
Grieks 1099 657 52 20 9 0
Bulgaars 1044 404 17 28 4 62
Lets 959 192 6 3 172 0
Welsh 901 622 90 32 5 0
Fins 859 559 27 28 12 0
Perzisch 768 439 18 26 10 7
Iers 747 527 42 24 6 2
Xhosa 729 208 8 39 10 29
Oekraïens 693 472 31 27 2 0
Bretons 670 315 54 71 1 0
Kroatisch 636 319 6 0 0 0
Quechua 634 292 46 79 14 12
Fries 613 387 23 18 18 0
Koerdisch 614 371 15 29 2 122
Mandarijn 596 380 64 100 19 0
Roemeens 595 345 17 33 11 0
Arabisch 581 328 46 60 4 0
Oudnoords 577 239 26 197 5 5
Hindi 563 318 41 58 6 0
Faeröers 534 201 118 51 8 0
Papiamento 531 394 27 63 12 0
Occitaans 527 280 10 26 2 0
Estisch 479 264 9 0 1 0
Chinees 476 341 2 3 2 0
Veluws 463 276 26 48 25 1
Luxemburgs 458 137 20 15 11 1
Angelsaksisch 456 387 8 7 3 0
Middelnederlands 439 247 24 119 11 3
Litouws 432 270 2 3 2 0
Oudgrieks 431 269 7 16 8 0