WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek
Naar navigatie springen Naar zoeken springen

De voortgang van WikiWoordenboek[bewerken]

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

Statistieken elders[bewerken]

Het huidige bestand van WikiWoordenboek[bewerken]

Totaal aantal lemma's: 723.828

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voortgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle pagina's, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

Ons bestand naar brontaal[bewerken]

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.

Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord Werkwoords-
vorm
Nederlands 360857 70353 12830 9815 1663 89885
Spaans 195266 12503 2387 4226 358 182125
Frans 24998 5183 922 2228 177 14144
Noors 16124 3043 697 775 224 2263
Nynorsk 12492 2629 538 1049 188 1671
Engels 11126 6720 1109 1386 238 1301
Turks 9003 3519 591 544 104 238
Deens 7671 1108 176 198 55 1559
Tsjechisch 7471 2923 2906 1394 366 645
Duits 7227 3391 529 429 108 349
Zweeds 5707 1362 175 438 76 475
IJslands 4644 809 97 138 32 113
Italiaans 4246 1914 155 177 67 9
Russisch 3315 1402 188 151 140 94
Afrikaans 2752 1526 266 268 119 125
Indonesisch 2680 1636 294 293 50 0
Latijn 2047 805 171 215 89 385
Pennsylvania-Duits 1856 871 45 112 56 122
Nedersaksisch 1575 1057 58 95 46 1
Slowaaks 1613 693 516 13 40 4
Catalaans 1507 519 122 654 16 631
Vietnamees 1491 707 231 319 51 0
Limburgs 1473 852 82 338 65 34
Portugees 1422 912 74 136 7 1
Lets 1404 695 6 3 172 0
Japans 1396 1055 53 177 24 0
Esperanto 1337 685 72 214 15 0
Hongaars 1205 599 84 105 27 4
Pools 1228 881 77 33 10 0
Grieks 1103 657 52 23 9 0
Bulgaars 1049 407 17 30 4 62
Welsh 905 624 90 32 5 0
Fins 870 567 27 30 12 0
Perzisch 772 442 18 26 10 7
Iers 749 526 42 24 6 2
Xhosa 731 210 8 39 12 29
Oekraïens 700 472 31 27 2 0
Bretons 675 319 54 71 1 0
Kroatisch 642 320 6 3 0 0
Quechua 636 293 46 79 14 12
Estisch 633 307 117 0 1 0
Fries 632 404 23 19 18 1
Koerdisch 618 374 16 29 2 122
Roemeens 600 349 17 33 11 0
Mandarijn 596 380 64 100 19 0
Arabisch 588 332 47 60 4 0
Oudnoords 579 240 26 197 5 5
Hindi 564 318 41 58 6 0
Papiamento 564 412 29 63 14 0
Faeröers 537 201 118 52 8 0
Occitaans 530 281 10 26 2 0
Veluws 525 315 34 60 25 1
Chinees 483 345 2 4 2 0
Luxemburgs 497 173 20 16 11 1
Angelsaksisch 463 389 11 9 3 0
Middelnederlands 454 261 24 119 12 3
Litouws 435 271 2 4 2 0
Achterhoeks 433 283 22 16 11 0
Oudgrieks 431 269 7 16 8 0