WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek

Ga naar: navigatie, zoeken

Inhoud

[bewerken] De voortgang van WikiWoordenboek

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

[bewerken] Statistieken elders

[bewerken] Het huidige bestand van WikiWoordenboek

Totaal aantal lemma's: 62.084

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voorgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle paginas, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

[bewerken] Ons bestand naar brontaal

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.

Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord
Nederlands 25332 9527 1478 2155 609
Engels 4518 2159 342 532 69
Duits 2723 699 91 70 13
Spaans 2621 1308 153 269 13
Turks 2540 373 36 19 0
Frans 2232 783 80 61 15
Russisch 1668 398 112 74 84
Zweeds 1502 488 55 155 13
Noors 1509 493 80 100 47
Italiaans 1329 434 46 7 13
Nynorsk 1378 459 75 99 50
Vietnamees 1233 0 0 0 0
Latijn 1141 302 38 101 27
Limburgs 1116 573 63 300 59
Afrikaans 844 316 17 22 35
Pools 823 229 0 14 0
Portugees 768 341 30 0 3
Grieks 740 233 14 0 6
Hongaars 646 8 12 0 1
Esperanto 617 418 18 73 2
Indonesisch 597 363 48 13 8
Perzisch 568 167 7 10 9
Tsjechisch 561 31 0 0 0
Iers 544 176 28 0 0
Fins 526 54 2 0 0
Mandarijn 509 0 0 0 0
Oekraïens 499 0 0 0 0
IJslands 473 202 0 1 0
Deens 444 88 0 0 2
Japans 445 162 0 0 0
Papiamento 425 142 12 26 2
Slowaaks 412 1 35 3 0
Angelsaksisch 411 1 0 0 0
Welsh 389 148 0 0 0
Catalaans 410 96 0 0 0
Roemeens 360 71 0 7 0
Occitaans 305 75 1 0 0
Estisch 285 0 0 0 0
Bretons 280 79 0 0 0
Chinees 269 0 0 0 0
Hindi 267 6 0 4 0
Fries 262 19 0 0 0
Koerdisch 242 1 0 3 0
Bulgaars 287 2 0 0 1
Quechua 203 0 0 0 0
Litouws 187 14 0 0 0
Koreaans 181 0 0 0 0
Armeens 178 8 0 8 0
Hebreeuws 174 0 0 0 0
Servokroatisch 144 0 0 0 0
Kabylisch 140 18 0 0 0
Tataars 125 7 0 0 0
Swahili 113 0 0 0 0
Middelnederlands 125 59 0 20 0
Taroko 105 0 0 0 0
Albanees 104 0 0 0 0
Azeri 100 0 0 0 0
Krim-Tataars 100 14 3 0 2
Xhosa 100 26 0 4 0
Malayalam 98 0 0 0 0
Aragonees 102 0 0 0 0
Lezgi 81 2 0 0 0
Minangkabaus 71 40 12 0 0
Oudgrieks 64 13 0 8 0
Persoonlijke instellingen