WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek
Naar navigatie springen Naar zoeken springen

De voortgang van WikiWoordenboek[bewerken]

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

Statistieken elders[bewerken]

Het huidige bestand van WikiWoordenboek[bewerken]

Totaal aantal lemma's: 749.444

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voortgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle pagina's, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

Ons bestand naar brontaal[bewerken]

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.

Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord Werkwoords-
vorm
Nederlands 384850 73907 13673 10173 1720 100880
Spaans 195274 12510 2388 4226 358 182125
Frans 25110 5243 932 2231 179 14148
Noors 16262 3058 703 776 224 2272
Nynorsk 12553 2639 543 1051 188 1677
Engels 11328 6821 1119 1414 238 1326
Turks 9011 3527 591 544 104 238
Tsjechisch 7977 3418 2934 1418 370 652
Deens 7685 1115 176 199 55 1559
Duits 7283 3432 533 431 111 351
Zweeds 5812 1381 182 439 76 503
IJslands 4647 812 97 138 32 113
Italiaans 4278 1933 159 184 67 9
Russisch 3332 1416 188 151 140 94
Afrikaans 2782 1553 266 270 119 125
Indonesisch 2683 1639 294 294 50 0
Latijn 2057 811 171 216 89 386
Pennsylvania-Duits 1903 890 45 112 61 122
Slowaaks 1724 797 517 13 40 4
Nedersaksisch 1661 1106 62 113 53 1
Catalaans 1517 529 122 654 16 631
Vietnamees 1498 713 231 319 51 0
Limburgs 1484 862 83 338 65 34
Portugees 1430 920 74 136 7 1
Lets 1412 703 6 3 172 0
Japans 1401 1059 53 177 25 0
Esperanto 1348 693 72 214 16 0
Pools 1291 932 78 33 10 0
Hongaars 1212 606 84 105 27 4
Grieks 1108 662 52 23 9 0
Bulgaars 1059 416 18 30 5 62
Welsh 918 634 90 32 5 0
Fins 879 576 27 30 12 0
Perzisch 777 447 18 26 10 7
Iers 753 530 42 24 6 2
Xhosa 731 210 8 39 12 29
Oekraïens 709 481 31 27 2 0
Bretons 683 327 54 71 1 0
Kroatisch 653 329 6 3 0 0
Fries 643 414 23 19 18 1
Estisch 641 315 117 0 1 0
Quechua 637 294 46 79 14 12
Koerdisch 619 375 16 29 2 122
Roemeens 604 352 17 33 11 0
Arabisch 599 342 47 60 4 0
Mandarijn 596 380 64 100 19 0
Oudnoords 579 240 26 197 5 5
Hindi 565 319 41 58 6 0
Papiamento 565 412 29 63 14 0
Faeröers 542 206 118 52 8 0
Chinees 533 360 2 4 2 0
Occitaans 530 281 10 26 2 0
Veluws 527 317 34 60 25 1
Luxemburgs 512 187 20 17 11 2
Angelsaksisch 464 390 11 9 3 0
Middelnederlands 461 264 25 121 12 3
Litouws 444 280 2 4 2 0
Achterhoeks 440 288 22 16 12 0
Baskisch 435 271 29 6 3 0
Oudgrieks 432 269 7 16 8 0