WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek
Naar navigatie springen Naar zoeken springen

De voortgang van WikiWoordenboek[bewerken]

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

Statistieken elders[bewerken]

Het huidige bestand van WikiWoordenboek[bewerken]

Totaal aantal lemma's: 813.849

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voortgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle pagina's, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

Ons bestand naar brontaal[bewerken]

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.

Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord Werkwoords-
vorm
Nederlands 433049 89168 15096 11141 1915 107206
Spaans 195312 12546 2397 4229 358 182127
Frans 25546 5536 1007 2265 183 14191
Noors 19639 3341 761 805 232 2522
Nynorsk 13890 2848 589 1103 194 1863
Engels 12347 7266 1216 1542 257 1659
Tsjechisch 11697 4458 2973 4232 383 2391
Turks 9033 3540 592 544 104 238
Deens 8052 1162 176 204 56 1571
Duits 7662 3581 569 494 118 405
Zweeds 6142 1609 213 445 78 507
IJslands 5075 851 99 138 32 113
Italiaans 4460 2005 179 200 69 9
Russisch 3694 1531 231 195 171 131
Afrikaans 2937 1658 280 286 126 125
Indonesisch 2703 1651 295 294 50 0
Pennsylvania-Duits 2692 1186 86 136 70 184
Nedersaksisch 2192 1257 89 163 70 3
Latijn 2172 854 184 233 90 406
Slowaaks 2089 1045 523 34 47 24
Pools 1613 1105 82 64 17 32
Limburgs 1591 923 84 342 66 34
Catalaans 1563 549 123 657 16 634
Vietnamees 1521 726 231 319 51 0
Portugees 1476 948 81 136 7 1
Lets 1441 712 6 3 172 0
Japans 1441 1079 53 178 25 0
Esperanto 1379 709 72 215 16 0
Hongaars 1237 617 84 105 27 4
Grieks 1136 684 52 23 9 0
Bulgaars 1091 428 18 30 5 62
klassiek Nahuatl 1038 707 26 11 11 0
Welsh 988 661 90 32 5 0
Fins 976 640 31 45 14 0
Perzisch 812 464 18 26 10 7
Iers 783 545 42 24 6 2
Xhosa 738 213 8 39 12 29
Fries 749 466 27 20 22 2
Oekraïens 741 499 31 27 2 0
Veluws 710 423 43 84 31 1
Bretons 706 335 54 71 1 0
Kroatisch 676 344 6 3 0 0
Estisch 671 335 117 0 1 0
Quechua 653 300 46 79 14 12
Koerdisch 648 387 16 29 2 122
Arabisch 639 359 48 62 4 0
Roemeens 636 366 17 40 11 0
Oezbeeks 626 374 21 6 12 0
Mandarijn 596 381 64 100 19 0
Papiaments 604 433 30 64 14 0
Oudnoords 582 243 26 197 5 5
Hindi 588 333 41 59 6 0
Luxemburgs 578 214 22 27 15 6
Chinees 576 380 2 5 2 0
Faeröers 566 214 118 52 8 0
Middelnederlands 560 313 33 151 20 22
Angelsaksisch 550 419 16 16 5 1
Occitaans 546 290 11 26 2 0
Baskisch 472 288 29 6 3 0
Litouws 474 292 2 4 2 0
Achterhoeks 452 264 22 19 12 1
Oudgrieks 448 270 7 29 8 0
Koreaans 465 332 2 3 1 0
Hebreeuws 437 294 4 3 1 0
Servisch 436 310 6 0 1 0