WikiWoordenboek:Statistieken van het Nederlandse WikiWoordenboek

Uit WikiWoordenboek
Naar navigatie springen Naar zoeken springen

De voortgang van WikiWoordenboek[bewerken]

WikiWoordenboek groeit gestaag, zowel in omvang als in diepgang. Dat laatste is niet zo makkelijk in getallen uit te drukken. Daarom zijn er statistieken die verschillende aspecten van onze voortgang numeriek in beeld brengen. Er is informatie over het aantal bezoekers en de grootte van het huidige bestand beschikbaar via verschillende bronnen.

Statistieken elders[bewerken]

Het huidige bestand van WikiWoordenboek[bewerken]

Totaal aantal lemma's: 708.551

Dit totaal betreft alle bladzijden in de hoofdnaamruimte die ten minste één verbinding naar een andere pagina bevatten. Hoewel dit getal misschien het meest direct de voortgang in beeld brengt, is het ook onderhevig aan vele beperkingen omdat alle pagina's, goed of niet, helder of verwarrend, lang of kort, allemaal op één hoop geveegd worden.

Op een pagina kunnen ook meer dan één woord uit meer dan één taal beschreven staan die hieronder afzonderlijk geteld worden. Omgekeerd kan een pagina niet onder enige taal gerekend worden als er geen hoofdtaalsjabloon zoals =nld= op staat. Dit is bijvoorbeeld het geval voor pagina's met vervoegings- of verbuigingstabellen.

Ons bestand naar brontaal[bewerken]

Dankzij de hoofdtaalsjablonen, zoals =nld=, =eng= etc. zijn de getallen voor het totaal aantal woorden vrijwel geheel bij. Deze totalen bevatten echter ook lemma's voor minder gebruikelijke woordvormen zoals heeft of geschaafd, voorvoegsels, enz. De totalen zijn dus een vrij grove statistiek voor de huidige woordenschat uit een bepaalde taal en geven een wat rooskleurig beeld. De waarden staan ook aan enige inflatie bloot doordat ondercategorieën ook meegeteld worden.

De aantallen voor de specifieke woordsoorten hangen af van andere sjablonen, zoals -nlnoun- of adjcomp die niet op alle lemma's aanwezig zijn, bijvoorbeeld niet bij woordvormen maar ook op lemma's over een werkwoord of zelfstandig naamwoord dat nog niet volledig is uitgewerkt. Er ontbreekt bijvoorbeeld nog een verbuigings- of vervoegingstabel. De getoonde getallen geven dus een indruk van de beter uitgewerkte lemma's in het huidig bestand.

Er zijn vele andere talen met een klein aantal woorden niet weergegeven in de tabel.

Taal Woorden Zelfstandig
naamwoord
Bijvoeglijk
naamwoord
Werkwoord Bijwoord Werkwoords-
vorm
Nederlands 348477 67706 12074 9613 1624 77780
Spaans 195256 12496 2386 4225 358 182125
Frans 24958 5155 917 2224 176 14138
Noors 15648 3009 694 770 224 2237
Nynorsk 12365 2610 537 1049 188 1669
Engels 10999 6639 1085 1360 235 1298
Turks 8999 3516 591 544 104 238
Deens 7648 1101 176 198 55 1560
Duits 7078 3316 527 421 106 348
Tsjechisch 6688 2169 2898 1340 361 634
Zweeds 5145 1265 175 434 75 475
IJslands 4641 807 97 138 32 113
Italiaans 3805 1751 145 115 65 9
Russisch 3305 1396 188 150 139 94
Indonesisch 2679 1636 294 293 50 0
Afrikaans 2530 1392 261 257 117 125
Latijn 2031 800 170 214 89 379
Pennsylvania-Duits 1847 867 45 111 56 122
Catalaans 1502 516 122 654 16 631
Vietnamees 1486 705 231 317 51 0
Limburgs 1444 825 82 337 65 34
Slowaaks 1412 511 513 12 40 4
Portugees 1410 904 74 134 7 1
Lets 1401 693 6 3 172 0
Japans 1391 1052 53 177 24 0
Esperanto 1328 678 72 214 15 0
Nedersaksisch 1277 768 55 95 46 1
Hongaars 1198 593 84 105 27 4
Pools 1132 792 77 33 10 0
Grieks 1099 657 52 20 9 0
Bulgaars 1044 405 17 28 4 62
Welsh 902 622 90 32 5 0
Fins 858 558 27 28 12 0
Perzisch 770 441 18 26 10 7
Iers 747 526 42 24 6 2
Xhosa 730 209 8 39 10 29
Oekraïens 693 471 31 27 2 0
Bretons 670 315 54 71 1 0
Kroatisch 636 319 6 0 0 0
Quechua 635 293 46 79 14 12
Estisch 632 308 117 0 1 0
Fries 614 388 23 19 18 1
Koerdisch 617 374 16 29 2 122
Mandarijn 596 380 64 100 19 0
Roemeens 596 346 17 33 11 0
Arabisch 582 329 46 60 4 0
Oudnoords 579 240 26 197 5 5
Hindi 563 318 41 58 6 0
Faeröers 536 201 118 52 8 0
Papiamento 531 394 27 63 12 0
Occitaans 527 280 10 26 2 0
Chinees 477 342 2 3 2 0
Veluws 514 305 34 60 25 1
Luxemburgs 460 138 20 16 11 1
Angelsaksisch 456 387 8 7 3 0
Middelnederlands 447 255 24 119 11 3
Litouws 432 270 2 3 2 0
Oudgrieks 431 269 7 16 8 0